信息传播方法和装置的制造方法

文档序号:10626701阅读:232来源:国知局
信息传播方法和装置的制造方法
【专利摘要】本发明提出一种信息传播方法和装置,该信息传播方法包括:确定要传播的信息对应的第一用户,所述第一用户是所述第一用户属于的兴趣类型网络中影响力大于预设值的用户;获取以所述第一用户为起点的用户关系网络,在所述用户关系网络中以所述第一用户为起点传播所述信息。该方法能够提高信息传播的效率和可信性。
【专利说明】
信息传播方法和装置
技术领域
[0001] 本发明涉及互联网技术领域,尤其涉及一种信息传播方法和装置。
【背景技术】
[0002] 随着社会信息化的发展,许多信息都需要得到有效的传播。几年来,社交网络已经 成为人们获取、分享信息的主要渠道。通过社交网络传播信息,例如通过用户之间的信息分 享来传播信息等,变得更容易被用户所接受。由于社交网络中的信息传播还处于初步阶段, 许多信息传播的因素,例如信息传播速度、信息传播范围等参数,还处于难以预测的状态。 目前,信息传播时可以采用专门的传播方式,例如,广告、营销推广等,但是,这种传播方式 不容易被用户接受,效率不高。
[0003] 现有技术中,可通过建立概率模型学习用户之间的信息传播概率来控制信息的传 播。在传播概率学习的过程中,可以利用最大期望模型EM(Expectation-maximuzation)来 学习用户间的传播概率。但由于数据的稀疏性导致数据分布不均匀,EM模型方法很容易计 算得到概率为〇或概率为1的极端概率情况,导致得到的传播概率往往方差比较大,实际应 用后得到的传播效率仍然不高。

【发明内容】

[0004] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005] 为此,本发明的一个目的在于提出一种信息传播方法,该方法可以提高信息传播 的效率和可信性。
[0006] 本发明的另一个目的在于提出一种信息传播装置。
[0007] 为达到上述目的,本发明实施例提出的信息传播方法,包括:确定要传播的信息对 应的第一用户,所述第一用户是所述第一用户属于的兴趣类型网络中影响力大于预设值的 用户;获取以所述第一用户为起点的用户关系网络,在所述用户关系网络中以所述第一用 户为起点传播所述信息。
[0008] 本发明实施例提出的信息传播方法,通过确定要传播的信息对应的第一用户,第 一用户是影响力大于预设值的用户,并由第一用户为起点进行信息传播,可以由具有较大 影响力的用户传播信息,提高信息传播的可信性,提高信息传播效率。
[0009] 为达到上述目的,本发明实施例提出的信息传播装置,包括:确定模块,用于确定 要传播的信息对应的第一用户,所述第一用户是所述第一用户属于的兴趣类型网络中影响 力大于预设值的用户;传播模块,用于获取以所述第一用户为起点的用户关系网络,在所述 用户关系网络中以所述第一用户为起点传播所述信息。
[0010] 本发明实施例提出的信息传播装置,通过确定要传播的信息对应的第一用户,第 一用户是影响力大于预设值的用户,并由第一用户为起点进行信息传播,可以由具有较大 影响力的用户传播信息,提高信息传播的可信性,提高信息传播效率。
[0011] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0012] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变 得明显和容易理解,其中:
[0013] 图1是本发明一实施例提出的信息传播方法的流程示意图;
[0014] 图2是本发明一实施例的兴趣类型网络的示意图;
[0015] 图3是本发明一实施例的建立预设个数的兴趣类型网络,并在每个兴趣类型网络 中,确定对应的第一用户的流程示意图;
[0016] 图4是本发明一实施例的确定要传播的信息对应的第一用户的示意图;
[0017] 图5是本发明一实施例的用户关系网络传播概率的示意图;
[0018] 图6是本发明一实施例的获取用户之间的传播概率的流程示意图;
[0019] 图7是本发明另一实施例的信息传播装置的结构示意图;
[0020] 图8是本发明另一实施例的信息传播装置的结构示意图。
【具体实施方式】
[0021] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考 附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反, 本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同 物。
[0022] 下面参考附图描述根据本发明实施例的信息传播方法和装置。
[0023] 图1是本发明一实施例提出的信息传播方法的流程示意图,该方法包括:
[0024] S101 :确定要传播的信息对应的第一用户,所述第一用户是所述第一用户属于的 兴趣类型网络中影响力大于预设值的用户。
[0025] 其中,要传播的信息可以是商品推广信息,也可以是其他信息,本发明对此不做限 定。要传播的信息对应的第一用户可以是一个或多个。
[0026] 兴趣类型网络是基于用户的兴趣对用户进行划分后得到的类别的名称,用户的兴 趣可以根据用户具有的标签确定的,用户具有的标签可以根据用户的购买或浏览历史商品 信息等预先确定。
[0027] 具体地,可以预先建立预设个数的兴趣类型网络,并在每个兴趣类型网络中,确定 对应的第一用户。例如,可以预先设置多个标签,按照标签将用户划分到不同的兴趣类型网 络中。如图2所示,兴趣类型网络包括标签,例如时尚、户外、商务、运动、旅行、电子等,每个 用户都可以对应一个或多个标签。
[0028] 第一用户是兴趣类型网络中影响力大于预设值的用户。影响力是用户的一种属 性,在本实施例中,一个用户的影响力用于衡量该用户传播的信息被其他人接受的难易程 度,其中,影响力大的用户传播的信息更容易被其他人接受。第一用户也可以称为达人。每 个兴趣类型网络中达人可以是一个或者多个。
[0029] 可选的,以要传播的信息是商品的信息为例,如图3所示,建立预设个数的兴趣类 型网络,并在每个兴趣类型网络中,确定对应的第一用户,具体可以包括:
[0030] S31 :根据标签传播学习算法,获取用户-标签矩阵;
[0031] 具体的,根据标签传播学习算法,获取用户-标签矩阵,可以包括:
[0032] (1)计算得到商品与商品的相似度矩阵W。
[0033] 商品与商品的相似度矩阵可以用于表示商品之间在用户行为、商品标题和商品属 性上的相似度。
[0034] 其中,用于计算相似度矩阵的商品可以是优质买家处理过的商品,处理具体可以 是指购买,浏览,点击,收藏中的一项或者多项,优质买家可以根据优质买家模型确定,例 如,将信用等级高或者购买次数多的买家确定为优质买家。具体的,可以获取所有买家的信 息,再根据优质买家模型从所有买家中确定出优质买家,再获取优质买家处理过的商品,再 根据优质买家处理过的商品中的两两商品计算相似度,得到相似度矩阵W。
[0035] 具体的,可以通过最小哈希算法对商品(pid, vid)进行哈希映射,得到商品与商 品的相似度矩阵,其中^1(1是商品的10(1(16111:;^7,身份标识),¥1(1是商品属性值的10,口1(1 和vid通常可以从基础数据表中获取。
[0036] (2)计算得到商品-标签信息矩阵F。
[0037] 其中,商品-标签信息矩阵F中的商品也可以具体是指优质买家处理过的商品,标 签是指商品更新后的标签,在获取优质买家处理过的商品后,可以根据每个商品的初始标 签,经过迭代过程计算得到商品-标签信息矩阵F,其中,每个商品的初始标签可以是作为 商品的一个属性预先记录在数据库中的,从而可以从数据库中获取商品的初始标签。
[0038] 具体的,商品-标签信息矩阵F可以根据标签传播学习算法的迭代公式得到,迭代 公式如下:
[0039] While (F 收敛)
[0040] F(t+1) = a SF(t) + (l-a )Υ
[0041] end
[0042] 其中,要计算的商品-标签彳目息矩阵F是上述公式中收敛时得到F (t+1), 〇< a <1为预设的加权参数,s是根据上述的商品与商品的相似度矩阵W计算得到的,
Y是初始标签值, F(t)的初始值可以是根据已有的买家信息得到的商品-标签信息矩阵F的初始值,已有的 买家信息可以是根据优质买家模型得到的。例如,根据买家的信用等级从多个买家中确定 出预设个数的优质买家,再根据优质买家与优质买家对应的购买,点击或收藏的商品可以 得到用户-商品信息矩阵V,以及,根据优质买家购买,点击或收藏的商品与商品具有的标 签可以得到上述的商品-标签信息矩阵F的初始值。
[0043] 其中,商品具有的标签可以根据统计或者HITS(Hyperlink-induced Topic Search,超链诱导主题搜索)排序算法得到。
[0044] 在获取F的初始值后,可以根据上述迭代公式,在满足迭代收敛条件时得到最终 的商品-标签信息矩阵F。
[0045] 迭代收敛条件可以包括:设置最大迭代次数,当迭代次数达到最大迭代次数时满 足迭代收敛条件;或者,根据迭代后的值与迭代前的值的差值,在该差值大于预设阈值时满 足迭代收敛条件,例如,I |F(t+l)-F(t) I |〈β时表明满足迭代收敛条件,I |F(t+l)-F(t) I 表示F(t+1)与F(t)的欧氏距离,β表示预设阈值。
[0046] (3)计算得到用户-标签矩阵L。
[0047] 其中,用户-标签矩阵L中的用户也可以具体是指优质买家,标签是指用户具有的 标签,用户具有的标签可以根据用户处理过的商品的更新后的标签确定。
[0048] 具体的,可以采用如上所示的方式确定出优质买家,以及获取优质买家处理过的 商品,以及,从数据库中获取优质买家处理过的商品的初始标签,之后可以根据优质买家处 理过的商品以及上述的方式(1)计算得到商品与商品的相似度矩阵W,再根据商品与商品 的相似度矩阵W和优质买家处理过的商品具有的初始标签以及上述的方式(2)计算得到商 品-标签信息矩阵F,再根据优质买家以及优质买家处理过的商品可以建立用户-商品信息 矩阵V,之后在根据上述的V和F采用如下的方式得到用户-标签矩阵L。
[0049] 具体的,计算公式可以是:L = V*F,其中,V是上述得到的用户-商品信息矩阵,F 是上述得到的收敛时的最终的商品-标签信息矩阵。
[0050] S32 :对所述用户-标签矩阵进行聚类,得到预设个数的兴趣类型网络,并获取每 个兴趣类型网络中的第一用户。
[0051] 在得到用户-标签矩阵L后,可以对该矩阵L进行聚类,例如,预设个数是k个,则 可以对矩阵L进行双聚类得到k个类别,每个类别对应一个兴趣类型网络。
[0052] 在对矩阵L进行聚类得到k个类别后,以每个兴趣类型网络包括一个第一用户为 例,每个类别的中心点可以确定为该兴趣类型网络的第一用户。不同兴趣类型网络的第一 用户可以组成列表,该列表可以称为达人列表,达人列表例如表示为:P = {Pl,p2,…,pk}, 其中,Pl(i = 1,2, ···,!〇是第i个兴趣类型网络中的第一用户,也可以称为达人,Pl可以由 用户ID和该用户具有的标签组成。
[0053] 在上述预先建立多个兴趣类型网络,并确定每个兴趣类型网络中的第一用户后, 如上所述,可以得到由不同的兴趣类型网络中的第一用户组成的达人列表,达人列表中包 括不同兴趣类型网络中的第一用户,在当前需要传播信息时,可以首先确定要传播的信息 对应的第一用户。
[0054] 可选的,确定要传播的信息对应的第一用户,包括:
[0055] 获取第一标签,所述第一标签是所述要传播的信息包括的标签;
[0056] 将包括所述第一标签的第一用户,确定为所述要传播的信息对应的第一用户。
[0057] 例如,假设第一用户称为达人,如图4所示,达人列表中包括:服装达人,3C达人和 家居达人,则如果要传播的信息包括的标签是3C,则该要传播的信息对应的第一用户是3C 达人。
[0058] S102:获取以所述第一用户为起点的用户关系网络,在所述用户关系网络中以所 述第一用户为起点传播所述信息。
[0059] 其中,用户关系网络是用于描述用户与用户之间的关联关系的网络,可以直接从 已有的社交网络类型的应用程序中获取用户关系网络,在社交网络类型的应用程序中,用 户之间可以通过增加好友或者增加关注等方式预先建立用户关系网络。例如,可以先从第 一用户的应用程序中获取到第一用户的好友包括第二用户,再在第二用户的应用程序中获 取到第二用户的好友包括第三用户,则可以获取到的用户关系网络包括:第一用户一〉第 二用户一〉第三用户。
[0060] 以所述第一用户为起点的用户关系网络可以从应用程序的已有数据中导入,例 如,从社交网络的应用程序中导入以确定出的第一用户为起点的用户关系网络。
[0061] 例如,如图4所示,假设要传播的信息对应的第一用户是3C达人,从已有数据中获 取的以3C达人为起点的用户关系网络是用户关系网络41,则如图4所示,则可以将要传播 的信息以3C达人为起点在用户关系网络41中传播。
[0062] 可选的,所述在所述用户关系网络中以所述第一用户为起点传播所述信息,包 括:
[0063] 根据预设策略,在所述用户关系网络中以所述第一用户为起点传播所述信息,所 述预设策略包括传播范围策略,或者,传播速度策略。
[0064] 其中,传播范围策略是指优先考虑传播范围,传播速度策略是指优先考虑传播速 度。
[0065] 具体的,可以获取用户关系网络中用户与用户之间的传播概率,当采用传播范围 策略时,可以不论传播概率高低都进行信息传播,当采用传播速度策略时,可以只在传播概 率大于预设值的路径上进行信息传播。
[0066] 例如,以传播速度策略为例,参见图5,假设用户关系网络包括第一路径51,第二 路径52,第三路径53,第四路径54和第五路径55,假设第一路径51,第二路径52和第三路 径53中包括的用户之间的传播概率都大于预设值,而第四路径54和第五路径55上包括的 用户之间存在小于预设值的传播概率,则信息可以在第一路径51,第二路径52和第三路径 53上传播,而不在第四路径54和第五路径55上传播。
[0067] 具体的,信息在用户关系网络中传播时,第一用户在初始时刻作为信息传播的种 子节点,种子节点负责向其邻居节点传播信息,例如,第一用户是3C达人,与3C达人相邻的 邻居节点包括第一节点和第二节点,则在初始时刻t设置3C达人是种子节点,并且由3C达 人将信息传播给第一节点和第二节点,当种子节点将信息传播给邻居节点后,邻居节点在 下一时间成为新的种子节点,例如,在t+Ι时刻种子节点是第一节点,而不再是3C达人,依 次类推,从初始的第一用户依次根据用户关系网络中的用户相邻关系进行信息传播,直至 没有新的种子节点。另外,用户关系网络中邻居节点用户之间的传播概率是独立的,不受其 他邻居节点之间的关系影响。并且,每个种子节点只有一次机会向非种子邻居节点传播信 息,例如,用户在t时刻成为种子节点,仅在t时刻有一次机会尝试对非种子邻居节点传播 信息,如果传播成功,则该邻居节点成为t+Ι时刻的种子节点,而不管该用户在t时刻是否 传播成功,该用户再也不能在其他时刻试图传播信息给它的邻居节点。如果在同一时刻,有 多个种子节点试图传播信息给同一节点,其传播的顺序可以是任意的。
[0068] 可选的,所述获取所述用户关系网络中用户与用户之间的传播概率,包括:
[0069] 根据引入传播概率方差控制因子的传播概率学习模型,获取所述用户关系网络中 用户与用户之间的传播概率。
[0070] 例如,传播概率学习模型可以是EM(Expectation_maximuzation,最大期望)模 型。由于数据的稀疏性,在传播概率学习的过程中,根据EM模型学习到的传播概率往往方 差比较大。这主要是因为EM模型的计算方法在稀疏数据情况下过拟合导致数据分布不均 匀,很容易估计获得概率为〇或概率为1的极端概率情况。
[0071 ] 本申请实施例中,为了解决传统EM模型存在的上述问题,在EM模型中引入了传播 概率方差控制因子,防止EM模型在迭代过程中发生剧烈的波动。
[0072] 可选的,所述根据引入传播概率方差控制因子的传播概率学习模型,获取所述用 户关系网络中用户与用户之间的传播概率,包括:
[0073] 获取所述用户关系网络,并根据所述用户关系网络和时间片断数据建立信息传播 模型,所述时间片段数据是预设的信息传播扩散时间;
[0074] 将传播概率方差控制因子引入传播概率学习模型中,得到引入传播概率方差控制 因子的传播概率学习模型,并根据所述引入传播概率方差控制因子的传播概率学习模型, 对所述信息传播模型进行学习,获取传播概率更新规则,所述更新规则包括第一更新规则 和第二更新规则;
[0075] 采用所述第一更新规则更新第一组用户之间的传播概率,采用所述第二更新规则 更新第二组用户之间的传播概率,所述第一组用户之间的边在所述时间片断数据内被激 活,所述第二组用户之间的边在所述时间片断数据内没有被激活;
[0076] 将更新后的用户之间的传播概率确定为所述用户关系网络中用户与用户之间的 传播概率。
[0077] 具体的,如图6所示,获取用户之间的传播概率的流程可以包括:
[0078] S61 :导入用户关系网络。
[0079] 例如,从已有的社交网络的应用程序中导入用户关系网络。
[0080] S62 :建立独立级联模型。
[0081] 独立级联模型是一种基本的传播模型,可以采用现有的方式根据用户关系网络建 立。
[0082] 在传播模型中,可以包括节点和边,其中,每个节点可以对应用户关系网络中的一 个用户,每个边是由用户关系网络中两个相邻用户组成的线段。
[0083] S63 :将传播概率方差控制因子引入EM模型中。
[0084] EM(Expectation-maximuzation,最大化期望)模型是一种优化算法,在本实施例 中,可以采用EM模型对独立级联模型进行学习,从而得到独立级联模型中包括的每个边的 传播概率,也就是用户关系网络中用户与用户之间的传播概率。
[0085] 传统的EM模型可以表示为:
[0086]
[0087] 在引入传播概率方差控制因子后,可以根据求解过程是否收敛得到不同的引入传 播概率方差控制因子的EM模型,采用哪种引入传播概率方差控制因子的EM模型可以根据 实际需要确定,具体的,引入传播概率方差控制因子的EM模型可以是:
[0088]
[0089]
[0090]
[0091] 其中,λ是控制因子,kv,w是边(v,w)的传播概率。
[0092] S64 :根据引入传播概率方差控制因子的EM模型获取第一更新规则和第二更新规 则。
[0093] 其中,可以先根据引入λ的EM模型确定优化方程,再对优化方程进行求解,得到 第一更新规则。
[0094] 具体的,如果引入λ的ΕΜ模型是:
[0095]
[0096] 其对应的优化方程是:
[0097] V v.j
[0098] 对该优化方程进行求解后,得到第一更新规则是:
[0099]
[0100] 其中,表不 v e Ds(t),w e Ds(t+Ι),5^1 表不 v e Ds (t),H'g Z)s(y + 1), Ds (t) 表示在t时刻激活的点的集合,Pw(s)表示w被激活的概率。
[0101] 对该优化方程进行求解后,得到第二更新规则是:
[0102]
[0103]
[0104] - J V'-yW ' ' \ ' Ρ,:νν· f
[0105] 如果引入λ的EM模型是:
[0106]
[0107] 其对应的优化方程是:
[0108]
[0109] 对该优化方程进行求解后,得到第一更新规则是:
[0110]
[0111] 对该优化方程进行求解后,得到第二更新规则是:
[0112]
[0113] S65:判断时间片断数据是否结束,若否,执行S66,若是,执行S68。
[0114] 其中,时间片断数据是预设的,用于表明信息传播扩散时间。
[0115] 在得到第一更新规则和第二更新规则后,可以在用户关系网络中选取种子节点, 然后以种子节点为起点根据用户关系网络传播预设信息,传播时间是预设的时间片断数 据。
[0116] 具体的,可以得到当前时间与信息开始传播的时间之间的差值,如果该差值小于 预设的时间片断数据,则确定时间片断数据没有结束,否则结束。
[0117] S66:判断要计算的边在该时间片断数据内是否被激活,若是,执行S67,否则,重 复执行S65及其后续步骤。
[0118] 例如,要计算的边是用户A与用户B组成的边,在信息传播时间内,传播的信息经 过用户A和用户B,则可以确定用户A和用户B组成的边在该时间内被激活了,否则未激活。
[0119] S67 :采用第一更新规则,对该要计算的边的传播概率进行更新,之后,执行S69。
[0120] 其中,第一更新规则的具体公式可以参见上述描述。
[0121] 另外,每个边可以设置初始传播概率。
[0122] S68:采用第二更新规则,对整个时间片断数据内未被激活的边的传播概率进行更 新,之后,执行S69。
[0123] 例如,在整个预设的时间片断数据内,用户A和用户C组成的边都没有被激活,也 就是信息没有在用户A和用户C之间传播,则可以采用如上所示的第二更新规则对用户A 和用户C组成的边的传播概率进行更新。
[0124] S69 :将每个边更新后的传播概率写入传播概率更新库。
[0125] 可以理解的是,上述以传播概率学习模型是EM模型为例,传播概率学习模型也可 以是其他模型,例如,马尔科夫模型。
[0126] 本实施例中,通过确定要传播的信息对应的第一用户,第一用户是影响力大于预 设值的用户,并由第一用户为起点进行信息传播,可以由具有较大影响力的用户传播信息, 提高信息传播的可信性,提高信息传播效率。本实施例通过标签传播学习算法可以确定出 第一用户,提高有效性。本实施例通过在传播概率学习模型中引入控制因子,可以提高传播 概率的准确性。本实施例通过设置不同的传播策略,可以实现信息多样性传播。
[0127] 为了实现上述实施例,本发明还提出一种信息传播装置。
[0128] 图7是本发明另一实施例的信息传播装置的结构示意图。如图7所示,该信息传 播装置包括:确定模块100和传播模块200。
[0129] 具体地,确定模块100用于确定要传播的信息对应的第一用户,所述第一用户是 所述第一用户属于的兴趣类型网络中影响力大于预设值的用户。其中,要传播的信息可以 是商品推广信息,也可以是其他信息,本发明对此不做限定。要传播的信息对应的第一用户 可以是一个或多个。
[0130] 兴趣类型网络可以是根据兴趣类型对用户或信息进行分类标记的网络,也可以称 为兴趣网络。
[0131] 具体地,可以预先建立预设个数的兴趣类型网络,并在每个兴趣类型网络中,确定 对应的第一用户。例如,可以预先设置多个标签,按照标签将用户划分到不同的兴趣类型网 络中。如图2所示,兴趣类型网络包括标签,例如时尚、户外、商务、运动、旅行、电子等,每个 用户都可以对应一个或多个标签。具体建立兴趣类型网络的过程将在后续实施例中介绍。
[0132] 第一用户是兴趣类型网络中影响力大于预设值的用户,影响力是用户的一种属 性,在本实施例中,一个用户的影响力用于衡量该用户传播的信息被其他人接受的难易程 度,其中,影响力大的用户传播的信息更容易被其他人接受。
[0133] 第一用户也可以称为达人。每个兴趣类型网络中达人可以是一个或者多个。
[0134] 例如,假设第一用户称为达人,如图4所示,达人列表中包括:服装达人,3C达人和 家居达人,则如果要传播的信息包括的标签是3C,则该要传播的信息对应的第一用户是3C 达人。
[0135] 传播模块200用于获取以所述第一用户为起点的用户关系网络,在所述用户关系 网络中以所述第一用户为起点传播所述信息。其中,用户关系网络是用于描述用户与用户 之间的关联关系的网络,可以直接从已有的社交网络类型的应用程序中获取用户关系网 络,在社交网络类型的应用程序中,用户之间可以通过增加好友或者增加关注等方式预先 建立用户关系网络。例如,可以先从第一用户的应用程序中获取到第一用户的好友包括第 二用户,再在第二用户的应用程序中获取到第二用户的好友包括第三用户,则可以获取到 的用户关系网络包括:第一用户一〉第二用户一〉第三用户。
[0136] 以所述第一用户为起点的用户关系网络可以从应用程序的已有数据中导入,例 如,从社交网络的应用程序中导入以确定出的第一用户为起点的用户关系网络。
[0137] 例如,如图4所示,假设要传播的信息对应的第一用户是3C达人,从已有数据中获 取的以3C达人为起点的用户关系网络是用户关系网络41,则如图4所示,则可以将要传播 的信息以3C达人为起点在用户关系网络41中传播。
[0138] 本实施例中,通过确定要传播的信息对应的第一用户,第一用户是影响力大于预 设值的用户,并由第一用户为起点进行信息传播,可以由具有较大影响力的用户传播信息, 提高信息传播的可信性,提高信息传播效率。
[0139] 图8是本发明另一实施例的信息传播装置的结构示意图。如图8所示,该信息传 播装置包括:确定模块100、第二获取子模块110、第一确定子模块120、传播模块200、第三 获取子模块210、获取单元211、建模单元212、更新单元213、确定单元214、第二确定子模块 220、建立模块300、第一获取子模块310和聚类子模块320。其中,建立模块300包括第一 获取子模块310和聚类子模块320 ;确定模块100包括第二获取子模块110和第一确定子 模块120 ;传播模块200包括第三获取子模块210和第二确定子模块220 ;第三获取子模块 210包括获取单元211、建模单元212、更新单元213和确定单元214。
[0140] 具体地,建立模块300用于建立预设个数的兴趣类型网络,并在每个兴趣类型网 络中,确定对应的第一用户。以要传播的信息是商品的信息为例,建立模块300具体可以包 括:
[0141] 第一获取子模块310,用于根据标签传播学习算法,获取用户-标签矩阵。具体可 以包括:
[0142] (1)计算得到商品与商品的相似度矩阵W。
[0143] 商品与商品的相似度矩阵可以用于表示商品之间在用户行为、商品标题和商品属 性上的相似度。
[0144] 其中,用于计算相似度矩阵的商品可以是优质买家处理过的商品,处理具体可以 是指购买,浏览,点击,收藏中的一项或者多项,优质买家可以根据优质买家模型确定,例 如,将信用等级高或者购买次数多的买家确定为优质买家。具体的,可以获取所有买家的信 息,再根据优质买家模型从所有买家中确定出优质买家,再获取优质买家处理过的商品,再 根据优质买家处理过的商品中的两两商品计算相似度,得到相似度矩阵W。
[0145] 更具体的,第一获取子模块310可以通过最小哈希算法对商品(pid, vid)进行哈 希映射,得到商品与商品的相似度矩阵,其中,pid是商品的ID (Identity,身份标识),vid 是商品属性值的ID,pid和vid通常可以从基础数据表中获取。
[0146] (2)计算得到商品-标签信息矩阵F。
[0147] 其中,商品-标签信息矩阵F中的商品也可以具体是指优质买家处理过的商品,标 签是指商品更新后的标签,在获取优质买家处理过的商品后,可以根据每个商品的初始标 签,经过迭代过程计算得到商品-标签信息矩阵F,其中,每个商品的初始标签可以是作为 商品的一个属性预先记录在数据库中的,从而可以从数据库中获取商品的初始标签。
[0148] 更具体的,商品-标签信息矩阵F可以根据标签传播学习算法的迭代公式得到,迭 代公式如下:
[0149] While (F 收敛)
[0150] F(t+1) = a SF(t) + (l-a )Υ
[0151] end
[0152] 其中,要计算的商品-标签彳目息矩阵F是上述公式中收敛时得到F (t+1), 〇< a <1为预设的加权参数,s是根据上述的商品与商品的相似度矩阵W计算得到的,
,Y是初始标签值, F(t)的初始值可以是根据已有的买家信息得到的商品-标签信息矩阵F的初始值,已有的 买家信息可以是根据优质买家模型得到的。例如,根据买家的信用等级从多个买家中确定 出预设个数的优质买家,再根据优质买家与优质买家对应的购买,点击或收藏的商品可以 得到用户-商品信息矩阵V,以及,根据优质买家购买,点击或收藏的商品与商品具有的标 签可以得到上述的商品-标签信息矩阵F的初始值。
[0153] 其中,商品具有的标签可以根据统计或者HITS(Hyperlink-induced Topic Search,超链诱导主题搜索)排序算法得到。
[0154] 在获取F的初始值后,可以根据上述迭代公式,在满足迭代收敛条件时得到最终 的商品-标签信息矩阵F。
[0155] 迭代收敛条件可以包括:设置最大迭代次数,当迭代次数达到最大迭代次数时满 足迭代收敛条件;或者,根据迭代后的值与迭代前的值的差值,在该差值大于预设阈值时满 足迭代收敛条件,例如,I |F(t+l)-F(t) I |〈β时表明满足迭代收敛条件,I |F(t+l)-F(t) I 表示F(t+1)与F(t)的欧氏距离,β表示预设阈值。
[0156] (3)计算得到用户-标签矩阵L。
[0157] 其中,用户-标签矩阵L中的用户也可以具体是指优质买家,标签是指用户具有的 标签,用户具有的标签可以根据用户处理过的商品的更新后的标签确定。
[0158] 具体的,可以采用如上所示的方式确定出优质买家,以及获取优质买家处理过的 商品,以及,从数据库中获取优质买家处理过的商品的初始标签,之后可以根据优质买家处 理过的商品以及上述的方式(1)计算得到商品与商品的相似度矩阵W,再根据商品与商品 的相似度矩阵W和优质买家处理过的商品具有的初始标签以及上述的方式(2)计算得到商 品-标签信息矩阵F,再根据优质买家以及优质买家处理过的商品可以建立用户-商品信息 矩阵V,之后在根据上述的V和F采用如下的方式得到用户-标签矩阵L。
[0159] 更具体的,计算公式可以是:L = V*F,其中V是上述得到的用户-商品信息矩阵, F是上述得到的收敛时的最终的商品-标签信息矩阵。
[0160] 聚类子模块320,用于对所述用户-标签矩阵进行聚类,得到预设个数的兴趣类型 网络,并获取每个兴趣类型网络中的第一用户。在得到用户-标签矩阵L后,可以对该矩阵 L进行聚类,例如,预设个数是k个,则可以对矩阵L进行双聚类得到k个类别,每个类别对 应一个兴趣类型网络。
[0161] 在对矩阵L进行聚类得到k个类别后,以每个兴趣类型网络包括一个第一用户为 例,每个类别的中心点可以确定为该兴趣类型网络的第一用户。不同兴趣类型网络的第一 用户可以组成列表,该列表可以称为达人列表,达人列表例如表示为:P = {Pl,p2,…,pk}, 其中,Pl(i = 1,2, ···,!〇是第i个兴趣类型网络中的第一用户,也可以称为达人,Pl可以由 用户ID和该用户具有的标签组成。
[0162] 在上述预先建立多个兴趣类型网络,并确定每个兴趣类型网络中的第一用户后, 如上所述,可以得到由不同的兴趣类型网络中的第一用户组成的达人列表,达人列表中包 括不同兴趣类型网络中的第一用户,在当前需要传播信息时,可以首先确定要传播的信息 对应的第一用户。
[0163] 所述确定模块100具体包括:
[0164] 第二获取子模块110用于获取第一标签,所述第一标签是所述要传播的信息包括 的标签;
[0165] 第一确定子模块120用于将包括所述第一标签的第一用户,确定为所述要传播的 信息对应的第一用户。
[0166] 例如,假设第一用户称为达人,如图4所示,达人列表中包括:服装达人,3C达人和 家居达人,则如果第二获取子模块110获取到要传播的信息包括的标签是3C,则第一确定 子模块120确定该要传播的信息对应的第一用户是3C达人。
[0167] 传播模块200还用于根据预设策略,在所述用户关系网络中以所述第一用户为起 点传播所述信息,所述预设策略包括传播范围策略,或者,传播速度策略。其中,传播范围策 略是指优先考虑传播范围,传播速度策略是指优先考虑传播速度。
[0168] 更具体的,第三获取子模块210可以获取用户关系网络中用户与用户之间的传播 概率,当采用传播范围策略时,可以不论传播概率高低都进行信息传播,当采用传播速度策 略时,可以只在传播概率大于预设值的路径上进行信息传播。例如,以传播速度策略为例, 参见图5,假设用户关系网络包括第一路径51,第二路径52,第三路径53,第四路径54和第 五路径55,假设第一路径51,第二路径52和第三路径53中包括的用户之间的传播概率都 大于预设值,而第四路径54和第五路径55上包括的用户之间的存在小于预设值的传播概 率,则信息可以在第一路径51,第二路径52和第三路径53上传播,而不在第四路径54和第 五路径55上传播。
[0169] 更具体的,信息在用户关系网络中传播时,第一用户在初始时刻作为信息传播的 种子节点,种子节点负责向其邻居节点传播信息,例如,第一用户是3C达人,与3C达人相邻 的邻居节点包括第一节点和第二节点,则在初始时刻t设置3C达人是种子节点,并且由3C 达人将信息传播给第一节点和第二节点,当种子节点将信息传播给邻居节点后,邻居节点 在下一时间成为新的种子节点,例如,在t+Ι时刻种子节点是第一节点,而不再是3C达人, 依次类推,从初始的第一用户依次根据用户关系网络中的用户相邻关系进行信息传播,直 至没有新的种子节点。另外,用户关系网络中邻居节点用户之间的传播概率是独立的,不受 其他邻居节点之间的关系影响。并且,每个种子节点只有一次机会向非种子邻居节点传播 信息,例如,用户在t时刻成为种子节点,仅在t时刻有一次机会尝试对非种子邻居节点传 播信息,如果传播成功,则该邻居节点成为t+Ι时刻的种子节点,而不管该用户在t时刻是 否传播成功,该用户再也不能在其他时刻试图传播信息给它的邻居节点。如果在同一时刻, 有多个种子节点试图传播信息给同一节点,其传播的顺序可以是任意的。
[0170] 可选地,第三获取子模块210还用于根据引入传播概率方差控制因子的传播概率 学习模型,获取所述用户关系网络中用户与用户之间的传播概率。例如,传播概率学习模型 可以是EM(Expectation-maximuzation,最大化期望)模型。由于数据的稀疏性,在传播概 率学习的过程中,根据EM模型学习到的传播概率往往方差比较大。这主要是因为EM模型 的计算方法在稀疏数据情况下过拟合导致数据分布不均匀,很容易估计获得概率为〇或概 率为1的极端概率情况。
[0171] 本申请实施例中,为了解决传统EM模型存在的上述问题,在EM模型中引入了传播 概率方差控制因子,防止EM模型在迭代过程中发生剧烈的波动。
[0172] 可选的,所述第三获取子模块210,包括:
[0173] 获取单元211用于获取所述用户关系网络,例如,从已有的社交网络的应用程序 中导入用户关系网络,并根据所述用户关系网络和时间片断数据建立信息传播模型,例如, 可以建立独立级联模型。独立级联模型是一种基本的传播模型,可以采用现有的方式根据 用户关系网络建立。
[0174] 其中,时间片断数据是预设的,用于表明信息传播扩散时间。
[0175] 在传播模型中,可以包括节点和边,其中,每个节点可以对应用户关系网络中的一 个用户,每个边是由用户关系网络中两个相邻用户组成的线段。
[0176] 建模单元212用于将传播概率方差控制因子引入传播概率学习模型中,得到引入 传播概率方差控制因子的传播概率学习模型,并根据所述引入传播概率方差控制因子的传 播概率学习模型,对所述信息传播模型进行学习,获取传播概率更新规则,所述更新规则包 括第一更新规则和第二更新规则。
[0177] EM(Expectation_maximuzation,最大化期望)模型是一种优化算法,在本实施例 中,可以采用EM模型对独立级联模型进行学习,从而得到独立级联模型中包括的每个边的 传播概率,也就是用户关系网络中用户与用户之间的传播概率。
[0178] 传统的EM模型可以表示为:
[0179]
[0180] 在引入传播概率方差控制因子后,可以根据求解过程是否收敛得到不同的引入传 播概率方差控制因子的EM模型,采用哪种引入传播概率方差控制因子的EM模型可以根据 实际需要确定,具体的,引入传播概率方差控制因子的EM模型可以是:
[0181]
[0182]
[0183]
[0184] 其中,λ是控制因子,kv,w是边(v,w)的传播概率。
[0185] 其中,可以先根据引入λ的EM模型确定优化方程,再对优化方程进行求解,得到 第一更新规则。
[0186] 具体的,如果引入λ的ΕΜ模型是:
[0187]
[0188] 其对应的优化方程是:
[0189]
[0190] 对该优化方程进行求解后,得到第一更新规则是:
[0191]
[0192] 其中,|<,t|表示 v G Ds(t),w G Ds(t+1),表示 v G Ds(t),wfDJf + l), Ds(t) 表示在t时刻激活的点的集合,Pw(s)表示w被激活的概率。
[0193] 对该优化方程进行求解后,得到第二更新规则是:
[0194]
[0195]
[0196]
[0197] 如果引入λ的EM模型是:
[0198]
[0199] 其对应的优化方程是:
[0200]
[0201] 对该优化方程进行求解后,得到第一更新规则是:
[0202]
[0203] 对该优化方程进行求解后,得到第二更新规则是:
[0204]
[0205] 更新单元213用于采用所述第一更新规则更新第一组用户之间的传播概率,采用 所述第二更新规则更新第二组用户之间的传播概率,所述第一组用户之间的边在所述时间 片断数据内被激活,所述第二组用户之间的边在所述时间片断数据内没有被激活。在得到 第一更新规则和第二更新规则后,可以在用户关系网络中选取种子节点,然后以种子节点 为起点根据用户关系网络传播预设信息,传播时间是预设的时间片断数据。更具体地,可以 判断时间片断数据是否结束,例如,可以获取当前时间与信息开始传播的时间之间的差值, 如果该差值小于预设的时间片断数据,则确定时间片断数据没有结束,否则结束。
[0206] 若时间片断数据没有结束,则可以判断要计算的边在该时间片断数据内是否被激 活,例如,要计算的边是用户A与用户B组成的边,在信息传播时间内,传播的信息经过用户 A和用户B,则可以确定用户A和用户B组成的边在该时间内被激活了,否则未激活。如果 被激活,则采用第一更新规则,对该要计算的边的传播概率进行更新,之后,将每个边更新 后的传播概率写入传播概率更新库。如果未被激活,则返回继续判断时间片断数据是否结 束。
[0207] 若时间片断数据已结束,则采用第二更新规则,对整个时间片断数据内未被激活 的边的传播概率进行更新,之后,将每个边更新后的传播概率写入传播概率更新库。
[0208] 可以理解的是,上述以传播概率学习模型是EM模型为例,传播概率学习模型也可 以是其他模型,例如,马尔科夫模型。
[0209] 确定单元214用于将更新后的用户之间的传播概率确定为所述用户关系网络中 用户与用户之间的传播概率。
[0210] 第二确定子模块220用于将所述传播概率大于预设值的路径确定为传播路径,并 根据所述传播路径传播所述信息,以实现最大的传播速度。
[0211] 本实施例中,通过确定要传播的信息对应的第一用户,第一用户是影响力大于预 设值的用户,并由第一用户为起点进行信息传播,可以由具有较大影响力的用户传播信息, 提高信息传播的可信性,提高信息传播效率。本实施例通过标签传播学习算法可以确定出 第一用户,提高有效性。本实施例通过在传播概率学习模型中引入控制因子,可以提高传播 概率的准确性。本实施例通过设置不同的传播策略,可以实现信息多样性传播。
[0212] 需要说明的是,在本发明的描述中,术语"第一"、"第二"等仅用于描述目的,而不 能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,"多个"的含义 是两个或两个以上。
[0213] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括 一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部 分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺 序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明 的实施例所属技术领域的技术人员所理解。
[0214] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述 实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件 或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下 列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路 的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场 可编程门阵列(FPGA)等。
[0215] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步 骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介 质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0216] 此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以 是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模 块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如 果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机 可读取存储介质中。
[0217] 上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0218] 在本说明书的描述中,参考术语"一个实施例"、"一些实施例"、"示例"、"具体示 例"、或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特 点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不 一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何 的一个或多个实施例或示例中以合适的方式结合。
[0219] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例 性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述 实施例进行变化、修改、替换和变型。
【主权项】
1. 一种信息传播方法,其特征在于,包括: 确定要传播的信息对应的第一用户,所述第一用户是所述第一用户属于的兴趣类型网 络中影响力大于预设值的用户; 获取以所述第一用户为起点的用户关系网络,在所述用户关系网络中以所述第一用户 为起点传播所述信息。2. 根据权利要求1所述的方法,其特征在于,还包括: 建立预设个数的兴趣类型网络,并在每个兴趣类型网络中,确定对应的第一用户; 所述建立预设个数的兴趣类型网络,并在每个兴趣类型网络中,确定对应的第一用户, 包括: 根据标签传播学习算法,获取用户-标签矩阵; 对所述用户-标签矩阵进行聚类,得到预设个数的兴趣类型网络,并获取每个兴趣类 型网络中的第一用户。3. 根据权利要求2所述的方法,其特征在于,所述第一用户的标识信息包括:用户标识 和标签,兴趣类型网络包括标签,所述确定要传播的信息对应的第一用户,包括: 获取第一标签,所述第一标签是所述要传播的信息包括的标签; 将包括所述第一标签的第一用户,确定为所述要传播的信息对应的第一用户。4. 根据权利要求1所述的方法,其特征在于,所述在所述用户关系网络中以所述第一 用户为起点传播所述信息,包括: 根据预设策略,在所述用户关系网络中以所述第一用户为起点传播所述信息,所述预 设策略包括传播范围策略,或者,传播速度策略。5. 根据权利要求4所述的方法,其特征在于,当所述预设策略是传播速度策略时,所述 根据预设策略,在所述用户关系网络中以所述第一用户为起点传播所述信息,包括: 获取所述用户关系网络中用户与用户之间的传播概率; 将所述传播概率大于预设值的路径确定为传播路径,并根据所述传播路径传播所述信 息。6. 根据权利要求5所述的方法,其特征在于,所述获取所述用户关系网络中用户与用 户之间的传播概率,包括: 根据引入传播概率方差控制因子的传播概率学习模型,获取所述用户关系网络中用户 与用户之间的传播概率。7. 根据权利要求6所述的方法,其特征在于,所述根据引入传播概率方差控制因子的 传播概率学习模型,获取所述用户关系网络中用户与用户之间的传播概率,包括: 获取所述用户关系网络,并根据所述用户关系网络和时间片断数据建立信息传播模 型,所述时间片段数据是预设的信息传播扩散时间; 将传播概率方差控制因子引入传播概率学习模型中,得到引入传播概率方差控制因子 的传播概率学习模型,并根据所述引入传播概率方差控制因子的传播概率学习模型,对所 述信息传播模型进行学习,获取传播概率更新规则,所述更新规则包括第一更新规则和第 二更新规则; 采用所述第一更新规则更新第一组用户之间的传播概率,采用所述第二更新规则更新 第二组用户之间的传播概率,所述第一组用户之间的边在所述时间片断数据内被激活,所 述第二组用户之间的边在所述时间片断数据内没有被激活; 将更新后的用户之间的传播概率确定为所述用户关系网络中用户与用户之间的传播 概率。8. -种信息传播装置,其特征在于,包括: 确定模块,用于确定要传播的信息对应的第一用户,所述第一用户是所述第一用户属 于的兴趣类型网络中影响力大于预设值的用户; 传播模块,用于获取以所述第一用户为起点的用户关系网络,在所述用户关系网络中 以所述第一用户为起点传播所述信息。9. 根据权利要求8所述的装置,其特征在于,还包括: 建立模块,用于建立预设个数的兴趣类型网络,并在每个兴趣类型网络中,确定对应的 第一用户; 所述建立模块,包括: 第一获取子模块,用于根据标签传播学习算法,获取用户-标签矩阵; 聚类子模块,用于对所述用户-标签矩阵进行聚类,得到预设个数的兴趣类型网络,并 获取每个兴趣类型网络中的第一用户。10. 根据权利要求9所述的装置,其特征在于,所述第一用户的标识信息包括:用户标 识和标签,兴趣类型网络包括标签,所述确定模块,包括: 第二获取子模块,用于获取第一标签,所述第一标签是所述要传播的信息包括的标 签; 第一确定子模块,用于将包括所述第一标签的第一用户,确定为所述要传播的信息对 应的第一用户。11. 根据权利要求8所述的装置,其特征在于,所述传播模块还用于根据预设策略,在 所述用户关系网络中以所述第一用户为起点传播所述信息,所述预设策略包括传播范围策 略,或者,传播速度策略。12. 根据权利要求11所述的装置,其特征在于,当所述预设策略是传播速度策略时,所 述传播模块,包括: 第三获取子模块,用于获取所述用户关系网络中用户与用户之间的传播概率; 第二确定子模块,用于将所述传播概率大于预设值的路径确定为传播路径,并根据所 述传播路径传播所述信息。13. 根据权利要求12所述的装置,其特征在于,所述第三获取子模块还用于根据引入 传播概率方差控制因子的传播概率学习模型,获取所述用户关系网络中用户与用户之间的 传播概率。14. 根据权利要求13所述的装置,其特征在于,所述第三获取子模块,包括: 获取单元,用于获取所述用户关系网络,并根据所述用户关系网络和时间片断数据建 立信息传播模型,所述时间片段数据是预设的信息传播扩散时间; 建模单元,用于将传播概率方差控制因子引入传播概率学习模型中,得到引入传播概 率方差控制因子的传播概率学习模型,并根据所述引入传播概率方差控制因子的传播概率 学习模型,对所述信息传播模型进行学习,获取传播概率更新规则,所述更新规则包括第一 更新规则和第二更新规则; 更新单元,用于采用所述第一更新规则更新第一组用户之间的传播概率,采用所述第 二更新规则更新第二组用户之间的传播概率,所述第一组用户之间的边在所述时间片断数 据内被激活,所述第二组用户之间的边在所述时间片断数据内没有被激活; 确定单元,用于将更新后的用户之间的传播概率确定为所述用户关系网络中用户与用 户之间的传播概率。
【文档编号】H04L12/58GK105991397SQ201510058167
【公开日】2016年10月5日
【申请日】2015年2月4日
【发明人】李朝, 王志荣
【申请人】阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1