用于基于扩散仿真的社交网络服务策略的方法和设备的制造方法_3

文档序号:9204272阅读:来源:国知局
户属性的相似性)来计算权重。因此,不同项目转换成按照种子用户群组的不同扩散概率和结果。例如,在在线和离线社交网络种子用户群组之间(其中项目包括针对离线情况的“可访问性的不同”),种子用户群组可以只包括可以容易地离线在互联网上冲浪的用户。这些用户可以包括那些可以参与离线浏览的用户。
[0061]在一个实施例中,通过将基于矩阵的社交扩散仿真包括在内,控制器301和启发式模块303可以仿真在不同的种子用户群组当中的扩散过程。如之前所讨论的,基于矩阵的社交扩散仿真只是启发式模块303可采用的一个示例方法。在一个实施例中,每个用户可以表示社交扩散中的一个节点,其中,节点“激活”指用户设备分享和/或传输给定的内容项目。例如,控制器301和启发式模块303可以确定节点以概率p(u,V) (S卩,边权)影响邻近节点。此概率可以被称为两个节点之间的被激活状态或两个节点之间传输的内容项目的“转变概率(transit1n probability) ”。在一个实施例中,控制器301和启发式模块303然后可以用随机漫步法将社交网络结构的概率邻接矩阵与概率转变矩阵相链接。例如,一个用随机漫步模型的社交扩散仿真可以包括以矩阵形式的迭代公式,如下:
[0062]P' = (Mt), P' +(MtB)'
[0063]在此,在N维中(其中,N表示节点数量),矢量P表示每个节点的激活概率,使得N*N维的矩阵M表示概率邻接矩阵,而N维的矢量B表示每个节点的初始状态。例如,如果节点i是节点用户Iv则矢量B的第i个元素将为1,否则为O。因为一个节点通常只与几个邻居节点连接,所以邻接矩阵M可以是稀疏的。在一个实施例中,某种形式的稀疏矩阵存储可以被用于节省存储器。
[0064]随机漫步法可以是扩散过程的一种示例性仿真(通过采取社交影响的基本假设),其中,每一步骤中的节点激活涉及两个因素:1)来自邻居节点的影响和2)在最后一步中的邻居的状态(其中,只有激活的邻居可以影响其他节点)。此外,来自不同源的影响可以是独立的,并且每个节点只能被激活一次。例如,假设概率P以及每个节点N的激活之间的独立性,所有节点N将被激活的概率是概率!1 N(Ι-p)。这种转换意味着节点越多,激活就越可能会发生,因为节点N的集合的激活概率可以是1- TIn(1-P)。然而,对于每个节点,影响概率可以考虑到节点自身的激活概率以及该节点和其他节点之间的关系。这可以根据下式来建模:
[0065]pv(t) = 1- Π ue N(v) (l_puv*pu(t-1))
[0066]在此,pv(t)可以是步骤t中的点V的激活概率(或边权),其中,pu#从节点u(v的邻居)对节点V的影响概率。
[0067]在一个实施例中,节点之间的相互影响概率可以是1%或比1%更低,因此控制器301和启发式模块303可以取puv〈〈l,上述公式近似为:
[0068]Pv(t) = 1-(1- Σ ueN(v)Puv*Pu(t-l))
[0069]=Σ ueN(v)puv*pu(t_l),
[0070](这是因为,例如如果针对节点a和b的概率远小于1%(如a,b,〈〈l),(1-a) (l_b)可以近似为1-(8+13),允许%〈〈1,Π (1-Bi)将用1- Σ %来近似。然后,所述公式是迭代的并且,如从之前讨论的概率邻接矩阵所变换的,类似随机漫步概率转变矩阵。因此,随机漫步可以是针对某些扩散过程仿真的合适模型。
[0071]例如,随机漫步可以近似于这样的扩散过程,其中条件满足:
[0072]V e V,XueN(v)Puv< I
[0073]考虑到规则化并且计算出的相互影响并不妨碍个体用户不遵循所述影响,在一个或多个扩散过程仿真中,估计Puv〈l可以是现实的。因此,随机漫步是供控制器301和启发式模型303使用的一个可能模型。
[0074]在一个实施例中,控制器301和阈值模块305可以确定针对不同用户和内容项目的阈值激活概率。此类激活概率可以基于历史扩散、平均激活概率、理想激活概率或它们的结合。例如,流行音乐家可以为该音乐家的新歌的扩散仿真分配高阈值激活概率,因为该音乐家可能期望很可能分享该歌曲。然而,新的艺术家可以容忍低得多的阈值,因为预期分享很少。
[0075]在一个实施例中,控制器301和概率模块307可以计算矢量P,即,每个节点的激活概率。在一个实施例中,概率模块307可以将启发式模块303的公式变换为线性等式问题,例如:
[0076][1-(Mt) ' ]P' = (MtB)'
[0077]在此,I可以是单位矩阵。在线性等式问题的情况下可以使用迭代法,包括高斯-赛德尔(Gauss-Seidel)迭代法或雅克比(Jacobi)迭代法。因为该矩阵的在M中每一行中的元素(除了对角线中的元素)的绝对值之和小于I (即,每一行之和小于对角线中的元素)的条件,可以保证迭代的收敛特性。对于大规模的社交网络,其中这类等式可以涉及维数灾难(由高玮度数据导致的困难),并行计算技术能提高效率。并行计算技术能保证某个范围内的较高速度(考虑到社交网络的规模、所需数据更新的相互通信,或其结合)。
[0078]在又一个实施例中,为了控制不合理的相互影响,控制器301和概率模块307可以限制每个节点的迭代步骤。在此,“步”可以指存在于针对要在两个节点之间被分享的给定内容项目的路径中的节点。例如,如果内容项目被直接在节点i和节点ii之间分享,则可以存在一“步”。然而,如果内容项目在其与节点ii分享之前从节点i移动到节点iii以及到节点iv,则该内容项目在从节点i到达节点ii之前用了四步。
[0079]在一种情况下,一旦概率模块307确定节点根本已被激活,激活概率就可能没有意义,因为一个节点不会被激活更多次。对于这样的情况,即使邻居节点受到其影响,控制器301也可以停止激活概率的迭代。控制器301可以采用多种方法来确定用以停止迭代的恰当步骤是可能的。例如,最大影响路径(MIP)方法是合适的,因为它表示用最高概率激活一个节点的理论轨迹。另一种可能的方法是用于示出激活一个节点必需的最短步骤的最短路径方法。这些只是找到限制迭代的步骤的一些示例性方法。
[0080]在又一个实施例中,控制器301可以选择一种“路径长度”,其中,计算点的所有Step(v),其中,节点V被设置为在Step(v)步之后停止其迭代。这意味着在Step(V)之后,P (v)将不会改变,尽管它对其他节点有影响。这种方法可以限制来自不合理的相互影响的结构性无意义。因为社交影响过程是一个随机过程,所以任何具有稳定约束的“路径长度”规则可能是不现实的。为了包括一些波动,阈值模块305例如可以将阈值定义为Step (V)+-t,其中t是小整数。如前面提到的,这种方法只是控制器301可以使用的许多可能仿真模型中的一个例子。
[0081]在确定阈值激活概率和种子用户的激活概率之后,控制器301和选择模块309可以确定激活概率超过阈值的一个或多个种子用户和一个或多个种子用户群组。在一个实施例中,控制器301和选择模块309可以例如根据最大到最小激活概率来组织种子用户。在另一个实施例中,控制器301和选择模块309可以简单地识别出激活概率超过阈值的种子用户。控制器301和启发式模块303可以仿真来自不同用户节点的扩散以选择种子用户来发送媒体项目。在一个实施例中,被选择的种子用户可以是显示出最可能分享内容项目的用户节点。
[0082]图3B是根据一个实施例的采用者平台207的组件的示图。举例来说,采用者平台207包括用于确定分发到由仿真平台205确定的种子用户和种子用户群组的内容项目的一个或多个组件。可以设想,这些组件的功能可以被结合在一个或多个组件中或者可以由等效功能的其他组件来执行。在此实施例中,采用者平台207包括控制器311、用户属性模块313、内容属性模块315、分类模块317和嵌入模块319。例如,控制器311可以从种子用户平台203、仿真平台205和监视平台209接收信息。在一个实施例中,控制器311可以与用户属性模块313—起工作来确定由仿真平台205得到的种子用户的用户属性(包括由简档平台103潜在地提供的用户简档和用户偏好信息)。如先前讨论的,与用户相关联的用户属性包括简档和/或偏好信息。例如,控制器311和用户属性模块313可以确定来自仿真平台205的一个或多个种子用户具有就读已知有特殊体育队的大学的简档信息和喜欢运动的偏好信息。
[0083]在一个实施例中,控制器311和内容属性模块315又可以确定与由内容提供商109、广告提供商111或其结合提供的各种内容项目相关联的属性。例如,内容提供商109和广告提供商111可以存储、访问和/或提供内容项目以及对应用户属性的内容项目属性。在一个实施例中,控制器311和内容项目模块315可以提取与内容项目相关联的内容项目属性。例如,广告内容项目可以包括描述该内容项目的内容项目属性。例如,显示了著名篮球运动员的运动鞋商业内容项目可以与包括“鞋”、“篮球”的属性、与此运动相关联的篮球队,或其结合相关联。
[0084]然后,控制器311和分类模块317可以针对内容项目属性对种子用户属性进行分类,以基于种子用户属性来选择一个或多个用于媒体分发的内容项目。例如,控制器311和分类模块317可以选择具有与所确定的一个或多个种子用户相类似或相关联的属性的内容项目。一个这种情况可以包括控制器311和分类模块317可以为具有指出对体育亲和力强的属性的一个或多个种子用户选择运动饮料商。在又一个实施例中,控制器311和分类模块317还可以至少部分地促使所选择的一个或多个内容项目与一个或多个其他内容项目之间的关联。在一个实施例中,一个或多个内容项目可以包括广告。例如,控制器311和嵌入模块319可以选择电视节目作为用于分发的内容项目,但是控制器311和嵌入模块319也可以选择电视节目内容项目和这样的广告,所述广告具有与所述电视节目和所分析的种子用户属性相匹配的属性以便分发到所述种子用户。
[0085]图3C是根据一个实施例的监视平台209的组件的框图。在媒体分发之后,扩散过程不再可控。然而,在一个实施例中,系统100和分发处理器107可以包括监视平台209来定义何时及如何监视扩散过程以确保分发质量并解决发布后的问题。在一个实施例中,系统100能够提取最初几个分享步骤。然而,因为许多节点可能存在于社交网络中,后续扩散可能随着越来越多的用户被激活而变得困难。在另一个实施例中,系统100可以通过监视关键节点或核心节点来监视扩散。然后,监视核心节点被视作整个社交网络的扩散表示。在一个实施例中,如果核心节点没有在特定阈值内激活,则监视平台209可以启动对种子用户和/或种子用户群组的改变。一个示例性的阈值可以基于时间,包括监视在激活发生之前的时间。对种子用户和/或种子用户群组做出的改变可以包括选择添加到扩散中的可以增强内容项目扩散的种子用户。
[0086]举例来说,监视平台209包括用于在发布媒体分发之后监视和调节内容项目扩散过程的一个或多个组件。可以设想,这些组件的功能可以被结合到一个或多个组件中,或者可以由具有等效功能的其他组件来执行。在此实施例中,监视平台209包括控制器321、核心模块323、长度模块325、激活模块327和更新模块329。例如,控制器321可以从种子用户平台203、仿真平台205和采用者平台207接收信息。
[0087]在一个实施例中,控制器321可以与核心模块323 —起工作来确定一个或多个种子用户群组内待监视的一个或多个节点。控制器321和核心模块323可以使用的方法例如可以包括搜索引擎中的网页排序方案。例如,类似于页面排序的方法可用于缩放预测扩散轨迹中每个节点的重要性或显著性。通过此缩放,控制器321可以选择具有高显著性的节点作为核心节点。监视平台209可以在发布媒体分发之前识别核心节点。在一个实施例中,监视平台209然后可以只监视核心节点。在这样的实施例中,可以忽略其他节点,无论它们是否被激活,使得它们的激活不影响监视平台209观察到的扩散结果。
[0088]在一个实施例中,控制器321和长度模块325可以确定阈值以确定什么时候开始调整扩散过程。在一个实施例中,长度模块325可以在给定节点被激活之前,根据从一个节点到下一个节点的分享的每一步或过程的长度来确定阈值。换言之,基于之前讨论的图论,阈值可以涉及节点是否以及何时将被激活。例如,图论方法可用于计算节点之间的最长扩散长度。备选地,所述方法可用于计算节点之间的平均扩散长度。换言之,控制器301和阈值模块305可以基于历史扩散给出的平均时间为节点之间的每一步设置阈值。分享时间间隔可以包括时间衰减、损害影响。例如,节点的潜在影响通常随时间降低,因为假设节点已经尝试行使其影响。此类监视的一种可能情况可以包括控制器301和阈值模块305计算从开始节点到给定节点花了五步,并且假设对于每一步来说三十分钟是等效的。然后,如果节点甚至在两个半小时之后还未激活,则控制器321可以启动一些补救措施来改善扩散。
[0089]在一个实施例中,控制器321和激活模块327工作来确定核心节点是否在阈值长度内被激活。如果控制器321和激活模块327确定核心节点经过了阈值长度才被激活,则控制器321可以使更新模块329开始改变种子用户分组。在一个实施例中,控制器321和更新模块320可以使种子用户平台203向种子用户群组中添加种子用户。在一个实施例中,控制器321和更新模块329可以确定许多节点已经被激活,因此初始的预发布种子用户选择可能不再相关。在一个涉及离线社交网络的实施例中,控制器321和更新模块329可以通过修改社交网络来回到初始预发布种子用户选择分析。例如,控制器321可以将最近激活的一些节点保留为种子用户,因为它们仍有可能影响它们的邻居(而长激活的节点可能已经施加了它们的大多数(如果不是全部)影响)。在一个实施例中,如果假设长时间激活的节点代表的影响已经耗尽,则控制器321可以忽视这些节点。在一个实施例中,控制器321然后可以获得具有一些初始种子用户的整个社交网络的子图,并且使用该子图来运行相同的算法或仿真
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1