关键受众确定方法、装置及电子设备与流程

文档序号:20188113发布日期:2020-03-27 19:22阅读:254来源:国知局
关键受众确定方法、装置及电子设备与流程
本申请涉及计算机
技术领域
,尤其涉及一种关键受众确定方法、装置及电子设备。
背景技术
:近年来以互联网为基础的社交媒体迅猛发展,人们足不出户就可以实现社交目的。例如,人们可以通过网络社交平台获取、发表、传播言论,并对别人发表或传播的言论做出评论,以表达自己对某一话题或事件的看法和感受。通过网络社交平台参与社交活动的人即为网络社交平台的用户,接收在该网络社交平台传播的某一发文的用户即为该发文的受众。在与某一话题(或事件)相关的某一发文的传播过程中,往往存在这样一些用户,他们具有影响其他用户对该话题的态度的能力,他们的介入,加快了该发文的传播速度并扩大了影响,对该话题的传播起到了引导作用。这些用户可以被称为关键受众(或称为意见领袖)。找出关键受众是网络社交平台为用户提供更好的服务的手段之一。目前,确定关键受众时考虑的因素比较单一,导致确定出的关键受众不够准确,因此亟需改进。技术实现要素:本申请实施例提供了一种关键受众确定方法、装置及电子设备,以提高确定出的关键受众的准确性。为解决上述技术问题,本申请实施例是这样实现的:第一方面,提出了一种关键受众确定方法,所述方法包括:获取目标话题的受众的发文数据和发文传播行为数据;基于所述发文数据和所述发文传播行为数据,构建所述目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定;基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数;基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。第二方面,提出了一种关键受众确定装置,所述装置包括:数据获取模块,用于获取目标话题的受众的发文数据和发文传播行为数据;网络构建模块,用于基于所述发文数据和所述发文传播行为数据,构建所述目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定;参数确定模块,用于基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数;关键受众确定模块,用于基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。第三方面,提出了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:获取目标话题的受众的发文数据和发文传播行为数据;基于所述发文数据和所述发文传播行为数据,构建所述目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定;基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数;基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:获取目标话题的受众的发文数据和发文传播行为数据;基于所述发文数据和所述发文传播行为数据,构建所述目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定;基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数;基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。由以上本申请实施例提供的技术方案可见,本申请实施例提供的方案至少具备如下一种技术效果:由于目标话题的受众的社交网络是基于目标话题的受众的发文数据和发文传播行为数据这两方面的数据确定的,并且在确定目标话题的受众的重要性评估参数时,同时考虑了受众(节点)本身的权重和受众之间的交互关系(边权重),因此,可以提高确定出的目标话题的受众的重要性参数的准确性,从而提高确定出的关键受众的准确性。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本说明书实施例提供的一种关键受众确定方法的流程示意图。图2是本说明书实施例提供的一种社交网络示意图。图3是图1所示的步骤103的一种详细流程示意图。图4是本说明书实施例提供的关键受众确定方法的效果示意图之一。图5是本说明书实施例提供的关键受众确定方法的效果示意图之二。图6是本说明书实施例提供的一种关键受众确定装置的结构示意图。图7是本说明书实施例提供的一种电子设备的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了提高确定出的关键受众的准确性,本说明书实施例提供一种关键受众确定方法、装置及设备,所述方法及装置的执行主体可以是终端设备和服务器中的任一种。如图1所示,本说明书实施例提供了一种关键受众确定方法,包括:步骤101、获取目标话题的受众的发文数据和发文传播行为数据。目标话题(或称目标专题),是某一社交网络平台上待确定关键受众(亦可称为意见领袖)的某一话题。作为一个例子,可以先从所述社交网络平台收集与目标话题相关的详细发文数据(例如微博上与某一话题相关的详细博文数据);然后依据收集的这些详细发文数据,确定目标话题的部分或全部受众;在确定出目标话题的受众之后,再从所述社交网络平台收集目标话题的受众的发文数据和发文传播行为数据。举例来说,假如所述社交网络平台为微博,从该社交网络平台收集的一条详细发文数据可以如下表1所示,这条详细发文数据与目标话题相关,则确定出表1中对博文做出点赞、评论和分享行为的用户id即可确定出目标话题的一部分受众。可以理解,根据收集到的与目标话题相关的所有详细发文数据,即可确定出目标话题的全部受众。进一步地,在确定出目标话题的受众之后,可以根据目标话题的受众id收集到目标话题的受众的全部发文数据和全部发文传播行为数据,下表2示例性地列出了一条发文传播行为数据。表1在一个例子中,目标话题的一个受众的发文数据可以包括但不限于以下数据中的至少一种:该受众的发文数量,该受众收到的评论数量,该受众收到的点赞数量,该受众收到的打赏次数,该受众收到的打赏金额(包括单次打赏金额、最高打赏金额和打赏总额等金额中的至少一种),该受众的发文被收藏的次数,该受众收到的所述目标话题的其他受众分享的发文数量,等等。表2博文id发文传播行为分享时间分享用户id分享用户的昵称4302708846623740分享11-052747934781------婧可以理解,除了表2中的分享(或称转发),发文传播行为包括但不限于点赞、评论、分享(转发)、打赏和收藏等行为,而不仅仅是分享行为(或称转发行为)。相应的,第一受众对第二受众的发文传播行为对应的发文传播行为数据可以包括但不限于以下数据中的至少一种:第一受众向第二受众点赞的次数,第一受众向第二受众评论的次数,第一受众向第二受众分享发文的次数,第一受众向第二受众打赏的次数,第一受众向第二受众打赏的金额,第一受众收藏第二受众的发文的次数,等等。需要说明的是,在本说明书实施例中目标话题的受众为社交网络平台的用户。可选地,在另一个例子中,步骤101具体可以包括:获取目标话题的受众的属性信息、发文数据和发文传播行为数据。其中,受众的属性信息可以包括但不限于该受众的身份、职业、工作领域、职称、获得的荣誉、就职的单位等信息中的至少一种。步骤102、基于所述发文数据和所述发文传播行为数据,构建所述目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定。详细地,在步骤102中,可以先对步骤101中获取的目标话题的受众的发文数据和发文传播行为数据进行预处理,得到两张数据表。其中,一张数据表用于存储反映目标话题的受众本身的基础重要性的数据,表3示出了一条这样的数据;另一张数据表用于存储反映目标话题的不同受众之间的互动关系的数据,表4示出了一条这样的数据。表3用户(受众)名点赞数发文数评论数转发数第一权重头条新闻14918833843451359359810.53表3中用于反映受众本身的基础重要性的第一权重,可以根据受众的发文数据计算得到,如根据受众的发文数量、收到的点赞数量、收到的评论数量、收到的其他受众分享的发文数量加权得到。可以理解,如果在计算目标话题的受众的第一权重时考虑了该受众收到的评论数量、收到的其他受众分享的发文数量,意味着考虑了目标话题的间接受众和潜在受众的影响,使得确定出的第一权重能准确的反映该受众的基础影响力,从而使得最终确定出的关键受众更为准确。表4传播者接收者第二权重xx新闻周刊------婧9.5表4中用于反映传播者(目标话题的一个受众)和接收者(目标话题的另一受众)之间的互动关系的第二权重,可以根据传播者向接收者做出的发文传播行为对应的发文传播行为数据计算得到,如根据传播者向接收者做出的点赞、评论和分享次数等数据加权得到。进一步地,在步骤102中,在确定出如表3和表4所示的数据之后,根据表3中的一条数据可以建立所述社交网络中的一个节点,其中第一权重可以作为建立的节点的权重;根据表4中的一条数据可以建立所述社交网络中的一条有向边,其中第二权重可以作为建立的有向边的权重,最终得到目标话题的受众的社交网络。可选地,在步骤101还获取了目标话题的受众的属性信息之后,第一权重还可以由该节点代表的受众的发文数据和属性信息确定。可以理解,除了受众的发文数据,受众的属性信息(如受众的身份、职业、工作领域、职称、获得的荣誉、就职的单位等信息中的至少一种)也决定了该受众的重要性(或者说影响力)。如图5所示的受众为美国第四十五届总统唐纳德·特朗普(donaldtrump),由于一个国家的总统通常具有非凡的影响力,他本身就是一个意见领袖,因此,在确定该受众的重要性时有必要考虑他的身份等属性信息,使得确定出的权重更能代表该受众的影响力,从而进一步提高最终确定出的关键受众的准确性。如图2所示,在构建得到的目标话题的受众的社交网络中,既可以存在由第一节点指向第二节点的有向边(如节点a指向节点b),也可以存在由第二节点指向第一节点的有向边(如节点b指向节点a)。如果第一节点代表的受众向第二节点代表的受众做出过发文传播行为,则存在第一节点指向第二节点的有向边。如果第二节点代表的受众向第一节点代表的受众做出过发文传播行为,则存在第二节点指向第一节点的有向边。如果第一节点代表的受众向第二节点代表的受众做出过发文传播行为,且第二节点代表的受众向第一节点代表的受众做出过发文传播行为,则既存在第一节点指向第二节点的有向边,也存在第二节点指向第一节点的有向边。在步骤102构建的社交网络中,第一节点向第二节点做出的发文传播行为对应的发文传播行为数据包括以下数据中的至少一种:所述第一受众向所述第二受众点赞的次数,所述第一受众向所述第二受众评论的次数,所述第一受众向所述第二受众分享发文的次数,所述第一受众向所述第二受众打赏的次数,所述第一受众向所述第二受众打赏的金额,所述第一受众收藏所述第二受众的发文的次数,等等。步骤103、基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数。受众的重要性评估参数是用于评价受众的重要性的指标,作为一个例子,重要性评估参数可以是重要性值。关键受众的确定即意见领袖的挖掘。意见领袖挖掘工作的实质是评估社交网络中代表受众的各个节点的重要性,即中心性分析。常用的中心性分析方法包括度中心性分析、紧密度中心性分析、介数中心性分析和特征向量中心性分析。其中,度中心性分析的基本思想是节点的重要性与该节点的数量(度)有关。一个节点的度越大,该节点就显得越重要。其中,紧密度中心性分析认为,相较于非中心节点,一个中心节点能够更快到达社交网络中的其他节点。紧密度中心性分析用于评价一个节点到其他所有节点的紧密程度,一般用节点到社交网络中其他所有节点的平均距离进行度量。其中,介数中心性分析是用节点的介数大小来衡量节点的重要性,节点的介数越大该节点越重要。节点的介数表示社交网络中经过该节点的最短路径的数量。其中,特征向量中心性分析的基本思想是,一个人的重要性取决于其朋友的重要性,其采用的是一种链接投票的策略,即一个节点会将自身的权重根据出度平均分配给邻接节点,直到收敛。基于特征向量中心性分析的思想,作为一个例子,步骤103可以包括:对所述社交网络中的每一第二节点循环执行指定步骤,直到所述社交网络中的节点所代表的受众的重要性评估参数收敛(如受众的重要性评估参数不再变化)。如图3所示,对所述社交网络中的每一第二节点循环执行步骤301至步骤304,在所述社交网络中的节点所代表的受众的重要性评估参数收敛后,执行步骤306。具体的,如图3所示,步骤103可以包括:步骤301、基于所述社交网络中所述第二节点的权重,确定所述第二受众的第一重要性评估参数。具体可以直接将所述第二节点的权重作为所述第二受众的第一重要性评估参数。可以理解,第二受众即所述第二节点所代表的受众。步骤302、确定所述社交网络中目标节点的权重,其中,所述目标节点是通过有向边指向所述第二节点的所述第一节点。也即确定与所述第二节点关联的其他节点,以确定其他受众对所述第二受众的重要性评估参数的影响。步骤303、基于所述目标节点的权重,以及所述目标节点指向所述第二节点的有向边的权重,确定所述目标节点代表的受众传递给所述第二受众的第二重要性评估参数。作为一个例子,可以将目标节点的权重与目标节点指向所述第二节点的有向边的权重的乘积,确定为所述目标节点代表的受众传递给所述第二受众的第二重要性评估参数。步骤304、基于所述第一重要性评估参数和所述第二重要性评估参数,确定所述第二受众的重要性评估参数。作为一个例子,可以将所述第一重要性评估参数与所述第二重要性评估参数之和,确定为所述第二受众的重要性评估参数。步骤305、判断所述社交网络中的节点所代表的受众的重要性评估参数是否收敛,若为否,返回执行步骤301,否则执行步骤306。步骤306、结束。pagerank算法是特征向量中心性分析方法的一种变形,因此,作为另一个例子,上述步骤103可以包括:基于所述社交网络中节点的权重和有向边的权重,以及pagerank算法,确定所述社交网络中的节点所代表的受众的重要性评估参数。pagerank算法采用的是链接投票的策略,即由第一节点vi指向第二节点vj的有向边eij表示第一节点vi向第二节点vj的一次投票,第一节点在向第二节点投票时会将自身的权重按有向边eij的权重分配到第二节点。如图2所示,假如节点a的权重为10,节点b的权重为9,节点c的权重为8,由节点a指向节点b的有向边ab的权重为5,由节点c指向节点b的有向边cb的权重为4,则在一次迭代过程中节点b的重要性评估参数可以表示为:p(b)=10*5+8*4=82。可见,采用pagerank算法计算所述社交网络中的节点所代表的受众的重要性评估参数时,也考虑了与第二节点相关的第一节点的重要性对第二节点的重要性的影响。具体的,在本说明书实施例中,pagerank算法如下式:π(k+1)t=(1-α)et+απ(k)tv其中,π表示所述社交网络中的节点的重要性评估参数p构成的矩阵,π(k)t表示迭代前的所述社交网络中的节点的重要性评估参数p构成的矩阵,π(k+1)t表示迭代后的所述社交网络中的节点的重要性评估参数p构成的矩阵,α是阻尼系数,et表示单位行向量,v表示投票矩阵,v中的元素vij表示所述社交网络中的节点vi给节点vj分配的权重的比例,vij等于由所述第一节点vi指向所述第二节点vj的有向边eij的权重。在具体计算时,可以先删除所述社交网络中的死节点(出度为0的节点),然后反复利用上述pagerank算法的迭代公式计算各节点的重要性评估参数p,直到收敛(也即直到各节点的重要性评估参数不再变化)。由以上两个例子可以看出,步骤103在确定受众的重要性评估参数时,不仅考虑受众本身的重要性,还考虑了与该受众相关的其他受众的重要性对自身的影响,这使得最终确定出的重要性评估参数更能代表该受众的真实影响力,从而使得最后确定出的关键受众更为准确。还需要说明的是,在本说明书实施例中,第一受众的重要性是通过由第一受众指向第二受众的有向边的权重传递给第二受众的。反过来,第二受众的重要性是通过由第二受众指向第一受众的有向边的权重传递给第一受众。这使得第一受众对第二重要的影响程度,与第二受众对第一受众的影响程度可能是不同的,这与真实的社交网络中的情况相符,由此可以使得本说明书实施例提供的方法最终确定出的关键受众更为准确。步骤104、基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。在一个例子中,步骤104可以包括:基于所述目标话题的受众的重要性评估参数,对所述目标话题的受众进行排序;将所述目标话题的受众中排序符合预设条件的至少一个受众,确定为所述目标话题的关键受众。具体的,将所述目标话题的受众中重要性评估参数排在最前的预设数量受众(如前n位受众),确定为所述目标话题的关键受众,表5示出了确定出的一位关键受众(用户名为reldonaldtrump)的相关数据,图4和图5示出了确定出的一位关键受众在社交网络平台的前端的展示效果。表5用户名重要性评估参数关键受众reldonaldtrump11可以理解,目标话题的受众的重要性评估参数,可以反映受众在目标话题的传播过程中的影响力,因此,如图4所示重要性评估参数也可以称为影响力指数41。可选地,如图5所示,本说明书实施例提供的方法,还可以在社交网络平台的前端展示意见领袖标识51和/或“意见领袖52”字样,以表示该受众为关键受众。此外,如图5所示,本说明书实施例提供的方法,还可以在社交网络平台的前端展示该受众的属性信息,如“第45届美国总统”;或者,还可以展示该受众的发文数据,如“博文4.0w”,以及展示“受关注用户数”、“粉丝数”、“受关注数”等发文数据和发文传播行为数据,以直观地展现意见领袖具备什么样的特征。可选地,在确定出关键受众之后,还可以进一步地对确定出的关键受众是否准确的效果进行评估。具体的,可以根据覆盖率、核心率甚至人工评价等方式来评估。其中,覆盖度是从用户交互形成的社交网络的角度出发,计算n个关键受众单步传播能覆盖的受众人数占目标话题的所有受众的比例,一般而言,如果所述预设数量受众传播的信息所覆盖的受众,在所述目标话题的受众中所占的比例超过第一预设比例(如80%),则认为利用本发明实施例提供的关键受众确定方法确定出的关键受众是准确的,具备作为意见领袖的能力,确定效果好。其中,核心率也是从用户交互的角度,计算关键受众与目标话题的其他受众交互的信息量占目标话题的总信息量的比例,一般而言,如果所述预设数量受众与所述目标话题的其余受众交互的信息量,在所述目标话题的总信息量中所占的比例超过第二预设比例(如85%),则认为利用本发明实施例提供的关键受众确定方法确定出的关键受众是准确的,具备作为意见领袖的能力,确定效果好。其中,人工评价是指通过人为分析关键受众的相关特征来判断确定出的关键受众是否是意见领袖的评价方法。总之,本说明书实施例提供的一种关键受众确定方法,由于目标话题的受众的社交网络是基于目标话题的受众的发文数据和发文传播行为数据这两方面的数据确定的,并且在确定目标话题的受众的重要性评估参数时,同时考虑了受众(节点)本身的权重和受众之间的交互关系(有向边及其权重),因此,可以提高确定出的目标话题的受众的重要性参数的准确性,从而提高确定出的关键受众的准确性,确定出的关键受众具备意见领袖的能力,确定效果好。以上是对本说明书提供一种关键受众确定方法和系统的说明,下面对本说明书提供的关键受众确定装置进行介绍。下面对本说明书提供的关键受众确定装置进行说明。如图6所示,本说明书的一个实施例提供了一种关键受众确定装置,在一种软件实施方式中,该关键受众确定装置600可包括:数据获取模块601、网络构建模块602、参数确定模块603、关键受众确定模块604。数据获取模块601,用于获取目标话题的受众的发文数据和发文传播行为数据。目标话题(或称目标专题),是某一社交网络平台上待确定关键受众(亦可称为意见领袖)的某一话题。作为一个例子,数据获取模块601可以先从所述社交网络平台收集与目标话题相关的详细发文数据(例如微博上与某一话题相关的详细博文数据);然后依据收集的这些详细发文数据,确定目标话题的部分或全部受众;在确定出目标话题的受众之后,再从所述社交网络平台收集目标话题的受众的发文数据和发文传播行为数据。在一个例子中,目标话题的一个受众的发文数据可以包括但不限于以下数据中的至少一种:该受众的发文数量,该受众收到的评论数量,该受众收到的点赞数量,该受众收到的打赏次数,该受众收到的打赏金额(包括单次打赏金额、最高打赏金额和打赏总额等金额中的至少一种),该受众的发文被收藏的次数,该受众收到的所述目标话题的其他受众分享的发文数量,等等。作为另一个例子,目标话题的一个受众(称为第一受众)相对于另一受众(称为第二受众)的发文传播行为对应的发文传播行为数据可以包括但不限于以下数据红的至少一种:第一受众向第二受众点赞的次数,第一受众向第二受众评论的次数,第一受众向第二受众分享发文的次数,第一受众向第二受众打赏的次数,第一受众向第二受众打赏的金额,第一受众收藏第二受众的发文的次数,等等。网络构建模块602,用于基于所述发文数据和所述发文传播行为数据,构建所述目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定。详细地,网络构建模块602可用于:先对数据获取模块601获取的目标话题的受众的发文数据和发文传播行为数据进行预处理,得到两张数据表。其中,一张数据表用于存储反映目标话题的受众本身的基础重要性的数据,上表3示出了一条这样的数据,具体参见上表3;另一张数据表用于存储反映目标话题的不同受众之间的互动关系的数据,上表4示出了一条这样的数据,具体参见上表4。详细地,在网络构建模块602构建的社交网络中,第一节点向第二节点做出的发文传播行为对应的发文传播行为数据包括以下数据中的至少一种:所述第一受众向所述第二受众点赞的次数,所述第一受众向所述第二受众评论的次数,所述第一受众向所述第二受众分享发文的次数,所述第一受众向所述第二受众打赏的次数,所述第一受众向所述第二受众打赏的金额,所述第一受众收藏所述第二受众的发文的次数,等等。参数确定模块603,用于基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数。受众的重要性评估参数是用于评价受众的重要性的指标,作为一个例子,重要性评估参数可以是重要性值。关键受众的确定即意见领袖的挖掘。意见领袖挖掘工作的实质是评估社交网络中代表受众的各个节点的重要性,即中心性分析。常用的中心性分析方法包括度中心性分析、紧密度中心性分析、介数中心性分析和特征向量中心性分析。作为一个例子,参数确定模块603可用于:基于所述社交网络中节点的权重和有向边的权重,以及pagerank算法,确定所述社交网络中的节点所表示的受众的重要性评估参数。pagerank算法采用的是链接投票的策略,即由第一节点vi指向第二节点vj的有向边eij表示第一节点vi向第二节点vj的一次投票,第一节点在向第二节点投票时会将自身的权重按有向边eij的权重分配到第二节点。如图2所示,假如节点a的权重为10,节点b的权重为9,节点c的权重为8,由节点a指向节点b的有向边ab的权重为5,由节点c指向节点b的有向边cb的权重为4,则在一次迭代过程中节点b的重要性评估参数可以表示为:p(b)=10*5+8*4=82。具体的,在本说明书实施例中,pagerank算法如下式:π(k+1)t=(1-α)et+απ(k)tv其中,π表示所述社交网络中的节点的重要性评估参数p构成的矩阵,π(k)t表示迭代前的所述社交网络中的节点的重要性评估参数p构成的矩阵,π(k+1)t表示迭代后的所述社交网络中的节点的重要性评估参数p构成的矩阵,α是阻尼系数,et表示单位行向量,v表示投票矩阵,v中的元素vij表示所述社交网络中的节点vi给节点vj分配的权重的比例,vij等于由所述第一节点vi指向所述第二节点vj的有向边eij的权重。在具体计算时,可以先删除所述社交网络中的死节点(出度为0的节点),然后反复利用上述pagerank算法的迭代公式计算各节点的重要性评估参数p,直到收敛(也即直到各节点的重要性评估参数不再变化)。关键受众确定模块604,用于基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。在一个例子中,关键受众确定模块604可用于:基于所述目标话题的受众的重要性评估参数,对所述目标话题的受众进行排序;将所述目标话题的受众中排序符合预设条件的至少一个受众,确定为所述目标话题的关键受众。具体的,将所述目标话题的受众中重要性评估参数排在最前的预设数量受众(如前n位受众),确定为所述目标话题的关键受众。可选地,在确定出关键受众之后,还可以进一步地对确定出的关键受众是否准确的效果进行评估。具体的,可以根据覆盖率、核心率甚至人工评价等方式来评估。其中,覆盖度是从用户交互形成的社交网络的角度出发,计算n个关键受众单步传播能覆盖的受众人数占目标话题的所有受众的比例,一般而言,如果所述预设数量受众传播的信息所覆盖的受众,在所述目标话题的受众中所占的比例超过第一预设比例(如80%),则认为利用本发明实施例提供的关键受众确定方法确定出的关键受众是准确的,具备作为意见领袖的能力,确定效果好。其中,核心率也是从用户交互的角度,计算关键受众与目标话题的其他受众交互的信息量占目标话题的总信息量的比例,一般而言,如果所述预设数量受众与所述目标话题的其余受众交互的信息量,在所述目标话题的总信息量中所占的比例超过第二预设比例(如85%),则认为利用本发明实施例提供的关键受众确定方法确定出的关键受众是准确的,具备作为意见领袖的能力,确定效果好。其中,人工评价是指通过人为分析关键受众的相关特征来判断确定出的关键受众是否是意见领袖的评价方法。总之,本说明书实施例提供的一种关键受众确定装置,由于目标话题的受众的社交网络是基于目标话题的受众的发文数据和发文传播行为数据这两方面的数据确定的,并且在确定目标话题的受众的重要性评估参数时,同时考虑了受众(节点)本身的权重和受众之间的交互关系(边权重),因此,可以提高确定出的目标话题的受众的重要性参数的准确性,从而提高确定出的关键受众的准确性,确定出的关键受众具备意见领袖的能力,确定效果好。需要说明的是,关键受众确定装置600能够实现图1的方法实施例的方法,具体可参考图1所示实施例的关键受众确定方法,不再赘述。图7是本说明书的一个实施例提供的电子设备的结构示意图。请参考图7,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-accessmemory,ram),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industrystandardarchitecture,工业标准体系结构)总线、pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成关键受众确定装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:获取目标话题的受众的发文数据和发文传播行为数据;基于所述发文数据和所述发文传播行为数据,构建所述目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定;基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数;基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。上述如本说明书图1所示实施例揭示的关键受众确定方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。该电子设备还可执行图1的关键受众确定方法,本说明书在此不再赘述。当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图6所示实施例的方法,并具体用于执行以下操作:获取目标话题的受众的发文数据和发文传播行为数据;基于所述发文数据和所述发文传播行为数据,构建所述目标话题的受众的社交网络,其中,所述社交网络的节点用于表示受众,所述节点的权重由所述节点代表的受众的发文数据确定,所述社交网络中第一节点到第二节点的有向边用于表示第一受众对第二受众的发文传播行为,所述有向边的权重由所述发文传播行为对应的发文传播行为数据确定;基于所述社交网络中节点的权重和有向边的权重,确定所述社交网络中的节点所代表的受众的重要性评估参数;基于所述目标话题的受众的重要性评估参数,确定所述目标话题的关键受众。上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制时,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1