特定用户群体的管理方法及管理系统与流程

文档序号:15686456发布日期:2018-10-16 21:06阅读:219来源:国知局

本发明涉及数据处理技术领域,具体而言,涉及特定用户群体的管理方法和特定用户群体的管理系统。



背景技术:

目前,随着互联网的急速发展,越来越多的人倾向于在网络中获取资讯、发表观点等,各类社交活动都已经开始向互联网迁移。而社交媒体作为互联网社交的重要组成部分,越来越多的人选择在社交媒体中设立账号、发布信息。由于社交媒体用户基数的庞大和互联网的迅捷,其内容扩展的速度与广度都远远高于传统媒体,使得社交媒体上传播的信息极有可能快速而强烈地威胁到社会公共安全。因此对社交媒体进行长时间的追踪是十分必要的,但是社交媒体用户数量过于庞大且不活跃用户占据主流,对全部用户进行实时追踪是十分浪费资源且不现实的处理方式,故根据种子用户使用社交媒体的特点快速扩展并筛选出值得进行追踪观察的用户群体是十分重要的。

现有的用户评价体系一般只基于某些特定的指标评定用户优先级,无法全局综合性地评价用户价值,且也很难人工对结果进行干预,无法突出重点用户,并且需要大量采集用户信息后才能对用户进行评价。



技术实现要素:

本发明正是基于上述技术问题,提出了一种新的技术方案,基于社交媒体的用户行为特征分析对待筛选用户群体中的每个用户进行综合评价,并根据评价结果进行剪枝,实现对特定用户群体快速准确地扩展筛选,提高扩展速度,且便于准确地、有方向性地进行舆情追踪。

有鉴于此,本发明的第一方面,提出了一种特定用户群体的管理方法,包括:获取待筛选用户群体中每个用户的社交基本信息;根据所述社交基本信息分析确定所述每个用户的多个用户评价参数值;将所述多个用户评价参数值进行加权计算确定所述每个用户的综合评价值;根据所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中。

在该技术方案中,通过对社交媒体中的待筛选用户群体中的每个用户的社交基本信息进行分析,从而确定每个用户的用于评价其媒体账号的综合评价值的多个用户评价参数值,具体通过对该多个用户评价参数值进行加权计算确定该综合评价值,以根据该综合评价值确定是否将该每个用户自待筛选用户群体转移至特定用户群体,通过对待筛选用户群体进行综合评价及剪枝实现对特定用户群体的快速而准确地扩展筛选,从而提高特定用户群体的扩展速度,以对特定用户群体进行舆情追踪,避免对社交媒体中过多用户进行实时追踪的资源浪费,同时能够掌控社交媒体的信息传播主流动态,即特定用户群体是指在社交媒体中需要对其进行舆情追踪的用户群体。

在上述技术方案中,优选地,所述根据所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中的步骤,包括:根据所述综合评价值和阈值计算公式确定所述每个用户的评价阈值;判断所述评价阈值是否大于或等于预设阈值;若是,则将所述每个用户自所述待筛选用户群体移至所述特定用户群体中,否则将所述每个用户保留在所述待筛选用户群体中。

在该技术方案中,具体可以根据阈值计算公式和每个用户的综合评价值确定每个用户的评价阈值,进而根据该评价阈值与预设阈值的大小比较结果确定是否将每个用户自待筛选用户群体移至特定用户群体中,若该评价阈值大于或等于预设阈值则对特定用户群体进行扩展,否则将该用户继续保留在待筛选用户群体中,避免增加舆情追踪的工作量,提高舆情追踪的有效价值。

在上述任一技术方案中,优选地,所述阈值计算公式为:其中,t代表所述评价阈值,代表所述综合评价值的算术平均值,d(s)代表所述综合评价值的方差,a和b为常数。

在该技术方案中,通过获取每个用户的多组综合评价值,并基于该多组综合评价值的算术平均值和方差值计算其评价阈值,以确保计算结果的准确性和稳定性,其中,a和b为可调节的常数,用于调整评价阈值使其适用于定向程度具有不同需求的采集环境,使得计算结果更加符合用户需求。

在上述任一技术方案中,优选地,所述多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,所述相似性评价值是指所述每个用户与所述特定用户群体的特征相似度值;以及采用如下公式加权计算所述综合评价值:s=am+bn+cp+dq,其中,s代表所述综合评价值,m代表所述相似性评价值,n代表所述言论评价值,p代表所述注册信息评价值,q代表所述影响力评价值,以及a、b、c和d为常数,且a+b+c+d=1。

在该技术方案中,具体可以通过对待筛选用户群体中的每个用户的社交基本信息分析确定其至少包括相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,言论评价值、注册信息评价值和影响力评价值是分别对每个用户最近发表的言论、注册社交媒体账号时填写的信息以及每个用户的舆情影响力的评价值,而相似性评价值用于表征每个用户与特定用户群体中已有用户的相似程度,从而结合多个方面对用户的舆情追踪价值进行综合评价;进一步地,可以基于上述公式对每个用户的综合评价值进行准确的加权计算。

在上述任一技术方案中,优选地,所述社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及所述根据所述社交基本信息分析确定所述每个用户的多个用户评价参数值的步骤包括:根据所述用户发帖内容信息分析确定所述相似性评价值;根据所述用户发帖数量和所述用户发帖内容信息分析确定所述言论评价值;根据所述用户注册信息完整度和所述用户基本注册信息分析确定所述注册信息评价值;根据所述用户发帖评论数、所述用户发帖转发数和所述用户发帖点赞数分析确定所述影响力评价值。

在该技术方案中,用于评估待筛选用户群体中的每个用户的各个用户评价参数值的社交基本信息至少可以包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息,具体地可以基于用户发帖内容信息分析确定对应用户与特定用户群体的相似性评价值,根据用户发帖数量和用户发帖内容信息分析确定对应用户的言论评价值,根据用户注册信息完整度和用户基本注册信息分析确定对应用户的注册信息评价值,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定对应用户的影响力评价值;当然,用户的社交基本信息还可以包括其用户自我介绍信息、社交媒体账号的用户关注者数量和被用户关注者数量等,比如,在分析确定用户的相似性评价值时可以综合考虑用户自我介绍信息,在分析确定用户的言论评价值时可以综合考虑用户发帖的原创比,以及在分析确定用户的影响力评价值可以综合考虑用户关注者数量和被用户关注者数量,以使评价结果更加准确、更具有说服力。

根据本发明的第二方面,提出了一种特定用户群体的管理系统,包括:获取模块,用于获取待筛选用户群体中每个用户的社交基本信息;分析模块,用于根据所述获取模块获取的所述社交基本信息分析确定所述每个用户的多个用户评价参数值;计算模块,用于将所述分析模块确定的所述多个用户评价参数值进行加权计算确定所述每个用户的综合评价值;处理模块,用于根据所述计算模块得到的所述综合评价值确定是否将所述每个用户自所述待筛选用户群体移至特定用户群体中。

在该技术方案中,通过对社交媒体中的待筛选用户群体中的每个用户的社交基本信息进行分析,从而确定每个用户的用于评价其媒体账号的综合评价值的多个用户评价参数值,具体通过对该多个用户评价参数值进行加权计算确定该综合评价值,以根据该综合评价值确定是否将该每个用户自待筛选用户群体转移至特定用户群体,通过对待筛选用户群体进行综合评价及剪枝实现对特定用户群体的快速而准确地扩展筛选,从而提高特定用户群体的扩展速度,以对特定用户群体进行舆情追踪,避免对社交媒体中过多用户进行实时追踪的资源浪费,同时能够掌控社交媒体的信息传播主流动态,即特定用户群体是指在社交媒体中需要对其进行舆情追踪的用户群体。

在上述技术方案中,优选地,所述处理模块具体包括:确定子模块,用于根据所述综合评价值和阈值计算公式确定所述每个用户的评价阈值;判断子模块,用于判断所述评价阈值是否大于或等于预设阈值;处理子模块,用于在所述判断子模块判定为是时,将所述每个用户自所述待筛选用户群体移至所述特定用户群体中,否则将所述每个用户保留在所述待筛选用户群体中。

在该技术方案中,具体可以根据阈值计算公式和每个用户的综合评价值确定每个用户的评价阈值,进而根据该评价阈值与预设阈值的大小比较结果确定是否将每个用户自待筛选用户群体移至特定用户群体中,若该评价阈值大于或等于预设阈值则对特定用户群体进行扩展,否则将该用户继续保留在待筛选用户群体中,避免增加舆情追踪的工作量,提高舆情追踪的有效价值。

在上述任一技术方案中,优选地,所述确定子模块用于确定所述评价阈值的所述阈值计算公式为:其中,t代表所述评价阈值,代表所述综合评价值的算术平均值,d(s)代表所述综合评价值的方差,a和b为常数。

在该技术方案中,通过获取每个用户的多组综合评价值,并基于该多组综合评价值的算术平均值和方差值计算其评价阈值,以确保计算结果的准确性和稳定性,其中,a和b为可调节的常数,用于调整评价阈值使其适用于定向程度具有不同需求的采集环境,使得计算结果更加符合用户需求。

在上述任一技术方案中,优选地,所述多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,所述相似性评价值是指所述每个用户与所述特定用户群体的特征相似度值;以及所述计算模块采用如下公式加权计算所述综合评价值:s=am+bn+cp+dq,其中,s代表所述综合评价值,m代表所述相似性评价值,n代表所述言论评价值,p代表所述注册信息评价值,q代表所述影响力评价值,以及a、b、c和d为常数,且a+b+c+d=1。

在该技术方案中,具体可以通过对待筛选用户群体中的每个用户的社交基本信息分析确定其至少包括相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,言论评价值、注册信息评价值和影响力评价值是分别对每个用户最近发表的言论、注册社交媒体账号时填写的信息以及每个用户的舆情影响力的评价值,而相似性评价值用于表征每个用户与特定用户群体中已有用户的相似程度,从而结合多个方面对用户的舆情追踪价值进行综合评价;进一步地,可以基于上述公式对每个用户的综合评价值进行准确的加权计算。

在上述任一技术方案中,优选地,所述社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及所述分析模块具体用于:根据所述用户发帖内容信息分析确定所述相似性评价值;根据所述用户发帖数量和所述用户发帖内容信息分析确定所述言论评价值;根据所述用户注册信息完整度和所述用户基本注册信息分析确定所述注册信息评价值;根据所述用户发帖评论数、所述用户发帖转发数和所述用户发帖点赞数分析确定所述影响力评价值。

在该技术方案中,用于评估待筛选用户群体中的每个用户的各个用户评价参数值的社交基本信息至少可以包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息,具体地可以基于用户发帖内容信息分析确定对应用户与特定用户群体的相似性评价值,根据用户发帖数量和用户发帖内容信息分析确定对应用户的言论评价值,根据用户注册信息完整度和用户基本注册信息分析确定对应用户的注册信息评价值,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定对应用户的影响力评价值;当然,用户的社交基本信息还可以包括其用户自我介绍信息、社交媒体账号的用户关注者数量和被用户关注者数量等,比如,在分析确定用户的相似性评价值时可以综合考虑用户自我介绍信息,在分析确定用户的言论评价值时可以综合考虑用户发帖的原创比,以及在分析确定用户的影响力评价值可以综合考虑用户关注者数量和被用户关注者数量,以使评价结果更加准确、更具有说服力。

通过本发明的上述技术方案,基于社交媒体的用户行为特征分析对待筛选用户群体中的每个用户进行综合评价,并根据评价结果进行剪枝,实现对特定用户群体快速准确地扩展筛选,提高扩展速度。

附图说明

图1示出了根据本发明的实施例的特定用户群体的管理方法的流程示意图;

图2示出了根据本发明的实施例的筛选用户的方法流程示意图;

图3示出了根据本发明的实施例的特定用户群体的管理系统的示意框图;

图4示出了图3所示的处理模块的示意框图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的实施例的特定用户群体的管理方法的流程示意图。

如图1所示,根据本发明的实施例的特定用户群体的管理方法,具体包括以下流程步骤:

步骤102,获取待筛选用户群体中每个用户的社交基本信息。

步骤104,根据社交基本信息分析确定每个用户的多个用户评价参数值。

步骤106,将多个用户评价参数值进行加权计算确定每个用户的综合评价值。

步骤108,根据综合评价值确定是否将每个用户自待筛选用户群体移至特定用户群体中。

在该实施例中,通过对社交媒体中的待筛选用户群体中的每个用户的社交基本信息进行分析,从而确定每个用户的用于评价其媒体账号的综合评价值的多个用户评价参数值,具体通过对该多个用户评价参数值进行加权计算确定该综合评价值,以根据该综合评价值确定是否将该每个用户自待筛选用户群体转移至特定用户群体,通过对待筛选用户群体进行综合评价及剪枝实现对特定用户群体的快速而准确地扩展筛选,从而提高特定用户群体的扩展速度,以对特定用户群体进行舆情追踪,避免对社交媒体中过多用户进行实时追踪的资源浪费,同时能够掌控社交媒体的信息传播主流动态,即特定用户群体是指在社交媒体中需要对其进行舆情追踪的用户群体。

进一步地,如图2所示,上述实施例中的步骤108具体可以执行为如下步骤:

步骤1082,根据综合评价值和阈值计算公式确定每个用户的评价阈值。

步骤1084,判断评价阈值是否大于或等于预设阈值。

步骤1086,若是,则将每个用户自待筛选用户群体移至特定用户群体中,否则将每个用户保留在待筛选用户群体中。

在该实施例中,具体可以根据阈值计算公式和每个用户的综合评价值确定每个用户的评价阈值,进而根据该评价阈值与预设阈值的大小比较结果确定是否将每个用户自待筛选用户群体移至特定用户群体中,若该评价阈值大于或等于预设阈值则对特定用户群体进行扩展,否则将该用户继续保留在待筛选用户群体中,避免增加舆情追踪的工作量,提高舆情追踪的有效价值,即对低于预设阈值的用户扩展得到的用户进行剪枝,防止下载资源浪费,实现快速定向用户扩展,其中,预设阈值的具体指可以根据实际应用场景进行设定及调整。

进一步地,在上述任一实施例中,阈值计算公式为:其中,t代表评价阈值,代表综合评价值的算术平均值,d(s)代表综合评价值的方差,a和b为常数。

在该实施例中,通过获取每个用户的多组综合评价值,并基于该多组综合评价值的算术平均值和方差值计算其评价阈值,以确保计算结果的准确性和稳定性,其中,a和b为可调节的常数,用于调整评价阈值使其适用于定向程度具有不同需求的采集环境,使得计算结果更加符合用户需求。

进一步地,在上述任一实施例中,多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,相似性评价值是指每个用户与特定用户群体的特征相似度值;以及采用如下公式加权计算综合评价值:s=am+bn+cp+dq,其中,s代表综合评价值,m代表相似性评价值,n代表言论评价值,p代表注册信息评价值,q代表影响力评价值,以及a、b、c和d为常数,且a+b+c+d=1。

在该实施例中,具体可以通过对待筛选用户群体中的每个用户的社交基本信息分析确定其至少包括相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,言论评价值、注册信息评价值和影响力评价值是分别对每个用户最近发表的言论、注册社交媒体账号时填写的信息以及每个用户的舆情影响力的评价值,而相似性评价值用于表征每个用户与特定用户群体中已有用户的相似程度,从而结合多个方面对用户的舆情追踪价值进行综合评价;进一步地,可以基于上述公式对每个用户的综合评价值进行准确的加权计算。

进一步地,在上述任一实施例中,社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及根据社交基本信息分析确定每个用户的多个用户评价参数值的步骤包括:根据用户发帖内容信息分析确定相似性评价值;根据用户发帖数量和用户发帖内容信息分析确定言论评价值;根据用户注册信息完整度和用户基本注册信息分析确定注册信息评价值;根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定影响力评价值。

在该实施例中,用于评估待筛选用户群体中的每个用户的各个用户评价参数值的社交基本信息至少可以包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息,具体地可以基于用户发帖内容信息分析确定对应用户与特定用户群体的相似性评价值,根据用户发帖数量和用户发帖内容信息分析确定对应用户的言论评价值,根据用户注册信息完整度和用户基本注册信息分析确定对应用户的注册信息评价值,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定对应用户的影响力评价值;当然,用户的社交基本信息还可以包括其用户自我介绍信息、社交媒体账号的用户关注者数量和被用户关注者数量等,比如,在分析确定用户的相似性评价值时可以综合考虑用户自我介绍信息,在分析确定用户的言论评价值时可以综合考虑用户发帖的原创比,以及在分析确定用户的影响力评价值可以综合考虑用户关注者数量和被用户关注者数量,以使评价结果更加准确、更具有说服力。

图3示出了根据本发明的实施例的特定用户群体的管理系统的示意框图。

如图3所示,根据本发明的实施例的特定用户群体的管理系统300,具体包括:获取模块302、分析模块304、计算模块306和处理模块308。

其中,获取模块302用于获取待筛选用户群体中每个用户的社交基本信息;分析模块304用于根据获取模块302获取的社交基本信息分析确定每个用户的多个用户评价参数值;计算模块306用于将分析模块304确定的多个用户评价参数值进行加权计算确定每个用户的综合评价值;处理模块308用于根据计算模块306得到的综合评价值确定是否将每个用户自待筛选用户群体移至特定用户群体中。

在该实施例中,通过对社交媒体中的待筛选用户群体中的每个用户的社交基本信息进行分析,从而确定每个用户的用于评价其媒体账号的综合评价值的多个用户评价参数值,具体通过对该多个用户评价参数值进行加权计算确定该综合评价值,以根据该综合评价值确定是否将该每个用户自待筛选用户群体转移至特定用户群体,通过对待筛选用户群体进行综合评价及剪枝实现对特定用户群体的快速而准确地扩展筛选,从而提高特定用户群体的扩展速度,以对特定用户群体进行舆情追踪,避免对社交媒体中过多用户进行实时追踪的资源浪费,同时能够掌控社交媒体的信息传播主流动态,即特定用户群体是指在社交媒体中需要对其进行舆情追踪的用户群体。

进一步地,如图4所示,上述实施例中的处理模块308具体包括:确定子模块3082、判断子模块3084和处理子模块3086。

其中,确定子模块3082用于根据综合评价值和阈值计算公式确定每个用户的评价阈值;判断子模块3084用于判断评价阈值是否大于或等于预设阈值;处理子模块3086用于在判断子模块3084判定为是时,将每个用户自待筛选用户群体移至特定用户群体中,否则将每个用户保留在待筛选用户群体中。

在该实施例中,具体可以根据阈值计算公式和每个用户的综合评价值确定每个用户的评价阈值,进而根据该评价阈值与预设阈值的大小比较结果确定是否将每个用户自待筛选用户群体移至特定用户群体中,若该评价阈值大于或等于预设阈值则对特定用户群体进行扩展,否则将该用户继续保留在待筛选用户群体中,避免增加舆情追踪的工作量,提高舆情追踪的有效价值,即对低于预设阈值的用户扩展得到的用户进行剪枝,防止下载资源浪费,实现快速定向用户扩展,其中,预设阈值的具体指可以根据实际应用场景进行设定及调整。

进一步地,在上述任一实施例中,确定子模块3082用于确定评价阈值的阈值计算公式为:其中,t代表评价阈值,代表综合评价值的算术平均值,d(s)代表综合评价值的方差,a和b为常数。

在该实施例中,通过获取每个用户的多组综合评价值,并基于该多组综合评价值的算术平均值和方差值计算其评价阈值,以确保计算结果的准确性和稳定性,其中,a和b为可调节的常数,用于调整评价阈值使其适用于定向程度具有不同需求的采集环境,使得计算结果更加符合用户需求。

进一步地,在上述任一实施例中,多个用户评价参数值包括:相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,相似性评价值是指每个用户与特定用户群体的特征相似度值;以及计算模块306采用如下公式加权计算综合评价值:s=am+bn+cp+dq,其中,s代表综合评价值,m代表相似性评价值,n代表言论评价值,p代表注册信息评价值,q代表影响力评价值,以及a、b、c和d为常数,且a+b+c+d=1。

在该实施例中,具体可以通过对待筛选用户群体中的每个用户的社交基本信息分析确定其至少包括相似性评价值、言论评价值、注册信息评价值和影响力评价值,其中,言论评价值、注册信息评价值和影响力评价值是分别对每个用户最近发表的言论、注册社交媒体账号时填写的信息以及每个用户的舆情影响力的评价值,而相似性评价值用于表征每个用户与特定用户群体中已有用户的相似程度,从而结合多个方面对用户的舆情追踪价值进行综合评价;进一步地,可以基于上述公式对每个用户的综合评价值进行准确的加权计算。

进一步地,在上述任一实施例中,社交基本信息包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息;以及分析模块304具体用于:根据用户发帖内容信息分析确定相似性评价值;根据用户发帖数量和用户发帖内容信息分析确定言论评价值;根据用户注册信息完整度和用户基本注册信息分析确定注册信息评价值;根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定影响力评价值。

进一步地在上述任一实施例中,用于评估待筛选用户群体中的每个用户的各个用户评价参数值的社交基本信息至少可以包括:用户发帖内容信息、用户发帖数量、用户发帖评论数、用户发帖转发数、用户发帖点赞数、用户注册信息完整度、用户基本注册信息,具体地可以基于用户发帖内容信息分析确定对应用户与特定用户群体的相似性评价值,根据用户发帖数量和用户发帖内容信息分析确定对应用户的言论评价值,根据用户注册信息完整度和用户基本注册信息分析确定对应用户的注册信息评价值,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定对应用户的影响力评价值;当然,用户的社交基本信息还可以包括其用户自我介绍信息、社交媒体账号的用户关注者数量和被用户关注者数量等,比如,在分析确定用户的相似性评价值时可以综合考虑用户自我介绍信息,在分析确定用户的言论评价值时可以综合考虑用户发帖的原创比,以及在分析确定用户的影响力评价值可以综合考虑用户关注者数量和被用户关注者数量,以使评价结果更加准确、更具有说服力。

综上,对于如图1和图2所示的特定用户群体的管理方法的实施例和如图3和图4所示的特定用户群体的管理系统的实施例,其核心是通过评价算法对从社交媒体的用户数据中提炼出的用户行为特征进行分析与计算,从整体的角度评估社交媒体账号的价值,给出评分,并利用该评分影响扩展方向,实现定向扩展。

具体可以分为扩展和评价两个方面,其中扩展部分负责获取社交媒体中用户相关信息(即社交基本信息)以及扩展新用户,而扩展新用户即是通过当前用户的用户社交关系、社交网站推荐类似用户等途径获取新用户,在扩展过程中会参考评价部分给出的评分对用户进行剪枝以达到对扩展方向进行调整的目的;而评价部分即是通过对由扩展模块获取的用户相关信息进行分析和计算给出多方面的评价值(即得到多个用户评价参数值)并通过加权调整给出最终的评价结果(即综合评价值s)。

进一步地,在上述任一实施例中,根据用户发帖内容信息分析确定相似性评价值m的步骤具体可以采用如下方式执行:

其中,n代表用户发帖内容信息中特征词命中个数(即与特定用户群体的用户发帖内容信息特征词库中的词的匹配个数),u、v和w为可调节参数。

进一步地,在上述任一实施例中,根据用户发帖数量和用户发帖内容信息分析确定言论评价值n的步骤具体可以采用如下方式执行:

其中,g代表用户发帖内容信息中的特征词命中数(即与特定用户群体的用户发帖内容信息特征词库中的词的匹配个数),即需要预先通过自然语言处理提取其中的特征词,h代表每日的用户发帖数量,e、f和g为可调节参数。

进一步地,在上述任一实施例中,根据用户注册信息完整度和用户基本注册信息分析确定注册信息评价值p的步骤具体可以采用如下方式执行:

其中,e代表用户注册信息完整度,为用户注册时个人资料中已填写的常用信息数目与所列待填写的所有常用信息数目的比值,f代表用户基本注册信息中特征词命中个数(即与特定用户群体的用户基本注册信息特征词库中的词的匹配个数),用户基本注册信息可以包括用户个人简介信息和/或昵称,即需要预先通过自然语言处理提取其中的特征词,用于后续处理,c和d为可调节参数。

进一步地,在上述任一实施例中,根据用户发帖评论数、用户发帖转发数和用户发帖点赞数分析确定影响力评价值q的步骤具体可以采用如下方式执行:

q=ih+jl+kr+ls(+t),

其中,h代表每天的用户发帖数量,l代表每天平均的用户发帖评论数的,r代表每天平均的用户发帖转发数,s代表每天平均的用户发帖点赞数,i、j、k和l为可调节参数,且i+j+k+l=1,t为可调节参数,当前用户为认证用户时添加至该式中。

进一步地,上述用户发帖内容信息用户发帖数量、用户发帖评论数、用户发帖转发数和用户发帖点赞数等可以为用户近期一段时间内数据统计。

进一步地,对上述四个参数评价值对其进行加权平均即可得到最终的用户价值评分,其中,其中权重(即a、b、c和d)可以根据应用场景进行分配,一般情况下用户相似性权重大于用户影响力大于用户言论权重大于用户信息权重。

进一步地,在本发明的其他实施例中,除了上述常规统计数据外,也可按用户特殊需求添加统计数据,例如用户需求为优先关注认证账号或建立时间久的账号则可以统计出相应数据为相关评价提供支持。

以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,基于社交媒体的用户行为特征分析对待筛选用户群体中的每个用户进行综合评价,并根据评价结果进行剪枝,实现对特定用户群体快速准确地扩展筛选,提高扩展速度,且便于准确地、有方向性地进行舆情追踪。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1