一种用于确定研究对象的影响因子的方法与设备与流程

文档序号:17067559发布日期:2019-03-08 23:02阅读:301来源:国知局
一种用于确定研究对象的影响因子的方法与设备与流程

本申请涉及计算机领域,尤其涉及一种用于确定研究对象的影响因子的技术。



背景技术:

随着信息技术的发展,大众得以了解多种研究对象(例如包括但不限于各类运动员、演员等公众人物,或者各类线上项目)并进行评论、打分等活动,并且这些活动对研究对象造成的相关结果(或影响因子)正在对各类研究对象的影响力造成越来越大的影响,大众也越来越多地依赖上述影响因子而将其作为相关行动(例如参与话题、做出相关的决策等)的依据。及时而准确地获取一个研究对象的影响因子数据,将有助于大众做出正确决策。



技术实现要素:

本申请的一个目的是提供一种用于确定研究对象的影响因子的方法。

根据本申请的一个方面,提供了一种用于确定研究对象的影响因子的方法,该方法包括以下步骤:

确定所述研究对象的认知评价信息、关注评价信息以及活跃评价信息;

基于所述认知评价信息、所述关注评价信息以及所述活跃评价信息,分别确定对应的认知评价向量、关注评价向量以及活跃评价向量;

将所述认知评价向量、所述关注评价向量以及所述活跃评价向量应用于关于所述研究对象的影响因子模型,并基于所述影响因子模型的输出确定所述研究对象当前的影响因子。

根据本申请的另一个方面,提供了一种用于确定研究对象的影响因子的设备,该设备包括:

第一模块,用于确定所述研究对象的认知评价信息、关注评价信息以及活跃评价信息;

第二模块,用于基于所述认知评价信息、所述关注评价信息以及所述活跃评价信息,分别确定对应的认知评价向量、关注评价向量以及活跃评价向量;

第三模块,用于将所述认知评价向量、所述关注评价向量以及所述活跃评价向量应用于关于所述研究对象的影响因子模型,并基于所述影响因子模型的输出确定所述研究对象当前的影响因子。

根据本申请的另一个方面,提供了一种用于确定研究对象的影响因子的设备,该设备包括:

处理器;以及

被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以上所述的方法。

根据本申请的另一个方面,提供了一种包括指令的计算机可读介质,所述指令在被执行时使得系统执行以上所述的方法。

与现有技术相比,本申请基于对研究对象的背景分析、热度分析和情绪分析分别获取研究对象的认知评价信息、关注评价信息和活跃评价信息,并基于这些信息和相关的数据模型获取研究对象的影响因子,充分考虑了相对变化较慢的认知评价信息和相对变化较快的关注评价信息,从而取得了节省系统开销和保证系统反馈及时性之间的平衡,并且能够获得准确的影响因子;进一步地,在引入影响因子的回溯数据后,本申请还可进一步保持研究对象的影响因子的稳定性而使其更加可靠。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是根据本申请一个实施例的一种用于确定研究对象的影响因子的方法的流程图;

图2示出根据本申请另一个实施例的一种用于确定研究对象的影响因子的设备的功能模块;

图3示出根据本申请另一个实施例的一种示例性系统。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本申请作进一步详细描述。

在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。

本申请所指设备包括但不限于用户设备、网络设备、或用户设备与网络设备通过网络相集成所构成的设备。所述用户设备包括但不限于任何一种可与用户进行人机交互(例如通过触摸板进行人机交互)的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作系统,如android操作系统、ios操作系统等。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(asic)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、数字信号处理器(dsp)、嵌入式设备等。所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(cloudcomputing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、vpn网络、无线自组织网络(adhoc网络)等。优选地,所述设备还可以是运行于所述用户设备、网络设备、或用户设备与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的程序。

当然,本领域技术人员应能理解上述设备仅为举例,其他现有的或今后可能出现的设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。

在本申请的描述中,“多个”的含义是两个或者更多,除非另有明确具体的限定。

以下基于一种用于确定研究对象的影响因子的设备(或称为影响因子确定设备),对本申请进行详细描述。

根据本申请的一个方面,提供了一种用于确定研究对象的影响因子的方法。参考图1,该方法包括步骤s100、步骤s200和步骤s300。具体而言,在步骤s100中,影响因子确定设备确定所述研究对象的认知评价信息、关注评价信息以及活跃评价信息。其中,在一些实施例中,认知评价信息基于对研究对象的背景分析得到,用于表征研究对象的总体知名度,其一般随着时间增长而增长,短时间内变化较小;关注评价信息反映研究对象受关注的程度,有时也可称为热度,相对于认知评价信息而言短时间内的变化有可能会比较大;活跃评价信息则能够反映关注评价信息的变化趋势(或理解为热度上升或下降的程度)。在步骤s200中,影响因子确定设备基于所述认知评价信息、所述关注评价信息以及所述活跃评价信息,分别确定对应的认知评价向量、关注评价向量以及活跃评价向量;之后在步骤s300中,影响因子确定设备将所述认知评价向量、所述关注评价向量以及所述活跃评价向量应用于关于所述研究对象的影响因子模型,并基于所述影响因子模型的输出确定所述研究对象当前的影响因子。在此,影响因子模型为一数据模型;在一些实施例中,该影响因子模型基于深度神经网络开发所得。当然,本领域技术人员应能理解,该影响因子模型并不限于基于深度神经网络开发所得,其他现有的或今后可能出现的数据模型如能适用于本申请,也包含在本申请的保护范围内,并以引用方式包含于此。例如,该影响因子模型基于神经网络、支持向量机(supportvectormachine,svm)、决策树、随机森林等一种或多种数据模型开发所得。

为清楚起见,在此以所述研究对象为一足球运动员(以下简称球员)为例,对认知评价信息、关注评价信息、活跃评价信息等各方面进一步解释。

一、认知评价信息

认知评价信息用于表征该球员的总体知名度,一般来说一名球员的总体知名度随着时间增长而增长,因此反映了该球员在公众心中的认知程度,一般短时间内的变化很小。在一些实施例中,该认知评价信息z可由下式计算:

z=w1*m1+w2*m2+…+wn*mn

其中,z为知名度评分,m为各个数据源的输入,w为各个输入数据源的权重;各输入数据属于变化较慢的球员背景数据,为简明起见,可将这些数据归属于“背景分析模块”。需要注意的是,在一些实施例中,各个数据源的权重不需要在这里显式地计算;来自这些数据源的数据可被输入到影响因子模型,由影响因子模型来自动调整各个数据源的权重以至整个背景分析模块的权重,来得到对该球员最准确的最终评分(影响因子)。更具体来说,在一些实施例中,该认知评价信息是基于研究对象的至少一项属性信息确定的,因此具有一定的客观性,且随时间变化相对较慢,从而有助于提升最终结果的准确度。例如,背景分析模块中,可包含球星的基本资料,例如包括但不限于:国籍、效力俱乐部、年薪、效力年限、主打位置、主力/替补信息、累计为国家队效力的次数等。

二、关注评价信息和活跃评价信息

关注评价信息用于捕捉球星较短时间内的受关注状况(或者活跃程度),可用于发现热点球员,例如将关注评价信息用于衡量球员评分改变的程度(例如,活跃球员的评分改变幅度可能比较大,而不活跃的球员的评分则相对比较稳定)。因此,关注评价信息也可用于对球员进行评价,一些实施例也将关注评价信息作为影响因子模型的输入。与认知评价信息相对应,该部分输入数据可被归于“热度分析模块”,具体实现也与“背景分析模块”中的输入数据相类似。

在一些实施例中,该关注评价信息是基于研究对象的相关媒体信息确定的,例如,相关媒体信息包括但不限于与该球员相关的社交网络媒体信息(包括但不限于图片、文字、视频内容,以及点赞、转发等数据内容)、新闻媒体信息、搜索引擎媒体信息(包括但不限于排名增量、词条增量)等中的一项或者多项。

其中,与“背景分析模块”不同的是,该部分监控的数据是增量数据,例如在一定时间内,球员社交网络新增的粉丝数量,或者新增的相关评论、转发等的数量。通过引入关注评价信息,我们可以掌握热点话题和热点球员,并将这些信息及时地反映至相应球员的影响因子。本领域技术人员应能理解,上述增量数据仅为举例,其他现有的或今后可能出现的增量数据如能适用于本申请,也包含在本申请的保护范围内,并以引用方式包含于此。在一些实施例中,上述步骤s100包括子步骤s110(未示出)、子步骤s120(未示出)和子步骤s130(未示出)。在子步骤s110中,影响因子确定设备确定所述研究对象的认知评价信息;在子步骤s120中,影响因子确定设备基于所述研究对象的至少一项相关媒体信息确定对应的至少一项增量媒体信息,以及所述研究对象的活跃评价信息,其中研究对象的活跃评价信息也是基于所述至少一项增量媒体信息确定的;在子步骤s130中,影响因子确定设备基于所述至少一项增量媒体信息确定所述研究对象的关注评价信息。

在一些实施例中,上述子步骤s130中,影响因子确定设备基于所述至少一项增量媒体信息以及各项增量媒体信息所对应的媒体信息权重,确定所述研究对象的关注评价信息。例如,在对指定国家或者全球的社交网络媒体或者新闻媒体进行监控的过程中,更加权威的媒体报道将获得更高的影响力权重,从而对研究对象(例如前例中的球员)的影响力造成更大的影响;还可对新闻媒体的报道和社交媒体的讨论内容进行情绪分析,从而获得舆论导向是否有利于一个球员的影响力。这些数据可以通过对社交网络和搜索引擎的监控来获得,例如使用网页爬虫对球员的俱乐部资料和各个社交媒体进行爬取。在一些实施例中,上述子步骤s120还包括子步骤s121(未示出)、子步骤s122(未示出)。在子步骤s121中,影响因子确定设备基于所述研究对象的至少一项相关媒体信息确定对应的增量媒体信息,例如基于一定的时间周期获取相关媒体信息,并根据更新信息得到对应的增量媒体信息;在子步骤s122中,影响因子确定设备对所述至少一项相关媒体信息执行分类操作,并根据对应的分类结果确定所述研究对象的活跃评价信息。

其中,上述分类操作在一些实施例中基于分类算法执行,例如基于支持向量机执行;活跃评价信息可用于分析公众对研究对象(例如上例中的球员)的情绪,因此相应的输入数据可被归入“情绪分析模块”。球星活跃程度的方向(例如活跃度是正面的还是负面的)可使用情绪分析模块来把控,通过分析媒体和新闻中的数据内容来得到公众对一个球星的情感,例如通过对热门球员的用户评论和转发数据进行情感分析,得知公众是支持该球员,还是反对该球员。具体来说,情绪分析是对新闻媒体和社交媒体关于一个球星报道的文字分析;通过对文字语义的分析,能够得知新闻媒体和社交媒体关于一个球星的评价,从而计入对该球星的整体打分。支持向量机的主要原理是:在搜索空间中确定最佳分离不同类别的线性的或者非线性的分隔带,例如此处的类别可以定义为“强烈支持”、“支持”、“中立”、“反对”和“强烈反对”,基于使用支持向量局分类每一条评论或转发,最终得到大众对此球星的情绪;错误分类的点这可能是因为数据的模糊性,或是该向量机模型的参数太少或维度太低。支持向量机是一类需要监督的机器学习算法,所以为了得到支持向量机模型,需要事先通过一定的数据对其进行训练。这些数据(评论)中,需要有明确的类别标注。数据量的大小将直接决定支持向量机模型的准确性。

上述影响因子模型的输入,除了以上所述的认知评价信息、关注评价信息以及活跃评价信息等方面之外,还可包括关于该研究对象的历史数据(例如历史评分数据的加权平均数),以下称为回溯影响信息。

三、回溯影响信息

在一些实施例中,在上述步骤s300中,影响因子确定设备将所述认知评价向量、所述关注评价向量、所述活跃评价向量以及关于所述研究对象的回溯影响向量,应用于关于所述研究对象的影响因子模型,并基于所述影响因子模型的输出确定所述研究对象当前的影响因子,从而有利于保证输出数据的稳定性和可靠性。其中,所述回溯影响向量基于回溯影响信息进行向量化后获得。以回溯影响信息为历史评分均值为例,可采用简单但有效的模型,基于下式来对历史评分进行加权平均值的计算:

λi=σw(i-j)λ’(i-j)(1≤j≤n)

其中λi是第i次对一个球员的评分,λ’(i-j)是第(i-j)次的历史评分记录,上式从第i次评分开始,向前追溯n次评分;w(i-j)是第i次评分所占比重(权重)。在一些实施例中,为所有历史评分分配相同的权重。在另一些实施例中,针对每个权重进行对数衰落计算。相应地,上述步骤s300包括子步骤s310、子步骤s320、子步骤s330和子步骤s340。在子步骤s310中,影响因子确定设备对于关于所述研究对象的至少一个回溯影响因子中的每个回溯影响因子,确定对应的初始衰落权重;在子步骤s320中,影响因子确定设备对所述初始衰落权重执行数据标准化操作,以确定每个回溯影响因子所对应的回溯影响因子权重;在子步骤s330中,影响因子确定设备根据所述至少一个回溯影响因子以及每个回溯影响因子所对应的回溯影响因子权重,确定对应的回溯影响向量;在子步骤s340中,影响因子确定设备将所述认知评价向量、所述关注评价向量、所述活跃评价向量以及所述回溯影响向量,应用于关于所述研究对象的影响因子模型,并基于所述影响因子模型的输出确定所述研究对象当前的影响因子。例如,为获得一项历史评分所对应的回溯影响因子权重ws,可首先根据下式计算初始衰落权重:

w’s=β^(i-s)

其中,β是衰落参数,一般介于0与1之间。然后,通过对所有评分权重执行数据标准化操作,从而得到上述回溯影响因子权重ws。计算可基于下式进行:

ws=ws’/σw’(i-j)(1≤j≤n)

随后基于上述历史评分以及各历史评分所对应的权重计算历史评分的加权平均数,并确定对应的回溯影响向量,再将该回溯影响向量连同其他信息一同输入影响因子模型,以获取最终输出。基于上述方法,能灵活地对从当前评分追溯n个评分,并对这些评分进行灵活有效的加权平均,得到一个最合适的历史评分,在该评分系统中,最近的评分数据将占有更大的权重,从而有助于保证输出数据的稳定性和可靠性。

在一些实施例中,上述影响因子模型是基于深度神经网络生成的。例如,该影响因子模型使用提取的特征作为神经网络的输入,其中我们假设每个特征由一个二维向量表示,在具体实现过程中对特征的表示维度将按照实际的特征提取结果做相应调整。在一个具体实施例中,深度神经网络为7层全连接神经网络,实际实现过程中会根据训练过程中网络的收敛程度和精度,对神经网络的结构进行优化,例如使用卷积神经网络、编码解码神经网络等等,以使得输出结果更加准确。在神经网络中,神经元之间通过矩阵运算和激活方程来控制信号传递的强弱,使其能够学习到最完美的特征运用和组合方案。在本申请中,上述基于神经网络的影响因子模型合理分配了各个特征(例如来自背景分析模块、热度分析模块、情绪分析模块、历史评分等的数据)对输出结果(例如本次的评分)的影响程度。本领域技术人员应能理解,上述影响因子模型仅为举例,其他现有的或者今后可能出现的影响因子模型如能适用于本申请,也包含在本申请的保护范围内,并以引用方式包含于此。

为了根据大众的反馈调整上述影响因子模型,以优化输出结果的准确度,一些实施例对用户反馈信息进行反馈分析。相应地,上述方法还包括步骤s400(未示出)、步骤s500(未示出)和步骤s600(未示出)。在步骤s400中,影响因子确定设备获取至少一个目标用户关于所述当前的影响因子的用户反馈信息;在步骤s500中,影响因子确定设备确定关于所述用户反馈信息的反馈强度信息以及反馈情感信息;在步骤s600中,影响因子确定设备基于所述反馈强度信息、所述反馈情感信息以及所述当前的影响因子,确定所述影响因子模型的损失,并基于所述损失更新所述影响因子模型。以上述影响因子模型基于神经网络开发为例,在一些实施例中,具体来说,首先对用户数据进行监控,对反馈数量(反馈强度)和反馈情感(正反馈还是负反馈)进行数据整理与分析。对于反馈强度,反馈数据通过标准化处理,建立和使用线性或者多维的回归模型,建立起数据量和反馈强度的关系,从而将数据量转化为反馈强度;对于反馈情感,我们将使用同上文介绍的情绪分析方法,建模用户的情绪数据。这样最终得到用户对评分的用户反馈信息,一种表现形式为用户认为准确度为a%,其中b%用户为正向的,即认为评分应该增加。这个数据将和神经网络的输出形成loss,继而使用神经网络的反向传播更新神经网络中各个参数的数值,例如分配合理的神经网络学习速率(learningrate),使神经网络吸收该反馈并作出相应的调整,以输出更新后的评分数据,该更新后的评分数据考虑了模型本身和用户的反馈信息,使得神经网络朝着更准确的方向演化。需要注意的是,在采用神经网络数据模型时,上述反馈系统需要设置合理的神经网络学习速率,太高的学习速率会导致神经网络评分的大幅度波动,从而损失通用性和准确性;太小的学习速率会使得用户的评分反馈不对神经网络的输出造成影响。

其中,需要说明的是,以上基于足球运动员对本申请的相关说明仅为举例,而不对本申请的应用领域进行任何限定。实际上,基于上述技术所构建的对球员进行评分的系统也可用于其他实体,例如对一个影视明星或者区块链项目的热度进行评价。例如,基于上述系统设计,可重用以下参数:

-特征提取;

-神经网络架构;

-评分反馈系统架构。

在特征提取过程中,只需将追踪球员的爬虫替换为追踪影视明星或者区块链项目的爬虫,调整相应的数据爬取源,即可得到相应明星或者区块链项目的数据,然后通过类似算法,得到相应明星或区块链项目的背景分析信息、热度分析信息、情感分析信息、历史平均加权等特征。接着,可以将提取好的特征输入到神经网络中,通过不同的神经网络调试,对评分进行优化。最后,评分将输入到评分反馈系统,由用户群体/专家进行评分的矫正。但需要注意的是,为了让整套系统能够更好的为另一个实体(例如明星或者区块链项目)评分,可能需要调整/重新设计下列模块:

-数据提取源;

-数据处理词典;

-神经网络调试;

-反馈系统调试。

总之,以上所构建的对于球员热度的评分系统可以扩展到对于其他实体的评价过程中,因此本申请所提供的用于确定研究对象的影响因子的方案具有较强的可扩展性。

根据本申请的另一个方面,提供了一种用于确定研究对象的影响因子的设备。参考图2,该设备包括第一模块100、第二模块200和第三模块300。具体而言,第一模块100确定所述研究对象的认知评价信息、关注评价信息以及活跃评价信息。其中,在一些实施例中,认知评价信息基于对研究对象的背景分析得到,用于表征研究对象的总体知名度,其一般随着时间增长而增长,短时间内变化较小;关注评价信息反映研究对象受关注的程度,有时也可称为热度,相对于认知评价信息而言短时间内的变化有可能会比较大;活跃评价信息则能够反映关注评价信息的变化趋势(或理解为热度上升或下降的程度)。第二模块200基于所述认知评价信息、所述关注评价信息以及所述活跃评价信息,分别确定对应的认知评价向量、关注评价向量以及活跃评价向量;之后第三模块300将所述认知评价向量、所述关注评价向量以及所述活跃评价向量应用于关于所述研究对象的影响因子模型,并基于所述影响因子模型的输出确定所述研究对象当前的影响因子。在此,影响因子模型为一数据模型;在一些实施例中,该影响因子模型基于深度神经网络开发所得。当然,本领域技术人员应能理解,该影响因子模型并不限于基于深度神经网络开发所得,其他现有的或今后可能出现的数据模型如能适用于本申请,也包含在本申请的保护范围内,并以引用方式包含于此。例如,该影响因子模型基于神经网络、支持向量机(supportvectormachine,svm)、决策树、随机森林等一种或多种数据模型开发所得。

为清楚起见,在此以所述研究对象为一足球运动员(以下简称球员)为例,对认知评价信息、关注评价信息、活跃评价信息等各方面进一步解释。

一、认知评价信息

认知评价信息用于表征该球员的总体知名度,一般来说一名球员的总体知名度随着时间增长而增长,因此反映了该球员在公众心中的认知程度,一般短时间内的变化很小。在一些实施例中,该认知评价信息z可由下式计算:

z=w1*m1+w2*m2+…+wn*mn

其中,z为知名度评分,m为各个数据源的输入,w为各个输入数据源的权重;各输入数据属于变化较慢的球员背景数据,为简明起见,可将这些数据归属于“背景分析模块”。需要注意的是,在一些实施例中,各个数据源的权重不需要在这里显式地计算;来自这些数据源的数据可被输入到影响因子模型,由影响因子模型来自动调整各个数据源的权重以至整个背景分析模块的权重,来得到对该球员最准确的最终评分(影响因子)。更具体来说,在一些实施例中,该认知评价信息是基于研究对象的至少一项属性信息确定的,因此具有一定的客观性,且随时间变化相对较慢,从而有助于提升最终结果的准确度。例如,背景分析模块中,可包含球星的基本资料,例如包括但不限于:国籍、效力俱乐部、年薪、效力年限、主打位置、主力/替补信息、累计为国家队效力的次数等。

二、关注评价信息和活跃评价信息

关注评价信息用于捕捉球星较短时间内的受关注状况(或者活跃程度),可用于发现热点球员,例如将关注评价信息用于衡量球员评分改变的程度(例如,活跃球员的评分改变幅度可能比较大,而不活跃的球员的评分则相对比较稳定)。因此,关注评价信息也可用于对球员进行评价,一些实施例也将关注评价信息作为影响因子模型的输入。与认知评价信息相对应,该部分输入数据可被归于“热度分析模块”,具体实现也与“背景分析模块”中的输入数据相类似。

在一些实施例中,该关注评价信息是基于研究对象的相关媒体信息确定的,例如,相关媒体信息包括但不限于与该球员相关的社交网络媒体信息(包括但不限于图片、文字、视频内容,以及点赞、转发等数据内容)、新闻媒体信息、搜索引擎媒体信息(包括但不限于排名增量、词条增量)等中的一项或者多项。

其中,与“背景分析模块”不同的是,该部分监控的数据是增量数据,例如在一定时间内,球员社交网络新增的粉丝数量,或者新增的相关评论、转发等的数量。通过引入关注评价信息,我们可以掌握热点话题和热点球员,并将这些信息及时地反映至相应球员的影响因子。本领域技术人员应能理解,上述增量数据仅为举例,其他现有的或今后可能出现的增量数据如能适用于本申请,也包含在本申请的保护范围内,并以引用方式包含于此。在一些实施例中,上述第一模块100包括第一单元110(未示出)、第二单元120(未示出)和第三单元130(未示出)。第一单元110确定所述研究对象的认知评价信息;第二单元120基于所述研究对象的至少一项相关媒体信息确定对应的至少一项增量媒体信息,以及所述研究对象的活跃评价信息,其中研究对象的活跃评价信息也是基于所述至少一项增量媒体信息确定的;第三单元130基于所述至少一项增量媒体信息确定所述研究对象的关注评价信息。

在一些实施例中,上述第三单元130基于所述至少一项增量媒体信息以及各项增量媒体信息所对应的媒体信息权重,确定所述研究对象的关注评价信息。例如,在对指定国家或者全球的社交网络媒体或者新闻媒体进行监控的过程中,更加权威的媒体报道将获得更高的影响力权重,从而对研究对象(例如前例中的球员)的影响力造成更大的影响;还可对新闻媒体的报道和社交媒体的讨论内容进行情绪分析,从而获得舆论导向是否有利于一个球员的影响力。这些数据可以通过对社交网络和搜索引擎的监控来获得,例如使用网页爬虫对球员的俱乐部资料和各个社交媒体进行爬取。在一些实施例中,上述第二单元120还包括第一组件121(未示出)、第二组件122(未示出)。第一组件121基于所述研究对象的至少一项相关媒体信息确定对应的增量媒体信息,例如基于一定的时间周期获取相关媒体信息,并根据更新信息得到对应的增量媒体信息;第二组件122对所述至少一项相关媒体信息执行分类操作,并根据对应的分类结果确定所述研究对象的活跃评价信息。

其中,上述分类操作在一些实施例中基于分类算法执行,例如基于支持向量机执行;活跃评价信息可用于分析公众对研究对象(例如上例中的球员)的情绪,因此相应的输入数据可被归入“情绪分析模块”。球星活跃程度的方向(例如活跃度是正面的还是负面的)可使用情绪分析模块来把控,通过分析媒体和新闻中的数据内容来得到公众对一个球星的情感,例如通过对热门球员的用户评论和转发数据进行情感分析,得知公众是支持该球员,还是反对该球员。具体来说,情绪分析是对新闻媒体和社交媒体关于一个球星报道的文字分析;通过对文字语义的分析,能够得知新闻媒体和社交媒体关于一个球星的评价,从而计入对该球星的整体打分。支持向量机的主要原理是:在搜索空间中确定最佳分离不同类别的线性的或者非线性的分隔带,例如此处的类别可以定义为“强烈支持”、“支持”、“中立”、“反对”和“强烈反对”,基于使用支持向量局分类每一条评论或转发,最终得到大众对此球星的情绪;错误分类的点这可能是因为数据的模糊性,或是该向量机模型的参数太少或维度太低。支持向量机是一类需要监督的机器学习算法,所以为了得到支持向量机模型,需要事先通过一定的数据对其进行训练。这些数据(评论)中,需要有明确的类别标注。数据量的大小将直接决定支持向量机模型的准确性。

上述影响因子模型的输入,除了以上所述的认知评价信息、关注评价信息以及活跃评价信息等方面之外,还可包括关于该研究对象的历史数据(例如历史评分数据的加权平均数),以下称为回溯影响信息。

三、回溯影响信息

在一些实施例中,上述第三模块300将所述认知评价向量、所述关注评价向量、所述活跃评价向量以及关于所述研究对象的回溯影响向量,应用于关于所述研究对象的影响因子模型,并基于所述影响因子模型的输出确定所述研究对象当前的影响因子,从而有利于保证输出数据的稳定性和可靠性。其中,所述回溯影响向量基于回溯影响信息进行向量化后获得。以回溯影响信息为历史评分均值为例,可采用简单但有效的模型,基于下式来对历史评分进行加权平均值的计算:

λi=σw(i-j)λ’(i-j)(1≤j≤n)

其中λi是第i次对一个球员的评分,λ’(i-j)是第(i-j)次的历史评分记录,上式从第i次评分开始,向前追溯n次评分;w(i-j)是第i次评分所占比重(权重)。在一些实施例中,为所有历史评分分配相同的权重。在另一些实施例中,针对每个权重进行对数衰落计算。相应地,上述第三模块300包括第四单元310、第五单元320、第六单元330和第七单元340。第四单元310对于关于所述研究对象的至少一个回溯影响因子中的每个回溯影响因子,确定对应的初始衰落权重;第五单元320对所述初始衰落权重执行数据标准化操作,以确定每个回溯影响因子所对应的回溯影响因子权重;第六单元330根据所述至少一个回溯影响因子以及每个回溯影响因子所对应的回溯影响因子权重,确定对应的回溯影响向量;第七单元340将所述认知评价向量、所述关注评价向量、所述活跃评价向量以及所述回溯影响向量,应用于关于所述研究对象的影响因子模型,并基于所述影响因子模型的输出确定所述研究对象当前的影响因子。例如,为获得一项历史评分所对应的回溯影响因子权重ws,可首先根据下式计算初始衰落权重:

w’s=β^(i-s)

其中,β是衰落参数,一般介于0与1之间。然后,通过对所有评分权重执行数据标准化操作,从而得到上述回溯影响因子权重ws。计算可基于下式进行:

ws=ws’/σw’(i-j)(1≤j≤n)

随后基于上述历史评分以及各历史评分所对应的权重计算历史评分的加权平均数,并确定对应的回溯影响向量,再将该回溯影响向量连同其他信息一同输入影响因子模型,以获取最终输出。基于上述方法,能灵活地对从当前评分追溯n个评分,并对这些评分进行灵活有效的加权平均,得到一个最合适的历史评分,在该评分系统中,最近的评分数据将占有更大的权重,从而有助于保证输出数据的稳定性和可靠性。

在一些实施例中,上述影响因子模型是基于深度神经网络生成的。例如,该影响因子模型使用提取的特征作为神经网络的输入,其中我们假设每个特征由一个二维向量表示,在具体实现过程中对特征的表示维度将按照实际的特征提取结果做相应调整。在一个具体实施例中,深度神经网络为7层全连接神经网络,实际实现过程中会根据训练过程中网络的收敛程度和精度,对神经网络的结构进行优化,例如使用卷积神经网络、编码解码神经网络等等,以使得输出结果更加准确。在神经网络中,神经元之间通过矩阵运算和激活方程来控制信号传递的强弱,使其能够学习到最完美的特征运用和组合方案。在本申请中,上述基于神经网络的影响因子模型合理分配了各个特征(例如来自背景分析模块、热度分析模块、情绪分析模块、历史评分等的数据)对输出结果(例如本次的评分)的影响程度。本领域技术人员应能理解,上述影响因子模型仅为举例,其他现有的或者今后可能出现的影响因子模型如能适用于本申请,也包含在本申请的保护范围内,并以引用方式包含于此。

为了根据大众的反馈调整上述影响因子模型,以优化输出结果的准确度,一些实施例对用户反馈信息进行反馈分析。相应地,上述设备还包括第四模块400(未示出)、第五模块500(未示出)和第六模块600(未示出)。第四模块400获取至少一个目标用户关于所述当前的影响因子的用户反馈信息;第五模块500确定关于所述用户反馈信息的反馈强度信息以及反馈情感信息;第六模块600基于所述反馈强度信息、所述反馈情感信息以及所述当前的影响因子,确定所述影响因子模型的损失,并基于所述损失更新所述影响因子模型。以上述影响因子模型基于神经网络开发为例,在一些实施例中,具体来说,首先对用户数据进行监控,对反馈数量(反馈强度)和反馈情感(正反馈还是负反馈)进行数据整理与分析。对于反馈强度,反馈数据通过标准化处理,建立和使用线性或者多维的回归模型,建立起数据量和反馈强度的关系,从而将数据量转化为反馈强度;对于反馈情感,我们将使用同上文介绍的情绪分析方法,建模用户的情绪数据。这样最终得到用户对评分的用户反馈信息,一种表现形式为用户认为准确度为a%,其中b%用户为正向的,即认为评分应该增加。这个数据将和神经网络的输出形成loss,继而使用神经网络的反向传播更新神经网络中各个参数的数值,例如分配合理的神经网络学习速率(learningrate),使神经网络吸收该反馈并作出相应的调整,以输出更新后的评分数据,该更新后的评分数据考虑了模型本身和用户的反馈信息,使得神经网络朝着更准确的方向演化。需要注意的是,在采用神经网络数据模型时,上述反馈系统需要设置合理的神经网络学习速率,太高的学习速率会导致神经网络评分的大幅度波动,从而损失通用性和准确性;太小的学习速率会使得用户的评分反馈不对神经网络的输出造成影响。

其中,需要说明的是,以上基于足球运动员对本申请的相关说明仅为举例,而不对本申请的应用领域进行任何限定。实际上,基于上述技术所构建的对球员进行评分的系统也可用于其他实体,例如对一个影视明星或者区块链项目的热度进行评价。例如,基于上述系统设计,可重用以下参数:

-特征提取;

-神经网络架构;

-评分反馈系统架构。

在特征提取过程中,只需将追踪球员的爬虫替换为追踪影视明星或者区块链项目的爬虫,调整相应的数据爬取源,即可得到相应明星或者区块链项目的数据,然后通过类似算法,得到相应明星或区块链项目的背景分析信息、热度分析信息、情感分析信息、历史平均加权等特征。接着,可以将提取好的特征输入到神经网络中,通过不同的神经网络调试,对评分进行优化。最后,评分将输入到评分反馈系统,由用户群体/专家进行评分的矫正。但需要注意的是,为了让整套系统能够更好的为另一个实体(例如明星或者区块链项目)评分,可能需要调整/重新设计下列模块:

-数据提取源;

-数据处理词典;

-神经网络调试;

-反馈系统调试。

总之,以上所构建的对于球员热度的评分系统可以扩展到对于其他实体的评价过程中,因此本申请所提供的用于确定研究对象的影响因子的方案具有较强的可扩展性。

本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如前任一项所述的方法被执行。

本申请还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。

本申请还提供了一种计算机设备,所述计算机设备包括:

一个或多个处理器;

存储器,用于存储一个或多个计算机程序;

当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。

图3示出了可被用于实施本申请中所述的各个实施例的示例性系统。

如图3所示,在一些实施例中,系统700能够作为各所述实施例中的任意一个影响因子确定设备。在一些实施例中,系统700可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或nvm/存储设备720)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本申请中所述的动作的一个或多个处理器(例如,(一个或多个)处理器705)。

对于一个实施例,系统控制模块710可包括任意适当的接口控制器,以向(一个或多个)处理器705中的至少一个和/或与系统控制模块710通信的任意适当的设备或组件提供任意适当的接口。

系统控制模块710可包括存储器控制器模块730,以向系统存储器715提供接口。存储器控制器模块730可以是硬件模块、软件模块和/或固件模块。

系统存储器715可被用于例如为系统700加载和存储数据和/或指令。对于一个实施例,系统存储器715可包括任意适当的易失性存储器,例如,适当的dram。在一些实施例中,系统存储器715可包括双倍数据速率类型四同步动态随机存取存储器(ddr4sdram)。

对于一个实施例,系统控制模块710可包括一个或多个输入/输出(i/o)控制器,以向nvm/存储设备720及(一个或多个)通信接口725提供接口。

例如,nvm/存储设备720可被用于存储数据和/或指令。nvm/存储设备720可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(hdd)、一个或多个光盘(cd)驱动器和/或一个或多个数字通用光盘(dvd)驱动器)。

nvm/存储设备720可包括在物理上作为系统700被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,nvm/存储设备720可通过网络经由(一个或多个)通信接口725进行访问。

(一个或多个)通信接口725可为系统700提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统700可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。

对于一个实施例,(一个或多个)处理器705中的至少一个可与系统控制模块710的一个或多个控制器(例如,存储器控制器模块730)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器705中的至少一个可与系统控制模块710的一个或多个控制器的逻辑封装在一起以形成系统级封装(sip)。对于一个实施例,(一个或多个)处理器705中的至少一个可与系统控制模块710的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器705中的至少一个可与系统控制模块710的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(soc)。

在各个实施例中,系统700可以但不限于是:服务器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统700可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统700包括一个或多个摄像机、键盘、液晶显示器(lcd)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(asic)和扬声器。

需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。

另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。

通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个系统传送到另一系统的介质。通信介质可包括有导的传输介质(诸如电缆和线(例如,光纤、同轴等))和能传播能量波的无线(未有导的传输)介质,诸如声音、电磁、rf、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。

作为示例而非限制,计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括,但不限于,易失性存储器,诸如随机存储器(ram,dram,sram);以及非易失性存储器,诸如闪存、各种只读存储器(rom,prom,eprom,eeprom)、磁性和铁磁/铁电存储器(mram,feram);以及磁性和光学存储设备(硬盘、磁带、cd、dvd);或其它现在已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息/数据。

在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1