一种文档展示的方法、装置、电子设备及可读存储介质与流程

文档序号:11216454阅读:241来源:国知局
一种文档展示的方法、装置、电子设备及可读存储介质与流程
本发明涉及互联网
技术领域
,特别是涉及一种文档展示的方法、装置、电子设备及可读存储介质。
背景技术
:随着通信技术的发展,尤其是3g网络和智能移动终端的发展,用户的网络生活越来越丰富,可以随时随地在网络上聊天、浏览新闻、看电影、玩游戏、搜索、购物、发布信息等。对于内容提供商,通过向用户展示推荐资讯内容吸引用户显得至关重要,资讯内容的质量好坏、资讯内容的时效性等往往对能否吸引用户关注起着决定性作用,其中,资讯内容也可以称为文章或者文档。在现有技术中,往往是通过统计一段时间内用户浏览的目标文档得到历史数据,然后根据历史数据向用户展示推荐资讯内容,其中,该历史数据可以包括:对目标文档进行分析得到的用户的浏览习惯,或者每个文档被用户浏览的次数等。但是,基于历史数据推荐的目标文档具有时间上的局限性,用户并不能浏览到时下最新的事物,造成用户体验不佳。技术实现要素:本发明实施例的目的在于提供一种文档展示的方法、装置、电子设备及可读存储介质,以实现将与最新资讯内容有关的文档及时展现给用户,提高用户的浏览体验。具体技术方案如下:第一方面,本发明实施例提供了一种文档展示的方法,该方法包括:获取用户对目标文档的用户操作信息,并根据用户操作信息对应的预设评分规则对目标文档进行评分,得到目标文档的用户操作信息对应的评分,其中,用户操作信息包括:停留时间、点击率、浏览量及互动度,互动度包括用户对目标文档的评论次数、点赞次数、分享次数中的至少一个;获取目标热词集合;根据目标热词集合对目标文档进行热度分析,得到目标文档的热度值;对用户操作信息对应的评分和热度值进行加权处理,得到目标文档的综合评分;根据目标文档的综合评分对目标文档进行展示。可选的,获取用户对目标文档的用户操作信息,并根据用户操作信息对应的预设评分规则对目标文档进行评分,得到目标文档的用户操作信息对应的评分,包括:获取用户浏览目标文档的停留时间和目标文档的字数,根据第一预设评分规则对目标文档进行评分,得到目标文档的停留时间评分;获取目标文档的点击率,根据第二预设评分规则对目标文档进行评分,得到目标文档的点击率评分;获取目标文档的浏览量,根据第三预设评分规则对目标文档进行评分,得到目标文档的浏览量评分;获取目标文档的互动度,根据第四预设评分规则对目标文档进行评分,得到目标文档的互动度评分。可选的,获取用户浏览目标文档的停留时间和目标文档的字数,根据第一预设评分规则对目标文档进行评分,得到目标文档的停留时间评分,包括:获取用户浏览目标文档的停留时间和目标文档的字数;与预先建立的停留时间评分表中的文档字数以及用户浏览文档对应的停留时间对比,得到目标文档的停留时间评分,其中,预先建立的停留时间评分表包括:文档字数、用户浏览文档对应的停留时间以及停留时间评分之间的一一对应关系;可选的,获取目标文档的点击率,根据第二预设评分规则对目标文档进行评分,得到目标文档的点击率评分,包括:获取目标文档的点击率,与预先建立的点击率评分表中的点击率及点击率评分对比,得到目标文档的点击率评分,其中,点击率评分表包括:点击率及点击率评分的一一对应关系;可选的,获取目标文档的浏览量,根据第三预设评分规则对目标文档进行评分,得到目标文档的浏览量评分,包括:获取目标文档的浏览量,与预先建立的浏览量评分表中的浏览量及浏览量评分对比,得到目标文档的点击率评分,其中,浏览量评分表包括:浏览量及浏览量评分的一一对应关系。可选的,第一预设评分规则为:目标文档的字数在预设区间i时其中,f1(x1)为停留时间评分,x1为停留时间,ai、bi、m分别为大于0的实数,ci、di分别为大于或等于0的实数,i为大于0的自然数;第二预设评分规则为f2(x2)=k1x2+w1,其中,f2(x2)为点击率评分,x2为点击率,k1为大于0的实数,w1为大于或等于0的实数;第三预设评分规则为f3(x3)=k2x3+w2,其中,f3(x3)为浏览量评分,x3为浏览量,k2为大于0的实数,w2为大于或等于0的实数;第四预设评分规则为f4(x4)=k3x4+w3,其中,f4(x4)为互动度评分,x4为点击率,k3为大于0的实数,w3为大于或等于0的实数。可选的,获取目标热词集合,包括:通过网络爬虫爬取各网站中的热词,得到初始热词集合;通过预设过滤词库对初始热词集合中的热词进行过滤,得到过滤后的热词集合;统计过滤后的热词集合中相同热词的数量,根据相同热词的数量得到过滤后的热词集合中的每个热词的热词权重,并对相同热词进行去重处理,得到包含热词权重的目标热词集合。可选的,根据目标热词集合对目标文档进行热度分析,得到目标文档的热度值,包括:通过目标热词集合对目标文档中包含的热词进行统计,得到目标文档包含的热词及每个热词对应的热词数量;根据热词及每个热词对应的热词数量,计算目标文档的热度值。可选的,根据目标文档的综合评分对目标文档进行展示,包括:在存在与目标文档的综合评分相同的文档时,根据热度值对与目标文档的综合评分相同的文档和目标文档进行展示。第二方面,本发明实施例还提供了一种文档展示的装置,该装置包括:操作信息评分计算模块,用于获取用户对目标文档的用户操作信息,并根据用户操作信息对应的预设评分规则对目标文档进行评分,得到目标文档的用户操作信息对应的评分,其中,用户操作信息包括:停留时间、点击率、浏览量及互动度,互动度包括用户对目标文档的评论次数、点赞次数、分享次数中的至少一个;获取模块,用于获取目标热词集合;热度值计算模块,用于根据目标热词集合对目标文档进行热度分析,得到目标文档的热度值;综合评分计算模块,用于对用户操作信息对应的评分和热度值进行加权处理,得到目标文档的综合评分;展示模块,用于根据目标文档的综合评分对目标文档进行展示。可选的,操作信息评分计算模块,包括:第一评分计算子模块,用于获取用户浏览目标文档的停留时间和目标文档的字数,根据第一预设评分规则对目标文档进行评分,得到目标文档的停留时间评分;第二评分计算子模块,用于获取目标文档的点击率,根据第二预设评分规则对目标文档进行评分,得到目标文档的点击率评分;第三评分计算子模块,用于获取目标文档的浏览量,根据第三预设评分规则对目标文档进行评分,得到目标文档的浏览量评分;第四评分计算子模块,用于获取目标文档的互动度,根据第四预设评分规则对目标文档进行评分,得到目标文档的互动度评分。可选的,第一评分计算子模块,具体用于获取用户浏览目标文档的停留时间和目标文档的字数,与预先建立的停留时间评分表中的文档字数以及用户浏览文档对应的停留时间对比,得到目标文档的停留时间评分,其中,预先建立的停留时间评分表包括:文档字数、用户浏览文档对应的停留时间以及停留时间评分之间的一一对应关系;可选的,第二评分计算子模块,具体用于获取目标文档的点击率,与预先建立的点击率评分表中的点击率及点击率评分对比,得到目标文档的点击率评分,其中,点击率评分表包括:点击率及点击率评分的一一对应关系;可选的,第三评分计算子模块,具体用于获取目标文档的浏览量,与预先建立的浏览量评分表中的浏览量及浏览量评分对比,得到目标文档的点击率评分,其中,浏览量评分表包括:浏览量及浏览量评分的一一对应关系。可选的,第一预设评分规则为:目标文档的字数在预设区间i时其中,f1(x1)为停留时间评分,x1为停留时间,ai、bi、m分别为大于0的实数,ci、di分别为大于或等于0的实数,i为大于0的自然数;第二预设评分规则为f2(x2)=k1x2+w1,其中,f2(x2)为点击率评分,x2为点击率,k1为大于0的实数,w1为大于或等于0的实数;第三预设评分规则为f3(x3)=k2x3+w2,其中,f3(x3)为浏览量评分,x3为浏览量,k2为大于0的实数,w2为大于或等于0的实数;第四预设评分规则为f4(x4)=k3x4+w3,其中,f4(x4)为互动度评分,x4为点击率,k3为大于0的实数,w3为大于或等于0的实数。可选的,获取模块,包括:爬取子模块,用于通过网络爬虫爬取各网站中的热词,得到初始热词集合;预处理子模块,用于通过预设过滤词库对初始热词集合中的热词进行过滤,得到过滤后的热词集合;目标热词集合生成模块,用于统计过滤后的热词集合中相同热词的数量,根据相同热词的数量得到过滤后的热词集合中的每个热词的热词权重,并对相同热词进行去重处理,得到包含热词权重的目标热词集合。可选的,热度值计算模块,具体用于通过目标热词集合对目标文档中包含的热词进行统计,得到目标文档包含的热词及每个热词对应的热词数量,根据热词及每个热词对应的热词数量,计算目标文档的热度值。可选的,展示模块,还用于在存在与目标文档的综合评分相同的文档时,根据热度值对与目标文档的综合评分相同的文档和目标文档进行展示。第三方面,本发明实施例还提供了一种电子设备,该电子设备可以包括:处理器、通信接口、存储器、显示设备、通信总线和输入设备,其中,处理器、通信接口、存储器、显示设备、输入设备通过通信总线完成相互间的通信,存储器,用于存储计算机程序;处理器,用于执行存储器上所存储的程序时,实现第一方面提供的文档展示的方法步骤;显示设备,用于对处理器执行上述方法步骤后得到的目标文档进行展示;输入设备,用于获取用户的操作信息,并将该操作信息发送至存储器。第四方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现第一方面提供的文档展示的方法步骤。本发明实施例提供的一种文档展示的方法、装置、电子设备及可读存储介质,通过分别计算用户操作信息对应的评分和目标文档的热度值,得到综合评分,再根据综合评分对目标文档进行展示,可以将与最新资讯有关的、质量较高的文档及时展现给用户,提高用户的浏览体验,从而吸引更多的用户关注内容提供商,提高用户黏性。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例的一种文档展示的方法的流程图;图2为本发明实施例的一种文档展示的装置的结构示意图;图3为本发明实施例的一种文档展示的方法应用于电子设备的结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。为了解决现有技术存在的问题,本发明实施例提供了一种文档展示的方法,以实现将与最新资讯有关的文档及时展现给用户,提高用户的浏览体验,从而吸引更多的用户关注内容提供商,提高用户黏性。首先,对本发明实施例中的名词进行解释。停留时间:从用户打开目标文档的时间到用户关闭目标文档的时间之间的时间长度。点击率=点击量/展现量,展现量为目标文档被推荐的次数,点击量为目标文档被点击的次数。浏览量:目标文档被用户浏览的次数,这里的用户可以是不同的用户。下面,对本发明实施例的一种文档展示的方法进行介绍,如图1所示,为本发明实施例的一种文档展示的方法的流程图,该方法可以包括:s101,获取用户对目标文档的用户操作信息,并根据用户操作信息对应的预设评分规则对目标文档进行评分,得到目标文档的用户操作信息对应的评分。其中,用户操作信息包括:停留时间、点击率、浏览量及互动度,互动度包括用户对目标文档的评论次数、点赞次数、分享次数中的至少一个。本发明实施例提供的方法可以应用于电子设备。具体的,该电子设备可以为:台式计算机、便携式计算机、智能移动终端、服务器等。应用本发明实施例的电子设备上可以保存有多个文档,目标文档为该多个文档中的任一个文档,用户在对目标文档进行操作时,该电子设备可以对用户的操作进行记录,形成操作信息,例如用户打开目标文档、用户关闭目标文档等。电子设备在计算目标文档的用户操作信息对应的评分时,可以根据用户操作信息调用预设评分规则,然后通过预设评分规则得到目标文档的用户操作信息对应的评分。s102,获取目标热词集合。其中,热词,即热门词汇,作为一种词汇现象,反映了一个国家、一个地区在一个时期人们普遍关注的问题或事物。在本发明实施例中,为了将与最新资讯有关的文档及时展现给用户,这里可以根据目标文档中存在的热词评价目标文档的热度。在根据目标文档中存在的热词评价目标文档的热度时,可以首先获取目标热词集合,通过目标热词集合查找目标文档中存在的热词。该目标热词集合可以是预先设置的热词集合,也可以是通过网络爬虫实时爬取得到的热词集合。在该目标热词集合中,每个热词可以具有不同的权重,从而可以体现每个热词的热度,在后续步骤中,可以更精细的计算出目标文档的热度。s103,根据目标热词集合对目标文档进行热度分析,得到目标文档的热度值。具体的,在通过上述步骤得到目标热词集合后,可以通过该目标热词集合中的每个词对目标文档进行热度分析,得到目标文档中包含的热词,再计算该热词在目标文档中占的百分比,从而可以得到目标文档的热度值。s104,对用户操作信息对应的评分和热度值进行加权处理,得到目标文档的综合评分。在通过上述步骤得到用户操作信息对应的评分和目标文档对应的热度值后,可以根据预先设置的权值,对用户操作信息对应的评分和热度值进行加权计算,得到目标文档的综合评分,其中,该综合评分可以从整体上体现出目标文档的热度、质量以及受欢迎程度。s105,根据目标文档的综合评分对目标文档进行展示。其中,该目标文档可以是正在展示的文档,在接受到需要对目标文档的展示位置进行调整的指令时,可以通过上述步骤计算目标文档的综合评分,再根据该综合评分对目标文档的位置进行调整,从而实现对目标文档的展示。本发明实施例提供的一种文档展示的方法,可以将与最新资讯有关的文档及时展现给用户,提高用户的浏览体验,从而吸引更多的用户关注内容提供商,提高用户黏性。为了更精确的计算用户操作信息对应的评分,在本发明实施例中,可以对用户操作信息中的停留时间、点击率、浏览量以及互动度进行计算,得到各用户操作信息对应的评分。具体的,获取用户对目标文档的用户操作信息,并根据用户操作信息对应的预设评分规则对目标文档进行评分,得到目标文档的用户操作信息对应的评分,包括:获取用户浏览目标文档的停留时间和目标文档的字数,根据第一预设评分规则对目标文档进行评分,得到目标文档的停留时间评分;用户在浏览目标文档时,电子设备可以记录一段时间内每个用户浏览目标文档的停留时间,然后将计算得到的停留时间的平均值作为用户浏览该目标文档对应的停留时间。具体的,在计算目标文档的停留时间评分时,电子设备可以查询与停留时间及目标文档的字数对应的记录得到该目标文档的字数,然后通过第一预设评分规则对目标文档进行评分,得到目标文档的停留时间评分。其中,停留时间可以反映该目标文档的质量,用户浏览该目标文档时的停留时间越长,则说明该目标文档的内容质量越好,反之,则说明该目标文档的内容质量较差,用户没有兴趣认真阅读。获取目标文档的点击率,根据第二预设评分规则对目标文档进行评分,得到目标文档的点击率评分。其中,点击率=点击量/展现量,展现量为目标文档被推荐的次数,点击量为目标文档被点击的次数。点击率能够反映该目标文档吸引用户的程度。用户在浏览目标文档时,电子设备可以分别记录一段时间内目标文档被推荐的次数和被点击的次数,其中,该点击次数可以用户点击目标文档的标题的次数。在计算点击率评分时,电子设备可以通过查询与点击率对应记录得到目标文档的点击率,在得到目标文档的点击率后,可以通过第二预设评分规则对目标文档进行评分,得到目标文档的点击率评分。获取目标文档的浏览量,根据第三预设评分规则对目标文档进行评分,得到目标文档的浏览量评分;浏览量,即浏览目标文档的用户的数量,可以反映目标文档被用户接受的程度。用户在浏览目标文档时,电子设备可以记录一段时间内目标文档被不同用户浏览的次数。在计算浏览量评分时,电子设备可以通过查询与浏览量对应的记录得到目标文档的浏览量,然后通过第三预设评分规则对目标文档进行评分,得到目标文档的浏览量评分。获取目标文档的互动度,根据第四预设评分规则对目标文档进行评分,得到目标文档的互动度评分。用户在浏览完目标文档后,可以对目标文档进行互动操作,例如对目标文档进行评论、点赞、分享,该互动度可以是用户对目标文档进行互动操作的次数。因此,互动度可以进一步反映目标文档的内容质量。用户在对目标文档进行互动操作时,电子设备可以记录与该目标文档对应的互动操作,在计算互动度评分时,可以通过查询于互动操作对应的记录得到目标文档的互动度,然后通过第四预设评分规则对目标文档进行评分,得到目标文档的互动度评分。在本步骤中,通过分别计算用户操作信息中的停留时间、点击率、浏览量以及互动度对应的评分,可以实现在后续计算综合评分时,提供更精确的评分,提高本发明实施例的文档展示的精确度。具体的,在一种可能的实施方式中,在获取用户浏览目标文档的停留时间和目标文档的字数,根据第一预设评分规则对目标文档进行评分,得到目标文档的停留时间评分时,可以通过以下步骤实现:第一步,获取用户浏览目标文档的停留时间和目标文档的字数。目标文档的字数可以在将该目标文档保存到电子设备上时进行统计,也可以在根据第一预设评分规则对目标文档进行评分时统计该目标文档的评分。优选的,可以在将该目标文档保存到电子设备上时统计该目标文档的字数,这样可以在根据第一预设评分规则对目标文档进行评分时,降低获取用户浏览目标文档的停留时间和目标文档的字数的时间,节省时间开销。第二步,与预先建立的停留时间评分表中的文档字数以及用户浏览文档对应的停留时间对比,得到目标文档的停留时间评分,其中,预先建立的停留时间评分表包括:文档字数、用户浏览文档对应的停留时间以及停留时间评分之间的一一对应关系。其中,在建立该停留时间评分表时,可以对文档的字数和停留时间分别进行分段,并对不同分段的字数和不同停留时间分段的时间设置不同的评分。在获取到用户浏览目标文档的停留时间和目标文档的字数后,可以在预先建立的与文档字数及停留时间对应的停留时间评分表中进行查询,得到目标文档的停留时间评分。具体的,可以通过目标文档的字数在该表中查询字数所在的字数分段,再通过该停留时间再该表中查询停留时间所在的停留时间分段,从而确定目标文档的停留时间评分。为了更清楚的说明本发明实施例,这里举例进行说明,假设,表1为预先设置的停留时间评分表,目标文档的字数为1050字,所有用户在一天内浏览目标文档时的停留时间的平均值为4分钟,则可以通过查询该停留时间评分表,得到目标文档的停留时间评分为3分。表1停留时间评分表具体的,在获取目标文档的点击率,根据第二预设评分规则对目标文档进行评分,得到目标文档的点击率评分时,可以通过获取目标文档的点击率,与预先建立的点击率评分表中的点击率及点击率评分对比,得到目标文档的点击率评分,其中,点击率评分表包括:点击率及点击率评分的一一对应关系。其中,在建立该点击率评分表时,可以对点击率进行分段,然后对不同分段的点击率设置不同的评分。电子设备可以查询一段时间内目标文档的点击率获取目标文档的点击率,根据该点击率在预先建立的点击率评分表中查询该点击率对应的点击率分段,从而确定该点击率对应的评分。假设,目标文档在一天时间内的点击率为48%,表2为预先建立的点击率评分表,电子设备可以在表2所示的点击率评分表中查询该目标文档的点击率所在的点击率分段,为51%-60%的分段,然后再根据该点击率评分表得到该目标文档的点击率评分为6。表2点击率评分表点击率(%)1-1011-2021-3031-4041-50评分12345点击率(%)51-6061-7071-8081-9091-100评分678910具体的,在获取目标文档的浏览量,根据第三预设评分规则对目标文档进行评分,得到目标文档的浏览量评分时,可以通过获取目标文档的浏览量,与预先建立的浏览量评分表中的浏览量及浏览量评分对比,得到目标文档的点击率评分,其中,浏览量评分表包括:浏览量及浏览量评分的一一对应关系。其中,在建立该浏览量评分表时,可以对浏览量进行分段,然后对不同分段的浏览量设置不同的评分。电子设备可以查询一段时间内目标文档的浏览量获取目标文档的浏览量,根据该浏览量在预先建立的浏览量评分表中查询该浏览量对应的浏览量分段,从而确定该浏览量对应的评分。假设,目标文档在一天时间内的浏览量为7.8万,表3为预先建立的浏览量评分表,电子设备可以在表3所示的浏览量评分表中查询该目标文档的浏览量所在的浏览量分段,为7-9万的分段,然后再根据该浏览量评分表得到该目标文档的浏览量评分为7。表3浏览量评分表浏览量(万)0-0.10.1-0.50.5-11-33-5评分12345浏览量(万)5-77-99-1515-20>20评分678910需要说明的是,上述的三个评分表是为了清楚地说明本发明实施例而进行的举例。具体的,在一种可能的实施方式中,为了更精确的计算目标文档的用户操作信息的评分,本发明实施例还具体列出了停留时间、点击率、浏览量及互动度分别对应的评分规则,如下:第一预设评分规则为:目标文档的字数在预设字数区间i时其中,f1(x1)为停留时间评分,x1为停留时间,ai、bi、m分别为大于0的实数,ci、di分别为大于或等于0的实数,i为大于0的自然数。这里,ai、bi、m、ci、di为预先设置的值,在不同的预设字数区间,具有不同的数值。在用户浏览文档时,对于每一篇文档,都具有一定的理论停留时间,在该理论停留时间内,用户浏览该文档的停留时间与浏览的仔细程度的相关度较高,并且,从用户浏览的仔细程度可以反映出该文档的质量,因此,通过上述第一评分规则,可以在理论停留时间内,用户浏览的越仔细,停留时间越长,计算得到的对应的停留时间评分越高,其中,该停留时间可以是通过对多个用户仔细浏览同一文档的时间进行统计后得到的平均停留时间。在本步骤中,可以设置预设字数区间,例如,可以设置0-500字的区间、501-1000字的区间等,假设目标文档的字数为487,用户浏览该目标文档对应的停留时间为3分钟,在0-500字的区间,在该区间中,ai=2、bi=1、m=1、ci=10、di=1,则通过该第一预设评分规则,可以计算出停留时间评分为2.89。当用户浏览该目标文档对应的停留时间为10分钟时,则停留时间评分为2.97。第二预设评分规则为f2(x2)=k1x2+w1,其中,f2(x2)为点击率评分,x2为点击率,k1为大于0的实数,w1为大于或等于0的实数。第三预设评分规则为f3(x3)=k2x3+w2,其中,f3(x3)为浏览量评分,x3为浏览量,k2为大于0的实数,w2为大于或等于0的实数。第四预设评分规则为f4(x4)=k3x4+w3,其中,f4(x4)为互动度评分,x4为点击率,k3为大于0的实数,w3为大于或等于0的实数。其中,第一预设评分规则为用户浏览目标文档的停留时间对应的评分规则,第二预设评分规则为目标文档的点击率对应的评分规则,第三预设评分规则为目标文档的浏览量对应的评分规则,第四预设评分规则为用户与目标文档的互动度对应的评分规则。通过使用上述四种预设评分规则计算用户操作信息对应的评分,可以计算出更精确地评分,使电子设备可以根据该评分对目标文档进行展示,提高本发明实施例的文档展示的精确度。在一种可能的实施方式中,为了能够及时得到目标热词集合,提高计算目标文档的热度值的精确度,在获取目标热词集合时,可以通过网络爬虫爬取各网站中的热词,得到初始热词集合;对初始热词集合中的热词进行预处理,得到目标热词集合。具体的,本发明实施例的文档展示的方法可以应用于服务器,在服务器中可以设置网络爬虫程序,用来爬取各网站中的热词,得到初始热词集合。通过使用网络爬虫程序,可以及时获取网络中最新的热词,以使得在计算目标文档的热度值时,可以使用最新热词对目标文档进行热度值计算,提高热度值计算的精确度。对于得到的初始热词集合,由于网络爬虫程序是从不同网站上进行爬取的,可能存在重复的热词,也可能存在不符合要求的热词,因此,在得到初始热词集合后,可以对初始热词集合中的热词进行进行预处理,以消除重复的热词和不符合要求的热词。具体的,对初始热词集合中的热词进行预处理,得到目标热词集合,可以包括:第一步,通过预设过滤词库对初始热词集合中的热词进行过滤,得到过滤后的热词集合。其中,该预设过滤词库中可以包含敏感词、非法词等不符合要求的词,这些词不宜作为热词对目标文档的热度进行评分。在得到目标热词集合时,可以通过预设过滤词库对获取到的初始热词集合进行过滤,过滤掉初始热词集合中不符合要求的词,得到过滤后的热词集合。第二步,统计过滤后的热词集合中相同热词的数量,根据相同热词的数量得到过滤后的热词集合中的每个热词的热词权重,并对相同热词进行去重处理,得到包含热词权重的目标热词集合。对初始热词集合过滤后,得到的热词集合中的热词可以用于对目标文档进行评分,这里,为了使得热度评分更精确,在得到过滤后的热词集合后,可以通过统计过滤后的热词集合中相同热词的数量,计算过滤后的热词集合中每个热词的权重,得到包含不同权重的热词的目标热词集合,这样,可以在后续步骤中,通过包含不同权重的热词的目标热词集合对目标文档进行热度分析,可以提高目标文档的热度值的精确度。在计算每个热词的热词权重时,可以计算该热词在热词集合中的占比,并将该占比作为该热词的权重。在得到每个热词的热词权重后,为了防止在后续步骤中用相同的热词对目标文档进行热度分析造成的重复操作,在本步骤中,可以对相同的热词进行去重处理,保留相同热词中的一个热词及该热词对应的权重,得到包含热词权重的目标热词集合。具体的,在一种可能的实施方式中,根据目标热词集合对目标文档进行热度分析,得到目标文档的热度值,可以包括:第一步,通过目标热词集合对目标文档中包含的热词进行统计,得到目标文档包含的热词及每个热词对应的热词数量。具体的,在本步骤中,可以使用目标热词集合的每个热词与目标文档进行匹配,当在目标文档中匹配到一个词后,记录该词,并统计该词被匹配到的次数,可以得到目标文档包含的热词及每个热词对应的热词数量。第二步,根据热词及每个热词对应的热词数量,计算目标文档的热度值。具体的,在得到目标文档包含的热词及每个热词对应的热词数量后,可以根据每个热词在目标文档中的占比和/或该热词在文档中的权重、每个热词在目标文档中的数量计算目标文档的热度值。假设在上一步骤中,得到目标文档中包含有热词a、热词b、热词c,热词a在目标文档中有5个,热词b在目标文档中有7个,热词c在目标文档中有9个,热词a在目标文档中的权重为0.8,热词b在目标文档中的权重为0.6,热词c在目标文档中的权重为0.5,得到目标文档的热度值为5*0.8+7*0.6+9*0.5=12.7。具体的,在根据目标文档的综合评分对目标文档进行展示时,还存在一种可能的情况,即:存在与目标文档的综合评分相同的文档。针对该情况,本发明实施例还提供了一种可能的实施方式,在存在与目标文档的综合评分相同的文档时,可以根据热度值对与目标文档的综合评分相同的文档和目标文档进行展示。假设,目标文档为文档a,综合评分为88,热度值评分为15.6,与目标文档的综合评分相同的文档为文档b,综合评分为88,热度值评分为13.7,这里,可以根据热度值评分的高低对目标文档和与目标文档的综合评分相同的文档分别进行展示,可以在文档b之前展示文档a。通过本步骤,可以将热度值高的文档较早的展示给用户,使用户能够及时浏览到热度值高的文档,提高用户的粘度。相应于上述方法实施例,本发明实施例还提供了一种文档展示的装置,如图2所示,为本发明实施例的一种文档展示的装置的结构示意图,该装置包括:操作信息评分计算模块201,用于获取用户对目标文档的用户操作信息,并根据用户操作信息对应的预设评分规则对目标文档进行评分,得到目标文档的用户操作信息对应的评分,其中,用户操作信息包括:停留时间、点击率、浏览量及互动度,互动度包括用户对目标文档的评论次数、点赞次数、分享次数中的至少一个;获取模块202,用于获取目标热词集合;热度值计算模块203,用于根据目标热词集合对目标文档进行热度分析,得到目标文档的热度值;综合评分计算模块204,用于对用户操作信息对应的评分和热度值进行加权处理,得到目标文档的综合评分;展示模块205,用于根据目标文档的综合评分对目标文档进行展示。具体的,操作信息评分计算模块201,可以包括:第一评分计算子模块,用于获取用户浏览目标文档的停留时间和目标文档的字数,根据第一预设评分规则对目标文档进行评分,得到目标文档的停留时间评分;第二评分计算子模块,用于获取目标文档的点击率,根据第二预设评分规则对目标文档进行评分,得到目标文档的点击率评分;第三评分计算子模块,用于获取目标文档的浏览量,根据第三预设评分规则对目标文档进行评分,得到目标文档的浏览量评分;第四评分计算子模块,用于获取目标文档的互动度,根据第四预设评分规则对目标文档进行评分,得到目标文档的互动度评分。具体的,第一评分计算子模块,具体用于获取用户浏览目标文档的停留时间和目标文档的字数,与预先建立的停留时间评分表中的文档字数以及用户浏览文档对应的停留时间对比,得到目标文档的停留时间评分,其中,预先建立的停留时间评分表包括:文档字数、用户浏览文档对应的停留时间以及停留时间评分之间的一一对应关系;具体的,第二评分计算子模块,具体用于获取目标文档的点击率,与预先建立的点击率评分表中的点击率及点击率评分对比,得到目标文档的点击率评分,其中,点击率评分表包括:点击率及点击率评分的一一对应关系;具体的,第三评分计算子模块,具体用于获取目标文档的浏览量,与预先建立的浏览量评分表中的浏览量及浏览量评分对比,得到目标文档的点击率评分,其中,浏览量评分表包括:浏览量及浏览量评分的一一对应关系。具体的,第一预设评分规则为:目标文档的字数在预设区间i时其中,f1(x1)为停留时间评分,x1为停留时间,ai、bi、m分别为大于0的实数,ci、di分别为大于或等于0的实数,i为大于0的自然数;第二预设评分规则为f2(x2)=k1x2+w1,其中,f2(x2)为点击率评分,x2为点击率,k1为大于0的实数,w1为大于或等于0的实数;第三预设评分规则为f3(x3)=k2x3+w2,其中,f3(x3)为浏览量评分,x3为浏览量,k2为大于0的实数,w2为大于或等于0的实数;第四预设评分规则为f4(x4)=k3x4+w3,其中,f4(x4)为互动度评分,x4为点击率,k3为大于0的实数,w3为大于或等于0的实数。具体的,获取模块202,可以包括:爬取子模块,用于通过网络爬虫爬取各网站中的热词,得到初始热词集合;预处理子模块,用于通过预设过滤词库对初始热词集合中的热词进行过滤,得到过滤后的热词集合;目标热词集合生成模块,用于统计过滤后的热词集合中相同热词的数量,根据相同热词的数量得到过滤后的热词集合中的每个热词的热词权重,并对相同热词进行去重处理,得到包含热词权重的目标热词集合。具体的,热度值计算模块203,具体用于通过目标热词集合对目标文档中包含的热词进行统计,得到目标文档包含的热词及每个热词对应的热词数量,根据热词及每个热词对应的热词数量,计算目标文档的热度值。具体的,展示模块205,还用于在存在与目标文档的综合评分相同的文档时,根据热度值对与目标文档的综合评分相同的文档和目标文档进行展示。本发明实施例还提供了一种电子设备,如图3所示,为本发明实施例的一种文档展示的方法应用于电子设备的结构示意图,该电子设备可以包括处理器301、通信接口302、存储器303、显示设备304、通信总线305和输入设备306,其中,处理器301,通信接口302,存储器303、显示设备304、输入设备306可以通过通信总线305完成相互间的通信,存储器303,用于存储计算机程序;输入设备306,用于获取用户的操作信息,并将该操作信息发送至存储器303。该输入设备可以是键盘、鼠标、具有输入功能的触摸屏等。处理器301,用于执行存储器303上所存储的程序时,实现如下步骤:步骤a,获取用户对目标文档的用户操作信息,并根据用户操作信息对应的预设评分规则对目标文档进行评分,得到目标文档的用户操作信息对应的评分;步骤b,获取目标热词集合;步骤c,根据目标热词集合对目标文档进行热度分析,得到目标文档的热度值;步骤d,对用户操作信息对应的评分和热度值进行加权处理,得到目标文档的综合评分;步骤e,根据目标文档的综合评分对目标文档进行展示。显示设备304,用于对处理器301执行上述方法步骤后得到的目标文档进行展示。上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口302用于上述电子设备与其他设备之间的通信。存储器303可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。上述的处理器301可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。本发明实施例还提供了一种计算机可读存储介质,该存储介质内存储有计算机程序,该计算机程序可以被处理器执行,以实现以下方法:步骤a,获取用户对目标文档的用户操作信息,并根据用户操作信息对应的预设评分规则对目标文档进行评分,得到目标文档的用户操作信息对应的评分;步骤b,获取目标热词集合;步骤c,根据目标热词集合对目标文档进行热度分析,得到目标文档的热度值;步骤d,对用户操作信息对应的评分和热度值进行加权处理,得到目标文档的综合评分;步骤e,根据目标文档的综合评分对目标文档进行展示。需要说明的是,本发明实施例的装置、电子设备及存储介质分别是应用上述文档展示的方法的装置、电子设备及存储介质,则上述文档展示的方法的所有实施例均适用于该装置、电子设备及存储介质,且均能达到相同或相似的有益效果。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1