内容筛选方法以及系统与流程

文档序号:12364407阅读:来源:国知局

技术特征:

1.一种内容筛选方法,包括:

基于用户的内容请求在内容资源中进行筛选从而生成内容筛选结果;

基于内容资源质量评分对所生成的内容筛选结果进行排序处理;以及

将经排序处理的内容筛选结果生成为最终内容筛选结果。

2.根据权利要求1所述的内容筛选方法,其中生成内容筛选结果包括以下步骤:

基于用户的第一内容请求生成第一内容筛选结果;以及

基于用户的第二内容请求生成第二内容筛选结果,

其中所述第二内容筛选结果基于所述第一内容筛选结果以及所述第二内容请求的结合而生成。

3.根据权利要求2所述的内容筛选方法,其中所述第一内容请求具有索引,并且所述第二内容请求不具有索引。

4.根据权利要求3所述的内容筛选方法,其中所述内容资源为文章,所述具有索引的第一内容请求包括文章的标题、作者和/或正文。

5.根据权利要求3所述的内容筛选方法,其中所述内容资源为文章,所述不具有索引的第二内容请求包括文章的浏览量、下载量、顶踩数和/或创建时间。

6.根据权利要求1-5中任一项所述的内容筛选方法,进一步包括在所述排序处理之前对所生成的内容筛选结果进行去重处理。

7.根据权利要求6所述的内容筛选方法,其中所述去重处理包括以下步骤:

针对所生成的内容筛选结果中的两个或更多个内容资源计算内容相似度S;

将所述内容相似度S与相似度阈值S0进行比较;

当S≥S0时,确定所述两个或更多个内容资源为相似,并将所述两个或更多个内容资源删除为一个。

8.根据权利要求7所述的内容筛选方法,其中所述相似度阈值为0.7。

9.根据权利要求1-5中任一项所述的内容筛选方法,其中所述内容资源为IT技术类文章资源,所述内容资源质量评分基于以下评价参数中的一个或多个而获得:文章中的中文字数、文章中的英文字数、文章所包含的代码中的中文字数、文章所包含的代码中的英文字数以及文章中的图片数。

10.根据权利要求9所述的内容筛选方法,其中所述内容资源质量评分通过如下公式计算:

SP=(max(NC,4000)/200*0.4+max(NE,800)/40*0.1+max(NCC,500)/20*0.1+max(NCE,1000)/50*0.2+max(NF,15)/1*0.2),

其中,SP为内容资源质量评分,NC为文章中的中文字数、NE为文章中的英文字数、NCC为文章所包含代码中的中文字数、NCE为文章所包含代码中的英文字数,NF为文章中的图片数。

11.根据权利要求1-3和7-8中任一项所述的内容筛选方法,其中所述内容资源为下载资源,所述下载资源质量评分基于以下评价参数中的一个或多个而获得:下载量、点赞数以及负面评价数。

12.根据权利要求11所述的内容筛选方法,其中所述下载资源质量评分通过如下公式计算:

SD=ND+NG*10-NP*20,

其中,SP为下载资源质量评分,ND为下载量、NG为点赞数、NP为负面评价数。

13.根据权利要求1-3和7-8中任一项所述的内容筛选方法,其中所述内容资源为代码片资源,所述代码片资源质量评分基于以下评价参数中的一个或多个而获得:是否可执行、是否有注释、代码片长度、被收藏数以及点赞数。

14.根据权利要求13所述的内容筛选方法,其中所述代码片资源质量评分通过如下公式计算:

SC=(1+NE*0.5+NC*0.3)*(max(NL,1000)/200*0.4+max(NF,100)*0.3+max(NG,100)*0.3)

其中,SC为代码片质量评分,NE为是否可执行,NC为是否有注释,NL为长度,NF为被收藏数,NG为点赞数,其中NE=0时表示不可执行,NE=1时表示可执行,NC=0时表示无注释,NC=1时表示有注释。

15.根据权利要求1-5和7-8中任一项所述的内容筛选方法,进一步包括截取经排序处理的内容筛选结果中的部分作为最终内容筛选结果。

16.根据权利要求15所述的内容筛选方法,其中所述部分为经排序处理的内容筛选结果中的前600条结果。

17.一种内容筛选系统,包括:

内容质量评价子系统,其收集内容资源的评价参数并基于所述评价参数针对一个或多个内容资源生成内容资源质量评分;

全库检索子系统,其基于用户的第一内容请求生成第一内容筛选结果;

筛选整理子系统,其包括:筛选模块,其基于所述第一内容筛选结果以及用户的第二内容请求生成第二内容筛选结果;排序模块,其基于所述内容质量评价子系统生成的所述内容资源质量评分对所述第二内容筛选结果进行排序处理从而生成最终内容筛选结果。

18.根据权利要求17所述的内容筛选系统,其中所述第一内容请求具有索引,并且所述第二内容请求不具有索引。

19.根据权利要求18所述的内容筛选系统,其中所述内容资源为文章,所述具有索引的第一内容请求包括文章的标题、作者和/或正文。

20.根据权利要求18所述的内容筛选系统,其中所述内容资源为文章,所述不具有索引的第二内容请求包括文章的浏览量、下载量、顶踩数和/或创建时间。

21.根据权利要求17-20中任一项所述的内容筛选系统,其中所述筛选整理子系统进一步去重模块,所述去重模块在所述排序处理之前对所述第二内容筛选结果进行去重处理。

22.根据权利要求21所述的内容筛选系统,其中所述去重模块响应于所述第二内容筛选结果的生成而执行以下操作:

针对所生成的内容筛选结果中的两个或更多个内容资源计算内容相似度S;

将所述内容相似度S与相似度阈值S0进行比较;

当S≥S0时,确定所述两个或更多个内容资源为相似,并将所述两个或更多个内容资源删除为一个。

23.根据权利要求22所述的内容筛选系统,其中所述相似度阈值为0.7。

24.根据权利要求17-20中任一项所述的内容筛选系统,其中所述内容资源为IT技术类文章资源,所述内容资源质量评分基于以下评价参数中的一个或多个而获得:文章中的中文字数、文章中的英文字数、文章所包含的代码中的中文字数、文章所包含的代码中的英文字数以及文章中的图片数。

25.根据权利要求24所述的内容筛选系统,其中所述内容资源质量评分通过如下公式计算:

SP=(max(NC,4000)/200*0.4+max(NE,800)/40*0.1+max(NCC,500)/20*0.1+max(NCE,1000)/50*0.2+max(NF,15)/1*0.2),

其中,SP为内容资源质量评分,NC为文章中的中文字数、NE为文章中的英文字数、NCC为文章所包含代码中的中文字数、NCE为文章所包含代码中的英文字数,NF为文章中的图片数。

26.根据权利要求17-20和22-23中任一项所述的内容筛选系统,其中所述内容资源为下载资源,所述下载资源质量评分基于以下评价参数中的一个或多个而获得:下载量、点赞数以及负面评价数。

27.根据权利要求26所述的内容筛选系统,其中所述下载资源质量评分通过如下公式计算:

SD=ND+NG*10-NP*20,

其中,SP为下载资源质量评分,ND为下载量、NG为点赞数、NP为负面评价数。

28.根据权利要求17-20和22-23中任一项所述的内容筛选系统,其中所述内容资源为代码片资源,所述代码片资源质量评分基于以下评价参数中的一个或多个而获得:是否可执行、是否有注释、代码片长度、被收藏数以及点赞数。

29.根据权利要求28所述的内容筛选系统,其中所述代码片资源质量评分通过如下公式计算:

SC=(1+NE*0.5+NC*0.3)*(max(NL,1000)/200*0.4+max(NF,100)*0.3+max(NG,100)*0.3)

其中,SC为代码片质量评分,NE为是否可执行,NC为是否有注释,NL为长度,NF为被收藏数,NG为点赞数,其中NE=0时表示不可执行,NE=1时表示可执行,NC=0时表示无注释,NC=1时表示有注释。

30.根据权利要求17-20和22-23中任一项所述的内容筛选系统,其中所述筛选整理子系统进一步包括截取模块,所述截取模块截取经排序处理的内容筛选结果中的部分作为最终内容筛选结果。

31.根据权利要求30所述的内容筛选方法,其中所述部分为经排序处理的内容筛选结果中的前600条结果。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1