一种用于出版行业热点选题的新颖性判断方法与系统的制作方法

文档序号:9579355阅读:464来源:国知局
一种用于出版行业热点选题的新颖性判断方法与系统的制作方法
【技术领域】
[0001]本发明涉及出版技术领域,具体地是涉及一种用于出版行业热点选题的新颖性判断方法与系统。
【背景技术】
[0002]出版业生存发展一个决定因素是出版的内容,而高质量内容的首要条件是高质量的选题,离开一流的选题,很难产生出一流的出版内容。因此,获得及时准确、具有市场价值的热点选题,对出版物的优质高效起着至关重要的作用。
[0003]而目前对热点选题的获取以及其是否具有新颖性的判断都需要借助编辑人员进行,面对海量的信息去筛选优化为具体的选题,工作量巨大,制约选题优化的进一步发展,迫切需求计算机辅助来进行选题优化工作。而且人工判断选题的新颖性时过分依赖于人的主观性,同时缺乏足够的数据支撑,使得其新颖性判断不够客观公正,在指导出版方向时难免会出现偏差,不利于出版行业的快速发展。
[0004]因此,本发明的发明人亟需构思一种新技术以改善其问题。

【发明内容】

[0005]本发明旨在提供一种用于出版行业热点选题的新颖性判断方法与系统,其可以使得选题的新颖性判断更加准确和高效。
[0006]为解决上述技术问题,本发明的技术方案是:
[0007]一种用于出版行业热点选题的新颖性判断方法,包括如下步骤:
[0008]S1:设定多个主题类别,其设定方式包括人工预定义和自动聚类生成。
[0009]S2:获取出版物资源库中所有出版物的主题,并确定其对应的主题类别,统计每一主题类别下对应的出版物数量。
[0010]根据对应出版物数量的不同将主题类别进行划分,包括第一主题类别和第二主题类别,其中所述第一主题类别下对应的出版物数量小于所述第二主题类别下对应的出版物数量。
[0011]S3:确定热点选题所在的主题类别,当该主题类别为第一主题类别时,判定其具有新颖性,标记为新颖选题并推送至出版单位所在的媒体终端。
[0012]进一步地,还包括:
[0013]S4:对新颖选题通过关联挖掘的方法得到与该新颖选题相关联的一个或者多个关联选题,而后确定该关联选题所在的主题类别,当该主题类别为第一主题类别时,判定其具有新颖性,标记为新颖选题并推送至出版单位所在的媒体终端。
[0014]进一步地,还包括:
[0015]S5:将所述新颖选题与专家新颖知识库中的数据进行相似度的比较,如果相似度高于预设阈值,则判定其新颖性高,标记为前沿选题并推送至出版单位所在的媒体终端。
[0016]进一步地,所述步骤S5具体包括:
[0017]S51:从所述新颖选题中识别出关键词集合,来表征该新颖选题。
[0018]S52:在整个专家新颖知识库中检索这些关键词,获得包含一个或者若干个关键词的句子,形成候选推荐集。
[0019]S53:计算候选推荐集中的数据与所述新颖选题的相似度,如果相似度高于预设阈值,则判定其新颖性高,标记为前沿选题并推送至出版单位所在的媒体终端。
[0020]进一步地,所述步骤S2还包括:
[0021]获取出版物资源库中所有出版物的出版时间,统计每一主题类别中出版物数量随时间变化的趋势,该趋势包括稳定、上升和下降。
[0022]所述步骤S3还包括:
[0023]确定热点选题所在的主题类别,当该主题类别中出版物数量随时间变化的趋势为上升,则判定其具有新颖性,标记为新颖选题并推送至出版单位所在的媒体终端。
[0024]一种用于出版行业热点选题的新颖性判断系统,包括:
[0025]主题类别设定模块,用于设定多个主题类别,其设定方式包括人工预定义和自动聚类生成。
[0026]统计和划分模块,用于获取出版物资源库中所有出版物的主题,并确定其对应的主题类别,统计每一主题类别下对应的出版物数量。
[0027]根据对应出版物数量的不同将主题类别进行划分,包括第一主题类别和第二主题类别,其中所述第一主题类别下对应的出版物数量小于所述第二主题类别下对应的出版物数量。
[0028]判定模块,用于确定热点选题所在的主题类别,当该主题类别为第一主题类别时,判定其具有新颖性,标记为新颖选题并推送至出版单位所在的媒体终端。
[0029]进一步地,还包括关联挖掘模块,用于对新颖选题通过关联挖掘的方法得到与该新颖选题相关联的一个或者多个关联选题,而后确定该关联选题所在的主题类别,当该主题类别为第一主题类别时,判定其具有新颖性,标记为新颖选题并推送至出版单位所在的媒体终端。
[0030]进一步地,还包括:
[0031]前沿选题判定模块,用于将所述新颖选题与专家新颖知识库中的数据进行相似度的比较,如果相似度高于预设阈值,则判定其新颖性高,标记为前沿选题并推送至出版单位所在的媒体终端。
[0032]进一步地,所述前沿选题判定模块具体包括:
[0033]表征单元,用于从所述新颖选题中识别出关键词集合,来表征该新颖选题。
[0034]候选推荐集形成单元,用于在整个专家新颖知识库中检索这些关键词,获得包含一个或者若干个关键词的句子,形成候选推荐集。
[0035]相似度计算单元,用于计算候选推荐集中的数据与所述新颖选题的相似度,如果相似度高于预设阈值,则判定其新颖性高,标记为前沿选题并推送至出版单位所在的媒体终端。
[0036]进一步地,所述统计和划分模块还包括:
[0037]趋势分析单元,用于获取出版物资源库中所有出版物的出版时间,统计每一主题类别中出版物数量随时间变化的趋势,该趋势包括稳定、上升和下降。
[0038]所述判定模块还包括:
[0039]趋势判定单元,用于确定热点选题所在的主题类别,当该主题类别中出版物数量随时间变化的趋势为上升,则判定其具有新颖性,标记为新颖选题并推送至出版单位所在的媒体终端。
[0040]采用上述技术方案,本发明至少包括如下有益效果:
[0041]本发明所述的用于出版行业热点选题的新颖性判断方法与系统,将选题分类统计与专家新颖知识库两种策略进行判定,更加准确和高效,同时附带关联选题推荐功能,使得分析更加全面,具有较大的市场应用价值。
【附图说明】
[0042]图1为本发明所述的用于出版行业热点选题的新颖性判断方法的流程图;
[0043]图2为本发明所述的用于出版行业热点选题的新颖性判断系统的结构示意图。
【具体实施方式】
[0044]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0045]实施例1
[0046]如图1所示,为符合本实施例的一种用于出版行业热点选题的新颖性判断方法,包括如下步骤:
[0047]S1:设定多个主题类别,其设定方式包括人工预定义和自动聚类生成。
[0048]S2:获取出版物资源库中所有出版物的主题,并确定其对应的主题类别,统计每一主题类别下对应的出版物数量。
[0049]根据对应出版物数量的不同将主题类别进行划分,包括但不限于第一主题类别和第二主题类别,其中所述第一主题类别下对应的出版物数量小于所述第二主题类别下对应的出版物数量。本实施例中所述第一主题类别优选指代为出版物分布数量较少的主题类另IJ,其可以包括出版物分布数量较少的主题类别中的一个或者多个,具体数量的划分可以结合实际的使用需求进行设定,本实施例对此不做限定。
[0050]S3:确定热点选题所在的主题类别,当该主题类别为第一主题类别时,判定其具有新颖性,标记为新颖选题并推送至出版单位所在的媒体终端。各个出版单位的编辑人员可以根据推荐的新颖选题进行选择和分析,并在该新颖选题的提示下形成出版创意。由于其不是通过人工搜索和分析,没有添加人的主观性,分析的更加客观和全面,有利于出版行业准确分析市场动态,提高市场竞争力。
[0051]本实施例在新颖选题分析过程中,需要设计出能够准确表征出出版
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1