新闻分类方法及装置的制造方法

文档序号:10655363阅读:453来源:国知局
新闻分类方法及装置的制造方法
【专利摘要】本申请提出一种新闻分类方法及装置,其中,该方法包括:接收新闻稿件;确定所述新闻稿件与各预设的新闻模板之间的各匹配度,其中,每个新闻模板对应一种新闻类别;根据所述各匹配度,确定所述新闻稿件所属的初级分类;根据预设的算法,确定所述新闻稿件中各个关键词的得分;根据所述各个关键词的得分,确定所述新闻稿件在所述初级分类中的维度。由此,实现了对新闻稿件的自动分级分类,提高了对新闻稿件分类的效率,并且分类结果不受个人主观感受影响,分类结果较精准。
【专利说明】
新闻分类方法及装置
技术领域
[0001 ]本申请涉及信息处理技术领域,尤其涉及一种新闻分类方法及装置。
【背景技术】
[0002]现在,新闻阅读产品一般是按照新闻内容所属的领域进行组织和整理的,如根据热点、国内和国际等进行首层分类,同一类别下再进行子分类,将最终将新闻进行分类发行。
[0003]目前,上述对新闻进行分类发行的过程,通常是由人工进行的,这不仅浪费了人力,而且使得新闻分类结果受个人主观感受的影响较大,使得分类结果不够精准。

【发明内容】

[0004]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此,本申请的第一个目的在于提出一种新闻分类方法,该方法实现了对新闻稿件的自动分级分类,提高了对新闻稿件分类的效率,并且分类结果不受个人主观感受影响,分类结果较精准。
[0006]本申请的第二个目的在于提出一种新闻分类装置。
[0007]为达上述目的,本申请第一方面实施例提出了一种新闻分类方法,包括:
[0008]接收新闻稿件;
[0009]确定所述新闻稿件与各预设的新闻模板之间的各匹配度,其中,每个新闻模板对应一种新闻类别;
[0010]根据所述各匹配度,确定所述新闻稿件所属的初级分类;
[0011]根据预设的算法,确定所述新闻稿件中各个关键词的得分;
[0012]根据所述各个关键词的得分,确定所述新闻稿件在所述初级分类中的维度,其中,初级分类中的每个维度对应N个关键词,N为大于或等于I的正整数。
[0013]本申请实施例的新闻分类方法,收到新闻稿件后,首先确定新闻稿件与预设的新闻模板之间的各匹配度,根据各匹配度,确定新闻稿件所属的初级分类,然后根据预设的算法,确定新闻稿件中各个关键词的得分,然后根据各关键词的得分,确定新闻稿件在初级分类中的维度。由此,实现了对新闻稿件的自动分级分类,提高了对新闻稿件分类的效率,并且分类结果不受个人主观感受影响,分类结果较精准。
[0014]为达上述目的,本申请第二方面实施例提出了一种新闻分类装置,包括:
[0015]接收模块,用于接收新闻稿件;第一确定模块,用于确定所述新闻稿件与各预设的新闻模板之间的各匹配度,其中,每个新闻模板对应一种新闻类别;第二确定模块,用于根据所述各匹配度,确定所述新闻稿件所属的初级分类;运算模块,用于根据预设的算法,确定所述新闻稿件中各个关键词的得分;第三确定模块,用于根据所述各个关键词的得分,确定所述新闻稿件在所述初级分类中的维度,其中,初级分类中的每个维度对应N个关键词,N为大于或等于I的正整数。
[0016]本申请实施例的新闻分类装置,收到新闻稿件后,首先确定新闻稿件与预设的新闻模板之间的各匹配度,根据各匹配度,确定新闻稿件所属的初级分类,然后根据预设的算法,确定新闻稿件中各个关键词的得分,然后根据各关键词的得分,确定新闻稿件在初级分类中的维度。由此,实现了对新闻稿件的自动分级分类,提高了对新闻稿件分类的效率,并且分类结果不受个人主观感受影响,分类结果较精准。
【附图说明】
[0017]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0018]图1是本申请一个实施例的新闻分类方法的流程图;
[0019]图2是本申请另一个实施例的新闻分类方法的流程图;
[0020]图3是本申请一个实施例的新闻分类装置的结构示意图;
[0021 ]图4是本申请另一个实施例的新闻分类装置的结构示意图。
【具体实施方式】
[0022]下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
[0023]下面参考附图描述本申请实施例的新闻分类方法及装置。
[0024]图1是本申请一个实施例的新闻分类方法的流程图。
[0025]如图1所示,该新闻分类方法包括:
[0026]步骤101,接收新闻稿件。
[0027]具体的,本申请实施例提供的新闻分类方法的执行主体为新闻分类装置。
[0028]步骤102,确定所述新闻稿件与各预设的新闻模板之间的各匹配度,其中,每个新闻模板对应一种新闻类别。
[0029]其中,新闻分类装置中可以预先存储多种新闻模板,每个新闻模板对应一种新闻类别。
[0030]举例来说,军事类新闻的新闻模板可以包括如:军事-兵器、军事-军情、军事-军史、军事-时事等等。
[0031]在收到新闻稿件后,即可将新闻稿件与预设的新闻模板进行匹配,从而确定新闻稿件与新闻模板之间的匹配度。
[0032]具体的,可以根据新闻稿件中的词语与新闻模板中的词语相同的数量,确定新闻稿件与新闻模板之间的匹配度。
[0033]步骤103,根据所述各匹配度,确定所述新闻稿件所属的初级分类。
[0034]通常,与新闻稿件匹配度最高的新闻模板对应的新闻类别,即为新闻稿件所属的初级分类。
[0035]举例来说,若某新闻稿件与军事-兵器的匹配度为0.9,与军事-军史的匹配度为0.88,与军事-军情的匹配度为0.5,与军事-时事的匹配对为0.7,则可以确定该新闻稿件所属的初级分类为:军事-兵器。
[0036]需要说明的是,还可以设定一个匹配度阈值,当新闻稿件与模板的匹配度大于设定的阈值时,则认为新闻稿件属于该新闻模板对应的初级分类,且匹配度的阈值可以根据文本类形自行设定调整,如指定匹配度的阈值为0.8,则可认为该新闻稿件属于军事-军史和军事-兵器两个新闻模板对应的新闻类别,也就是说,可将该新闻稿件分别划分至两个新闻模板中。
[0037]步骤104,根据预设的算法,确定所述新闻稿件中各个关键词的得分。
[0038]其中,新闻稿件中的关键词,可以采用任意关键词抓取方法获得,或者,可以将在新闻稿件的标题和正文中均出现的词,确定为关键词,或者将在新闻稿件中出现次数超过预设值的词确定为关键词,本实施例对此不作限定。
[0039]具体的,可以利用下式,确定各个关键词的得分:
[0040]s = aXti+bXt2+cXt3
[0041]其中,s为关键词的得分,a、b、c为比例常数,为关键词在标题中出现的次数,t:*关键词在新闻正文中出现的次数,t3为根据所述初级分类获取的与所述关键词相近的词在新闻稿件中出现的次数。
[0042]其中,a、b、c的和为I,比如,在计算新闻稿件中各关键词得分时,a可以取0.5、b为
0.3,c为0.2。
[0043]应说明的是,比例常数a、b、c的取值是动态变化的,对于不同的关键词,该比例常数可以取不同值。
[0044]举例来说,若接收的新闻稿件内容如下:
[0045][三八节特辑]射导弹开战机登航母进丛林:谁说女子不如男
[0046]这是一个有着坚强战斗精神又不失女性特有细腻的集体。她们从事的专业不再像过去局限于医疗和服务领域,而是奋战在操舵、机电、损管、监察、雷达等辽宁舰几乎所有战斗部门,为走向深蓝的中国海军注入了更多活力。
[0047]这个由90多名女军人组成的光荣集体一一海军辽宁舰女舰员队,组建以来,出色完成辽宁舰历次试验试航和舰载战斗机着舰起飞等重大任务。
[0048]通过关键词提取后,确定的关键词包括:女军人,辽宁舰,战斗机,导弹,航母,战机。
[0049]其中,关键词“女军人”在标题中未出现,在文章中出现过I次,与女军人相近的词“女子”在标题中出现过I次,“女性”、“女舰员”在正文中分别出现过一次,从而根据上式,即可确定关键词“女军人”的得分为:
[0050]s = a X 0+b X 1+c X 3
[0051]相同的方法,可以确定其它各个关键词的得分。
[0052]需要说明的是,新闻自动分类装置中,还可以存储近义词词典,在获取关键词后,可以通过查询该词典,获取各关键词相近的词,进而确定与关键词相近的词在新闻稿件中出现的次数。
[0053]步骤105,根据所述各个关键词的得分,确定所述新闻稿件在所述初级分类中的维度,其中,初级分类中的每个维度对应N个关键词,N为大于或等于I的正整数。
[0054]具体的,为了对新闻稿件进行精确的分类,可以在每个新闻类别下,再根据关键词将每个新闻类别进行不同维度的划分,即将新闻稿件在初级分类下再进行进一步的精确的分类。
[0055]实际应用时,在根据新闻稿件中各个关键词的得分,确定新闻稿件在初级分类中的维度时,可以根据关键词的得分,从高到低,依次确定各个关键词所属的维度,进而确定新闻稿件所属的维度。
[0056]具体的,上述步骤105,包括:
[0057]1051:根据所述各个关键词的得分,确定所述新闻稿件的关键词排序列表;
[0058]本实施例中,若共有η个关键词,可将所有η个关键词根据上述步骤计算得分,并根据得分,由高向低进行排序。
[0059]1052:从所述关键词排序列表中选取前N个关键词;
[0060]可以理解的是,为了提高分类的准确性,可选取一部分关键词,而不是所有的关键词,其中,I彡Ν<η/2,Ν为整数。
[0061]举例说明,若关键词共有5个,则可以根据关键词排序列表选取得分较高的前I个或前2个关键词进行后续操作。
[0062]1053:根据所述前N个关键词,确定所述新闻稿件在所述初级分类中的维度。
[0063]需要说明的是,可以采用上述方式,选取得分最高的前N个关键词作为确定新闻稿件维度的标准,也可以根据所有的关键词,确定新闻稿件的维度,从而使确定的维度更精确,但是会对新闻分类装置的数据处理能力和速度要求较高。
[0064]举例来说,若通过与预设的新闻模板匹配后,确定上述新闻稿件所属的初级分类为“军事-兵器”,然后采用上述方式,选取的上述新闻稿件对应的得分最高的关键词为“辽宁舰”。而在“军事-兵器”的初级分类下,包括由I个关键词定义的8个分类,分别为“战斗机”、“军舰”、“步枪”、“导弹”、“坦克”、“潜艇”、“核武器”,通过查询新闻分类装置中的近义词词典,确定“辽宁舰”与“军舰”相近,或者将“辽宁舰”上位后可归属到“军舰”中,从而可确定上述新闻稿件的具体的分类为“军事-兵器-军舰”,从而实现了对新闻稿件的精确分类。
[0065]需要说明的是,若预设的各初级分类下的一个维度对应I个关键词,而根据上述方式选择的一个新闻稿件对应2个或多个得分相同的关键词,则可以将该新闻稿件同时归属到两个维度中。
[0066]本申请实施例的新闻分类方法,收到新闻稿件后,首先确定新闻稿件与预设的新闻模板之间的各匹配度,根据各匹配度,确定新闻稿件所属的初级分类,然后根据预设的算法,确定新闻稿件中各个关键词的得分,然后根据各关键词的得分,确定新闻稿件在初级分类中的维度。由此,实现了对新闻稿件的自动分级分类,提高了对新闻稿件分类的效率,并且分类结果不受个人主观感受影响,分类结果较精准。
[0067]通过上述分析可知,新闻分类装置在接收到新闻稿件后,可以根据新闻稿件与预设的新闻模板之间的匹配度,确定新闻稿件所属的初级分类。相应的,新闻分类装置中需要预先存储各个初级分类对应的新闻模板,或者,该新闻模板,还可以是新闻分类装置对新闻库中的所有新闻稿件进行模型训练后得到的。即该方法还包括:
[0068]对新闻稿件库进行模型训练,确定各个初级分类对应的新闻模板。
[0069]举例来说,可以采用支持向量机(Support Vector Machine,简称SVM)的算法,对新闻稿件库进行模型训练,从而确定各个初级分类对应的新闻模板。
[0070]可以理解是,通过上述实施例可知,新闻模板对应的初级分类由两个特征限定。如“军事-兵器”分类,就由“军事”和“兵器”两个特征限定,因此,可以通过SVM算法,首先将新闻稿件库中的新闻进行第一层级分类,比如将新闻稿件首先分为“时事”、“娱乐”、“房地产”、“经济”、“军事”等等,进而再利用SVM算法,将各个第一层级再进行第二层级的分类,比如将“军事”最终分为:军事-兵器、军事-军情、军事-军史、军事-时事等等,且每个二级分类分别对应一个新闻模板。从而可以根据新闻稿件与各新闻模板的匹配度直接确定新闻稿件对应的初级分类。
[0071]需要说明的是,在根据新闻稿件库确定了新闻模板后,新闻分类装置,还可以对新接收的新闻继续进行模型训练,从而对确定的新闻模板进行补充和完善,进而使根据新闻模板确定的新闻的初级分类越来越精准。
[0072]进一步的,上述实施例中,在确定各关键词的得分时,可以利用新闻分类装置中的词典,确定与关键词相近的词,为了进一步提高对新闻分类的精度,在根据关键词得分确定新闻稿件的维度时,还可以对各关键词进行去重处理。下面结合图2,对本申请提供的新闻分类方法进行进一步的说明。
[0073]图2是本申请另一个实施例的新闻分类方法的流程图。
[0074]如图2所示,该新闻分类方法可以包括以下步骤:
[0075]步骤201,对新闻稿件库进行模型训练,确定各个初级分类对应的新闻模板。
[0076]步骤202,接收新闻稿件。
[0077]步骤203,确定所述新闻稿件与各预设的新闻模板之间的各匹配度,其中,每个新闻模板对应一种新闻类别。
[0078]步骤204,根据与新闻稿件匹配度最高的新闻模板对应的新闻类别,确定所述新闻稿件所属的初级分类。
[0079]步骤205,获取所述新闻稿件中的各个关键词。
[0080]具体的,可以采用现有的关键词抓取方法获取新闻稿件中的关键词,也可以选取在标题和正文中均出现的词作为关键词,或者,还可以选取在新闻稿件中出现次数达到预设的值的词作为关键词,本实施例对此不作限定。
[0081]步骤206,查询预设的词典,确定所述各个关键词的近义词和/或替换词。
[0082]具体的,预设的词典,可以是新闻分类装置根据对新闻稿件库的训练,自己生成的,或者,也可以是根据用户的输入确定的。
[0083]其中,预设的词典中,可以包括各种词的近义词和替换词。其中,替换词可以指该词的上位词。举例来说,“氢弹” 一词,可以通过替换词,替换为“核武器”。
[0084]步骤207,利用预设的算法,确定各个关键词的得分。
[0085]步骤208,根据所述各个关键词的得分,确定所述新闻稿件的关键词排序列表。
[0086]步骤209,从所述关键词排序列表中选取得分较高的前N个关键词。
[0087]其中,N可以为一个固定的数值,比如为1、3、5、6或8等等,也可以根据实际的场景确定。
[0088]举例来说,首先仅选取关键词排序列表中的前2个或3个关键词,若仅根据前2个就可以准确确定新闻稿件的维度,那么就可以只选前2个关键词;而若根据前3个关键词,确定的新闻稿件的维度并不唯一,此时,可以继续选择关键词,来对之前确定的新闻稿件的维度进行修正或者校正,从而最终确定新闻稿件所属的维度。
[0089]步骤210,根据所述N个关键词,确定所述新闻稿件在在所述初级分类中的维度。
[0090]本申请实施例的新闻分类方法,首先接收新闻稿件,然后确定新闻稿件与预设的新闻模板的匹配度,根据与新闻稿件匹配度最高的新闻模板对应的新闻分类,确定新闻稿件的初级分类,进而再从新闻稿件中选取关键词,然后通过查询预设的词典,确定各个关键词的近义词和/或替换词,再根据预设的算法,确定新闻稿件中各个关键词的得分,根据各个关键词的得分,确定新闻稿件的关键词排序列表,从排序列表中选取前N个关键词后,再根据前N个关键词,确定新闻稿件的维度。由此,实现了对新闻稿件的自动分级分类,提高了对新闻稿件分类的效率,并且分类结果不受个人主观感受影响,分类结果较精准。
[0091]为了实现上述实施例,本申请还提出一种新闻分类装置。
[0092]图3是本申请一个实施例的新闻分类装置的结构示意图。
[0093]如图3所示,该新闻分类装置包括:
[0094]接收模块31,用于接收新闻稿件;
[0095]第一确定模块32,用于确定所述新闻稿件与各预设的新闻模板之间的各匹配度,其中,每个新闻模板对应一种新闻类别;
[0096]第二确定模块33,用于根据所述各匹配度,确定所述新闻稿件所属的初级分类;
[0097]运算模块34,用于根据预设的算法,确定所述新闻稿件中各个关键词的得分;
[0098]第三确定模块35,用于根据所述各个关键词的得分,确定所述新闻稿件在所述初级分类中的维度,其中,初级分类中的每个维度对应N个关键词,N为大于或等于I的正整数。
[0099]其中,本实施例提供的新闻分类装置,用于执行上述实施例提供的新闻分类方法。
[0100]具体的,上述运算模块34,具体用于:
[0101 ] 利用s = a X ti+b X t2+c X t3,确定各个关键词的得分;
[0102]其中,s为关键词的得分,a、b、c为比例常数,t为关键词在标题中出现的次数,t2为关键词在新闻正文中出现的次数,t3为根据所述初级分类获取的与所述关键词相近的词在新闻稿件中出现的次数。
[0103]在一种实施例中,第三确定模块35,具体用于:
[0104]根据所述各个关键词的得分,确定所述新闻稿件的关键词排序列表;
[0105]从所述关键词排序中选取得分较高的前N个关键词;
[0106]根据所述N个关键词,确定所述新闻稿件在所述初级分类中的维度。
[0107]需要说明的是,前述对新闻分类方法实施例的解释说明也适用于该实施例的新闻分类装置,此处不再赘述。
[0108]本申请实施例的新闻分类装置,收到新闻稿件后,首先确定新闻稿件与预设的新闻模板之间的各匹配度,根据各匹配度,确定新闻稿件所属的初级分类,然后根据预设的算法,确定新闻稿件中各个关键词的得分,然后根据各关键词的得分,确定新闻稿件在初级分类中的维度。由此,实现了对新闻稿件的自动分级分类,提高了对新闻稿件分类的效率,并且分类结果不受个人主观感受影响,分类结果较精准。
[0109]图4是本申请另一个实施例的新闻分类装置的结构示意图。
[0110]如图4所示,在上述图3所示的基层上,该新闻分类装置,还包括:
[0111]查询模块41,用于查询预设的词典,确定所述各个关键词的近义词和/或替换词。
[0112]进一步地,通过上述分析可知,新闻分类装置在接收到新闻稿件后,可以根据新闻稿件与预设的新闻模板之间的匹配度,确定新闻稿件所属的初级分类。相应的,新闻分类装置中需要预先存储各个初级分类对应的新闻模板,或者,该新闻模板,还可以是新闻分类装置对新闻库中的所有新闻稿件进行模型训练后得到的。则该装置,还包括:
[0113]训练模块42,用于对新闻稿件库进行模型训练,确定各个初级分类对应的新闻模板。
[0114]需要说明的是,前述对新闻分类方法实施例的解释说明也适用于该实施例的新闻分类装置,此处不再赘述。
[0115]本申请实施例的新闻分类装置,首先接收新闻稿件,然后确定新闻稿件与预设的新闻模板的匹配度,根据与新闻稿件匹配度最高的新闻模板对应的新闻分类,确定新闻稿件的初级分类,进而再从新闻稿件中选取关键词,然后通过查询预设的词典,确定各个关键词的近义词和/或替换词,再根据预设的算法,确定新闻稿件中各个关键词的得分,根据各个关键词的得分,确定新闻稿件的关键词排序列表,从排序列表中选取如N个的关键词后,再根据前N个关键词,确定新闻稿件的维度。由此,实现了对新闻稿件的自动分级分类,提高了对新闻稿件分类的效率,并且分类结果不受个人主观感受影响,分类结果较精准。
[0116]在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
[0117]应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0118]本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0119]上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
【主权项】
1.一种新闻分类方法,其特征在于,包括以下步骤: 接收新闻稿件; 确定所述新闻稿件与各预设的新闻模板之间的各匹配度,其中,每个新闻模板对应一种新闻类别; 根据所述各匹配度,确定所述新闻稿件所属的初级分类; 根据预设的算法,确定所述新闻稿件中各个关键词的得分; 根据所述各个关键词的得分,确定所述新闻稿件在所述初级分类中的维度,初级分类中的每个维度对应N个关键词,N为大于或等于I的正整数。2.如权利要求1所述的方法,其特征在于,所述根据预设的算法,确定所述新闻稿件中各个关键词的得分,包括: 利用s = a X ti+b X t2+c X t3,确定各个关键词的得分; 其中,s为关键词的得分,a、b、c为比例常数,为关键词在标题中出现的次数,t2为关键词在新闻正文中出现的次数,t3为根据所述初级分类获取的与所述关键词相近的词在新闻稿件中出现的次数。3.如权利要求2所述的方法,其特征在于,所述根据预设的算法,确定所述新闻稿件中各个关键词的得分之前,还包括: 查询预设的词典,确定所述各个关键词的近义词和/或替换词。4.如权利要求1所述的方法,其特征在于,所述根据所述各个关键词的得分,确定所述新闻稿件在所述初级分类中的维度,包括: 根据所述各个关键词的得分,确定所述新闻稿件的关键词排序列表; 从所述关键词排序中选取得分较高的前N个关键词; 根据所述N个关键词,确定所述新闻稿件在所述初级分类中的维度。5.如权利要求1所述的方法,其特征在于,还包括: 对新闻稿件库进行模型训练,确定各个初级分类对应的新闻模板。6.一种新闻分类装置,其特征在于,包括: 接收模块,用于接收新闻稿件; 第一确定模块,用于确定所述新闻稿件与各预设的新闻模板之间的各匹配度,其中,每个新闻模板对应一种新闻类别; 第二确定模块,用于根据所述各匹配度,确定所述新闻稿件所属的初级分类; 运算模块,用于根据预设的算法,确定所述新闻稿件中各个关键词的得分; 第三确定模块,用于根据所述各个关键词的得分,确定所述新闻稿件在所述初级分类中的维度,其中,初级分类中的每个维度对应N个关键词,N为大于或等于I的正整数。7.如权利要求1所述的装置,其特征在于,所述运算模块,具体用于: 利用s = a X ti+b X t2+c X t3,确定各个关键词的得分; 其中,s为关键词的得分,a、b、c为比例常数,为关键词在标题中出现的次数,t2为关键词在新闻正文中出现的次数,t3为根据所述初级分类获取的与所述关键词相近的词在新闻稿件中出现的次数。8.如权利要求7所述的装置,其特征在于,还包括: 查询模块,用于查询预设的词典,确定所述各个关键词的近义词和/或替换词。9.如权利要求6所述的装置,其特征在于,所述第三确定模块,具体用于:根据所述各个关键词的得分,确定所述新闻稿件的关键词排序列表;从所述关键词排序中选取得分较高的前N个的关键词;根据所述N个关键词,确定所述新闻稿件在所述初级分类中的维度。10.如权利要求6所述的装置,其特征在于,还包括:训练模块,用于对新闻稿件库进行模型训练,确定各个初级分类对应的新闻模板。
【文档编号】G06F17/30GK106021526SQ201610352644
【公开日】2016年10月12日
【申请日】2016年5月25日
【发明人】麦涛
【申请人】东软集团股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1