一种通信过程的评论信息处理方法及系统的制作方法_4

文档序号:9810639阅读:来源:国知局
取模块81,包括:第一分词单元,用于对评论信息进行分词处理,获 得评论信息的关键词;第二确定单元,用于从评论信息的关键词中确定出排序位于前Μ位的 关键词作为至少一个关键词,Μ为正整数。
[0151]可选的,第一提取模块81,包括:第二分词单元,用于对评论信息进行分词处理,确 定分词处理后的评论信息中各中文词/字的词性、确定相邻中文词/字的组合性;获得单元, 用于根据分词处理后的中文词/字的词性、相邻中文词/字的组合性,获得评论信息的关键 1·^] 〇
[0152] 可选的,第一获取模块81,包括:第三确定单元,用于针对主题与关键词的对应关 系信息库中的每个主题,确定对应主题的关键词在至少一个关键词中的出现次数;判断单 元,用于判断出现次数是否大于预设次数;第四确定单元,用于在出现次数大于预设次数 时,确定对应主题为第一通信标识所属的主题。
[0153] 可选的,系统还包括:去除模块,用于在从评论信息中提取出至少一个关键词之 前,从评论信息中去除满足预设条件的评论信息;其中,满足预设条件的评论信息包括:产 生评论信息的数量大于预设数量的用户所对应的评论信息;和/或包含预定词汇的评论信 息;和/或预定用户所产生的评论信息。
[0154] 可选的,系统还包括:提供模块,用于在第一通信标识向第二通信标识发起通信之 后,向第二通信标识提供第一通信标识所属的主题。
[0155] 可选的,系统还包括:判断模块,用于在第一通信标识向第二通信标识发起通信 时,判断第一通信标识所属的主题中的任一主题是否属于预设主题列表;发送模块,用于在 第一通信标识所属的主题中的第一主题属于预设主题列表时,向第二通信标识发送风险提 示信息。
[0156] 可选的,发送模块,用于:向第二通信标识发送控制指令,以供第二通信标识所对 应的电子设备接收控制指令后控制第一主题突出显示;和/或,向第二通信标识发送防骚扰 指令,以供第二通信标识所对应的电子设备接收防骚扰指令后对通信内容进行防骚扰处 理。
[0157] 由于本发明实施例第二方面所提供的系统,为实施本发明实施例第一方面的一种 通信过程的评论信息处理方法所采用的系统,故而基于本发明实施例第一方面所介绍的一 种通信过程的评论信息处理方法,本领域所属技术人员能够了解本发明实施例第二方面所 介绍的系统的具体结构及变形,故而在此对于该系统不再赘述,凡是实施本发明实施例第 一方面的一种通信过程的评论信息处理方法所采用的系统都属于本发明实施例所欲保护 的范围。
[0158] 本申请实施例中提供的技术方案,至少具有如下技术效果或优点:
[0159] 由于在本发明实施例中,首先收集针对第一通信标识产生的评论信息,评论信息 由第一通信标识向其他通信标识产生通信内容之后由其他通信标识的用户针对第一通信 标识进行评论产生;然后从评论信息中提取出至少一个关键词;最后基于主题与关键词的 对应关系,获取至少一个关键词所对应的主题作为第一通信标识所属的主题。也即是说,基 于用户针对第一通信标识的评论信息能够确定第一通信标识所属的主题,由于评论信息所 包含的信息量较高,故而存在着能够精确确定出第一通信标识所属的主题的技术效果。 [0160]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。 各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求 的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种 编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发 明的最佳实施方式。
[0161] 在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施 例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构 和技术,以便不模糊对本说明书的理解。
[0162] 类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在 上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施 例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保 护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面 的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此, 遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身 都作为本发明的单独实施例。
[0163] 本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地 改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单 元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或 子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何 组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任 何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权 利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代 替。
[0164] 此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所 包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围 之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之 一都可以以任意的组合方式来使用。
[0165] 本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行 的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用 微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的系统中的一些或者全部部 件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全 部的设备或者系统程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序 可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以 从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0166] 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领 域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中, 不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词"包含"不排除存在未 列在权利要求中的元件或步骤。位于元件之前的单词"一"或"一个"不排除存在多个这样的 元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实 现。在列举了若干系统的单元权利要求中,这些系统中的若干个可以是通过同一个硬件项 来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名 称。
[0167] 本发明公开了,A1、一种通信过程的评论信息处理方法,包括:
[0168] 收集针对第一通信标识产生的评论信息,所述评论信息由所述第一通信标识向其 他通信标识发起通信之后由其他通信标识的用户针对所述第一通信标识进行评论产生;
[0169] 从所述评论信息中提取出至少一个关键词;
[0170] 基于预先获得的主题与关键词的对应关系信息库,获取所述至少一个关键词所对 应的主题作为所述第一通信标识所属的主题。
[0171 ] A2、如A1所述的方法,其特征在于,所述主题与关键词的对应关系信息库通过以下 方式获得:
[0172] 获取用户所产生的多条评论信息作为采样样本;
[0173] 提取出所述采样样本所包含的所有关键词;
[0174]将预先设定的多个主题、所述采样样本和所述关键词输入文档主题生成模型,进 而训练获得所述主题与关键词的对应关系信息库。
[0175] A3、如A1所述的方法,其特征在于,所述基于预先获得的主题与关键词的对应关系 信息库,获取所述至少一个关键词所对应的主题作为所述第一通信标识所属的主题,包括:
[0176] 针对所述至少一个关键词中的每个关键词,在所述主题与关键词的对应关系中查 找获得对应关键词所属的主题;
[0177] 将所述至少一个关键词中的每个关键词所属的主题皆作为所述第一通信标识所 属的主题。
[0178] A4、如A3所述的方法,其特征在于,所述从所述评论信息中提取至少一个关键词, 包括:
[0179] 对所述评论信息进行分词处理,获得所述评论信息的关键词;
[0180] 从所述评论信息的关键词中确定出排序位于前Μ位的关键词作为所述至少一个关 键词,Μ为正整数。
[0181] Α5、如Α1所述的方法,其特征在于,所述从所述评论信息中提取至少一个关键词, 包括:
[0182] 对所述评论信息进行分词处理,确定分词处理后的所述评论信息中各中文词/字 的词性、确定相邻中文词/字的组合性;
[0183] 根据所述分词处理后的中文词/字的词性、所述相邻中文词/字的组合性,获得所 述评论信息的关键词。
[0184] Α6、如Α1所述的方法,其特征在于,所述基于预先获得的主题与关键词的对应关系 信息库,获取所述至少一个关键词所对应的主题作为所述第一通信标识所属的主题,包括:
[0185] 针对所述主题与关键词的对应关系信息库中的每个主题,确定对应主题的关键词 在所述至少一个关键词中的出现次数;
[0186] 判断所述出现次数是否大于预设次数;
[0187] 在所述出现次数大于所述预设次数时,确定对应主题为所述第一通信标识所属的 主题。
[0188] Α7、如Α1所述的方法,其特征在于,在所述从所述评论信息中提取出至少一个关键 词之前,所述方法还包括:
[0189] 从所述评论信息中去除满足预设条件的评论信息;
[0190] 其中,所述满足预设条件的评论信息包括:产生评论信息的数量大于预设数量的 用户所对应的评论信息;和/或包含预定词汇的评论信息;和/或预定用户所产生的评论信 息。
[0191] A8、如A1所述的方法,其特征在于,在所述获取所述第一关键词所对应的第一主题 作为所述第一通信标识所属的主题之后,所述方法还包括:
[0192] 在所述第
...
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1