一种通信过程的评论信息处理方法及系统的制作方法_2

文档序号:9810639阅读:来源:国知局
术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的【具体实施方式】。
【附图说明】
[0072] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明 的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0073]图1示出了根据本发明一个实施例的一种通信过程的评论信息处理方法的流程 图;
[0074]图2示出了根据本发明一个实施例的一种通信过程的评论信息处理方法中从评论 信息中提取至少一个关键词的第一种方式的流程图;
[0075]图3示出了根据本发明一个实施例的一种通信过程的评论信息处理方法中从评论 信息中提取至少一个关键词的第二种方式流程图;
[0076]图4示出了根据本发明一个实施例的一种通信过程的评论信息处理方法中确定对 应主题为第一通信标识所属的主题的流程图;
[0077]图5示出了根据本发明一个实施例的一种通信过程的评论信息处理方法中显示第 一通信标识所属的主题的第一种示意图;
[0078]图6示出了根据本发明一个实施例的一种通信过程的评论信息处理方法中显示第 一通信标识所属的主题的第二种示意图;
[0079]图7示出了根据本发明一个实施例的一种通信过程的评论信息处理方法中对第一 主题突出显示的示意图;
[0080]图8示出了根据本发明一个实施例的一种通信过程的评论信息处理系统的结构 图。
【具体实施方式】
[0081 ]本发明实施例中的方案总体思路如下:
[0082] 首先收集针对第一通信标识产生的评论信息,评论信息由第一通信标识向其他通 信标识产生通信内容之后由其他通信标识的用户针对第一通信标识进行评论产生;然后从 评论信息中提取出至少一个关键词;最后基于主题与关键词的对应关系,获取至少一个关 键词所对应的主题作为第一通信标识所属的主题。也即是说,基于用户针对第一通信标识 的评论信息能够确定第一通信标识所属的主题,由于评论信息所包含的信息量较高,故而 存在着能够精确确定出第一通信标识所属的主题的技术效果。
[0083] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开 的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例 所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围 完整的传达给本领域的技术人员。
[0084]第一方面,本发明实施例提供一种通信过程的评论信息处理方法,请参考图1,包 括:
[0085]步骤S101:收集针对第一通信标识产生的评论信息,评论信息由第一通信标识向 其他通信标识发起通信之后由其他通信标识的用户针对第一通信标识进行评论产生; [0086]步骤S102:从评论信息中提取出至少一个关键词;
[0087]步骤S103:基于预先获得的主题与关键词的对应关系信息库,获取至少一个关键 词所对应的主题作为第一通信标识所属的主题。
[0088]步骤S101中,各个通信标识例如为:电话号码、即时聊天软件账号等等。
[0089] 第一通信标识向其他通信标识发起通信可能包括多种情况,例如:第一通信标识 向其他通信标识发起语音通信请求、发送信息(例如:短信、彩信等等)等等。其他通信标识 在接收到第一通信标识发起的通信之后,就可以在其他通信标识的电子设备的显示单元上 显示用于对第一通信标识进行评论的评论接口,例如:在来电界面、信息阅读界面显示该评 论接口。其他通信标识的用户可以基于第一通信标识一些通信内容或者行为数据对第一通 信标识产生评论信息,该评论信息例如为"这货是自动语音"、"美容美发打广告打到这来 了 !!!!!"、"这货是代开发票的"等等,其中,该评论信息可以为文字评论信息、语音评论信 息等等。
[0090] 步骤S102中,在提取出第一通信标识所包含的评论信息之后,可以直接对各条评 论信息进行分词处理,进而从中提取出至少一个关键词,而为了防止一些作弊或者恶意评 论行为,则可以首先从评论信息中去除满足预设条件的评论信息,然后针对剩下的评论提 取关键词,从而进一步的提高确定出的第一通信标识所属主题的精确度。
[0091] 在具体实施过程中,满足预定条件的评论信息可以为多种形式的评论信息,下面 列举其中的三种进行介绍,当然,在具体实施过程中,不限于以下三种情况,另外,在不冲突 的情况下,以下三种情况可以组合使用。
[0092] ①满足预设条件的评论信息包括:产生评论信息的数量大于预设数量的用户所对 应的评论信息。
[0093]举例来说,某些用户为了作弊,可能给某个通信标识产生大量的正面的评价信息, 例如"推荐的东西很不错,赞一个"、"很专业的理财服务"等等;而另一些用户可能与某个用 户有些矛盾,在这种情况下,则可能针对该用户的通信标识产生大量的恶意评论,例如:"这 就是个骗子"、"就是广告"等等,但是事实上,那个通信标识所对应的用户并非骗子也并非 广告。并且通常情况下,某个普通用户不可能有时间或者精力针对某个通信标识产生大量 的评论信息,如果某个用户针对第一通信标识产生大量的评论信息,则这些评论信息极有 可能是作弊或者产生恶意评论信息,为了防止这种情况,则从第一通信标识的评论信息中 剔除该用户所产生的评论信息。
[0094]②满足预设条件的评论信息包括:包含预定词汇的评论信息。
[0095]举例来说,该预定词汇例如为①广告用语,例如"办证请找135XXXXXX"、"XX培训, 联系地址为:A市A区"等等;②电话号码,电话号码例如为手机号、座机号等等;③其他一些 敏感词汇等等。
[0096] 其中,在确定第一通信标识的评论信息是否包含预定词汇时,如果对应评论信息 包含特殊字符,则可以先剔除评论信息中的特殊字符,然后对剔除特殊字符后的评论信息 判断是是否包含预定词汇,该特殊字符例如包括:" I "等等,例如,"办I证I请找 1350XXXXXX",可以首先从中剔除特殊字符"|"和"0",进而获得文本"办证请找135XXXXXX", 然后判断其是否包含预定词汇;又例如,"代开发##票",可以首先从中剔除特殊字符"##", 进而获得文本"代开发票",然后判断其是否包含预定词汇等等。
[0097] 在评论信息中包含特定词汇时,往往说明该评论信息并非真正针对通信标识所产 生的评论信息,而很有可能是一些广告用语,故而需要从评论信息去除这些评论信息。
[0098] ③满足预设条件的评论信息包括:预定用户所产生的评论信息。
[0099] 举例来说,预定用户例如为产生作弊评论信息的用户、产生大量恶意评论信息的 用户、评论信息中包含大量预定词汇的用户等等,系统可以定时对各个用户产生的评论信 息进行收集整理,然后基于评论信息所包含的内容判断对应用户是否为预定用户,例如:如 果某个用户针对某个通信标识产生大量的正面评价,则说明该用户为作弊用户的概率较 高;如果某个用户针对多个通信标识都产生大量的恶意评论,且经证明该用户对这些通信 标识的评论并不正确,则说明该用户为产生大量恶意评论信息的用户;如果某个用户所产 生的大部分评论信息中都包含预定词汇,则说明该用户为评论信息中包含大量预定词汇的 用户等等。当然,还可以基于其他原则判断各个用户是否为预定用户,本发明实施例不再详 细列举,并且不作限制。
[0100] 步骤S102中,可以通过多种方式从评论信息提取出至少一个关键词,下面列举其 中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况,可以理解的是,评论信 息中的没有实际意义的虚词(如标点、助动词、语气词、叹词、拟声词等)可不作为对应评论 信息的关键词。
[0101 ]第一种,从评论信息中提取至少一个关键词,请参考图2,包括:
[0102] 步骤S201:对评论信息进行分词处理,获得评论信息的关键词;
[0103] 步骤S202:从评论信息的关键词中确定出排序位于前Μ位的关键词作为至少一个 关键词,Μ为正整数。
[0104] 步骤S201中,对评论信息进行分词处理,获得评论信息的关键词,例如包括:对评 论信息进行分词处理,确定分词处理后的评论信息中各中文词/字的词性、确定相邻中文 词/字的组合性;根据分词处理后的中文词/字的词性、相邻中文词/字的组合性,获得评论 信息的关键词。
[0105] 例如,针对评论信息"这货是代开发票的",可对"这货是代开发票的"进行分词处 理,得到"这"、"货"、"是"、"代开"、"开"、"发票"、"的",根据该分词处理后的词性,以及相邻 中文词的组合性,获得评论信息的关键词"发票"或"开发票"等。
[0106] 又例如,针对评论信息美容美发打广告打到这来了 !!!!!",可对美容美发打广告 打到这来了 !!!!!"进行分词处理,得到"美容"、"美发"、"打"、"广告"、"打"、"到"、"这"、 "来"、"了",根据该分词处理后的词性,以及相邻中文词的组合性,获得评论信息的关键词 "美容"、"美发"、"美容美发"、"广告"、"打广告"等等。
[0107] 假设基于上述方案所确定出的第一通信标识的评论信息包含如表1所示的关键 词:
[0108] 表1
[0110] 步骤S202中,由于针对第一通信标识可能存在一条或多条评论信息,从而,同一关 键词在第一通信标识的评论信息可能会出现一次或者多次,故而可以统计第一通信标识的 评论信息中每个关键词出现的次数,然后将其按照出现次数从高到低进行排序,获得排序 位于前Μ位的关键词作为至少一个关键词,在这种情况下,Μ为固定值,例如:4、6等等,本发 明实施例不作限制;又或者,判断每个关键词出现次数是否大于预设次数(预设次数例如 为:10次、20次等等),进而在对应关键词的出现大于预设次数时,则将其加入至少一个关键 词,从而也可以获得排序位于Μ位的关键词,在这种情况下,Μ的值不固定。
[0111] 以表1所示的评论信息的关键词为例,假设获取排序位于前3位的关键词,则可以 确定出如下的至少一个关键词:美容、机器人、化妆。
[0112] 第二种,从评
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1