一种通信过程的评论信息处理方法及系统的制作方法_3

文档序号:9810639阅读:来源:国知局
论信息中提取至少一个关键词,包括:
[0113] 对评论信息进行分词处理,获得评论信息的关键词作为至少一个关键词。也即是 说,保留进行分词处理之后所获得所有关键词,提供给确定第一通信标识所属的主题进行 使用。在这种情况下,所确定出的至少一个关键词直接如表1所示。
[0114] 步骤S103中,同一通信标识(例如:第一通信标识)可以仅仅包含一个主题,也可以 包含至少两个主题,如果同一通信标识包含至少两个主题,则可以提供该通信标识更多的 信息。
[0115] 基于所获取的至少一个关键词的类型不同,进而确定出第一通信标识所属主题的 方式也不同,下面基于前面所列举的至少一个关键词分别进行介绍,当然,在具体实施过程 中,不限于以下两种情况。
[0116] 第一种,基于预先获得的主题与关键词的对应关系信息库,获取至少一个关键词 所对应的主题作为第一通信标识所属的主题,请参考图3,包括:
[0117] 步骤S301:针对至少一个关键词中的每个关键词,在主题与关键词的对应关系中 查找获得对应关键词所属的主题;
[0118]步骤S302:将至少一个关键词中的每个关键词所属的主题皆作为第一通信标识所 属的主题。
[0119] 在具体实施过程中,本发明实施例中所介绍的主题与关键词的对应关系信息库通 过以下方式获得:获取用户所产生的多条评论信息作为采样样本;提取出采样样本所包含 的所有关键词;将预先设定的多个主题、采样样本和关键词输入文档主题生成模型,进而训 练获得主题与关键词的对应关系信息库。
[0120] 举例来说,这里的用户指的是多个采样用户,多条评论信息为这多个采样用户分 别针对一个或多个通信标识进行评论所获得的评论信息。通过该文档主题生成模型可以将 评论信息的每个词分成一个个簇,进而将每个类别的关键词聚成一个簇,每个簇对应一个 主题。
[0121 ] 文档主题生成模型例如为:LDA(Latent Dirichlet Allocation)模型,通过将预 先设定的多个主题、采样样本和关键词输入LDA模型,就可以获得各个主题下各个关键词的 出现概率,然后获取每个主题下排序位于前几位的关键词作为对应主题下的关键词,并将 该主题与关键词的对应关系加入主题与关键词的对应关系信息库。其中,排序位于前几位 的关键词例如为前3位的关键词、前4位的关键词等等。其中,如果需要将各个评论信息的主 题划分的较为详细,则可以设置较为种类较多的主题,如果需要将各个评论信息的主题划 分的过于详细,则可以设置较为少量的主题,对于预先设定多少主题,本发明实施例不作限 制。
[0122] 假设,主题与关键词的对应关系信息库存在如表1所示的主题与关键词的对应关 系:
[0123] 表1
[0125] 以步骤S102中确定出的至少一个关键词为:美容、机器人、化妆为例,则分别通过 美容在主题列表中查找获得对应的主题为:美容美发;通过机器人在主题列表中查找获得 对应的主题为:自动语音;通过化妆在主题列表中查找获得对应的主题为:美容美发,进而 最终确定出第一通信标识所属的主题包括:美容美发、自动语音。
[0126] 第二种,基于预先获得的主题与关键词的对应关系信息库,获取至少一个关键词 所对应的主题作为第一通信标识所属的主题,请参考图4,包括:
[0127] 步骤S401:针对主题与关键词的对应关系信息库中的每个主题,确定对应主题的 关键词在至少一个关键词中的出现次数;
[0128] 步骤S402:判断出现次数是否大于预设次数;
[0129] 步骤S403:在出现次数大于预设次数时,确定对应主题为第一通信标识所属的主 题。
[0130]步骤S401中,以表1所示的至少一个关键词为例,则可以确定出主题"美容美发"的 关键词"美容"、"美发"、"化妆"在至少一个关键词中的出现次数为:100+10+50+10 = 170;主 题"自动语音"的关键词"机器人"、"录音"、"自动应答"在至少一个关键词中的出现次数为: 60+0+0 = 60;主题"骚扰电话"的关键词"广告"、"中介"在至少一个关键词中的出现次数为 0;主题"教育培训"的关键词"学校"、"幼儿园"在至少一个关键词中的出现次数为0;主题 "美食"的关键词"烤鱼"、"火锅"、"神仙兔"在至少一个关键词中的出现次数为〇;主题"诈骗 电话"的关键词"骗子"、"诈骗"在至少一个关键词中的出现次数为1+0 = 1。
[0131]步骤S402中,可以根据实际需求设置不同的预设次数,预设次数例如为:50、100等 等,本发明实施例不作限制。
[0132] 步骤S403中,如果预设次数为50,则可以确定出主题"美容美发"、"自动语音"为第 一通信标识所属的主题;如果预设次数为100,则可以确定出主题"美容美发"为第一通信标 识所属的主题。当然,基于第一通信标识的评论信息不同、主题列表所包含的主题不同,则 所确定出的第一通信标识所属的主题也不同,对此,本发明实施例不再详细列举,并且不作 限制。
[0133] 在具体实施过程中,在确定出第一通信标识所属的主题之后,还可以基于该主题 进行多种操作,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种 情况。
[0134] 第一种,在获取第一关键词所对应的第一主题作为第一通信标识所属的主题之 后,该方法还包括:在第一通信标识向第二通信标识发起通信之后,向第二通信标识提供第 一通信标识所属的主题。
[0135] 举例来说,第一通信标识向第二通信标识发起通信例如为第一通信标识向第二通 信标识发起语音通信请求、发送信息(例如:短信、彩信等等)等等。
[0136] 其中,如果第一通信标识向第二通信标识发起通信为:第一通信标识向第二通信 标识发起语音通信请求,则可以在检测到第一通信标识向第二通信标识发起语音通信请求 之后,将第一通信标识所属的主题发送到第二通信标识,进而第二通信标识在接听到该语 音通信请求之后,在第二通信标识的电子设备的显示单元上不仅显示该语音通信请求,还 显示第一通信标识所属的主题,如图5所示。基于第一通信标识的主题,第二通信标识的用 户就会考虑是否接听该语音通信请求。
[0137] 如果第一通信标识向第二通信标识发起通信为:第一通信标识向第二通信标识发 送信息,则可以在第二通信标识的电子设备接收到该信息之后,在信息列表的该信息侧边、 底部或者顶部显示第一通信标识所属的主题,如图6所示为在该信息底部显示第一通信标 识所属的主题的示意图。第二通信标识的用户基于该主题,就可以考虑是否阅读或者回复 对应的信息,或者是否将第一通信标识加入黑名单。
[0138] 第二种,在获取至少一个关键词所对应的主题作为第一通信标识所属的主题之 后,该方法还包括:在第一通信标识向第二通信标识发起通信时,判断第一通信标识所属的 主题中的任一主题是否属于预设主题列表;在第一通信标识所属的主题中的第一主题属于 预设主题列表时,向第二通信标识发送风险提示信息。
[0139] 举例来说,预设主题列表可以收集整理一些可能会用户造成风险或者骚扰的主 题,例如:诈骗电话、骚扰电话、自动语音等等,在第一通信标识向第二通信标识发起通信之 后,可以首先获取第一通信标识的主题(例如:美容美发、机器人),然后逐一判断这些主题 是否位于预设主题列表,以预设主题列表包括:诈骗电话、骚扰电话、自动语音为例,则"自 动语音"位于预设主题列表,也即第一主题为"自动语音"。在这种情况下,则可以向第二通 信标识发送风险提示信息,以提示第一通信标识可能会对第二通信标识的用户造成风险或 者骚扰。
[0140] 在具体实施过程中,向第二通信标识发送的风险提示信息可以为多种形式的风险 提示信息,下面列举其中的两种进行介绍,当然,在具体实施过程中,不限于以下两种情况, 另外,在不冲突的情况下,以下两种情况可以组合使用。
[0141] ①向第二通信标识发送风险提示信息,包括:向第二通信标识发送控制指令,以供 第二通信标识所对应的电子设备接收控制指令后控制第一主题突出显示。举例来说,对第 一主题突出显示例如为:改变第一主题的显示颜色、加粗显示、高点显示等等,基于对第一 主题突出显示则可以使用户快捷的了解第一通信标识对其可能造成的干扰,从而提高风险 提示的效果,尤其是在第一通信标识包含多个主题的情况下,能够排除其他主题的干扰。
[0142] ②向第二通信标识发送风险提示信息,包括:向第二通信标识发送防骚扰指令,以 供第二通信标识所对应的电子设备接收防骚扰指令后对通信内容进行防骚扰处理。
[0143] 举例来说,针对第一通信标识向第二通信标识发起的通信不同,防骚扰处理也不 同,例如:如果第一通信标识向第二通信标识发送的是语音呼叫请求,防骚扰处理例如为: 拦截第一通信标识产生的语音呼叫请求;如果第一通信标识向第二通信标识发送的是信 息,在这种情况下,防骚扰处理例如为:将该信息加入垃圾信息列表等等,当然,还可以为其 他防骚扰处理,本发明实施例不再详细列举,并且不作限制。
[0144] 第二方面,基于同一发明构思,本发明实施例提供一种通信过程的评论信息处理 系统,请参考图8,包括:
[0145] 接收模块80,用于收集针对第一通信标识产生的评论信息,评论信息由第一通信 标识向其他通信标识发起通信之后由其他通信标识的用户针对第一通信标识进行评论产 生;
[0146] 第一提取模块81,用于从评论信息中提取出至少一个关键词;
[0147] 第一获取模块82,用于基于预先获得的主题与关键词的对应关系信息库,获取至 少一个关键词所对应的主题作为第一通信标识所属的主题。
[0148] 可选的,系统还包括:第二获取模块,用于获取用户所产生的多条评论信息作为采 样样本;第二提取模块,用于提取出采样样本所包含的所有关键词;训练模块,用于将预先 设定的多个主题、采样样本和关键词输入文档主题生成模型,进而训练获得主题与关键词 的对应关系信息库。
[0149] 可选的,第一获取模块82,包括:查找单元,用于针对至少一个关键词中的每个关 键词,在主题与关键词的对应关系中查找获得对应关键词所属的主题;第一确定单元,用于 将至少一个关键词中的每个关键词所属的主题皆作为第一通信标识所属的主题。
[0150]可选的,第一提
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1