基于智能问答_人机交互机制的骚扰电话应对方法及系统与流程

文档序号:16888556发布日期:2019-02-15 22:51阅读:389来源:国知局
基于智能问答_人机交互机制的骚扰电话应对方法及系统与流程

本发明涉及通信安全技术领域,尤其涉及一种基于智能问答_人机交互机制的骚扰电话应对方法及系统。



背景技术:

伴随着通信技术的高度发展,人们利用通信技术如电话系统、传真系统、手机短信平台、电子邮件系统、即时通信等,可随时实现远距离的联络,人们相互联系的频率越来越高,但是人们在利用上述这些通信技术进行通信的过程中,无疑会向外界透漏自身的联系方式,由此便引起了一些如骚扰电话、骚扰短信等的通信骚扰问题。目前,由于通信骚扰的成本低廉,通信骚扰的现象十分普遍,通信骚扰已经严重影响了人们的正常工作、学习和生活。

现如今,骚扰电话已成为现代社会的一个痼疾,其产生的原因很复杂,很难短期内从根本上予以杜绝。目前,应对的基本方法是采用黑名单过滤,通过用户手动标注或网络举报的方式构建黑名单库,然后对来电进行匹配拦截。该方法对于号码固定且可以明确界定的骚扰电话非常有效,但存在以下不足:(1)骚扰方如果通过技术手段实现来电号码动态变化时,该方法将无从着手;(2)骚扰电话从出现到用户标注、被系统确认有一定的延时,在此之前用户还将受到骚扰;(3)是否被定义为骚扰电话,有很大的个人主观性,有人认为是绝对的骚扰,而有些人可能认为对自己是有帮助的,而且网络中也会存在因为竞争关系之类的恶意标注,所以对于网络标注的骚扰电话又可能会导致某些人认为正常电话甚至重要电话而被拦截,如发明人就曾因银行电话被自动拦截从而造成银行卡办理的延迟。



技术实现要素:

本发明的目的在于提供一种基于智能问答_人机交互机制的骚扰电话应对方法及系统,该方法是基于智能问答/人机交互和自然语音理解技术,对于正常电话则振铃通知机主,对于能够明确为骚扰电话的则直接屏蔽,而对于不能明确的陌生电话则交由电话机器人进行智能问答并将首次的问答过程录音保存,由机主进行人工识别,本方法能够合理地处理陌生电话,有效判断陌生电话是否为骚扰电话,并能避免因漏判而骚扰机主以及因误判而漏接正常的电话。

为了实现上述目的,本发明采用的基于智能问答/人机交互机制的抗骚扰电话的应对方法,具体包括以下步骤:

(1)在机主电话中设置白名单、黑名单和灰名单,对于属于白名单的来电无条件振铃通知机主,对于属于黑名单的来电无条件拒接(即拦截),而对于属于灰名单的来电启用机器人接听;

(2)对于每一个拨入的来电号码,首先判断其是陌生电话还是已知电话,具体是将来电号码与白名单、黑名单及灰名单中电话号码进行全号码直接匹配和/或前缀号段部分匹配,如匹配成功且判定为白名单中已知电话,则振铃通知机主接听;若能匹配成功且判定为黑名单中已知电话,则可以根据机主的设置直接拒接;若能匹配成功且判定为灰名单中已知电话,或者若匹配不成功判定为陌生电话,启用机器人与来电者进行智能问答;

(3)对于陌生电话,启用机器人与来电者进行智能问答,并根据问答内容对来电号码生成标记词(也称:标识词/特征词/关键词)集合,根据标记词的相似度计算判定决定是否振铃通知机主或加入灰名单不予接通;具体是将标记词向量与预置的电信诈骗、房产推销、贷款营销、投资理财、课外辅导等可疑词条库进行相似度计算,如果相似度较高,则保存问答录音并将来电号码加入灰名单中;如果相似度较低,则产生振铃通知机主接听,通话结束后提示机主对本次电话进行分组分类和标记词修改及补充;

(4)对于来自灰名单的号码,则继续启用机器人与来电者进行智能问答,并根据问答内容重新生成标记词集合,与可疑词条库进行相似度计算,根据相似度判定决定是否振铃通知机主或加入黑名单或是继续归入灰名单。

作为本发明的一种改进,对于来自灰名单的号码,如果计算所得的相似度和上次的相似度相比没有什么明显的下降,则对相似度进行进一步的倍增操作,如乘以倍增因子ßn-1(其中ß>1,n为该号码出现的次数),如果这时相似度达到黑名单的阈值,则直接挂断进入黑名单;如果没有达到黑名单的阈值,则继续保留于灰名单中。如果计算所得的相似度和上次的相似度相比有一定的下降,则对相似度进行进一步的衰减操作,如乘以衰减因子µn-1(其中µ<1,n为该号码出现的次数),如果这时相似度小于灰名单的阈值,产生振铃通知机主接听,通话结束后提示机主对本次电话进行分组分类和标记词的修改与补充。

作为本发明的一种改进,对于标记词的相似度高于灰名单阈值的来电号码,但如果该来电号码在20分钟内来电2次以上,为了防止有意外事件,则产生振铃通知机主接听,并在通话结束后提示机主进行分组分类和标记词的修改。

作为本发明的一种改进,所述的“在机主电话中设置白名单、黑名单和灰名单”具体包括:

a、机主电话通讯录中的电话号码缺省为白名单成员,来电无条件振铃通知机主,通讯录中被机主手动设置为黑名单成员或灰名单成员的电话号码除外;另一方面在机主电话的通话记录中出现频率高且具有一定通话时长的电话号码,(即在通话记录中频繁出现且具有一定通话时长的电话号码,而不是那种接通后发现是骚扰电话立即挂断的电话),机主虽然没有手动录入通讯录,但也可以判断为正常电话,自动加入白名单;此外,白名单号码成员也可由灰名单中经机器人或机主判断后,排除骚扰嫌疑后转换而来。

b、对于黑名单成员的来源,一方面由机主手动设置而来,这里包括多种情况,可以是机主手动输入,也可以是接听电话后手动设置,还可以是查阅问答录音后手动设置;另一方面由机器人对灰名单成员进行标记词的相似度计算和判别后产生。

c、对于灰名单成员的来源,是由机器人对陌生电话进行判定产生。

作为本发明的一种改进,如果来电号码与灰名单成员中电话号码相匹配,并由机器人与来电者经过智能问答后通过标记词的相似度计算确认为可归类为黑名单的骚扰电话,根据机主的预先设置,将机器人的运行模式切换为训练/惩戒模式,即让机器人努力维持与来电者的通话,并拉长通话时长。这样一方面可以有效提高骚扰方的时间成本和通讯成本,降低其骚扰执行的效率;另一方面让骚扰方成为机器人的一个训练工具。如果来电号码与灰名单成员中电话号码相匹配,并由机器人与来电者经过智能问答后通过标记词的相似度计算确认为可归类为黑名单的诈骗电话,则将该来电号码通过呼叫转移的方法转接至电信投诉中心,甚至公安侦查部门。

作为本发明的一种改进,机主电话中的灰名单是机器人处理陌生电话所生成的列表,其中包括来电号码、来电时间、标记词以及对应的录音链接,机主可对机器人生成的标记词进行修改、补充,并可决定将列表中的来电号码归入白名单中还是归入黑名单或是不变。

作为本发明的一种改进,对于执行智能问答的机器人的语音,采用机器合成音或对机主声音的模拟音中的任意一种,机主声音的模拟音能够通过对机主日常通话的声音进行采集与合成,然后进行智能拼接和匹配处理后获得。

作为本发明的一种改进,为了不影响机主电话接入新的来电,可对机器人正在应答的来电提供无缝转移呼叫功能,即可按照机主的设置,在来电者无察觉的情况下,将电话呼叫转移至专门的服务中心/投诉中心电话。

应用上述的基于智能问答_人机交互机制的骚扰电话应对方法的系统,该系统设置在机主电话中,系统包括陌生电话识别模块、智能问答模块、对话标记词提取模块、相似度计算模块、信息存储模块,其中,

信息存储模块,用于存储白名单列表、黑名单列表、灰名单列表和可疑词条库;

陌生电话识别模块,用于对每一个拨入的来电号码判断其是陌生电话还是已知电话,具体是将来电号码与白名单、黑名单及灰名单中电话号码进行全号码直接匹配和/或前缀号段部分匹配,若能匹配成功且判定为白名单中已知电话,则振铃通知机主接听;若能匹配成功且判定为黑名单中已知电话,则根据机主的设置直接拒接;若能匹配成功且判定为灰名单中已知电话,或者若匹配不成功判定为陌生电话,则此时陌生电话识别模块发送信号触发智能问答模块启动;

智能问答模块,用于启用机器人与来电者进行智能问答,并针对首次来电的陌生号码保存其问答录音至信息存储模块中,在机器人与来电者智能问答结束后,由智能问答模块同时触发对话标记词提取模块和相似度计算模块;

对话标记词提取模块,用于根据问答内容对来电号码在对话内容中提取标记词,形成标记词集合,并将标记词集合存储至信息存储模块中的可疑词条库中,同时将标记词传输至相似度计算模块中;

相似度计算模块,用于将标记词生成标记词向量,并将标记词向量与可疑词条库进行相似度计算。

相对于现有技术,本发明所提出的骚扰电话应对方法能够有效避免骚扰电话对机主的工作、学习、生活形成干扰,节省宝贵的时间,同时本方法能够合理地处理陌生电话,精确判断陌生电话是否为骚扰电话,并能避免因漏判而骚扰机主以及因误判而漏接正常的电话,也避免因不准确的屏蔽而导致正常甚至重要电话被延误。

附图说明

图1为本发明较佳实施例中的骚扰电话应对方法的操作流程图。

图2为本发明较佳实施例中的骚扰电话应对方法应用系统的结构示意图。

具体实施方式

为了加深对本发明的理解和认识,下面结合附图对本发明作进一步描述和介绍。

如图1给出了本发明较佳实施例的基于智能问答_人机交互机制的骚扰电话应对方法,该方法具体包括以下步骤:

(1)在机主电话中设置白名单、黑名单和灰名单,所述的机主电话可以是手机、固定电话或传真中的任一种,对于手机或固定电话,规定对于属于白名单的来电无条件振铃通知机主,对于属于黑名单的来电无条件拦截,而对于属于灰名单的来电启用机器人接听。而对于传真,则规定属于白名单的传真请求无条件接收并打印,对于属于黑名单的传真请求无条件拦截,对于属于灰名单的传真请求启用机器人与来电者进行智能问答,并根据问答内容决定接受传真,还是进入黑/灰名单以及是否保存对话录音交由机主处理。对于传真机可以通过问答将那些广告性的传真予以有效屏蔽,从而显著减少垃圾传真的接受,基本可以杜绝传真因广告而打出大量无用信息。

另外,在机主电话中构建/预置涉及房产中介、保险理财、招聘猎头、电信诈骗、贷款营销、课外辅导等可疑词条库,该词条库动态可扩展的,由人工输入或机器人自动添加,每个词条的权重也可以动态调整。此外,该词条库设计可以是全局统一的,也可以为黑名单、灰名单分别构建。

(3)对于每一个拨入的来电号码,首先判断其是陌生电话还是已知电话,具体是将来电号码在白名单、黑名单及灰名单中查找,并与白名单、黑名单及灰名单中电话号码进行全号码直接匹配和/或前缀号段部分匹配,至于前缀号段部分匹配,主要是针对固定电话的分机识别,号段匹配成功的,可能是正常的白名单成员,也可能是故意变换后几位的骚扰电话,因此,在匹配成功后仍需要对电话的组类进行判别。如果匹配成功且判定为白名单中已知电话,则振铃通知机主接听;若能匹配成功且判定为黑名单中已知电话,可以根据机主的设置直接拒接或转为惩戒模式(此处的“机主的设置”是指机主对黑名单中电话的处理方式);若能匹配成功且判定为灰名单中已知电话,或者若匹配不成功判定为陌生电话,启用机器人与来电者进行智能问答。

(4)对于陌生电话,启用机器人与来电者进行智能问答,并根据问答内容对来电号码生成标记词集合,根据标记词的相似度计算判定决定是否振铃通知机主或加入灰名单不予接通。

具体是将标记词向量与预置的可疑词条库进行相似度计算,如果相似度较高,具体是在相似度高于设定的灰名单阈值时,保存问答录音并将来电号码加入灰名单中;另外,在相似度大于等于灰名单阈值,这时即使存在相似度大于等于黑名单阈值的情况,为了防止误判,也不直接将本来电号码加入黑名单中,而是加入灰名单中待机主人工处理。此外,为了满足机主的不同需求,可将灰名单阈值和黑名单阈值设置为可调的设定方式实现。如果相似度较低,具体是在相似度低于灰名单阈值时,则产生振铃通知机主接听,通话结束后提示机主对本次电话进行分组分类和标记词修改及补充。

主要根据标记词与可疑词库的相似度对来电号码分组,组类为白名单、黑名单和灰名单。修改及补充所形成的标记词均记载于词条库中,标记词修改及补充主要是针对机器人标记不准确而漏判的情况,即未能将此次电话识别为骚扰电话,利用与机器人相同的词条库进行标记,也支持人工添加新的标记词,实现词条库的动态扩展。

(5)对于来自灰名单的号码,则继续启用机器人与来电者进行智能问答,从节省空间的角度,此处可以不再进行录音,并根据问答内容重新生成标记词集合,与可疑词条库进行相似度计算。

如果相似度和上次的相似度相比没有明显下降,则对相似度进行进一步的倍增操作,具体是将相似度乘以倍增因子ßn-1(其中ß>1,n为该号码出现的次数),如果这时相似度达到黑名单阈值,则直接挂断并将来电号码加入黑名单;如果没有达到黑名单阈值,则继续保留于灰名单中。如果相似度和上次的相似度相比有一定的下降,则对相似度进行进一步的衰减操作,具体是将相似度乘以衰减因子µn-1(其中µ<1,n为该号码出现的次数),如果这时相似度小于灰名单阈值,产生振铃通知机主接听,通话结束后提示机主对本次电话进行分组分类(白/灰/黑名单)和标记词的修改与补充。机主对于所给出的提示也可以忽略,机主对来电进行分组分类和标记词的修改与补充可以辅助机器人做准确的标注。

另外,优选的,在本较佳实施例中,对于标记词的相似度高于灰名单阈值的来电号码,如果该来电号码在20分钟内来电2次以上,为了防止有意外事件,则产生振铃通知机主接听,以排除可疑性或防止紧急电话漏接,并在通话结束后提示机主进行分组分类和标记词的修改。

进一步优选的,在本较佳实施例中,所述的“在机主电话中设置白名单、黑名单和灰名单”具体包括:

a、机主电话通讯录中的电话号码缺省为白名单成员,来电无条件振铃通知机主,通讯录中被机主手动设置为黑名单成员或灰名单成员的电话号码除外;另外,在机主电话的通话记录中经常出现的(即出现频率高)并有一定的通话时长的电话号码如各种服务电话(如10086、10000、110、122等)或各种固定办公电话,机主虽然没有手动录入通讯录,但也可以根据历史记录统计(次数、时长等)判断为正常电话,自动加入白名单。机主电话的通话记录中很可能会有很多正常电话被白名单遗漏,但后面可以通过人工或经过机器人智能问答后自动加入白名单。此外,白名单号码成员也可由灰名单中经机器人或机主判断后并排除骚扰嫌疑后的电话号码转换而来。

b、对于黑名单成员的来源,一方面由机主人工设置而来,这里包括多种情况,可以是机主手动输入,也可以是接听电话后手动设置,还可以是查阅问答录音后手动设置(机主闲暇时可以提出保存的语音信息,对保存的问答录音进行甄别,决定是否将对应的来电号码由灰名单转到白名单或黑名单中);另一方面由机器人对灰名单成员进行标记词的相似度计算和判别后产生。

c、对于灰名单成员的来源,是由机器人对陌生电话进行判定产生。另外,针对现有采用网络标注的方式形成的动态骚扰电话集也归类为灰名单成员。

机主电话中的灰名单是机器人处理陌生电话所生成的列表,其中包括来电号码、来电时间、标记词以及对应的录音链接,在列表最后一栏中,机主可对机器人生成的标记词进行修改、补充,并可决定将列表中的来电号码归入白名单中还是归入黑名单或是不变。

进一步优选的,在本较佳实施例中,如果来电号码与灰名单成员中电话号码相匹配,并由机器人与来电者经过智能问答后通过标记词的相似度计算确认为可归类为黑名单的骚扰电话,根据机主的预先设置(即对于黑名单的号码可以直接挂断,也可以切换为训练模式),将机器人的运行模式切换为训练/惩戒模式,即让机器人努力维持与来电者的通话,并拉长通话时长。这样一方面可以有效提高骚扰方的时间成本和通讯成本,降低其骚扰执行的效率;另一方面让骚扰方成为机器人的一个训练工具。如果来电号码与灰名单成员中电话号码相匹配,并由机器人与来电者经过智能问答后通过标记词的相似度计算确认为可归类为黑名单的诈骗电话,则将该来电号码通过呼叫转移的方法转接至电信投诉中心,甚至公安侦查部门。

进一步优选的,在本较佳实施例中,为了不影响机主电话接入新的来电,可对机器人正在应答的来电提供无缝呼叫转移功能,即可按照机主的设置(即可以进行如下设置:当机器人判断来电有骚扰的嫌疑即相似度大于等于黑名单阈值,则将该电话直接进行转移呼叫,且接受电话无需振铃直接接通),在来电者无察觉的情况下,将电话呼叫转移至专门的服务中心/投诉中心电话。

进一步优选的,在本较佳实施例中,对于执行智能问答的机器人的语音,采用机器合成音或对机主声音的模拟音中的任意一种,机主声音的模拟音能够通过对机主日常通话的声音进行采集与合成,然后进行智能拼接和匹配处理后获得。对机主日常通话的声音进行采集与合成可通过现有的声音采集和语言合成工具实现,该工具能够实现对机主声音信息的采集与自动合成。

如图2所示,应用上述的基于智能问答_人机交互机制的骚扰电话应对方法的系统,该系统设置在机主电话中,系统包括陌生电话识别模块、智能问答模块、对话标记词提取模块、相似度计算模块、信息存储模块,陌生电话识别模块连接智能问答模块,智能问答模块连接对话标记词提取模块和相似度计算模块,信息存储模块连接陌生电话识别模块、智能问答模块、对话标记词提取模块、相似度计算模块。其中,

信息存储模块,主要用于存储白名单列表、黑名单列表、灰名单列表和可疑词条库,另外,还用于存储智能问答模块发送的问答录音文件、对话标记词提取模块及相似度计算模块的数据处理临时文件;信息存储模块中的数据在非人为删除的情况下,将永久存储于信息存储模块中。

陌生电话识别模块,用于对每一个拨入的来电号码判断其是陌生电话还是已知电话,具体是将来电号码与白名单、黑名单及灰名单中电话号码进行全号码直接匹配和前缀号段部分匹配,若能匹配成功且判定为白名单中已知电话,则振铃通知机主接听;若能匹配成功且判定为黑名单中已知电话,则根据机主的设置直接拒接;若能匹配成功且判定为灰名单中已知电话,或者若匹配不成功判定为陌生电话,则此时陌生电话识别模块发送信号触发智能问答模块启动。

智能问答模块,用于启用机器人与来电者进行智能问答,并针对首次来电的陌生号码保存其问答录音至信息存储模块中,在机器人与来电者智能问答结束后,由智能问答模块同时触发对话标记词提取模块和相似度计算模块。

对话标记词提取模块,用于根据问答内容对来电号码在对话内容中提取标记词,形成标记词集合,并将标记词集合存储至信息存储模块中的可疑词条库中,同时将标记词传输至相似度计算模块中。

相似度计算模块,用于将标记词生成标记词向量,并将标记词向量与可疑词条库进行相似度计算。

本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1