一种自适应识别骚扰电话的处理方法及系统与流程

文档序号:11931028阅读:365来源:国知局
一种自适应识别骚扰电话的处理方法及系统与流程

本申请属于移动通信领域,具体地说,涉及一种自适应识别骚扰电话的处理方法及系统。



背景技术:

随着通信技术的发展,越来越多的商家、不法分子为了达到盈利的目的,借助于手机、固定电话、网络等通信技术进行广告推销、非法宣传和金融诈骗,造成很多电话用户的经常被骚扰,甚至可能给个人带来经济损失。而现有技术主要是通过记录拦截的电话号码实现拦截,在业务控制点SCP上保存记录表,该记录表中包括一个或多个待拦截电话号码,在接收业务交换点发送的包括主叫号码和被叫号码的初始检测点消息时,业务控制点根据记录表判断该主叫号码是否为配置的待拦截电话号码,获取判断结果,再根据判断结果对该呼叫进行处理,以拦截该被叫号码对应用户所需要拦截的呼叫,但是上述拦截方法只能拦截被叫用户设定的黑名单号码,不能判别和自动设置未设定的未知电话号码是否为骚扰电话。

因此,如何解决无法判别和自动设置未设定的未知电话号码是否为骚扰电话,便成为亟待解决的技术问题。



技术实现要素:

有鉴于此,本申请所要解决的技术问题是提供了一种自适应识别骚扰电话的处理方法及系统,以解决现有技术中无法判别和自动设置未设定的未知电话号码是否为骚扰电话的问题。

为了解决上述技术问题,本申请公开了一种自适应识别骚扰电话的处理 方法,应用于移动终端,包括:侦测到接听按键被触发,自动开启终端内置录音器对通话过程中语音进行录音;判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,如果存在嫌疑,则分析录音器录制的音频对应的文字且从所述文字中提取多个关键词,依次将所述关键词与数据库中预先收集的经验词汇进行匹配,当所述关键词的匹配命中率超过设定阀值时,停止匹配且确定所述当前接听号码为骚扰号码,其中所述经验词汇是骚扰电话的通话内容中的标志性词汇;将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器。

本申请公开了一种自适应识别骚扰电话的处理系统,应用于移动终端,包括:触发录音模块,用于侦测到接听按键被触发,自动开启终端内置录音器对通话过程中语音进行录音;语音匹配模块,用于判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,如果存在嫌疑,则分析录音器录制的音频对应的文字且从所述文字中提取多个关键词,依次将所述关键词与数据库中预先收集的经验词汇进行匹配,当所述关键词的匹配命中率超过设定阀值时,停止匹配且确定所述当前接听号码为骚扰号码,其中所述经验词汇是骚扰电话的通话内容中的标志性词汇;关联存储模块,用于将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器。

与现有技术相比,本申请可以获得包括以下技术效果:

1)通过对通话过程录音,并从录音中提取多个关键词,如果关键词与预先收集的经验词汇匹配命中率高于设定阀值,确定该号码为骚扰电话,实现了判别和自动设置未设定的未知电话号码是否为骚扰电话。

2)从录音中提取多个关键词,如果关键词与预先收集的经验词汇匹配命中率高于设定阀值,确定该号码为骚扰电话,多个关键词的匹配降低了误判骚扰电话的概率。

3)将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器,使得其它终端再次被该号码呼叫时可以提示,通过网络实现将各终端的骚扰号码汇总分享且提示。

当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是本申请实施例的识别骚扰电话的处理方法;

图2是本申请实施例的又一识别骚扰电话的处理方法;

图3是本申请实施例的又一识别骚扰电话的处理方法;

图4是本申请实施例的识别骚扰电话的处理系统的架构图。

具体实施方式

以下将配合附图及实施例来详细说明本申请的实施方式,藉此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。

当前对骚扰电话的拦截,主要是通过拦截被叫用户设定的黑名单号码,不能判别和自动设置未设定的未知电话号码是否为骚扰电话,而本申请通过对通话过程录音,并从录音中提取多个关键词,如果关键词与预先收集的经验词汇匹配命中率高于设定阀值,确定该号码为骚扰电话,并将骚扰号码加上骚扰标签关联关键词上传到网络服务器,不仅可以判别和自动设置未设定的未知电话号码是否为骚扰电话,还可以通过网络实现将各终端的骚扰号码汇总分享且提示。

图1所示,为本申请一个实施例所述的识别骚扰电话的处理方法,包括:

步骤S100,侦测到接听按键被触发,自动开启终端内置录音器对通话过程中语音进行录音;

来电时,侦测到用户触发接听按键后,自动开启终端内置录音器或者录音软件对通话过程中语音进行录音,用户自行设置是由终端内置录音器或者录音软件进行录音,可以选择录音音频质量较好的设备进行录音;

步骤S102,判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,如果存在嫌疑,则执行步骤S104;

通话时,录音器会对通话过程中语音进行录音,无论来电是正常电话还是骚扰电话,都需要通过对录制的对话音频分析才能得知,而且当接听电话明显不是骚扰电话时,依然需要对录制的对话音频进行分析操作,相当于重复操作,增加了系统运行负担和存储负担,所以在对录制的对话音频进行分析操作之前可以进行嫌疑判断,可以应用以下几种方式:

(1)来电话时用户看到陌生号码,尤其是另类号码,第一反应就是认为可能是推销或者诈骗等骚扰电话,因此,本申请采取方式1:将所述当前接听号码与终端中存储号码逐一进行匹配,若匹配不成功则所述接听号码为陌生号码,且确定所述当前接听号码存在骚扰电话的嫌疑,其中,终端中存储号码包括通讯录、通话记录和短信箱中存储的所有号码。遍历匹配通讯录、通话记录和短信箱中的所有号码,可以及时通过陌生号码的条件确定骚扰电话的嫌疑,而且可以防止将用户对最新通讯未存储的号码认为是陌生号码。

用户接听电话录音过程中或录音结束后(比如:极短时间挂断电话录音也就随之结束),将当前接听号码先与通讯录中的所有电话号码依次进行匹配,当匹配成功时则不存在骚扰嫌疑且停止匹配;若当前接听号码与通讯录中所有号码都没有匹配成功,则继续与通话记录中的所有号码进行匹配,当匹配成功时则不存在骚扰嫌疑且停止匹配;若当前接听号码与通话记录中所有号码都没有匹配成功,则继续与短信箱中的所有号码进行匹配,当匹配成功时则不存在骚扰嫌疑且停止匹配,若当前接听号码与短信箱中所有号码都没有匹配成功,则确定所述当前接听号码存在骚扰电话的嫌疑;如果电话号码不是陌生号码时,与通讯录中号码匹配成功度最高,按照通讯录、通话记录和短信箱的依次匹配顺序,可以降低匹配工作强度。

(2)用户接到骚扰电话时,由于对其讲述内容并不感兴趣或者存有防范心理,通常用户会选择很快挂断电话以示拒绝,因此,本申请采取方式2:判断接听通话时间是否小于预设时间阀值,如果是则确定存在骚扰电话的嫌疑,其中预设时间阀值是统计骚扰电话挂断时间的平均值。

用户接听电话后录音器对通话过程中语音进行录音同时计时,当计时时 间超过预设时间阀值,则确定不存在骚扰电话的嫌疑;当录音结束(用户挂断电话后录音自行结束,或者用户手动操作停止录音)且计时时间小于预设时间阀值,如果是则确定存在骚扰电话的嫌疑。通过计时通话时间长短判断是否存在骚扰电话的嫌疑,一方面是操作简单易于获取时间值,另一方面是不存在任何分析阶段误差得到的结果更加直接。

例如:用户接听电话后,手机屏幕上计时器会自动对通话时间进行计时并显示,如果对方是用户熟悉或者知道的人,用户对其讲述内容自然不会毫无兴趣而很快挂断电话,如果对方是推销或者诈骗的潜在人员,用户通常会对其讲述内容并不感兴趣从而想尽快结束通话,继续做用户正在做的事情,所以,利用判断通话时间长短的方式来确定骚扰电话的嫌疑,不仅操作直接而且准确度较高。

(3)用户接到骚扰电话时,由于对其讲述内容并不感兴趣或者存有防范心理,出于礼貌用户通常会委婉拒绝后挂断电话,但是有时基于对方不断讲述不同的新内容,用户可能会对讲述内容进行了解后再次进行委婉拒绝,总之,无论用户对讲述内容是否了解,用户的讲话过程中一定会出现委婉拒绝词汇,因此,本申请采取方式3:将麦克风采集的用户声音片段与数据库中预存音频片段进行匹配,若音频匹配相似度大于预设相似阀值,则确定存在骚扰电话的嫌疑,其中,所述预存音频片段是含有拒绝标志词汇的音频。将麦克风识别到的用户声音直接做语义分析,由于麦克风直接识别到的用户声音更加立体且直接,所以语义分析后对应的文字准确度更高,而且使得语义分析和音频匹配的过程更加便捷。

预存音频片段是含有拒绝标志词汇的音频,例如:用户说“谢谢、不需要、不用了、没必要”等委婉拒绝词汇。

用户可以预先设置对麦克风采集的用户声音是定时多段录音还是一段全程录音,若用户设定的是定时多段录音(用户每次讲话停顿时间较长时为一录音片段),则将每段录音依次与数据库中预存音频片段进行匹配,当出现录音匹配相似度大于预设相似阀值时,则确定存在骚扰电话的嫌疑且停止剩余音频片段的匹配;若用户设定的是一段全程录音,将该全程录音与数据库中预存音频片段进行匹配,如音频匹配相似度大于预设相似阀值,则确定 存在骚扰电话的嫌疑。录制的音频片段与预存音频片段匹配实际上就是音频片段中拒绝词汇的匹配,用户根据自己的实际需求设定是定时多段录音还是一段全程录音,定时多段录音匹配过程较快但匹配准确度较低,一段全程录音匹配过程较慢但匹配准确度较高。

例如:用户接听电话后,如果发现对方想要推销自己的产品,用户可能委婉说出拒绝词汇,在用户拒绝的过程中对方会尽可能讲到吸引用户的内容,从而用户可能讲述对其产品进行了解的话语,而在用户讲话的同时,麦克风实时采集的用户声音,系统在后台将采集到的声音片段语义分析为对应文字,并将该采集到的声音片段与含有拒绝标志性词汇的音频匹配,当相似度较高时确定存在骚扰电话的嫌疑,以便进行后续处理。

当然,上述三种方式都存在一定的误差概率,因此可以考虑通过以上方式协同组合的方式进行判断,来降低误差,具体组合方式如下:

1)方式1+方式2

将所述当前接听号码与终端中存储号码逐一进行匹配,若匹配不成功则所述接听号码为陌生号码;再判断接听通话时间是否小于预设时间阀值,如果是则确定存在骚扰电话的嫌疑。

首先判断当前号码是否为陌生号码,如果当前号码不是陌生号码那么必然不是骚扰电话,所以也无需再进行任何后续操作确定该号码是否为骚扰电话;如果当前号码是陌生号码,再继续判断其通话时间是否小于预设时间阀值,若当前号码是陌生号码且通话时间小于预设时间阀值,则确定存在骚扰电话的嫌疑。

例如:当前号码不是是陌生号码而是手机中存储号码时,也可能因为时间仓促、讲述内容简单等出现挂断电话时间短的现象,通过将判断陌生号码和判断通话时间相结合的方式来确定是否存在骚扰电话的嫌疑,可以避免在这种情况下误将当前号码确定存在骚扰电话的嫌疑,提高判断准确度。

2)方式1+方式3

将所述当前接听号码与终端中存储号码逐一进行匹配,若匹配不成功则所述接听号码为陌生号码;再将麦克风采集的用户声音片段与数据库中预存 音频片段进行匹配,若音频匹配相似度大于预设相似阀值,则确定存在骚扰电话的嫌疑。

首先判断当前号码是否为陌生号码,如果当前号码不是陌生号码那么必然不是骚扰电话,所以也无需再进行任何后续操作确定该号码是否为骚扰电话;如果当前号码是陌生号码,再继续将麦克风识别的用户声音片段与预存音频片段进行匹配,若当前号码是陌生号码且音频匹配相似度大于预设相似阀值,则确定存在骚扰电话的嫌疑。

例如:当前号码不是是陌生号码而是手机中存储号码时,也可能因为对方出游想给用户带些礼物等出现用户委婉拒绝的现象,通过将判断陌生号码和判断音频匹配相结合的方式来确定是否存在骚扰电话的嫌疑,可以避免在这种情况下误将当前号码确定存在骚扰电话的嫌疑,提高判断准确度。

步骤S104,分析录音器录制的音频对应的文字且从所述文字中提取多个关键词;

无论是通过上述哪种方式来判断骚扰电话的嫌疑,为了避免重复判断的操作,只有在确定当前号码存在骚扰电话嫌疑的情况下,才继续分析录音器录制的通话过程双方说话的音频。而且如果通话时间极短(录音随着通话结束而结束),那么分析录制音频的过程发生在用户挂断电话后,如果用户通话时间不是极短的情况下;那么分析录制音频的过程发生录音过程中,实时对录音进行分析,但无论是发生在挂断电话后还录音过程中,分析录制音频的过程如下:

利用音频转换器将录制的音频转换成对应的文本,然后分析文本中文字并对所述文字进行分词,根据数据库中的词性对照表判断所述每个分词的词性,选取一定数量的词性为动词和名词的分词作为关键词,对关键词的数量和词性分别进行限制,提高了关键词质量,进而使得匹配准确度较高。

例如:音频转换后的文本为“您好,我们是某某理财公司,我们公司新推出针对不同工薪族的多种理财方案”,我们可以一句一句对该文本进行分词划分为:您、好,我们、是、某某理财公司,我们、公司、新、推出、针对、不同工薪族、的、多种、理财方案;然后对划分之后得到的分词进行去重处理,再根据数据库中的词性对照表识别每个分词的词性,由于动词和名 词作为一个文本的关键词的可能性较大,所以从动词和名词中选取一定数量的分词作为关键词。

步骤S106,依次将所述关键词与数据库中预先收集的经验词汇进行匹配,当所述关键词的匹配命中率超过设定阀值时,停止匹配且确定所述当前接听号码为骚扰号码,其中所述经验词汇是骚扰电话的通话内容中的标志性词汇;

当通话时间过于简短时,则录制音频转化为的文字势必会较少,进而会出现从转化后的文字中提取关键词更少,而利用一个或两个等较少关键词匹配的结果不够客观性,准确度势必不高,所以,在将关键词与经验词汇进行匹配时还包括如下步骤:

首先将提取的关键词个数与预设最小值进行比较,如果关键词个数小于等于预设最小值时,则判断结果的准确度较低,即放弃判断当前号码是否为骚扰电话,如果关键词个数大于预设最小值时,则将提取的多个关键词依次与数据库中预先收集的经验词汇进行匹配,每个关键词都分别与所有经验词汇匹配,如匹配成功则停止匹配,否则继续匹配直到所有经验词汇匹配完毕后认为匹配不成功;如此继续进行下一个关键词与所有经验词汇的匹配,直到关键词的匹配命中率超过预先设定阀值时,停止匹配且确定所述当前接听号码为骚扰号码;提取多个关键词与预先收集的经验词汇匹配命中率高于设定阀值,确定该号码为骚扰电话,多个关键词的匹配降低了误判骚扰电话的概率。

其中,数据库中预先收集的经验词汇可以是保险、房屋、理财、金融产品、中奖等推销或诈骗的标志性词汇。

步骤S108,将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器。

将所述骚扰号码加上骚扰标签以用来提示该号码为骚扰电话,并将所有匹配成功的关键词关联所述骚扰号码上传到网络服务器,网络服务器会统计接收到该骚扰号码信息的次数,同时还需识别发送该骚扰号码信息的终端是否为同一终端,如果所有次数的信息都是由同一终端发送的,则有可能存在恶意破坏,这种情况下网络服务器不会对该骚扰号码信息进行任何操作,如 果网络服务器接收到该骚扰号码信息的次数较多并且分别来自不同的发送终端,则网络服务器对该骚扰号码及其对应的关键词进行汇总后统一生成黑名单,以便网络服务器将生成的最新黑名单及时下发到其它终端,提示其它终端该号码为骚扰号码,且通过网络实现将各终端的骚扰号码汇总分享且提示。

对于图1中步骤S108中将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器之后,如图2所示,还包括如下步骤:

步骤S200,接收所述网络服务器侧发来的骚扰电话黑名单,其中,所述骚扰电话黑名单为所述网络服务器根据骚扰标签对骚扰号码及对应关键词进行汇总后统一生成。

终端接收到网络服务器下发的最新黑名单后,及时将最新黑名单存储至终端中并删除原有的黑名单,且将该最新黑名单设置为应用拦截提示;网络服务器对各终端发送来的相同骚扰号码的发送次数进行统计,如果所有次数的信息都是由同一终端发送的,则有可能存在恶意破坏,这种情况下网络服务器不会对该骚扰号码信息进行任何操作;如果该号码的发送次数较多且分别来自不同的发送终端,则网络服务器会根据终端发送来的骚扰标签对骚扰号码及对应关键词进行汇总后统一生成骚扰电话黑名单,网络服务器不断对骚扰电话黑名单进行更新处理,将最新骚扰电话黑名单下发到各个移动终端,以便提示其它终端该号码为骚扰号码。

步骤S202,当侦测到电话呼入时,识别呼入的电话号码,并在所述骚扰电话黑名单中进行遍历比对,如命中,则针对所述电话号码提示骚扰标签或依据用户预先设定直接挂断呼入电话并提示所述电话号码为骚扰电话。

当侦测到终端有电话呼入时,识别呼入的电话号码,并在终端接收的最新骚扰电话黑名单中进行遍历比对,如果该呼入号码与黑名单中骚扰号码一致,则可以利用该呼入号码对应的骚扰标签对其进行提示,还可以依据用户预先设定直接挂断呼入电话并提示所述电话号码为骚扰电话,通过网络实现将各终端的骚扰号码汇总分享且提示。

图3所示,为本申请又一个实施例所述的识别骚扰电话的处理方法,包括:

步骤S300,侦测到接听按键被触发,自动开启终端内置录音器对通话过程中语音进行录音;

来电时,侦测到用户触发接听按键后,自动开启终端内置录音器或者录音软件对通话过程中语音进行录音;

步骤S302,判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,如果不存在嫌疑,执行步骤S304,否则执行步骤S306;

步骤S304,如果不存在嫌疑,则删除录音器录制的相应音频;

不存在嫌疑时删除录制的相应音频,既可以减轻移动终端的存储压力,又可以防止终端音频存储混乱。

步骤S306,分析录音器录制的音频对应的文字且从所述文字中提取多个关键词;

步骤S308,依次将所述关键词与数据库中预先收集的经验词汇进行匹配,当所述关键词的匹配命中率超过设定阀值时,停止匹配且确定所述当前接听号码为骚扰号码,其中所述经验词汇是骚扰电话的通话内容中的标志性词汇;

步骤S3010,将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器。

网络服务器会统计接收到该骚扰号码信息的次数,同时还需识别发送该骚扰号码信息的终端是否为同一终端,如果所有次数的信息都是由同一终端发送的,则有可能存在恶意破坏,这种情况下网络服务器不会对该骚扰号码信息进行任何操作,如果网络服务器接收到该骚扰号码信息的次数较多并且分别来自不同的发送终端,则网络服务器对该骚扰号码及其对应的关键词进行汇总后统一生成黑名单,然后网络服务器将生成的最新黑名单及时下发到其它终端;

终端接收到网络服务器下发的最新黑名单后,及时将最新黑名单存储至终端中并删除原有的黑名单,且将该最新黑名单设置为应用拦截提示,比如:当识别到呼入陌生电话号码时,并在终端接收的最新骚扰电话黑名单中进行遍历比对,如果该呼入号码与黑名单中骚扰号码一致,则可以利用该呼入号 码对应的骚扰标签对其进行提示,还可以依据用户预先设定直接挂断呼入电话并提示所述电话号码为骚扰电话,通过网络实现将各终端的骚扰号码汇总分享且提示。

图3所示的实施例之后也可以结合图2所示实施例内容,形成一新的实施例。

如图4所示,为本申请一个实施例所述的识别骚扰电话的处理系统,包括:

触发录音模块400,用于侦测到接听按键被触发,自动开启终端内置录音器对通话过程中语音进行录音;

语音匹配模块402,用于判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,如果存在嫌疑,则分析录音器录制的音频对应的文字且从所述文字中提取多个关键词,依次将所述关键词与数据库中预先收集的经验词汇进行匹配,当所述关键词的匹配命中率超过设定阀值时,停止匹配且确定所述当前接听号码为骚扰号码,其中所述经验词汇是骚扰电话的通话内容中的标志性词汇;

关联存储模块404,用于将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器。

语音匹配模块402,进一步用于将所述当前接听号码与终端中存储号码逐一进行匹配,若匹配不成功则所述接听号码为陌生号码,且确定所述当前接听号码存在骚扰电话的嫌疑,其中所述终端中存储号码包括通讯录、通话记录和短信箱中存储的所有号码。

语音匹配模块402,进一步用于判断接听通话时间是否小于预设时间阀值,如果是则确定存在骚扰电话的嫌疑。

语音匹配模块402,进一步用于将麦克风采集的用户声音片段与数据库中预存音频片段进行匹配,若音频匹配相似度大于预设相似阀值,则确定存在骚扰电话的嫌疑,其中,所述预存音频片段是含有拒绝标志词汇的音频。

语音匹配模块402,进一步用于对所述文字进行分词,根据数据库中的词性对照表判断所述每个分词的词性,选取一定数量的词性为动词和名词的 分词作为关键词。

语音匹配模块402,进一步用于如果不存在嫌疑,则删除录音器录制的相应音频。

关联存储模块404,还用于接收所述网络服务器侧发来的骚扰电话黑名单,其中,所述骚扰电话黑名单为所述网络服务器根据骚扰标签对骚扰号码及对应关键词进行汇总后统一生成。

关联存储模块404,进一步用于当侦测到电话呼入时,识别呼入的电话号码,并在所述骚扰电话黑名单中进行遍历比对,如命中,则针对所述电话号码提示骚扰标签或依据用户预先设定直接挂断呼入电话并提示所述电话号码为骚扰电话。

图4中所示出的识别骚扰电话的处理系统,与图1-3中所示的方法实施例特征和方案相互对应,上述对于快捷操作系统中描述的不足之处,请参考图1-3中所示的方法实施例的描述。

本申请通过接听电话后对通话过程进行录音,并从录音中提取多个关键词,如果关键词与预先收集的经验词汇匹配命中率高于设定阀值,确定该号码为骚扰电话,实现了判别和自动设置未设定的未知电话号码是否为骚扰电话,即可以自行判断黑名单和终端中存储号码以外的陌生号码是否为骚扰电话。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程 只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。

上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

a1、一种自适应识别骚扰电话的处理方法,应用于移动终端,包括:

侦测到接听按键被触发,自动开启终端内置录音器对通话过程中语音进行录音;

判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,如果存在嫌疑,则分析录音器录制的音频对应的文字且从所述文字中提取多个关键词,依次将所述关键词与数据库中预先收集的经验词汇进行匹配,当所述关键词的匹配命中率超过设定阀值时,停止匹配且确定所述当前接听号码为骚扰号码,其中所述经验词汇是骚扰电话的通话内容中的标志性词汇;

将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器。

a2、如权利要求a1所述的方法,从所述文字中提取多个关键词,进一步包括:对所述文字进行分词,根据数据库中的词性对照表判断所述每个分词的词性,选取一定数量的词性为动词和名词的分词作为关键词。

a3、如权利要求a1所述的方法,判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,进一步包括:将所述当前接听号码与终端中存储号码逐一进行匹配,若匹配不成功则所述接听号码为陌生号码,且确定所述当前接听号码存在骚扰电话的嫌疑。

a4、如权利要求a3所述的方法,所述终端中存储号码包括通讯录、通话记录和短信箱中存储的所有号码。

a5、如权利要求a1所述的方法,判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,进一步包括:判断接听通话时间是否小于预设时间阀值,如果是则确定存在骚扰电话的嫌疑。

a6、如权利要求a1所述的方法,判断当前接听号码是否存在骚扰电话的嫌疑,进一步包括:将麦克风采集的用户声音片段与数据库中预存音频片段进行匹配,若音频匹配相似度大于预设相似阀值,则确定存在骚扰电话的嫌疑,其中,所述预存音频片段是含有拒绝标志词汇的音频。

a7、如权利要求a1所述的方法,接收所述网络服务器侧发来的骚扰电话黑名单,其中,所述骚扰电话黑名单为所述网络服务器根据骚扰标签对骚扰号码及对应关键词进行汇总后统一生成。

a8、如权利要求a7所述的方法,当侦测到电话呼入时,识别呼入的电话号码,并在所述骚扰电话黑名单中进行遍历比对,如命中,则针对所述电话号码提示骚扰标签或依据用户预先设定直接挂断呼入电话并提示所述电话号码为骚扰电话。

a9、如权利要求a1所述的方法,判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,进一步包括:如果不存在嫌疑,则删除录音器录制的相应音频。

b10、一种自适应识别骚扰电话的处理系统,应用于移动终端,包括:

触发录音模块,用于侦测到接听按键被触发,自动开启终端内置录音器对通话过程中语音进行录音;

语音匹配模块,用于判断由终端屏幕上读取的当前接听号码是否存在骚扰电话的嫌疑,如果存在嫌疑,则分析录音器录制的音频对应的文字且从所述文字中提取多个关键词,依次将所述关键词与数据库中预先收集的经验词汇进行匹配,当所述关键词的匹配命中率超过设定阀值时,停止匹配且确定所述当前接听号码为骚扰号码,其中所述经验词汇是骚扰电话的通话内容中的标志性词汇;

关联存储模块,用于将所述骚扰号码加上骚扰标签,并将所述关键词关联所述骚扰号码上传到网络服务器。

b11、如权利要求b10所述的系统,所述语音匹配模块,进一步用于对所述文字进行分词,根据数据库中的词性对照表判断所述每个分词的词性,选取一定数量的词性为动词和名词的分词作为关键词。

b12、如权利要求b10所述的系统,所述语音匹配模块,进一步用于将所述当前接听号码与终端中存储号码逐一进行匹配,若匹配不成功则所述接听号码为陌生号码,且确定所述当前接听号码存在骚扰电话的嫌疑。

b13、如权利要求b12所述的系统,所述语音匹配模块,进一步用于所述终端中存储号码包括通讯录、通话记录和短信箱中存储的所有号码。

b14、如权利要求b10所述的系统,所述语音匹配模块,进一步用于判断接听通话时间是否小于预设时间阀值,如果是则确定存在骚扰电话的嫌 疑。

b15、如权利要求b10所述的系统,所述语音匹配模块,进一步用于将麦克风采集的用户声音片段与数据库中预存音频片段进行匹配,若音频匹配相似度大于预设相似阀值,则确定存在骚扰电话的嫌疑,其中,所述预存音频片段是含有拒绝标志词汇的音频。

b16、如权利要求b10所述的系统,所述关联存储模块,还用于接收所述网络服务器侧发来的骚扰电话黑名单,其中,所述骚扰电话黑名单为所述网络服务器根据骚扰标签对骚扰号码及对应关键词进行汇总后统一生成。

b17、如权利要求b16所述的系统,所述关联存储模块,进一步用于当侦测到电话呼入时,识别呼入的电话号码,并在所述骚扰电话黑名单中进行遍历比对,如命中,则针对所述电话号码提示骚扰标签或依据用户预先设定直接挂断呼入电话并提示所述电话号码为骚扰电话。

b18、如权利要求b10所述的系统,所述语音匹配模块,进一步用于如果不存在嫌疑,则删除录音器录制的相应音频。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1