一种基于语音交互的骚扰电话拦截方法及相关设备与流程

文档序号:16929173发布日期:2019-02-22 20:07阅读:495来源:国知局
一种基于语音交互的骚扰电话拦截方法及相关设备与流程

本发明涉及信息安全领域,特别涉及一种基于语音交互的骚扰电话拦截方法及相关设备。



背景技术:

随着互联网、大数据时代的到来,体系庞大的信息数据库给人们的生活带来了巨变,但是信息数据的泄露也引发了一系列问题。近年来,越来越多的威胁、诈骗等骚扰电话给人们的日常生活带来了诸多的困扰,也给很多缺乏防范意识的用户带来了无可挽回的生命、财产损失。

随着人们对数据安全的逐渐重视,越来越多的互联网企业也开始关注防骚扰电话拦截的技术方案。传统方式上的防骚扰方式都是将骚扰电话标记后存于数据库,通过比对判别作出拦截处理,虽然可以一定程度上保护用户的生命、财产安全,但是无法筛选产生的新骚扰电话。



技术实现要素:

基于此,有必要针对如何拦截骚扰电话,建立判别骚扰电话的计算模型等问题,提供一种基于语音交互的骚扰电话拦截方法及相关设备。

一种基于语音交互的骚扰电话拦截方法,包括:

通过语音交互采集来电者语音样本;

计算所述来电者语音样本的威胁及信用概率;

根据所述威胁及信用概率来判断来电是否为骚扰电话,并做出对应处理。

在其中一个实施例中,所述通过语音交互采集来电者语音样本,包括:

接收来电信号并提取所述来电者语音;

调取智能语音系统,与所述来电者进行语音交互获取所述来电者身份和目的信息并记录;

将所述来电者身份和目的信息汇总为语音样本并存储。

在其中一个实施例中,所述计算所述来电者语音样本的威胁及信用概率,包括:

调取所述来电者语音样本;

将所述来电者语音样本代入神经网络迭代算法,计算所述来电者语音样本的威胁及信用概率。

在其中一个实施例中,所述神经网络迭代算法包括:

调取多个来电语音样本,提取所述多个来电语音样本的声纹特征、语义特征,将所述多个来电语音样本的声纹特征、语义特征,和所述多个来电语音样本对应的期望输出的威胁及信用概率汇总成训练集;

设置用以存储神经网络迭代算法中的输入层数据、隐层训练函数的输入和输出、输出层的输入和输出、权值、误差、以及期望输出的威胁及信用概率的数据块;

将所述训练集代入所述神经网络迭代算法的输入层数据中,计算所述隐层训练函数的输入和输出、输出层的输入和输出,并存储于所述数据块中,所述输出层的输出为输出结果;

计算所述输出结果与所述期望输出的威胁及信用概率之间的误差,并存储于所述数据块中;

通过改变所述权值的大小修正所述神经网络迭代算法的误差;

重复计算,直到所述输出结果与所述期望输出的威胁及信用概率之间的误差不高于误差阈值n时,完成所述神经网络迭代算法的训练。

在其中一个实施例中,所述根据语音样本的威胁及信用概率来判断来电是否为骚扰电话,并做出对应处理,包括:

调取所述来电者语音样本的威胁及信用概率;

将所述威胁及信用概率与预设的威胁阈值m比较,判断所述来电者的来电信号是否为接听信号,当所述威胁及信用概率低于所述威胁阈值m时,判断所述来电者语音为非骚扰电话,接通所述来电信号;

当所述威胁及信用概率高于或等于所述威胁阈值m时,判断所述来电者语音为骚扰电话,挂断所述来电信号。

在其中一个实施例中,所述根据语音样本的威胁及信用概率来判断来电是否为骚扰电话,并做出对应处理后,还包括:

将所述来电者语音中所述语音样本和对应的威胁及信用概率存储,代入所述神经网络迭代算法,调整所述神经网络迭代算法的权值,修正所述神经网络迭代算法的误差。

基于相同的技术构思,本发明还提供了一种基于语音交互的骚扰电话拦截装置,所述一种基于语音交互的骚扰电话拦截装置包括:

语音采集模块,用于通过语音交互采集来电者语音样本;

概率计算模块,用于计算所述来电者语音样本的威胁及信用概率;

判断反馈模块,用于根据所述威胁及信用概率来判断来电是否为骚扰电话,并做出对应处理。

在其中一个实施例中,所述概率计算模块,包括:

语音调取单元,用于调取所述来电者语音样本;

算法处理单元,用于将所述来电者语音样本代入神经网络迭代算法,计算所述来电者语音样本的威胁及信用概率。

一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述一种基于语音交互的骚扰电话拦截方法的步骤。

一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述一种基于语音交互的骚扰电话拦截方法的步骤。

上述一种基于语音交互的骚扰电话拦截方法及相关设备,通过询问并采集来电者语音样本,计算所述来电者语音样本的威胁及信用概率,根据所述威胁及信用概率来判断来电是否为骚扰电话,并做出对应处理。本发明在防骚扰数据库的基础上,通过概率计算进一步精确拦截骚扰电话,避免重要电话被遗漏。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。

图1为本发明一个实施例中一种基于语音交互的骚扰电话拦截方法的流程图;

图2为本发明一个实施例中步骤s1采集语音样本的流程图;

图3为本发明一个实施例中步骤s2计算概率的流程图;

图4为本发明一个实施例中步骤s3反馈处理的流程图;

图5为本发明一个实施例中一种基于语音交互的骚扰电话拦截装置的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

图1为本发明一个实施例中一种基于语音交互的骚扰电话拦截方法的流程图,如图1所示,一种基于语音交互的骚扰电话拦截方法,包括以下步骤:

步骤s1,采集语音样本:通过语音交互采集来电者语音样本。

在采集语音样本过程中,调取综合接入设备接收语音信号,调取智能语音系统与所述来电者进行语音交互,获取所述来电者的语音信息,采集语音样本,具体可选用:honet综合接入设备、pcm综合业务接入设备、ian7200智能接入平台等。

综合接入设备iad可提供语音、数据、多媒体业务的综合接入。在网络侧,iad的接口类型可以是数字用户线路dsl、10/100m以太网接口、1000m以太网ge接口等。在用户侧,iad的接口主要是z接口(模拟用户接口)、10/100m以太网接口。

综合接入设备语音处理功能:由于在ip网上传输的时延较大,为避免回声对通话质量的影响,iad设备应具有回声抑制功能。回声抑制支持g.168,最坏情况不低于16ms。在通话过程中,为了提高带宽利用率,lad可以提供静音检测技术以进行静音压缩。在接收方应能产生舒适背景杂音信号以模拟真实环境。由于ip网中路由的不对称性及各ip节点的处理时间不同,会造成分组的时延抖动,影响通话质量。因此iad应设有输入缓冲,以尽可能消除时延对通话质量的影响。

本实施例从业务的角度讲,用户的需求是趋向于多样化的,用户驻地网络所用的传输媒质不一、用户的带宽需求不一、用户的业务流量模型不一,不可能用一种接入技术解决所有问题,这就要求语音采集过程必须具备多业务接入的能力,满足用户多样化接入的需求,因此采用综合输入设备采集语音样本,要求iad能够灵活适用于各种接入网环境中。

在具体设计时,当一手机终端接收到未知来电者a的语音时,综合输入设备在步骤s1中就是采集所述来电者a的语音样本。

步骤s2,计算概率:计算所述来电者语音样本的威胁及信用概率。

本实施例主要是对采集的来电者语音带入算法进行计算,得出威胁及信用概率,用以判断得出后续对来电者语音的反馈处理方案的选择。

计算得出的威胁及信用概率,可以反映所述来电者语音为骚扰电话的可能性大小,在相同条件下,可能出现也可能不出现。本实施例所采用的神经网络迭代算法存在一个重复计算过程,大量语音样本作为输入,计算后直到所述输出结果与所述期望输出的威胁及信用概率之间的误差不高于误差阈值n时,完成所述神经网络迭代算法的训练,批量语音样本的输入保证了数据的相对准确,尽可能避免了个别样本影响的问题。

在具体设计时,将步骤s1中未知来电者a的语音样本被采集后带入提前设定的算法中计算得出威胁及信用概率a,a可用在后续过程中判断未知来电者a的语音电话为骚扰电话的依据。

步骤s3,反馈处理:根据所述威胁及信用概率来判断来电是否为骚扰电话,并做出对应处理。

威胁及信用概率是度量所述来电者语音为骚扰电话可能性的数值。在经过大量重复试验后确定的威胁及信用概率可以作为依据来判断所述来电者语音是否为骚扰电话并作出是否接听处理。

本实施例是在依据威胁及信用概率的基础上作出的判断反馈,在做大量重复试验时,随着试验次数的增加,一个事件出现的频率,总在一个固定数的附近摆动,显示一定的稳定性,通过概率的计算可以更加准确地对来电者语音作出判断,降低了判断错误的可能性。

在具体设计时,针对步骤s2中计算得出的未知来电者a的威胁及信用概率a,依据威胁阈值m作为参考,针对所述来电者a的威胁及信用概率a的对比结果作出接听动作判断。

图2为本发明一个实施例中步骤s1采集语音样本的流程图,如图2所示,在一个实施例中,步骤s1可包括如下具体步骤:

步骤s101,提取语音:接收来电信号并提取所述来电者语音。

本实施例的过程是在步骤s1基础上的分解,本实施例的动作只在于提取所述来电者语音。

在具体设计时,在步骤s1中调取综合接入设备接收未知来电者a的来电信号,同时完成未知来电者a语音的提取。

步骤s102,获取信息:调取智能语音系统,获取并记录所述来电者身份和目的信息。

本实施例采用智能语音技术,将智能语音系统作为主要的信息提取设备,智能语音系统直接与来电者进行语音交互,通过与来电者的对话来获取来电者的身份和目的信息,具体选用:讯飞智能语音系统、百度语音系统、阿里云智能语音交互系统等。

智能语音,即智能语音技术,是实现人机语言的通信,包括语音识别技术asr和语音合成技术tts。语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。

本实施例采用的智能语音识别系统可以有效实现与来电者的语音交互,减少了人员的浪费,避免了真人直接回复的过程,同时可以根据提前设定的程序语言完成所需信息的及时采集,减少遗漏重要电话的概率。

在具体设计时,调取智能语音系统接收步骤s101中提取的来电者a的语音,进行语音交互,直接询问来电者a的身份和目的信息,完成语音信息的收集。

步骤s103,汇总存储:将所述来电者身份和目的信息汇总为语音样本并存储。

本实施例的主要作用是将来电者的身份和目的信息汇总为语音样本用作为神经网络迭代算法的输入,计算威胁及信用概率,利用存储器将来自智能语音识别系统的信息进行汇总并存储,便于后续过程的提取使用。

图3为本发明一个实施例中步骤s2计算概率的流程图,如图3所示,在一个实施例中,步骤s2可包括如下具体步骤:

步骤s201,调取语音样本:调取所述来电者语音样本。

步骤s202,算法计算:将所述来电者语音样本代入神经网络迭代算法,计算所述来电者语音样本的威胁及信用概率。

神经网络迭代算法的学习过程转化为求损失函数的最小值问题,一般来说,损失函数包括误差项和修正项两部分,误差衡量神经网络模型在训练数据集上的拟合程度,而修正项则是控制模型的复杂程度,防止出现过拟合现象。

神经网络迭代算法是由大量高度互联的处理元素所组成的复杂网络计算系统,具有从大量实际数据中学习和推广的功能。网络神经元分层排列,由输入层、隐层、输出层组成,其中隐层又可为多层,计算过程由正向计算过程和反向计算过程组成。正向传播过程,输入模式从输入层经隐单元层逐层处理,并转向输出层,每层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各神经元的权值,使得误差信号最小。

利用输出后的误差来估计输出层前一层的误差,再用这层误差来估计更前一层误差,如此获取所有各层误差估计。这里的误差估计可以理解为某种偏导数,我们就是根据这种偏导数来调整各层的连接权值,再用调整后的连接权值重新计算输出误差。直到输出的误差达到符合的要求或者迭代次数溢出设定值。它的学习规则是:使用最速下降法,通过反向传播(就是一层一层往前传)不断调整网络的权值和阈值,最后使全局误差系数最小。

本实施例的突出优点就是具有很强的非线性映射能力和柔性的网络结构。神经网络迭代算法无论在网络理论还是在性能方面已比较成熟,网络的中间层数、各层的神经元个数可根据具体情况任意设定,并且随着结构的差异其性能也有所不同,可以极大地避免由于个例导致数据不准确的情况发生。

在具体设计时,将步骤s1中采集的未知来电者a的语音样本带入神经网络算法计算得出威胁及信用概率a。

在一个实施例中,步骤s2中所述神经网络迭代算法,包括如下步骤:

调取多个来电语音样本,提取所述多个来电语音样本的声纹特征、语义特征,将所述多个来电语音样本的声纹特征、语义特征,和所述多个来电语音样本对应的期望输出的威胁及信用概率汇总成训练集;

设置用以存储神经网络迭代算法中的输入层数据、隐层训练函数的输入和输出、输出层的输入和输出、权值、误差、以及期望输出的威胁及信用概率的数据块;

将所述训练集代入所述神经网络迭代算法的输入层数据中,计算所述隐层训练函数的输入和输出、输出层的输入和输出,并存储于所述数据块中,所述输出层的输出为输出结果;

计算所述输出结果与所述期望输出的威胁及信用概率之间的误差,并存储于所述数据块中;

通过改变所述权值的大小修正所述神经网络迭代算法的误差;

重复计算,直到所述输出结果与所述期望输出的威胁及信用概率之间的误差不高于误差阈值n时,完成所述神经网络迭代算法的训练。

本实施例中采用的神经网络迭代算法主要是为计算威胁及信用概率,主要作用是通过大量计算,不断完善神经网络迭代算法,不断精确采取神经网络迭代算法的最终计算结果,同时通过自带学习能力的神经网络迭代算法自动提取“合理的”求解数值,具备一定的推广、概括能力。

图4为本发明一个实施例中步骤s3计反馈处理的流程图,如图4所示,在一个实施例中,步骤s3可包括如下具体步骤:

步骤s301,调取概率:调取所述来电者语音样本的威胁及信用概率。

步骤s302,判断处理:将所述威胁及信用概率与预设的威胁阈值m比较,所述威胁阈值m为所述骚扰电话占比,判断所述来电者的来电信号是否为接听信号,当所述威胁及信用概率低于所述阈值m时,判断所述来电者语音为非骚扰电话,接通所述来电信号;

当所述威胁及信用概率高于或等于所述阈值m时,判断所述来电者语音为骚扰电话,挂断所述来电信号。

本实施例主要是针对已经计算得出的威胁及信用概率作出判断反馈,设定威胁阈值m用于作为判断的参考系数,通过与威胁阈值m对比,合理把控判别骚扰电话的标准,避免错误判断骚扰电话。

在具体设计时,设定威胁阈值m为2/3,当威胁及信用概率高于或等于威胁阈值2/3时,所述来电者语音会被判断为骚扰电话,挂断所述来电者电话;相反,当威胁及信用概率低于威胁阈值2/3时,所述来电者语音为非骚扰电话,接通电话。

在一个实施例中,步骤s3后,还包括如下步骤:

将所述来电者语音中所述语音样本和对应的威胁及信用概率存储,代入所述神经网络迭代算法,调整所述神经网络迭代算法的权值,修正所述神经网络迭代算法的误差。

各行各业、各个领域都会对自身的行为结果做出评估,数据不可避免含有不确定的随机误差,会导致试验研究和性能分析出现偏差。本实施例中每一次出现来电信号,都是数据修正的一个依据,在完成威胁及信用概率计算的基础上,结合预先设定的误差阈值n,改变神经网络迭代算法的权值大小,修正神经网络迭代算法的误差,完善神经网络迭代算法的训练。

在具体设计时,针对步骤s1中未知来电者a的威胁及信用概率a,将结果代入神经网络迭代算法,调整神经网络迭代算法的权值大小,修正神经网络迭代算法的误差,以此来进一步完善神经网络迭代算法的训练。

一种基于语音交互的骚扰电话拦截方法,可以有效拦截骚扰电话,降低威胁、诈骗电话给用户的生命、财产带来损失的风险,同时神经网络迭代算法可以不断完善防骚扰拦截精确度,提高信息安全的保障机能。

在一个实施例中,提出了一种基于语音交互的骚扰电话拦截装置,如图5所示,其包括:

语音采集模块,用于通过语音交互采集来电者语音样本;

概率计算模块,用于计算所述来电者语音样本的威胁及信用概率;

判断反馈模块,用于根据所述威胁及信用概率来判断来电是否为骚扰电话,并做出对应处理。

在一个实施例中,所述概率计算模块,包括:

语音调取单元,用于调取所述来电者语音样本;

算法处理单元,用于将所述来电者语音样本代入神经网络迭代算法,计算所述来电者语音样本的威胁及信用概率。

在一个实施例中,提出了一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行计算机可读指令时实现上述各实施例里一种基于语音交互的骚扰电话拦截方法中的步骤。

在一个实施例中,提出了一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例里一种基于语音交互的骚扰电话拦截方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等非易失性存储介质,或随机存储记忆体(randomaccessmemory,ram)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1