一种通话内容预警提醒方法、装置和系统与流程

文档序号:15980862发布日期:2018-11-17 00:18阅读:400来源:国知局

本发明涉及语音识别技术领域,尤其是一种通话内容预警提醒方法、装置和系统。

背景技术

电话销售与电话营销的过程中,行业中通常会具备电话录音功能,但是并没有通话过程监控及敏感内容提醒功能。由于只是记录通话录音,当出现问题或者需要进行统计的时候,只能人工一个个去听取,且每一个录音都需要听取完成,会耗费大量精力听取非目标内容,效率低下。

对此,现有技术中提供了一种基于语音分析改善对话沟通效果的方法及装置(cn104616666a),然而其技术方案在语音分析时需要预先确定用户与通话对象的关系,难以对语音通话进行通用识别处理,并且难以实现事后对语音数据的统计分析。



技术实现要素:

为了解决上述技术问题,本发明的目的是:提供一种对通话内容进行通用预警提醒的方法、装置和系统。

本发明所采用的技术方案是:一种通话内容预警提醒方法,包括有以下步骤:

a、监听通信设备的通话状态,收到接通信号后,新建通话记录并开始录音;

b、收到挂断信号后,存储录音数据并更新通话记录;

c、对录音数据进行语音转文字处理,将录音数据转化后的文字存储至通话记录;

d、对录音数据进行语调识别得到语调特征;

e、对录音数据转化后的文字进行语义识别得到语义特征;

f、若语调识别的结果中出现异常语调特征或者语义识别结果中出现异常语义特征,则对用户进行预警提醒。

进一步,所述步骤d具体为:对录音数据进行离散抽样得到分别代表陈述、疑问、感叹、祈使的语调数组,然后基于rnn-ctc的语音识别模块对录音数据进行语调识别得到语调特征。

进一步,所述语调特征包括有音高、音长、音强和高层韵律特征,所述高层韵律特征包括有停顿、起伏度、重音和调型。

进一步,所述步骤f中,当语调特征的特征值超过语调特征的设定阈值时,判断为异常语调特征。

进一步,所述步骤f中,通过将语义识别结果与危险文字模板库进行对比,若对比成功则判断为异常语义特征。

本发明所采用的另一技术方案是:一种通话内容预警提醒装置,包括有

监听模块,用于监听通信设备的通话状态,收到接通信号后,新建通话记录并启动录音模块;

录音模块,用于对通话内容进行录音,完成录音后进行存储并更新通话记录;

语音文字转换模块,用于对录音数据进行语音转文字处理,并将录音数据转化后的文字存储至通话记录;

语调识别模块,用于对录音数据进行语调识别得到语调特征;

语义识别模块,用于对录音数据转化后的文字进行语义识别得到语义特征;

预警提醒模块,用于在语调识别的结果中出现异常语调特征或者语义识别结果中出现异常语义特征时,则对用户进行预警提醒。

进一步,所述语调识别模块还包括有基于rnn-ctc的语音识别子模块;所述语调识别模块用于对录音数据进行离散抽样得到分别代表陈述、疑问、感叹、祈使的语调数组,然后通过基于rnn-ctc的语音识别子模块对录音数据进行语调识别得到语调特征。

进一步,所述语调特征包括有音高、音长、音强和高层韵律特征,所述高层韵律特征包括有停顿、起伏度、重音和调型。

进一步,所述预警提醒模块用于在语调特征的特征值超过语调特征的设定阈值时,判断其为异常语调特征;所述预警提醒模块还用于将语义识别结果与危险文字模板库进行对比,若对比成功则判断为异常语义特征。

本发明所采用的另一技术方案是:一种通话内容预警提醒系统,包括有:

至少一个处理器;

至少一个存储器,用于存储至少一个程序;

当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上述一种通话内容预警提醒方法。

本发明的有益效果是:通过对录音数据进行语调识别,并将录音数据转换为文字后进行语义识别,支持危险文字的检索,针对异常语调和异常语义进行预警提醒,普遍适用于所有用户,无需考虑通话双方的关系,识别准确率高。

附图说明

图1为本发明方法的步骤流程图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步说明:

参照图1,一种通话内容预警提醒方法,包括有以下步骤:

a、监听通信设备的通话状态,收到接通信号后,新建通话记录并开始录音;

所述通信设备可以是电话、手机、网络通信软件或者连接电脑的固定电话机;此时该通话记录中存储有通话者的相应信息;

b、收到挂断信号后,存储录音数据并更新通话记录;

此时该通话记录中增加存储了录音数据;通话记录可存储于云端或本地,录音文件也可存储于云端或本地。

作为优选的实施例,录音数据存储于云端,通话记录存储于本地,而录音数据所对应的播放地址存储于通话记录中。

c、对录音数据进行语音转文字处理,将录音数据转化后的文字存储至通话记录;

此时该通话记录中增加存储了录音数据转化后的文字;

d、对录音数据进行语调识别得到语调特征;

e、对录音数据转化后的文字进行语义识别得到语义特征;

f、若语调识别的结果中出现异常语调特征或者语义识别结果中出现异常语义特征,则对用户进行预警提醒。

进一步作为优选的实施方式,所述步骤d具体为:对录音数据进行离散抽样得到分别代表陈述、疑问、感叹、祈使的语调数组,然后基于rnn-ctc的语音识别模块对录音数据进行语调识别得到语调特征。

基于rnn-ctc的语音识别模块中,包括有循环神经网络(recurrentneuralnetwork,rnn)、长短时记忆模块(long-shorttermmemory,lstm)和序列短时分类(connectionisttemporalclassification,ctc)输出层,其中在循环神经网络在隐层上增加了一个反馈连接,rnn隐层当前时刻的输入有一部分是前一时刻的隐层输出,这就可以通过循环反馈连接看到前面所有时刻的信息,赋予了rnn记忆功能,使之适合用于对时序信号的建模。而长短时记忆模块的引入解决了传统简单rnn梯度消失等问题。除此之外还包含两部分:深层双向rnn和序列短时分类输出层。其中双向rnn对当前语音帧进行判断时,不仅可以利用历史的语音信息,还可以利用未来的语音信息,从而进行更加准确的决策;序列短时分类输出层使得训练过程无需帧级别的标注,实现有效的“端对端”训练使得识别错误率相对下降了10%。

进一步作为优选的实施方式,所述语调特征包括有音高、音长、音强和高层韵律特征,所述高层韵律特征包括有停顿、起伏度、重音和调型。

进一步作为优选的实施方式,所述步骤f中,当语调特征的特征值超过语调特征的设定阈值时,判断为异常语调特征。

进一步作为优选的实施方式,所述步骤f中,通过将语义识别结果与危险文字模板库进行对比,若对比成功则判断为异常语义特征。

一种通话内容预警提醒装置,包括有

监听模块,用于监听通信设备的通话状态,收到接通信号后,新建通话记录并启动录音模块;

录音模块,用于对通话内容进行录音,完成录音后进行存储并更新通话记录;

语音文字转换模块,用于对录音数据进行语音转文字处理,并将录音数据转化后的文字存储至通话记录;

语调识别模块,用于对录音数据进行语调识别得到语调特征;

语义识别模块,用于对录音数据转化后的文字进行语义识别得到语义特征;

预警提醒模块,用于在语调识别的结果中出现异常语调特征或者语义识别结果中出现异常语义特征时,则对用户进行预警提醒。

进一步作为优选的实施方式,所述语调识别模块还包括有基于rnn-ctc的语音识别子模块;所述语调识别模块用于对录音数据进行离散抽样得到分别代表陈述、疑问、感叹、祈使的语调数组,然后通过基于rnn-ctc的语音识别子模块对录音数据进行语调识别得到语调特征。

进一步作为优选的实施方式,所述语调特征包括有音高、音长、音强和高层韵律特征,所述高层韵律特征包括有停顿、起伏度、重音和调型。

进一步作为优选的实施方式,所述预警提醒模块用于在语调特征的特征值超过语调特征的设定阈值时,判断其为异常语调特征;所述预警提醒模块还用于将语义识别结果与危险文字模板库进行对比,若对比成功则判断为异常语义特征。

进一步作为优选的实施方式,还包括有编辑模块,用于对危险文字模板库中的模板进行编辑。对通话录音转化后的文字进行语义分析后,支持危险文字自动检索,对危险文字模板库中的模板可自定义设置,从而根据不同需求实现对危险文字的通话记录进行预警与提醒。

进一步作为优选的实施方式,还包括有检索模块,用于对所有通话记录中的文字进行检索,适用于后续的统计分析。

一种通话内容预警提醒系统,包括有:

至少一个处理器;

至少一个存储器,用于存储至少一个程序;

当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上述一种通话内容预警提醒方法。

以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可以作出种种的等同变换或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1