音频关键字质检方法、装置、计算机设备及存储介质与流程

文档序号:16669109发布日期:2019-01-18 23:27阅读:201来源:国知局
音频关键字质检方法、装置、计算机设备及存储介质与流程

本发明涉及通信技术领域,尤其涉及到一种音频关键字质检的方法。



背景技术:

很多企业都配置有客服人员,客服人员通过与客户进行沟通来解答客户的咨询问题或者促成交易的发生,企业会对这些客服电话录音,安排专门的质检人员检查录音中是否存在违规语言,从而可以确保客服人员的服务质量和避免违规操作。

但是,对于大型企业来说,客服电话的录音数量非常庞大,同时,质检人员检查录音也要耗费大量的时间,需要将一个录音文件全部听完才能知晓该录音中是否存在违规语言,费时费力且效率低下。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种可以提升质检人员的工作效率的音频关键字质检方法、装置、计算机设备及存储介质。

一种音频关键字质检方法,包括:

确定当前待质检的目标关键字;

根据预先建立的音频时间对应关系确定出各个待质检的录音文件中存在所述目标关键字的目标录音文件,以及确定所述目标关键字所处的音频时间点,其中,所述音频时间对应关系记录了需质检的关键字、关键字文件以及关键字时间点之间的对应关系,所述关键字文件是指识别文本中存在的需质检的关键字的待质检的录音文件,所述关键字时间点是指存在的所述关键字位于录音文件音频中播放的时间点,所述音频时间点是指所述目标关键字位于目标录音文件中播放的时间点;

输出确定出的各个所述目标录音文件的文件信息,并标识各个所述目标录音文件中确定出的所述音频时间点。

一种音频关键字质检装置,包括:

关键字确定模块,用于确定当前待质检的目标关键字;

录音文件确定模块,用于根据预先建立的音频时间对应关系确定出各个待质检的录音文件中存在所述目标关键字的目标录音文件,以及确定所述目标关键字所处的音频时间点,其中,所述音频时间对应关系记录了需质检的关键字、关键字文件以及关键字时间点之间的对应关系,所述关键字文件是指识别文本中存在的需质检的关键字的待质检的录音文件,所述关键字时间点是指存在的所述关键字位于录音文件音频中播放的时间点,所述音频时间点是指所述目标关键字位于目标录音文件中播放的时间点;

文件信息输出模块,用于输出确定出的各个所述目标录音文件的文件信息,并标识各个所述目标录音文件中确定出的所述音频时间点。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述音频关键字质检方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述音频关键字质检方法的步骤。

上述提供了一种音频关键字质检方法、装置、计算机设备及存储介质,首先,确定当前待质检的目标关键字;然后,根据预先建立的音频时间对应关系确定出各个待质检的录音文件中存在所述目标关键字的目标录音文件,以及确定所述目标关键字所处的音频时间点,其中,所述音频时间对应关系记录了需质检的关键字、关键字文件以及关键字时间点之间的对应关系,所述关键字文件是指识别文本中存在的需质检的关键字的待质检的录音文件,所述关键字时间点是指存在的所述关键字位于录音文件音频中播放的时间点,所述音频时间点是指所述目标关键字位于目标录音文件中播放的时间点;最后,输出确定出的各个所述目标录音文件的文件信息,并标识各个所述目标录音文件中确定出的所述音频时间点。这样,当质检人员需要检查这些录音文件中是否出现某个需质检的关键字的违规语言时,可以直接通过该音频时间对应关系定位到存在关键字的录音文件,并标识出该录音文件中存在关键字的音频时间点,可以实现关键字在录音文件中的快速定位,有助于质检人员快速核实该录音文件中是否真的存在违规语言,大大提高了对录音文件质检的工作效率。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例中音频关键字质检方法的一应用环境示意图;

图2是本发明一实施例中音频关键字质检方法的一流程图;

图3是本发明一实施例中音频关键字质检方法在一个应用场景下预先建立音频时间对应关系的流程示意图;

图4是本发明一实施例中音频关键字质检方法在一个应用场景下播放目标录音文件并定位的流程示意图;

图5是本发明一实施中音频关键字质检方法步骤302在一个应用环境下的流程示意图;

图6是本发明一实施例中音频关键字质检装置的结构示意图;

图7是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请提供的一种音频关键字质检方法,可应用在如图1的应用环境中,其中,终端通过网络与服务器进行通信。其中,该终端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中,如图2所示,提供一种音频关键字质检方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:

101、确定当前待质检的目标关键字;

本方案中,质检人员可以先确定当前准备质检的关键字,即该目标关键字。具体地,服务器的系统可以在界面上将所有需要质检的关键字展示给质检人员选择,质检人员从这些展示的关键字中选取一个、两个或多个关键字作为当前待质检的目标关键字。

可以理解的是,系统上需要质检的关键字可以由管理员根据实际情况的需要预先设定,可以通过一个字库来管理这些关键字,管理员可以在终端添加、删除字库中的关键字,以实现对需要质检的关键字的管理。

102、根据预先建立的音频时间对应关系确定出各个待质检的录音文件中存在所述目标关键字的目标录音文件,以及确定所述目标关键字所处的音频时间点,其中,所述音频时间对应关系记录了需质检的关键字、关键字文件以及关键字时间点之间的对应关系,所述关键字文件是指识别文本中存在的需质检的关键字的待质检的录音文件,所述关键字时间点是指存在的所述关键字位于录音文件音频中播放的时间点,所述音频时间点是指所述目标关键字位于目标录音文件中播放的时间点;

可以理解的是,简单来说,音频时间对应关系就是记录了关键字、录音文件和该关键字在该录音文件中播放时间点的之间关系。比如某个录音文件a的录音内容是“购买xxx保险,可以返现200元……”,其中“返现”一词为质检的关键字,该关键字出现在录音文件a的第3分40秒的时间点位置,因此,音频时间对应关系可以将关键字“返现”、录音文件a和第3分40秒这一时间点关联存储,建立三者的对应关系。

进一步地,如图3,所述音频时间对应关系可以通过如下步骤预先建立:

201、获取各个待质检的录音文件;

202、所述各个待质检的录音文件进行语音识别,得到与各个待质检的录音文件对应的识别文本,同时记录所述识别文本在与之对应的录音文件中播放的时间点;

203、将各个所述识别文本分别与预设需质检的关键字进行比对,确定关键字文件以及关键字时间点;

204、根据所述需质检的关键字、关键字文件以及关键字时间点之间的对应关系建立所述音频时间对应关系。

对于步骤201,首先,需要获取那些待质检的录音文件。在服务器上,每天都会产生大量的录音文件,本方案中可以设定在每天的凌晨时间段获取这些未经过质检的录音文件进行音频时间对应关系的预先建立。

对于步骤202,在获取到这些待质检的录音文件之后,可以采用语音识别技术对这些录音文件进行语音识别,得到各个待质检的录音文件对应的识别文本。本方案中,考虑到录音文件的数量往往较为庞大,因此可以以跑批的方式让服务器在凌晨时间段再执行语音识别的步骤,从而利用服务器系统的空闲时间段来完成语音识别的处理工作。在语音识别的同时,还需要服务器还需记录识别得出的识别文本在与之对应的录音文件中播放的时间点。例如某个录音文件a的录音内容是“购买xxx保险,可以返现200元……”,其中“购买”一词的播放时间点是第3分36秒,“保险”一词的播放时间点是第3分38秒,“可以”一词的播放时间点是第3分39秒,“返现”一词的播放时间点是第3分40秒,“200元”一词的播放时间点是第3分41秒,等。

对于步骤203,可以理解的是,上述步骤202已经识别得到各个待质检的录音文件对应的识别文本,并记录了这些识别文本中文本的播放时间点。在这种情况下,只需检测各个识别文本中哪些文本属于关键字,找到关键字并获取关键字对应的播放时间点,即可得知这些需质检的关键字出现在哪些录音文件中,以及出现在录音文件中的播放时间点,从而建立三者的对应关系,得到该音频时间对应关系。

对于步骤204,可知,在步骤203确定识别文本中存在所述需质检的关键字的录音文件以及存在的所述关键字位于录音文件音频中播放的时间点的基础上,步骤204根据“需质检的关键字”、“识别文本中存在所述需质检的关键字的录音文件”以及“存在的所述关键字位于录音文件音频中播放的时间点”三者之间的对应关系即可建立所述音频时间对应关系。例如,承接上述举例,假设需质检的关键字包括“购买”和“保险”,经过对录音文件a的检测,发现该录音文件a的识别文本存在“购买”和“保险”这两个关键字,因此可以建立得到“购买-录音文件a-第3分36秒”以及“保险-录音文件a-第3分38秒”这两个音频时间对应关系。可知,同理可以通过上述步骤201-204建立其它音频时间对应关系。

103、输出确定出的各个所述目标录音文件的文件信息,并标识各个所述目标录音文件中确定出的所述音频时间点。

在确定出各个所述目标录音文件时,也即得知了哪些目标录音文件中很可能存在属于“违规语言”的关键字,这是质检人员需要知道的,可以帮助质检人员从大量的录音文件中进行初步的筛选,因此,还需要输出这些目标录音文件的文件信息,这样质检人员在质检时便可得知这些目标录音文件。其中,文件信息具体可以包括文件名、文件存放位置、录音文件中对话的双方人员信息、录音时长等信息中的一个或多个。另外,本方案为了便于质检人员快速定位到录音文件中存在质检关键字的位置,还在输出确定出的各个所述目标录音文件的文件信息的同时标识各个所述目标录音文件中确定出的所述音频时间点。由上述内容可知,这里的音频时间点就是所述目标关键字位于目标录音文件中播放的时间点。

进一步地,为了更便于质检人员收听这些目标录音文件的音频,本方案还在确定目标录音文件之后对这些目标录音文件进行自动播放,且播放位置自动定位至音频时间点前面位置,从而质检人员无需浪费大量的时间从头开始播放录音文件,也无需手动将当前播放位置定位至该音频时间点前,进一步提升了质检人员对这些目标录音文件质检的效率。如图4,在确定出各个所述目标之后,还可以包括:

301、从各个所述目标录音文件中选取一个目标录音文件作为当前播放的当前录音文件;

302、根据所述当前录音文件对应的音频时间点确定所述当前录音文件的开始播放时间点;

303、从所述开始播放时间点开始播放所述当前录音文件。

对于步骤301,由于质检人员同时只能听取一个目标录音文件,因此,当目标录音文件为多个时,需要从中选取一个目标录音文件作为当前播放的当前录音文件;如果目标录音文件只有一个,则可以将这一个目标录音文件选取作为当前播放的当前录音文件。

对于步骤302,该音频时间点是目标关键字位于目标音频文件中的播放时间点,本方案中,一般需要给质检人员听取目标录音文件中内容一个准备时间,因此一般需要在播放当前录音文件时,从该音频时间点的前面开始播放,也即开始播放时间点位于音频时间点的前面。

进一步地,如图5,根据所述当前录音文件对应的音频时间点确定所述当前录音文件的开始播放时间点,所述步骤302具体还可以包括:

401、将所述当前录音文件对应的音频时间点中时间最早的一个音频时间点确定为第一时间点;

402、将所述当前录音文件中位于所述第一时间点前面的一个播放的时间点确定为所述当前录音文件的开始播放时间点。

对于步骤401和步骤402,考虑到当前录音文件中可能存在多个音频时间点,这种情况下,质检人员需要从该当前录音文件中各个音频时间点的最早一个音频时间点开始听取,因此,可以将其中最早的一个音频时间点确定为第一时间点,并将该第一时间点前面的一个播放的时间点确定为所述当前录音文件的开始播放时间点。这样,便可以保证质检人员在一个当前录音文件中存在两个以上音频时间点的情况下,从最早的一个音频时间点的前面开始播放,符合质检的要求和听取音频的习惯。

进一步地,本方案可以通过以下两种方式来具体确定该开始播放时间点,所述步骤402具体可以包括:

方式一:所述当前录音文件中位于所述第一时间点前面的一个播放的时间点确定为所述当前录音文件的开始播放时间点,可通过两种方式来具体确定该开始播放时间点。比如,可以将第一时间点前面3秒的时间点确定为第一录音文件的开始播放时间点。举例说明,假设第一录音文件a包括两个音频时间点,一个音频时间点为第2分10秒,另一个音频时间点为第2分30秒,则可致第一时间点为第2分10秒,预设第一时长为3秒,则可以确定出该第一录音文件a的开始播放时间点为第2分7秒。

方式二:步骤501、对所述当前录音文件进行音频分析,获取所述当前录音文件中位于所述第一时间点前面、与所述第一时间点最接近的语音停顿点;

步骤502、将获取到的所述语音停顿点对应的时间点确定为所述当前录音文件的开始播放时间点。

对于步骤501和502,可以理解的是,在方式二中,为了充分考虑质检人员听取音频的效率,便于质检人员理解当前录音文件的内容,可以通过寻找当前录音文件中的语音停顿点,将位于第一时间点前面且与所述第一时间点最接近的语音停顿点作为该当前录音文件开始播放的位置。这样,不仅可以让开始播放的位置尽可能靠近第一时间点(即该当前录音文件中最前面的音频时间点),而且可以使得开始播放的位置对应的音频内容是连贯的,更加便于质检人员理解当前录音文件中的内容。这是因为,录音文件录制的人的对话内容,人在对话时,发言连贯但有具有停顿,若直接在第一时间点前面选取一个时间点开始播放,很可能开始播放的位置位于一句连贯的发言中间,甚至某个字的发音中间,这就不利于质检人员理解将要听到的这段录音的内容。因此,本方案通过步骤501和502,从语音停顿点的位置开始播放,将符合人对话的规律,也符合质检人员听取录音内容的规律。需要说明的是,可以通过分析当前录音文件中音频的音量高低来确定语音停顿点的位置。在一段音频中,语音停顿点位于该段音频的音量最低点位置,因为人对话时,其停顿点就是没有发音或者音量很低,因此通过分析当前录音文件中音频的音量高低可以快速确定该当前录音文件中各个语音停顿点。当然,为了节省服务器的运算能力和资源,在进行音频分析时,只需分析第一时间点前面的音频段即可。更进一步地,具体可以截取该当前录音文件中靠近该第一时间点且位于第一时间点前面第二时长的音频段。比如第二时长为10秒,则截取该第一时间点前面10秒的音频段进行音频分析。这是因为,一般人对话沟通是不会一口气连续讲话10秒以上不存在停顿的。当然,该第二时长具体可以根据实际情况进行设定。

进一步地,在确定出各个所述目标录音文件之后,还可以包括:

步骤601、若确定出的各个所述目标录音文件的数量大于1,则获取各个所述目标录音文件的录制时间;

步骤602、按照录制时间的先后顺序确定各个所述目标录音文件的排序;

其中,所述步骤103中“输出确定出的各个所述目标录音文件的文件信息”的步骤具体为:将确定出的各个所述目标录音文件的文件信息输出至指定终端,以使所述指定终端按照所述排序展示各个所述目标录音文件。

对于步骤601和步骤602,考虑到在输出各个目标录音文件的文件信息时,若输出的目标录音文件数量过多,将使得质检人员无所适从,不利于有序地质检这些目标录音文件。因此,本方案还可以按照录制时间的先后顺序确定各个所述目标录音文件的排序,在输出这些目标录音文件的文件信息时,将将确定出的各个所述目标录音文件的文件信息输出至指定终端,以使所述指定终端按照所述排序展示各个所述目标录音文件。

另一方面,上述步骤303从所述开始播放时间点开始播放所述当前录音文件,可知,当当前录音文件播放完成,并且质检人员在系统界面上确定当前录音文件质检结束后,服务器可以自动播放下一个录音文件,此时,自动播放的顺序也可以按照录制时间的先后顺序来确定。

综上所述,上述提供了一种音频关键字质检方法,首先,确定当前待质检的目标关键字,然后,根据预先建立的音频时间对应关系确定出各个待质检的录音文件中存在所述目标关键字的目标录音文件以及所述目标关键字所处的音频时间点,所述音频时间对应关系记录了需质检的关键字、识别文本中存在的需质检的关键字的待质检的录音文件以及存在的所述关键字位于录音文件音频中播放的时间点之间的对应关系,所述音频时间点是指所述目标关键字位于目标录音文件中播放的时间点;最后,输出确定出的各个所述目标录音文件的文件信息,并标识各个所述目标录音文件中确定出的所述音频时间点。当质检人员需要检查这些录音文件中是否出现某个需质检的关键字的违规语言时,可以直接通过该音频时间对应关系定位到存在关键字的录音文件,并标识出该录音文件中存在关键字的音频时间点,可以实现关键字在录音文件中的快速定位,有助于质检人员快速核实该录音文件中是否真的存在违规语言,大大提高了对录音文件质检的工作效率。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在一实施例中,提供一种音频关键字质检装置,该音频关键字质检装置与上述实施例中音频关键字质检方法一一对应。如图6所示,该音频关键字质检装置包括关键字确定模块701、录音文件确定模块702、和文件信息输出模块703,各功能模块详细说明如下:

关键字确定模块701,用于确定当前待质检的目标关键字;

录音文件确定模块702,用于根据预先建立的音频时间对应关系确定出各个待质检的录音文件中存在所述目标关键字的目标录音文件以及所述目标关键字所处的音频时间点,所述音频时间对应关系记录了需质检的关键字、识别文本中存在的需质检的关键字的待质检的录音文件以及存在的所述关键字位于录音文件音频中播放的时间点之间的对应关系,所述音频时间点是指所述目标关键字位于目标录音文件中播放的时间点;

文件信息输出模块703,用于输出确定出的各个所述目标录音文件的文件信息,并标识各个所述目标录音文件中确定出的所述音频时间点。

进一步地,所述音频时间对应关系可以通过如下模块预先建立:

文件获取模块,用于获取各个待质检的录音文件;

语音识别模块,用于对所述各个待质检的录音文件进行语音识别,得到与各个待质检的录音文件对应的识别文本,同时记录所述识别文本在与之对应的录音文件中播放的时间点;

比对模块,用于将各个所述识别文本分别与预设需质检的关键字进行比对,确定关键字文件以及关键字时间点;

关系建立模块,用于根据所述需质检的关键字、关键字文件以及关键字时间点之间的对应关系建立所述音频时间对应关系。

进一步地,所述音频关键字质检装置还可以包括:

录音文件选取模块,用于从各个所述目标录音文件中选取一个目标录音文件作为当前播放的当前录音文件;

播放时间点确定模块,用于根据所述当前录音文件对应的音频时间点确定所述当前录音文件的开始播放时间点;

录音文件播放模块,用于从所述开始播放时间点开始播放所述当前录音文件。

进一步地,所述播放时间点确定模块可以包括:

最早时间确定单元,用于将所述当前录音文件对应的音频时间点中时间最早的一个音频时间点确定为第一时间点;

开始播放时间确定单元,用于将所述当前录音文件中位于所述第一时间点前面的一个播放的时间点确定为所述当前录音文件的开始播放时间点。

进一步地,确定出各个所述目标录音文件之后,还包括:

数量确定单元,若确定出的各个所述目标录音文件的数量大于1,则获取各个所述目标录音文件的录制时间;

排序单元,按照录制时间的先后顺序确定各个所述目标录音文件的排序;

其中,所述文件信息输出模块具体可以用于:确定出的各个所述目标录音文件的文件信息输出至指定终端,以使所述指定终端按照所述排序展示各个所述目标录音文件。

关于音频关键字质检装置的具体限定可以参见上文中对于音频关键字质检方法的限定,在此不再赘述。上述音频关键字质检装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储频关键字质检方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种频关键字质检方法。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中音频关键字质检方法的步骤,例如图2所示的步骤101至步骤103。或者,处理器执行计算机程序时实现上述实施例中音频关键字质检装置的各模块/单元的功能,例如图6所示模块701至模块703的功能。为避免重复,这里不再赘述。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中音频关键字质检方法的步骤,例如图2所示的步骤101至步骤103。或者,计算机程序被处理器执行时实现上述实施例中音频关键字质检装置的各模块/单元的功能,例如图6所示模块701至模块703的功能。为避免重复,这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1