音频文件确定方法和装置、存储介质及电子装置与流程

文档序号：20769431发布日期：2020-05-15 19:28阅读：143来源：国知局

本发明涉及计算机领域，具体而言，涉及一种音频文件确定方法和装置、存储介质及电子装置。

背景技术：

随着服务行业的发展，越来越多的顾客更加注重服务的质量，顾客进店和服务员的沟通环节则是最能体现此次服务的质量，通过录音设备的使用，记录服务员和顾客之间的对话信息，然后通过人工智能技术对对话信息进行分析，可以判断员工的服务质量。但是，对于某些员工来说，可能会存在录音作弊的问题。

针对相关技术中，在通过使用录音设备判断员工服务质量的过程中，如何判断录音作弊的行为的问题，尚未提出有效的技术方案。

技术实现要素：

本发明实施例提供了一种音频文件确定方法及装置，以至少解决相关技术中，在通过使用录音设备判断员工服务质量的过程中，存在录音作弊的行为的问题。

根据本发明的一个实施例，提供了一种音频文件确定方法，包括：对n个关键词集合中的每个关键词集合中的所有关键词进行排序，得到上述n个关键词集合对应的n个关键词排序结果，其中，上述n个关键词集合与n个音频文件一一对应，上述n为自然数；根据上述n个关键词排序结果确定上述n个关键词排序结果中相似度超过第一预设阈值的m个关键词排序结果，其中，上述m为小于或等于n的自然数；确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件。

在本发明实施例中，对n个关键词集合中的每个关键词集合中的所有关键词进行排序之前，上述方法还包括：获取n个目标设备的上述n个音频文件，将获取到的上述n个音频文件进行语音识别，得到上述n个音频文件对应的n个文本信息；提取上述n个文本信息中的关键词，得到上述n个文本信息对应的n个关键词集合，其中，上述n个关键词集合与上述n个文本信息一一对应。

在本发明实施例中，上述获取n个目标设备的上述n个音频文件，包括：确定目标时间段内上述n个目标设备所产生的音频的分贝值；根据上述分贝值确定上述n个目标设备中任意两个分贝值的差值在第二预设阈值内的上述n个音频文件。

在本发明实施例中，上述对n个关键词集合中的每个关键词集合中的所有关键词进行排序，包括：根据上述n个关键词集合中的每个关键词集合中的所有关键词在上述每个关键词集合中出现的次数进行排序。

在本发明实施例中，在确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件之后，上述方法还包括：标记上述m个目标音频文件；确定产生被标记的上述m个目标音频文件对应的m个目标设备存在目标录音行为。

根据本发明的另一个实施例，还提供了一种音频文件确定装置，包括：排序单元，用于对n个关键词集合中的每个关键词集合中的所有关键词进行排序，得到上述n个关键词集合对应的n个关键词排序结果，其中，上述n个关键词集合与n个音频文件一一对应，上述n为自然数；第一确定单元，用于根据上述n个关键词排序结果确定上述n个关键词排序结果中相似度超过第一预设阈值的m个关键词排序结果，其中，上述m为小于或等于n的自然数；第二确定单元，用于确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件。

在本发明实施例中，上述装置还包括：获取单元，用于对n个关键词集合中的每个关键词集合中的所有关键词进行排序之前，获取n个目标设备的上述n个音频文件，将获取到的上述n个音频文件进行语音识别，得到上述n个音频文件对应的n个文本信息；提取单元，用于提取上述n个文本信息中的关键词，得到上述n个文本信息对应的n个关键词集合，其中，上述n个关键词集合与上述n个文本信息一一对应。

在本发明实施例中，上述获取单元，包括：第一确定模块，用于确定目标时间段内上述n个目标设备所产生的音频的分贝值；第二确定模块，用于根据上述分贝值确定上述n个目标设备中任意两个分贝值的差值在第二预设阈值内的上述n个音频文件。

在本发明实施例中，上述排序单元，还用于根据上述n个关键词集合中的每个关键词集合中的所有关键词在上述每个关键词集合中出现的次数进行排序。

在本发明实施例中，上述装置还包括：标记单元，用于在确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件之后，标记上述m个目标音频文件；第三确定单元，用于确定产生被标记的上述m个目标音频文件对应的m个目标设备存在目标录音行为。

根据本发明的另一个实施例，还提供了一种计算机可读的存储介质，存储介质包括存储的程序，其中，程序运行时执行以上任一项的音频文件确定方法。

根据本发明的另一个实施例，还提供了一种电子装置，存储介质包括存储的程序，其中，程序运行时执行以上任一项的音频文件确定方法。

通过本发明，对n个关键词集合中的每个关键词集合中的所有关键词进行排序，得到上述n个关键词集合对应的n个关键词排序结果，其中，上述n个关键词集合与n个音频文件一一对应，上述n为自然数；根据上述n个关键词排序结果确定上述n个关键词排序结果中相似度超过第一预设阈值的m个关键词排序结果，其中，上述m为小于或等于n的自然数；确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件。采用上述技术方案，通过对n个音频文件的关键词进行排序，可以确定出n个音频文件中相似度超过第一预设阈值的m个音频文件，进而可以将该m个音频文件确定为存在录音作弊行为，解决了相关技术中，在通过使用录音设备判断员工服务质量的过程中，如何判断录音作弊的行为的问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种音频文件确定方法的硬件结构框图；

图2是根据本发明实施例一种可选的音频文件确定方法的流程示意图；

图3是根据本发明实施例一种可选的音频文件确定装置的结构框图；

图4是根据本发明实施例另一种可选的音频文件确定装置的结构框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

本申请实施例所提供的方法实施例可以应用于移动终端、计算机终端或者类似的运算装置中执行。以运行在终端(如手机)上为例，图1是本发明实施例的一种音频文件确定装置的硬件结构框图。终端(如手机)10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104，可选地，上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述终端的结构造成限定。例如，移动终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的音频文件确定方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(networkinterfacecontroller，简称为nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(radiofrequency，简称为rf)模块，其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种运行于上述音频文件确定装置的音频文件确定方法，图2是根据本发明实施例一种可选的音频文件确定方法的流程图，如图2所示，该方法包括如下步骤：

步骤s202，对n个关键词集合中的每个关键词集合中的所有关键词进行排序，得到上述n个关键词集合对应的n个关键词排序结果，其中，上述n个关键词集合与n个音频文件一一对应，上述n为自然数；

步骤s204，根据上述n个关键词排序结果确定上述n个关键词排序结果中相似度超过第一预设阈值的m个关键词排序结果，其中，上述m为小于或等于n的自然数；

步骤s206，确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件。

下面结合可选示例对音频文件确定方法的流程进行说明，该方法包括以下步骤：

步骤1，分析同一时间段内的不同录音音频文件(对应于上述n个音频文件)的分贝大小。

步骤2，将分贝大小相近(差值小于第二预设阈值)的录音音频文件进行语音识别，得到各自对应的文本信息。

步骤3，对每个音频文件对应的文本信息进行关键词提取，其中，关键词是预设的一些词(可以是服务用词，如您好、欢迎光临、谢谢等)。

步骤4，将关键词按照在文本信息中的出现次数进行排序。

步骤5，比较不同录音文件的关键词排序顺序，若不同录音文件的关键词的排序顺序达到预设的重合度(对应于上述第一预设阈值)，即认为对应的录音文件重合。

步骤6，将重合率较高(60％或80％)的录音文件标记为重合文件，从而将对应设备判断为作弊设备。

通过本实施例，由于每个录音设备在同一时间内有且仅被一个员工使用，所以当录制的录音文件上传到云存储后，通过语音识别的技术(将语言信息转化为文字信息)得到文本信息，通过分析文本信息的重合度，即可判断是否出现一个员工佩戴多个录音设备进行录音的作弊行为。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例的方法。

在本实施例中还提供了一种音频文件确定装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本发明实施例的一种可选的音频文件确定装置的结构框图，如图3所示，该装置包括：

排序单元302，用于对n个关键词集合中的每个关键词集合中的所有关键词进行排序，得到上述n个关键词集合对应的n个关键词排序结果，其中，上述n个关键词集合与n个音频文件一一对应，上述n为自然数；

第一确定单元304，用于根据上述n个关键词排序结果确定上述n个关键词排序结果中相似度超过第一预设阈值的m个关键词排序结果，其中，上述m为小于或等于n的自然数；

第二确定单元306，用于确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件。

本发明实施例中，如图4所示，上述装置还包括：

获取单元308，用于对n个关键词集合中的每个关键词集合中的所有关键词进行排序之前，获取n个目标设备的上述n个音频文件，将获取到的上述n个音频文件进行语音识别，得到上述n个音频文件对应的n个文本信息；

提取单元310，用于提取上述n个文本信息中的关键词，得到上述n个文本信息对应的n个关键词集合，其中，上述n个关键词集合与上述n个文本信息一一对应

本发明实施例中，上述获取单元308，包括：第一确定模块，用于确定目标时间段内上述n个目标设备所产生的音频的分贝值；第二确定模块，用于根据上述分贝值确定上述n个目标设备中任意两个分贝值的差值在第二预设阈值内的上述n个音频文件。

本发明实施例中，上述排序单元302，还用于根据上述n个关键词集合中的每个关键词集合中的所有关键词在上述每个关键词集合中出现的次数进行排序。

本发明实施例中，如图4所示，上述装置还包括：

标记单元312，用于在确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件之后，标记上述m个目标音频文件；

第三确定单元314，用于确定产生被标记的上述m个目标音频文件对应的m个目标设备存在目标录音行为。

本发明的实施例还提供了一种计算机可读的存储介质，该存储介质包括存储的程序，其中，上述程序运行时执行上述任一项的方法。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

s1，对n个关键词集合中的每个关键词集合中的所有关键词进行排序，得到上述n个关键词集合对应的n个关键词排序结果，其中，上述n个关键词集合与n个音频文件一一对应，上述n为自然数；

s2，根据上述n个关键词排序结果确定上述n个关键词排序结果中相似度超过第一预设阈值的m个关键词排序结果，其中，上述m为小于或等于n的自然数；

s3，确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件。

可选地，在本实施例中，上述存储介质可以包括但不限于：u盘、只读存储器(read-onlymemory，简称为rom)、随机存取存储器(randomaccessmemory，简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

s2，根据上述n个关键词排序结果确定上述n个关键词排序结果中相似度超过第一预设阈值的m个关键词排序结果，其中，上述m为小于或等于n的自然数；

s3，确定上述m个关键词排序结果对应的m个音频文件为m个目标音频文件。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘浩;黄杰辉;梁志婷
技术所有人：秒针信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。