一种处理录音文件方法和装置制造方法

文档序号：6641001阅读：81来源：国知局

一种处理录音文件方法和装置制造方法
【专利摘要】本发明实施例公开了一种录音文件处理方法和设备。该方法包括：录音处理设备从录音设备获取录音源文件，从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段，对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理，将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件，通过从录音源文件中识别出含有涉及用户数据安全的敏感信息的录音片段，并仅对涉及用户数据安全的该录音片段进行加密，在提高效率的同时提高了录音数据的安全性。
【专利说明】一种处理录音文件方法和装置

【技术领域】
[0001] 本发明涉及通信【技术领域】，特别涉及一种处理录音文件方法和装置。

【背景技术】
[0002] 在通信日益发达的今天，外包呼叫中心的应用越来越普遍，电话成为产品服务和产品销售的主要渠道之一。为保障客户权益，避免纠纷，呼叫中心的通话需要被录音。特别对于金融行业电销系统来说，录音是保监会、银监会监管的重要手段，是金融保险公司是否合规的重要证据，因此对录音文档的存放年限有很高要求，录音数据量巨大。一个中等规格的呼叫中心，通常有3000左右坐席人员。在这些通话录音文件中存在用户大量敏感信息。如用户姓名、银行卡号、用户身份信息、密码保护信息等，可用做用户身份识别，办理各类业务等。因此需要如何在保证传输和播放效率的同时，保证录音数据的安全性就是面临的难题。
[0003] 现有的技术是对录音文件进行全文加密。由于对如此大的录音文件进行全文加密是相当耗费计算机的技术资源的，耗时也非常长。要么是对录音文件没有进行加密，仅仅做了格式变换，用户的隐私、关键信息的安全得不到保障。

【发明内容】

[0004] 本发明实施例提供一种处理录音文件方法和装置以提高录音数据的安全性。
[0005] 第一方面，一种录音文件处理方法，包括录音处理设备从录音设备获取录音源文件；从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
[0006] 在第一方面的第一种可能的实现方式中，所述将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件具体包括将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
[0007] 结合第一方面的第一种可能的实现方式，在第二种可能的实现方式中，在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。
[0008] 结合第一方面的第一种可能的实现方式，在第三种可能的实现方式中，进一步包括设置关键字特征库，所述关键字特征库中包括关键字，所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中的内容与所述关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0009] 结合第一方面的第三种可能的实现方式，在第四种可能的实现方式中进一步包括对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件，所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括将所述录音源文件的文本文件中的内容与键字特征库中的关键字进行特征匹配。
[0010] 结合第一方面的第三种或者第四种可能的实现方式，第五种可能的实现方式中，所述关键字特征库包括提示音关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字；所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中与所述提示音关键字相匹配的部分之外的其它部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0011] 结合第一方面的第五种可能的实现方式，第六种可能的实现方式中，进一步包括基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0012] 结合第一方面的第三种或者第四种可能的实现方式，第七种可能的实现方式中，所述关键字特征库包括内容关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字；所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0013] 第二方面，录音处理设备，包括：获取模块，用于从录音设备获取录音源文件；识别模块，用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；加密模块，用于对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；文件形成模块，用于将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
[0014] 结合第二方面的第一种可能的实现方式中，所述文件形成模块用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
[0015] 结合第二方面的第一种可能的实现方式，第二种可能的实现方式中，文件形成模块用于在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。
[0016] 结合第二方面的第二种可能的实现方式中，第三种可能的实现方式中，所述的录音处理设备进一步包括设置模块，用于设置关键字特征库，所述关键字特征库中包括关键字；所述识别模块具体用于根据所述录音源文件中的内容与所述键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0017] 结合第二方面的第三种可能的实现方式中，第四种可能的实现方式中，所述的录音处理设备进一步包括转换模块，用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；所述识别模块具体用于将所述录音源文件的文本文件中的内容与关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0018] 结合第二方面的第三种可能的实现方式中，第五种可能的实现方式中，所述关键字特征库包括提示音关键字；所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述提示音关键字进行特征匹配，将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0019] 结合第二方面的第五种可能的实现方式中，第六种可能的实现方式中，所述识别模块具体用于基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0020] 结合第二方面的第三种可能的实现方式中，第七种可能的实现方式中，所述关键字特征库包括内容关键字；所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述内容关键字进行特征匹配，将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0021] 第三方面，一种录音处理设备，包括：接收器用于从录音设备获取录音源文件；与所述接收器相连接的处理器，用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
[0022] 结合第二方面的第一种可能的实现方式中，所述处理器具体用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
[0023] 结合第三方面的第一种可能的实现方式，第二种可能的实现方式中，所述处理器进一步用于在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。
[0024] 结合第三方面的第一种可能的实现方式中，第三种可能的实现方式中，所述所述处理器进一步设置关键字特征库，所述关键字特征库中包括关键字；所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段具体包括具体包括根据所述录音源文件中的内容与所述键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0025] 结合第三方面的第三种可能的实现方式中，第四种可能的实现方式中，所述的处理器进一步用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括将所述录音源文件的文本文件中的内容与关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0026] 结合第三方面的第三种可能的实现方式中，第五种可能的实现方式中，所述关键字特征库包括提示音关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字；所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包括将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0027] 结合第三方面的第五种可能的实现方式中，第六种可能的实现方式中，进一步包括基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0028] 结合第三方面的第三种可能的实现方式中，第七种可能的实现方式中，所述关键字特征库包括内容关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字；所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0029] 在上述实施例中，通过从录音源文件中识别出含有涉及用户数据安全的敏感信息的录音片段，并仅对涉及用户数据安全的该录音片段进行加密，在提高效率的同时提高了录音数据的安全性。

【专利附图】

【附图说明】
[0030] 为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0031] 图1是本发明实施例提供的一种录音处理系统的系统架构图；
[0032] 图2是本发明实施例提供的一种录音处理的结构示意图；
[0033] 图3是本发明另一实施例提供的一种录音处理的结构不意图；
[0034] 图4是本发明实施例提供的一种录音处理方法的方法流程图；
[0035] 图5是本发明另一实施例提供的一种录音处理方法的方法流程图；
[0036] 图6是本发明另一实施例提供的一种录音处理方法的方法流程图；

【具体实施方式】
[0037] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0038] 图1为本发明实施例提供的一种录音处理系统100的架构图。如图1所示，该系统包括录音文件存储设备101，录音处理设备102以及关键字特征库103。其中，录音文件存储设备101存储有录音源文件1011以及录音目标文件1022。录音处理设备102包括接收/发射器1021，处理器1022以及存储器1023。
[0039] 其中，所述接收/发射器1021用于接收来自于录音文件存储设备101的录音源文件1011，以及将处理器1022处理后形成的录音目标文件1022发送至录音文件存储设备 101进行保存。
[0040] 所述处理器1022可以采用通用的中央处理器（Central Processing Unit，CPU)，微处理器，应用专用集成电路（Application Specific Integrated Circuit，ASIC)，或者一个或多个集成电路，或者现场可编逻辑门阵列（Field Programmable Gate Array, FPGA) 用于执行相关程序，以执行本发明各实施例中所描述的识别模块、加密模块，文件形成模块，设置模块以及转换模块所具有的功能。
[0041] 存储器1023可以是只读存储器（Read Only Memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器（Random Access Memory，RAM)等各种类型的存储器。存储器 1023可以存储操作系统和/或其他应用程序的指令以及应用数据，所述指令包括用于实现本发明各实施例中的识别模块、加密模块，文件形成模块，设置模块以及转换模块的功能的指令。
[0042] 存储器1022中存储的指令由处理器1023来运行执行。
[0043] 在本发明实施例中，处理器1022通过运行存储器1022中的指令实现以下功能：处理器1022用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段，对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理，将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
[0044] 处理器1022的上述功能的具体实现可参考下面的方法实施例部分，这里不再赘述。
[0045] 关键字特征库103用于存储关键字，所述关键字用于与录音源文件中的内容进行特征匹配，从而识别出含有涉及用户数据安全的敏感信息的录音片段。具体实施例中，所述的关键字可以包括提示音关键字和/或内容关键字。不同类型的关键字匹配的方式不同，参见以下表一为提示音关键字，表二为内容关键字，具体匹配方式可以参考以下方法实施例中具体的描述，此处不赘述。
[0046] 关键字特征库103中的关键字可以由呼叫中心系统预先设置，例如，呼叫中心根据各类业务场景等因素提取提示音关键字以及内容关键字。也可以由录音处理设备102进行预先设置，例如，录音处理设备102也可以根据各类业务场景等因素或历史录音文件记录等因素提取提不音关键字以及内容关键字。关键字特征库103中的关键字还可以被动态更新，根据新的业务增加新的关键字或者修改已经过时的关键字，例如根据历史业务记录和业务场景变更等情况进行动态更新。
[0047] 需要说明的是，该关键字特征库103可以独立于所述录音处理设备102设置，也可以设置在所述的录音处理设备102中，本发明对此不做限定。关键字特征库中配置的提示音关键字的示例如表1所示，内容关键字的示例如表2所示。
[0048] 表 1
[0049]

【权利要求】
1. 一种录音文件处理方法，其特征在于，包括：录音处理设备从录音设备获取录音源文件；从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
2. 如权利要求1所述的方法，其特征在于，所述将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件具体包括：将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
3. 如权利要求2所述的方法，其特征在于，进一步包括：在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。
4. 如权利要求2所述的方法，其特征在于，进一步包括：设置关键字特征库，所述关键字特征库中包括关键字；所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中的内容与所述关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
5. 如权利要求4所述的方法，其特征在于，所述方法进一步包括，对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括：将所述录音源文件的文本文件中的内容与键字特征库中的关键字进行特征匹配。
6. 如权利要求4或5所述的方法，其特征在于，所述关键字特征库包括提示音关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字；所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中与所述提示音关键字相匹配的部分之外的其它部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
7. 如权利要求6所述的方法，其特征在于，基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
8. 如权利要求4或5所述的方法，其特征在于，所述关键字特征库包括内容关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字；所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
9. 一种录音处理设备，其特征在于，包括：获取模块，用于从录音设备获取录音源文件；识别模块，用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；加密模块，用于对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；文件形成模块，用于将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
10. 如权利要求9所述的录音处理设备，其特征在于，所述文件形成模块用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
11. 如权利要求10所述的录音处理设备，其特征在于，文件形成模块用于在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。
12. 如权利要求11所述的录音处理设备，其特征在于，所述的录音处理设备进一步包括设置模块，用于设置关键字特征库，所述关键字特征库中包括关键字；所述识别模块具体用于根据所述录音源文件中的内容与所述键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
13. 如权利要求12所述的录音处理设备，其特征在于，所述的录音处理设备进一步包括转换模块，用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；所述识别模块具体用于将所述录音源文件的文本文件中的内容与关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
14. 如权利要求12所述的录音处理设备，其特征在于，所述关键字特征库包括提示音关键字；所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述提示音关键字进行特征匹配，将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
15. 如权利要求14所述的录音处理设备，其特征在于，所述识别模块具体用于基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
16. 如权利要求12所述的录音处理设备，其特征在于，所述关键字特征库包括内容关键字；所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述内容关键字进行特征匹配，将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
17. -种录音处理设备，其特征在于，包括：接收器，用于从录音设备获取录音源文件；与所述接收器相连接的处理器，用于：从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
18. 如权利要求17所述的方录音处理设备，其特征在于，所述处理器具体用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
19. 如权利要求18所述的录音处理设备，其特征在于，所述处理器进一步用于：在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。
20. 如权利要求18所述的录音处理设备，其特征在于，所述处理器进一步用于设置关键字特征库，所述关键字特征库包括关键字；所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段具体包括：将所述录音源文件中的内容与所述关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
21. 如权利要求20所述的录音处理设备，所述处理器进一步用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括：将所述录音源文件的文本文件中的内容与键字特征库中的关键字进行特征匹配。
22. 如权利要求20所述的录音处理设备，其特征在于，所述关键字特征库包括提示音关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字；所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
23. 如权利要求22所述的录音处理设备，其特征在于，基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
24. 如权利要求20所述的录音处理设备，其特征在于，所述关键字特征库包括内容关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字；所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
【文档编号】G06F21/62GK104517068SQ201410855439
【公开日】2015年4月15日申请日期:2014年12月31日优先权日:2014年12月31日
【发明者】刘威威申请人:华为技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘威威;
技术所有人：华为技术有限公司;
我是此专利的发明人

上一篇：一种阵列基板的制造方法及触摸屏的制作方法
上一篇：基于nfc设备的支付系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。