一种处理录音文件方法和装置制造方法

文档序号:6641001阅读:81来源:国知局
一种处理录音文件方法和装置制造方法
【专利摘要】本发明实施例公开了一种录音文件处理方法和设备。该方法包括:录音处理设备从录音设备获取录音源文件,从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段,对所述含有所述敏感信息的第一录音片段进行加密,对录音源文件中非敏感信息所在的第二录音片段不做加密处理,将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件,通过从录音源文件中识别出含有涉及用户数据安全的敏感信息的录音片段,并仅对涉及用户数据安全的该录音片段进行加密,在提高效率的同时提高了录音数据的安全性。
【专利说明】一种处理录音文件方法和装置

【技术领域】
[0001] 本发明涉及通信【技术领域】,特别涉及一种处理录音文件方法和装置。

【背景技术】
[0002] 在通信日益发达的今天,外包呼叫中心的应用越来越普遍,电话成为产品服务和 产品销售的主要渠道之一。为保障客户权益,避免纠纷,呼叫中心的通话需要被录音。特别 对于金融行业电销系统来说,录音是保监会、银监会监管的重要手段,是金融保险公司是否 合规的重要证据,因此对录音文档的存放年限有很高要求,录音数据量巨大。一个中等规格 的呼叫中心,通常有3000左右坐席人员。在这些通话录音文件中存在用户大量敏感信息。 如用户姓名、银行卡号、用户身份信息、密码保护信息等,可用做用户身份识别,办理各类业 务等。因此需要如何在保证传输和播放效率的同时,保证录音数据的安全性就是面临的难 题。
[0003] 现有的技术是对录音文件进行全文加密。由于对如此大的录音文件进行全文加密 是相当耗费计算机的技术资源的,耗时也非常长。要么是对录音文件没有进行加密,仅仅做 了格式变换,用户的隐私、关键信息的安全得不到保障。


【发明内容】

[0004] 本发明实施例提供一种处理录音文件方法和装置以提高录音数据的安全性。
[0005] 第一方面,一种录音文件处理方法,包括录音处理设备从录音设备获取录音源文 件;从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段;对所 述含有所述敏感信息的第一录音片段进行加密,对录音源文件中非敏感信息所在的第二录 音片段不做加密处理;将加密后的第一录音片段和所述不做加密处理的第二录音片段合并 为录音目标文件。
[0006] 在第一方面的第一种可能的实现方式中,所述将加密后的第一录音片段和所述不 做加密处理的第二录音片段合并为录音目标文件具体包括将加密后的第一录音片段和所 述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
[0007] 结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,在所述录 音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。
[0008] 结合第一方面的第一种可能的实现方式,在第三种可能的实现方式中,进一步包 括设置关键字特征库,所述关键字特征库中包括关键字,所述从所述录音源文件中识别出 含有涉及用户数据安全的敏感信息的第一录音片段包括:将所述录音源文件中的内容与所 述关键字特征库中的关键字进行特征匹配,并根据匹配结果识别出含有所述涉及用户数据 安全的敏感信息的第一录音片段。
[0009] 结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中进一步包括 对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件,所述将所述录音源 文件中的内容与键字特征库中的关键字进行特征匹配包括将所述录音源文件的文本文件 中的内容与键字特征库中的关键字进行特征匹配。
[0010] 结合第一方面的第三种或者第四种可能的实现方式,第五种可能的实现方式中, 所述关键字特征库包括提示音关键字;与所述录音源文件中的内容进行特征匹配的关键字 为所述提示音关键字;所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的 第一录音片段包括:将所述录音源文件中与所述提示音关键字相匹配的部分之外的其它部 分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0011] 结合第一方面的第五种可能的实现方式,第六种可能的实现方式中,进一步包括 基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其 他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0012] 结合第一方面的第三种或者第四种可能的实现方式,第七种可能的实现方式中, 所述关键字特征库包括内容关键字;与所述录音源文件中的内容进行特征匹配的关键字为 所述内容关键字;所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音 片段包括:将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户 数据安全的敏感信息的第一录音片段。
[0013] 第二方面,录音处理设备,包括:获取模块,用于从录音设备获取录音源文件;识 别模块,用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片 段;加密模块,用于对所述含有所述敏感信息的第一录音片段进行加密,对录音源文件中非 敏感信息所在的第二录音片段不做加密处理;文件形成模块,用于将加密后的第一录音片 段和所述不做加密处理的第二录音片段合并为录音目标文件。
[0014] 结合第二方面的第一种可能的实现方式中,所述文件形成模块用于将加密后的第 一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
[0015] 结合第二方面的第一种可能的实现方式,第二种可能的实现方式中,文件形成模 块用于在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片 段顺序。
[0016] 结合第二方面的第二种可能的实现方式中,第三种可能的实现方式中,所述的录 音处理设备进一步包括设置模块,用于设置关键字特征库,所述关键字特征库中包括关键 字;所述识别模块具体用于根据所述录音源文件中的内容与所述键字特征库中的关键字进 行特征匹配,并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片 段。
[0017] 结合第二方面的第三种可能的实现方式中,第四种可能的实现方式中,所述的录 音处理设备进一步包括转换模块,用于对所述录音源文件进行语音文本转化获得所述录音 源文件的文本文件;所述识别模块具体用于将所述录音源文件的文本文件中的内容与关键 字特征库中的关键字进行特征匹配,并根据匹配结果识别出含有所述涉及用户数据安全的 敏感信息的第一录音片段。
[0018] 结合第二方面的第三种可能的实现方式中,第五种可能的实现方式中,所述关键 字特征库包括提示音关键字;所述识别模块具体用于将所述录音源文件的文本文件中的内 容与所述提示音关键字进行特征匹配,将所述录音源文件中与所述提示音关键字相匹配的 部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0019] 结合第二方面的第五种可能的实现方式中,第六种可能的实现方式中,所述识别 模块具体用于基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的 部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0020] 结合第二方面的第三种可能的实现方式中,第七种可能的实现方式中,所述关键 字特征库包括内容关键字;所述识别模块具体用于将所述录音源文件的文本文件中的内容 与所述内容关键字进行特征匹配,将所述录音源文件中与所述内容关键字相匹配的部分确 定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0021] 第三方面,一种录音处理设备,包括:接收器用于从录音设备获取录音源文件;与 所述接收器相连接的处理器,用于从所述录音源文件中识别出含有涉及用户数据安全的敏 感信息的第一录音片段;对所述含有所述敏感信息的第一录音片段进行加密,对录音源文 件中非敏感信息所在的第二录音片段不做加密处理;将加密后的第一录音片段和所述不做 加密处理的第二录音片段合并为录音目标文件。
[0022] 结合第二方面的第一种可能的实现方式中,所述处理器具体用于将加密后的第一 录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。
[0023] 结合第三方面的第一种可能的实现方式,第二种可能的实现方式中,所述处理器 进一步用于在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段 的片段顺序。
[0024] 结合第三方面的第一种可能的实现方式中,第三种可能的实现方式中,所述所述 处理器进一步设置关键字特征库,所述关键字特征库中包括关键字;所述从所述录音源文 件中识别出含有涉及用户数据安全的敏感信息的第一录音片段具体包括具体包括根据所 述录音源文件中的内容与所述键字特征库中的关键字进行特征匹配,并根据匹配结果识别 出含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0025] 结合第三方面的第三种可能的实现方式中,第四种可能的实现方式中,所述的处 理器进一步用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件;所 述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括将所述录音源 文件的文本文件中的内容与关键字特征库中的关键字进行特征匹配,并根据匹配结果识别 出含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0026] 结合第三方面的第三种可能的实现方式中,第五种可能的实现方式中,所述关键 字特征库包括提示音关键字;与所述录音源文件中的内容进行特征匹配的关键字为所述提 示音关键字;所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音 片段包括将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为 含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0027] 结合第三方面的第五种可能的实现方式中,第六种可能的实现方式中,进一步包 括基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的 其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
[0028] 结合第三方面的第三种可能的实现方式中,第七种可能的实现方式中,所述关键 字特征库包括内容关键字;与所述录音源文件中的内容进行特征匹配的关键字为所述内容 关键字;所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括 将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全 的敏感信息的第一录音片段。
[0029] 在上述实施例中,通过从录音源文件中识别出含有涉及用户数据安全的敏感信息 的录音片段,并仅对涉及用户数据安全的该录音片段进行加密,在提高效率的同时提高了 录音数据的安全性。

【专利附图】

【附图说明】
[0030] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附 图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域 普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0031] 图1是本发明实施例提供的一种录音处理系统的系统架构图;
[0032] 图2是本发明实施例提供的一种录音处理的结构示意图;
[0033] 图3是本发明另一实施例提供的一种录音处理的结构不意图;
[0034] 图4是本发明实施例提供的一种录音处理方法的方法流程图;
[0035] 图5是本发明另一实施例提供的一种录音处理方法的方法流程图;
[0036] 图6是本发明另一实施例提供的一种录音处理方法的方法流程图;

【具体实施方式】
[0037] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0038] 图1为本发明实施例提供的一种录音处理系统100的架构图。如图1所示,该系 统包括录音文件存储设备101,录音处理设备102以及关键字特征库103。其中,录音文件 存储设备101存储有录音源文件1011以及录音目标文件1022。录音处理设备102包括接 收/发射器1021,处理器1022以及存储器1023。
[0039] 其中,所述接收/发射器1021用于接收来自于录音文件存储设备101的录音源 文件1011,以及将处理器1022处理后形成的录音目标文件1022发送至录音文件存储设备 101进行保存。
[0040] 所述处理器1022可以采用通用的中央处理器(Central Processing Unit,CPU), 微处理器,应用专用集成电路(Application Specific Integrated Circuit,ASIC),或者 一个或多个集成电路,或者现场可编逻辑门阵列(Field Programmable Gate Array, FPGA) 用于执行相关程序,以执行本发明各实施例中所描述的识别模块、加密模块,文件形成模 块,设置模块以及转换模块所具有的功能。
[0041] 存储器1023可以是只读存储器(Read Only Memory,ROM),静态存储设备,动态存 储设备或者随机存取存储器(Random Access Memory,RAM)等各种类型的存储器。存储器 1023可以存储操作系统和/或其他应用程序的指令以及应用数据,所述指令包括用于实现 本发明各实施例中的识别模块、加密模块,文件形成模块,设置模块以及转换模块的功能的 指令。
[0042] 存储器1022中存储的指令由处理器1023来运行执行。
[0043] 在本发明实施例中,处理器1022通过运行存储器1022中的指令实现以下功能:处 理器1022用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音 片段,对所述含有所述敏感信息的第一录音片段进行加密,对录音源文件中非敏感信息所 在的第二录音片段不做加密处理,将加密后的第一录音片段和所述不做加密处理的第二录 音片段合并为录音目标文件。
[0044] 处理器1022的上述功能的具体实现可参考下面的方法实施例部分,这里不再赘 述。
[0045] 关键字特征库103用于存储关键字,所述关键字用于与录音源文件中的内容进行 特征匹配,从而识别出含有涉及用户数据安全的敏感信息的录音片段。具体实施例中,所述 的关键字可以包括提示音关键字和/或内容关键字。不同类型的关键字匹配的方式不同, 参见以下表一为提示音关键字,表二为内容关键字,具体匹配方式可以参考以下方法实施 例中具体的描述,此处不赘述。
[0046] 关键字特征库103中的关键字可以由呼叫中心系统预先设置,例如,呼叫中心根 据各类业务场景等因素提取提示音关键字以及内容关键字。也可以由录音处理设备102进 行预先设置,例如,录音处理设备102也可以根据各类业务场景等因素或历史录音文件记 录等因素提取提不音关键字以及内容关键字。关键字特征库103中的关键字还可以被动态 更新,根据新的业务增加新的关键字或者修改已经过时的关键字,例如根据历史业务记录 和业务场景变更等情况进行动态更新。
[0047] 需要说明的是,该关键字特征库103可以独立于所述录音处理设备102设置,也可 以设置在所述的录音处理设备102中,本发明对此不做限定。关键字特征库中配置的提示 音关键字的示例如表1所示,内容关键字的示例如表2所示。
[0048] 表 1
[0049]

【权利要求】
1. 一种录音文件处理方法,其特征在于,包括: 录音处理设备从录音设备获取录音源文件; 从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段; 对所述含有所述敏感信息的第一录音片段进行加密,对录音源文件中非敏感信息所在 的第二录音片段不做加密处理; 将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
2. 如权利要求1所述的方法,其特征在于,所述将加密后的第一录音片段和所述不做 加密处理的第二录音片段合并为录音目标文件具体包括: 将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并 为录音目标文件。
3. 如权利要求2所述的方法,其特征在于,进一步包括: 在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段 顺序。
4. 如权利要求2所述的方法,其特征在于,进一步包括: 设置关键字特征库,所述关键字特征库中包括关键字; 所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段 包括: 将所述录音源文件中的内容与所述关键字特征库中的关键字进行特征匹配,并根据匹 配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
5. 如权利要求4所述的方法,其特征在于,所述方法进一步包括,对所述录音源文件进 行语音文本转化获得所述录音源文件的文本文件; 所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括: 将所述录音源文件的文本文件中的内容与键字特征库中的关键字进行特征匹配。
6. 如权利要求4或5所述的方法,其特征在于,所述关键字特征库包括提示音关键字; 与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字; 所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包 括: 将所述录音源文件中与所述提示音关键字相匹配的部分之外的其它部分确定为含有 所述涉及用户数据安全的敏感信息的第一录音片段。
7. 如权利要求6所述的方法,其特征在于,基于预设的时间段信息将所述录音源文件 中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全 的敏感信息的第一录音片段。
8. 如权利要求4或5所述的方法,其特征在于,所述关键字特征库包括内容关键字;与 所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字; 所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括: 将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据 安全的敏感信息的第一录音片段。
9. 一种录音处理设备,其特征在于,包括: 获取模块,用于从录音设备获取录音源文件; 识别模块,用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一 录音片段; 加密模块,用于对所述含有所述敏感信息的第一录音片段进行加密,对录音源文件中 非敏感信息所在的第二录音片段不做加密处理; 文件形成模块,用于将加密后的第一录音片段和所述不做加密处理的第二录音片段合 并为录音目标文件。
10. 如权利要求9所述的录音处理设备,其特征在于,所述文件形成模块用于将加密后 的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文 件。
11. 如权利要求10所述的录音处理设备,其特征在于,文件形成模块用于在所述录音 目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。
12. 如权利要求11所述的录音处理设备,其特征在于,所述的录音处理设备进一步包 括设置模块,用于设置关键字特征库,所述关键字特征库中包括关键字; 所述识别模块具体用于根据所述录音源文件中的内容与所述键字特征库中的关键字 进行特征匹配,并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音 片段。
13. 如权利要求12所述的录音处理设备,其特征在于,所述的录音处理设备进一步包 括转换模块,用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件; 所述识别模块具体用于将所述录音源文件的文本文件中的内容与关键字特征库中的 关键字进行特征匹配,并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第 一录音片段。
14. 如权利要求12所述的录音处理设备,其特征在于,所述关键字特征库包括提示音 关键字; 所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述提示音关键字 进行特征匹配,将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确 定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
15. 如权利要求14所述的录音处理设备,其特征在于,所述识别模块具体用于基于预 设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分 确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。
16. 如权利要求12所述的录音处理设备,其特征在于,所述关键字特征库包括内容关 键字; 所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述内容关键字进 行特征匹配,将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用 户数据安全的敏感信息的第一录音片段。
17. -种录音处理设备,其特征在于,包括: 接收器,用于从录音设备获取录音源文件; 与所述接收器相连接的处理器,用于: 从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段; 对所述含有所述敏感信息的第一录音片段进行加密,对录音源文件中非敏感信息所在 的第二录音片段不做加密处理; 将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。
18. 如权利要求17所述的方录音处理设备,其特征在于,所述处理器具体用于将加密 后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标 文件。
19. 如权利要求18所述的录音处理设备,其特征在于,所述处理器进 一步用于: 在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段 顺序。
20. 如权利要求18所述的录音处理设备,其特征在于,所述处理器进一步用于设置关 键字特征库,所述关键字特征库包括关键字; 所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段 具体包括: 将所述录音源文件中的内容与所述关键字特征库中的关键字进行特征匹配,并根据匹 配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。
21. 如权利要求20所述的录音处理设备,所述处理器进一步用于对所述录音源文件进 行语音文本转化获得所述录音源文件的文本文件; 所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括: 将所述录音源文件的文本文件中的内容与键字特征库中的关键字进行特征匹配。
22. 如权利要求20所述的录音处理设备,其特征在于,所述关键字特征库包括提示音 关键字;与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字; 所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包 括: 将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有 所述涉及用户数据安全的敏感信息的第一录音片段。
23. 如权利要求22所述的录音处理设备,其特征在于,基于预设的时间段信息将所述 录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用 户数据安全的敏感信息的第一录音片段。
24. 如权利要求20所述的录音处理设备,其特征在于,所述关键字特征库包括内容关 键字;与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字; 所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括: 将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据 安全的敏感信息的第一录音片段。
【文档编号】G06F21/62GK104517068SQ201410855439
【公开日】2015年4月15日 申请日期:2014年12月31日 优先权日:2014年12月31日
【发明者】刘威威 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1