录音信息处理方法及装置的制造方法

文档序号：10512376阅读：401来源：国知局

录音信息处理方法及装置的制造方法
【专利摘要】本发明实施例提供了一种录音信息处理方法及装置，方法包括：获取采集到的音频信息的分贝值；在获取到的分贝值符合预置分句条件时，则执行分句操作并记录分句时的录音时长信息；对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异。以此，可通过相邻两句音频信息具有不同显示效果的波形图，清晰的区分出每一句音频信息，进而在播放由所有音频信息组成的录音文件时，可根据每句音频信息对应的位置对播放位置进行调整，以更快速的在播放的录音文件中查找并定位到想要找的内容，提高查找定位的效率。
【专利说明】
录音信息处理方法及装置
技术领域
[0001] 本发明实施例涉及互联网技术领域，尤其涉及录音信息处理方法及装置。
【背景技术】
[0002] 现如今，智能终端设备越来越普遍的应用于人们的日常生活中，在智能终端设备中，通常内置或由用户下载安装有用于录音的应用，通过使用该录音应用以对某些场景中的相关内容进行记录。在录音过程中，智能终端设备可通过内置麦克风对某场景中的音频信息进行采集，以在录音结束后生成对应的录音文件，然后可通过播放该录音文件以再现某场景，比如，可对与某人对话时的内容进行录音、对某授课过程中的授课内容进行录音、对某会议中的会议内容进行录音等，以便于更好的回忆与某人的对话内容、更好的学习授课内容、更好的了解会议内容等。
[0003] 发明人在实现本发明的过程中，发现现有技术存在如下缺陷：
[0004] 当用户想要查找录音文件中的某特定内容时，比如想要查找与某人对话过程中的某段话等，通常是通过随意调整录音文件的播放进度或根据记忆中该特定内容可能出现的位置来调整录音文件的播放进度，以进行该特定内容的查找定位，在此过程中，可能需要反复调整很多次才能查找并定位到该特定内容，因此，查找定位的效率较低。

【发明内容】

[0005] 本发明的目的在于，提供一种录音信息处理方法及装置，可更快速的在播放的录音文件中查找并定位到想要找的内容，提高查找定位的效率。
[0006] 为了实现上述目的，本发明实施例提供了一种录音信息处理方法，包括：
[0007] 获取采集到的音频信息的分贝值；
[0008] 若获取到的分贝值符合预置分句条件，则执行分句操作，并记录分句时的录音时长信息；
[0009] 对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异。
[0010]进一步的，所述方法，还包括：
[0011]在录音的过程中，根据采集到的分贝值、分句时的录音时长信息以及显示参数生成所述音频信息对应的波形图，并进行实时显示。
[0012] 可选的，所述获取到的分贝值符合预置分句条件，包括：
[0013] 所述分贝值低于预置分贝阈值;或
[0014] 所述分贝值低于预置分贝阈值且持续时间长于预置时间。
[0015] 可选的，所述方法，还包括：
[0016] 根据所述分句时的录音时长信息确定分句位置之前的一句音频信息的结束时间，及分句位置之后的一句音频信息的开始时间。
[0017] 进一步的，所述显示参数中包括显示颜色对应的色值；
[0018] 所述对每句音频信息配置用于进行波形图显示的显示参数，包括：
[0019] 在每次执行完分句操作后，获取分句位置之前的一句音频信息对应的显示参数中包含的第一色值；
[0020] 将分句位置之后的一句音频信息对应的显示参数中包含的色值设置为与所述第一色值存在视觉差异的第二色值。
[0021] 本发明实施例还提供了一种录音信息处理装置，包括：
[0022] 获取模块，用于获取采集到的音频信息的分贝值；
[0023] 分句模块，用于当获取到的分贝值符合预置分句条件时，执行分句操作，并记录分句时的录音时长信息；
[0024]配置模块，用于对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异。
[0025] 可选的，所述装置，还包括：
[0026] 波形图处理模块，用于在录音的过程中，根据采集到的分贝值、分句时的录音时长信息以及显示参数生成所述音频信息对应的波形图，并进行实时显示。
[0027] 可选的，所述获取到的分贝值符合预置分句条件，包括：
[0028] 所述分贝值低于预置分贝阈值;或
[0029 ]所述分贝值低于预置分贝阈值且持续时间长于预置时间。
[0030] 可选的，所述装置，还包括：
[0031 ]时间确定模块，用于根据所述分句时的录音时长信息确定分句位置之前的一句音频信息的结束时间，及分句位置之后的一句音频信息的开始时间。
[0032] 可选的，所述显示参数中包括显示颜色对应的色值；
[0033]基于此，所述配置模块，具体用于：
[0034] 在每次执行完分句操作后，获取分句位置之前的一句音频信息对应的显示参数中包含的第一色值；
[0035] 将分句位置之后的一句音频信息对应的显示参数中包含的色值设置为与所述第一色值存在视觉差异的第二色值。
[0036] 本发明实施例提供的技术方案可以包括以下有益效果：
[0037] 使用本发明实施例提供的录音信息处理方法及装置，可在录音过程中获取采集到的音频信息的分贝值，在获取到的分贝值符合预置分句条件时，则可执行分句操作并记录分句时的录音时长信息，然后对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异，以此，可通过相邻两句音频信息具有不同显示效果的波形图，清晰的区分出每一句音频信息，进而在播放由所有音频信息组成的录音文件时，可根据每句音频信息对应的位置对播放位置进行调整，以更快速的在播放的录音文件中查找并定位到想要找的内容，提高查找定位的效率。
[0038] 上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的【具体实施方式】。
【附图说明】
[0039] 图1为本发明实施例提供的录音信息处理方法的流程示意图；
[0040] 图2为本发明实施例提供的录音信息处理方法的场景示意图一；
[0041] 图3为本发明实施例提供的录音信息处理方法的场景示意图二；
[0042]图4为本发明实施例提供的录音信息处理方法的场景示意图三；
[0043]图5为本发明实施例提供的录音信息处理方法的场景示意图四；
[0044] 图6为本发明实施例提供的录音信息处理装置的结构示意图。
【具体实施方式】
[0045] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。
[0046] 下面结合图1所示的本发明实施例提供的录音信息处理方法的流程示意图、图2至 5所示的本发明实施例提供的录音信息处理方法的场景示意图，对本发明实施例提供的录音信息处理方法进行说明。
[0047] 本发明实施例提供的录音信息处理方法可以应用在智能终端设备上，例如：智能手机、平板电脑、台式计算机、可穿戴设备等，可以通过在终端设备上安装应用（比如名为录音的APP)的方式或者在台式计算机上安装软件的方式实现，如图1所示，该录音信息处理方法可以包括以下步骤：
[0048] S101，获取采集到的音频信息的分贝值。
[0049] 在本发明实施例中，可在录音的过程中执行获取采集到的音频信息的分贝值的操作，如图2和图3所示，比如可在进入录音应用的界面20中提供用于启动录音的操作选项（比如开始图标21)、用于暂停录音的操作选项（比如暂停图标22)、用于结束录音的操作选项 (比如结束图标23)、用于显示录音时长的时间标识，等等。
[0050] 当开始图标21被触发，比如可通过用户点击来触发，则为接收到开始录音的指令，响应于所述开始录音的指令，则可开始录音，即开始采集音频信息(可结合参看图3,该界面中可显示录音过程的音频波形图），并对采集到的音频信息的分贝值进行获取并记录，以备后续步骤中使用。
[0051] S102,若获取到的分贝值符合预置分句条件，则执行分句操作，并记录分句时的录音时长信息。
[0052]所述预置分句条件可根据实际需求进行设置，在本实施例中，预置分句条件可根据音频信息的分贝值、或音频信息的分贝值及持续时间来设置。
[0053]所述获取到的分贝值符合预置分句条件，比如可设置为获取到的分贝值低于预置分贝阈值，或者可设置为获取到的分贝值低于预置分贝阈值且持续时间长于预置时间。
[0054] 在具体实现时，比如可预置分贝阈值可设置为30分贝，预置时间可设置为0.1秒，当获取到的分贝值低于30分贝且持续时间长于0.1秒（即持续0.1秒以上），则可判定为符合预置分句条件。
[0055] 由于在人们的口语习惯中，在说话时，通常为以每一句话为单位的说出口，且在每句话之间会有暂时的停顿，以达到语义区分、突出强调、情绪转移等目的，因此，可根据每句话之间的停顿以将各句话进行分隔，即进行分句，在本实施例中，将停顿的部分设置为属于前一句话，当然，根据实际情况的不同，也可将停顿的部分设置为属于后一句话。
[0056] 也即，在上述符合预置分句条件的情况下，则可判定为音频信息处于停顿状态(也可称为非连续状态），据此可将采集到的音频信息以每句话为单位进行分句操作，并可记录分句时的录音时长信息，在本发明实施例中，分句时的录音时长信息可如以下表1所示：
[0057] 表 1
[0060] 在本实施例中，可根据所述分句时的录音时长信息来确定分句位置之前的一句音频信息的结束时间，及分句位置之后的一句音频信息的开始时间，比如分句时的录音时长信息为"〇〇: 〇〇: 15"，则可将"00:00:15"确定为分句位置之前的一句音频信息(在本实施例中可称为第一句音频信息）的结束时间，同时可将"00 :00:15"确定为分句位置之后的一句音频信息(在本实施例中可称为第二句音频信息）的开始时间，然后可对第一句音频信息的开始时间（即"〇〇: 〇〇: 〇〇"）、结束时间（即"〇〇: 〇〇: 15"），第二句音频信息的开始时间（即"00: 00:15"）等时间信息进行记录，此后当第二句音频信息与第三句音频信息分隔开之后，还可将第二句音频信息的结束时间进行记录，以此类推，在本发明实施例中，每句音频信息及其对应的时间信息可如以下表2所示：
[0061] 表 2
[0063] S103,对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异。
[0064] 其中，所述显示参数中可包括显示颜色对应的色值，在本实施例中，比如可设置四个显示颜色对应的色值，包括红色对应的色值、绿色对应的色值、蓝色对应的色值、黄色对应的色值等。
[0065]为了将每句音频信息的波形图进行清晰的区分，可将相邻两句音频信息的用于进行波形图显示的显示参数进行有区别的配置，以使得相邻两句音频信息的波形图的显示效果存在差异。在具体实现时，比如可将第一句音频信息的显示参数配置为第一色值(比如红色对应的色值），在执行完分句操作后，比如在分隔出第二句音频信息后，可先获取第一句音频信息对应的显示参数中包括的色值(即第一色值），然后可将第二句音频信息的显示参数包括的色值配置为与所述第一色值存在视觉差异的第二色值(比如绿色对应的色值），也就是除红色对应的色值之外的其他色值，可将第三句音频信息的显示参数配置为与第二色值存在视觉差异的色值，也就是除第二色值之外的其他色值，如第四色值等，以此类推，以通过配置相邻两句音频信息的显示参数是不同的，使得相邻两句音频信息的波形图显示效果存在差异，并可将每句音频信息对应的显示参数配置信息进行记录，在本发明实施例中，每句音频信息及其对应的显示参数配置信息可如以下表3所示：
[0066]表 3
[0068] 在实际应用中，表3中可为只包括音频信息句及其对应的显示参数配置信息，也可在表1的基础上添加"显示参数配置信息"列，等等。
[0069] 如图4所示，在本实施例的一种实现方式中，可在录音的过程中，根据上述采集到的音频信息的分贝值、分句时的录音时长信息以及显示参数生成所述音频信息对应的波形图并进行实时显示，比如可包括第一句音频信息对应的波形图241、第二句音频信息对应的波形图242等，根据上述显示参数的配置结果，第一句音频信息对应的波形图241可显示为红色，第二句音频信息对应的波形图242可显示为绿色，以此，可便于用户可及时了解录音过程中每句话的开始与结束，以随时掌握录音情况。
[0070] 在本实施例的另一种实现方式中，也可在录音结束后生成整个录音文件的波形图，比如可响应于结束录音的指令，根据采集到的所有音频信息、每次分句时的时长信息、每句音频信息对应的参数配置信息生成录音文件及其对应的完整波形图。
[0071] 在本发明实施例中，如图4所示，当结束图标23被触发，比如可通过用户点击来触发，则为接收到结束录音的指令，响应于所述结束录音的指令，则可根据采集到的所有音频信息、每次分句时的时长信息、每句音频信息对应的参数配置信息生成录音文件(本实施例中可称为第一录音文件)及其对应的完整波形图。
[0072] 在该完整波形图中，以句为单位来显示录音文件，且相邻两句音频信息对应位置的显示效果存在差异的，比如可根据上述显示参数配置结果将第一句音频信息的对应位置显示为红色，第二句音频信息的对应位置显示为绿色，以更清晰的区分出每一句音频信息。
[0073] 在实际应用中，还可响应于播放所述录音文件的指令，展示包括所述完整波形图的播放界面并对所述录音文件进行播放，以便根据完整波形图中显示的每句音频信息对应的位置对播放位置进行调整。
[0074] 在本发明实施例的录音应用中，可提供用于展示所有录音文件的录音文件列表，每生成一个录音文件，都可将其加入到录音文件列表中。
[0075] 参看图5,本发明实施例的录音应用中，还可提供用于播放录音文件的播放界面，当用户在所述录音文件列表中选择触发任一录音文件（比如点击了"第一录音文件"），则可显示所述播放界面40并进行第一录音文件的播放，在该播放界面40中可包括开始图标21、暂停图标22等操作选项，且在该播放界面40中还包括第一录音文件对应的完整波形图41，在该完整波形图41中包括第一句音频信息对应的波形图411、第二句音频信息对应的波形图412,等等。
[0076] 以此，可根据在完整波形图中显示的每句音频信息对应的位置，对播放位置（即播放进度)进行调整，以通过在录音文件对应的完整波形图中的以句为单位的位置提示，更快速的在录音文件中查找并定位到想要找的内容，提高查找定位的效率。
[0077] 此外，为了进一步方便用户操作，还可响应于播放在波形图中选定位置的内容的指令，识别所述选定位置对应的音频信息句，获取该句音频信息的内容并进行播放。
[0078] 在具体实现时，当用户点击波形图中的某个位置（比如第一位置），则为接收到响应于播放在波形图中选定位置(第一位置)的内容的指令，响应于播放所述第一位置的内容的指令，可确定所述第一位置在录音文件中所处的录音时长信息，然后根据该录音时长信息确定所属的音频信息句(比如以通过查询表2或表3的方式进行确定），在确定了所属的音频信息句后，获取该句音频信息的内容以进行播放。
[0079] 根据实际需要，可设置为从该句音频信息的开始时间进行播放，以从一句话的开始进行播放，以便于更完整的了解该句话的内容，以实现快速查找到想要找的内容。当然，也可设置为从第二录音时长处开始播放，而无需从该句话的开始进行播放，以便于用户查到定位到想要找的内容，以此，可在更方便用户操作的基础上，提高查找定位效率，提升用户体验。
[0080] 以此，可通过相邻两句音频信息具有不同显示效果的波形图，清晰的区分出每一句音频信息，进而在播放由所有音频信息组成的录音文件时，可根据每句音频信息对应的位置对播放位置进行调整，以更快速的在播放的录音文件中查找并定位到想要找的内容，提高查找定位的效率。
[0081] 下面结合图6所示的本发明实施例提供的录音信息处理装置的结构示意图，对本发明实施例提供的录音信息处理装置进行说明。
[0082]参看图6,所述录音信息处理装置，可包括:获取模块61、分句模块62、配置模块63，其中：
[0083]获取模块61，用于获取采集到的音频信息的分贝值。
[0084] 分句模块62,用于当获取到的分贝值符合预置分句条件时，执行分句操作，并记录分句时的录音时长信息。
[0085] 其中，所述获取到的分贝值符合预置分句条件，比如可包括:所述分贝值低于预置分贝阈值，或所述分贝值低于预置分贝阈值且持续时间长于预置时间。
[0086]配置模块63,用于对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异。
[0087]其中，显示参数中包括显示颜色对应的色值，基于此，所述配置模块63,可具体用于：
[0088] 在每次执行完分句操作后，获取分句位置之前的一句音频信息对应的显示参数中包含的第一色值；
[0089] 将分句位置之后的一句音频信息对应的显示参数中包含的色值设置为与所述第一色值存在视觉差异的第二色值。
[0090] 在具体实现时，所述装置，还可包括：
[0091] 波形图处理模块，可用于在录音的过程中，根据采集到的分贝值、分句时的录音时长信息以及显示参数生成所述音频信息对应的波形图，并进行实时显示。
[0092] 在具体实现时，所述装置，还可包括：
[0093] 时间确定模块，用于根据所述分句时的录音时长信息确定分句位置之前的一句音频信息的结束时间，及分句位置之后的一句音频信息的开始时间。
[0094] 本发明实施例提供的录音信息处理装置，可在录音过程中获取采集到的音频信息的分贝值，在获取到的分贝值符合预置分句条件时，则可执行分句操作并记录分句时的录音时长信息，然后对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异，以此，可通过相邻两句音频信息具有不同显示效果的波形图，清晰的区分出每一句音频信息，进而在播放由所有音频信息组成的录音文件时，可根据每句音频信息对应的位置对播放位置进行调整，以更快速的在播放的录音文件中查找并定位到想要找的内容，提高查找定位的效率。
[0095]本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤;而前述的存储介质包括:R〇M、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
[0096]最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
【主权项】
1. 一种录音信息处理方法，其特征在于，包括：获取采集到的音频信息的分贝值；若获取到的分贝值符合预置分句条件，则执行分句操作，并记录分句时的录音时长信息；对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异。2. 根据权利要求1所述的方法，其特征在于，还包括：在录音的过程中，根据采集到的分贝值、分句时的录音时长信息以及显示参数生成所述音频信息对应的波形图，并进行实时显示。3. 根据权利要求1所述的方法，其特征在于，所述获取到的分贝值符合预置分句条件，包括：所述分贝值低于预置分贝阈值;或所述分贝值低于预置分贝阈值且持续时间长于预置时间。4. 根据权利要求1所述的方法，其特征在于，还包括：根据所述分句时的录音时长信息确定分句位置之前的一句音频信息的结束时间，及分句位置之后的一句音频信息的开始时间。5. 根据权利要求1所述的方法，其特征在于，所述显示参数中包括显示颜色对应的色值；所述对每句音频信息配置用于进行波形图显示的显示参数，包括：在每次执行完分句操作后，获取分句位置之前的一句音频信息对应的显示参数中包含的第一色值；将分句位置之后的一句音频信息对应的显示参数中包含的色值设置为与所述第一色值存在视觉差异的第二色值。6. -种录音信息处理装置，其特征在于，包括：获取模块，用于获取采集到的音频信息的分贝值；分句模块，用于当获取到的分贝值符合预置分句条件时，执行分句操作，并记录分句时的录音时长信息；配置模块，用于对每句音频信息配置用于进行波形图显示的显示参数，使得相邻两句音频信息的波形图的显示效果存在差异。7. 根据权利要求6所述的装置，其特征在于，还包括：波形图处理模块，用于在录音的过程中，根据采集到的分贝值、分句时的录音时长信息以及显示参数生成所述音频信息对应的波形图，并进行实时显示。8. 根据权利要求6所述的装置，其特征在于，所述获取到的分贝值符合预置分句条件，包括：所述分贝值低于预置分贝阈值;或所述分贝值低于预置分贝阈值且持续时间长于预置时间。9. 根据权利要求6所述的装置，其特征在于，还包括：时间确定模块，用于根据所述分句时的录音时长信息确定分句位置之前的一句音频信息的结束时间，及分句位置之后的一句音频信息的开始时间。10.根据权利要求6所述的装置，其特征在于，显示参数中包括显示颜色对应的色值；所述配置模块，具体用于：在每次执行完分句操作后，获取分句位置之前的一句音频信息对应的显示参数中包含的第一色值；将分句位置之后的一句音频信息对应的显示参数中包含的色值设置为与所述第一色值存在视觉差异的第二色值。
【文档编号】G06F17/27GK105868400SQ201610245484
【公开日】2016年8月17日
【申请日】2016年4月19日
【发明人】郭于晨
【申请人】乐视控股（北京）有限公司, 乐视移动智能信息技术（北京）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭于晨;
技术所有人：乐视控股（北京）有限公司;乐视移动智能信息技术（北京）有限公司;
我是此专利的发明人

上一篇：用于终端设备的图片管理方法及终端设备的制造方法
上一篇：相册文件夹的管理方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。