一种语音记录的方法及装置与流程

文档序号：12789781阅读：209来源：国知局

本发明实施例涉及智能终端领域，尤其涉及一种语音记录的方法及装置。

背景技术：

由于无线移动通信技术的飞速发展，用户应用无线移动通信设备进行语音通信已成为必不可少的通信方式。

用户在通过手机、平板等通话终端接听电话时经常会遇到以下场景，比如甲方在电话中告诉乙方一些重要的信息，例如电话会议，领导通过通话终端向下属传达一些重要信息，下属需要记录下领导传达的内容，并整理成稿，由于记忆力有限，很容易忘记一些重要内容，给之后的工作带来困扰。

在现有技术中，用户为解决此类问题，可以选择通话终端自带的录音功能，对通话内容进行录音，然后将录音内容整理成稿。但这种方式存在如下缺点：即便用户对通话内容进行录音，仍需要用户事后边听取录音边拿笔和纸进行记录，依旧不方便。

技术实现要素：

本发明实施例提供一种语音记录的方法及装置，使得语音的记录更加便捷。

第一方面，本发明实施例提供了一种语音记录的方法，该方法包括：

于第一采集单元处于工作状态下获取第一音频信息、所述第一音频信息产生时间，并于所述第一采集单元处于空闲状态根据所述第一音频信息形成与所述第一音频信息对应的文本数据；

于第二采集单元处于工作状态下获取第二音频信息、所述第二音频信息产生时间，并于所述第二采集单元处于空闲状态根据所述第二音频信息形成与所述第二音频信息对应的文本数据；

于所述第一采集单元和/或所述第二采集单元处于空闲状态下根据所述第一音频信息产生时间和所述第二音频信息产生时间对所述第一音频信息对应的文本数据和所述第二音频信息对应的文本数据进行排序以形成一文本文件。

进一步的，还包括：

建立所述第一音频信息对应的文本数据和所述第一音频信息产生时间之间的对应关系；

建立所述第二音频信息对应的文本数据和所述第二音频信息产生时间之间的对应关系。

进一步的，于所述第一采集单元和/或所述第二采集单元处于空闲状态下根据所述第一音频信息产生时间和所述第二音频信息产生时间对所述第一音频信息对应的文本数据和所述第二音频信息对应的文本数据进行排序以形成一文本文件，包括：

于所述第一采集单元和/或所述第二采集单元处于空闲状态下，且经过预设时间后，根据所述第一音频信息产生时间和所述第二音频信息产生时间对所述第一音频信息对应的文本数据和所述第二音频信息对应的文本数据进行排序以形成一文本文件。

进一步的，还包括：

对文本数据中的错误文字数据进行标记，并将标记的所述错误文字数据与对应所述错误文字数据的音频信息建立映射关系，其中，所述文本数据包括正确文字数据和错误文字数据。

第二方面，本发明实施例还提供了一种语音记录的装置，该装置包括：

第一文本数据形成模块，用于于第一采集单元处于工作状态下获取第一音频信息、所述第一音频信息产生时间，并于所述第一采集单元处于空闲状态根据所述第一音频信息形成与所述第一音频信息对应的文本数据；

第二文本数据形成模块，用于于第二采集单元处于工作状态下获取第二音频信息、所述第二音频信息产生时间，并于所述第二采集单元处于空闲状态根据所述第二音频信息形成与所述第二音频信息对应的文本数据；

文本文件形成模块，用于于所述第一采集单元和/或所述第二采集单元处于空闲状态下根据所述第一音频信息产生时间和所述第二音频信息产生时间对所述第一音频信息对应的文本数据和所述第二音频信息对应的文本数据进行排序以形成一文本文件。

进一步的，还包括：

第一对应关系建立模块，用于建立所述第一音频信息对应的文本数据和所述第一音频信息产生时间之间的对应关系；

第二对应关系建立模块，用于建立所述第二音频信息对应的文本数据和所述第二音频信息产生时间之间的对应关系。

进一步的，所述文本文件形成模块具体用于：

进一步的，还包括：

映射关系建立模块，用于对文本数据中的错误文字数据进行标记，并将标记的所述错误文字数据与对应所述错误文字数据的音频信息建立映射关系，其中，所述文本数据包括正确文字数据和错误文字数据。

本发明实施例通过于第一采集单元处于工作状态下获取第一音频信息、第一音频信息产生时间，并于第一采集单元处于空闲状态根据第一音频信息形成与第一音频信息对应的文本数据；于第二采集单元处于工作状态下获取第二音频信息、第二音频信息产生时间，并于第二采集单元处于空闲状态根据第二音频信息形成与第二音频信息对应的文本数据；于第一采集单元和/或第二采集单元处于空闲状态下根据第一音频信息产生时间和第二音频信息产生时间对第一音频信息对应的文本数据和第二音频信息对应的文本数据进行排序以形成一文本文件。避免了由于记忆力有限而导致忘记语音通话过程中的一些重要内容的情况，或者避免了由于采用对语音通话进行录音的方式记录语音通话内容、边听取录音边拿笔和纸进行记录将录音内容整理成稿，导致语音记录过程非常繁琐的情况，能够使得语音的记录更加便捷，提升用户体验。

附图说明

图1是本发明实施例一中的一种语音记录的方法的流程图；

图2是本发明实施例二中的一种语音记录的方法的流程图；

图3是本发明实施例三中的一种语音记录的装置的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种语音记录的方法的流程图，本实施例可适用于语音记录的情况，该方法可以由本发明实施例提供的语音记录的装置来执行，该装置可采用软件和/或硬件的方式实现，如图1所示，该方法具体包括如下步骤：

S110，于第一采集单元处于工作状态下获取第一音频信息、所述第一音频信息产生时间，并于所述第一采集单元处于空闲状态根据所述第一音频信息形成与所述第一音频信息对应的文本数据。

其中，所述第一采集单元处于工作状态下可以为在两个用户进行通话过程中时第一采集单元处于工作状态，也可以为两个用户通过通讯类应用进行语音通话的过程中第一采集单元处于工作状态。

其中，所述第一音频信息为进行语音通话的用户发出的音频信息。所述第一音频信息产生时间可以为第一采集单元采集到用户刚开始发出音频信息的时间，也可以为第一采集单元采集到用户结束发出音频信息的时间，本实施例对此不进行限制。

其中，所述第一采集单元处于空闲状态指的是用户没有发出音频信息的情况下，第一采集单元不用采集音频信息的状态。

S120，于第二采集单元处于工作状态下获取第二音频信息、所述第二音频信息产生时间，并于所述第二采集单元处于空闲状态根据所述第二音频信息形成与所述第二音频信息对应的文本数据。

其中，所述第二采集单元处于工作状态下可以为在两个用户进行通话过程中时第二采集单元处于工作状态，也可以为两个用户通过通讯类应用进行语音通话的过程中第二采集单元处于工作状态。

其中，所述第二音频信息为与用户进行语音通话的其他用户发出的音频信息。所述第二音频信息产生时间可以为第二采集单元采集到与用户进行语音通话的其他用户刚开始发出音频信息的时间，也可以为第二采集单元采集到与用户进行语音通话的其他用户结束发出音频信息的时间，本实施例对此不进行限制。

其中，所述第二采集单元处于空闲状态指的是与用户进行语音通话的其他用户没有发出音频信息的情况下，第二采集单元不用采集音频信息的状态。

在一个具体的例子中，用户A和用户B在进行通话的过程中，第一采集单元在用户A侧，第二采集单元在用户B侧，当用户A在说话的过程中，第一采集单元处于工作状态，第一采集单元采集用户A说的话，记录采集到用户A说的话的时间，用户A说完，将第一采集单元采集到的用户A说的话翻译成文字，用户A说完后用户B说话，第二采集单元处于工作状态，第二采集单元采集用户B说的话，记录采集到用户B说的话的时间，利用用户B说话的空闲，将用户A说的话翻译成文字；用户B说完后用户A说话，利用用户A说话的空闲，将用户B说的话翻译成文字。

S130，于所述第一采集单元和/或所述第二采集单元处于空闲状态下根据所述第一音频信息产生时间和所述第二音频信息产生时间对所述第一音频信息对应的文本数据和所述第二音频信息对应的文本数据进行排序以形成一文本文件。

其中，所述文本文件的记录形式为按照用户说话的时间的顺序进行记录用户说话的内容。

具体的，若满足第一采集单元处于空闲状态下，则对文本数据进行排序形成文本文件；若满足第二采集单元处于空闲状态下，则对文本数据进行排序形成文本文件；若满足第一采集单元和第二采集单元处于空闲状态下，则对文本数据进行排序形成文本文件。

可选的，还包括：

建立所述第一音频信息对应的文本数据和所述第一音频信息产生时间之间的对应关系；

建立所述第二音频信息对应的文本数据和所述第二音频信息产生时间之间的对应关系。

具体的，可以预先建立第一音频信息对应的文本数据和所述第一音频信息产生时间之间的对应关系和第二音频信息对应的文本数据和所述第二音频信息产生时间之间的对应关系，然后根据上述对应关系形成一文本文件。

可选的，于所述第一采集单元和/或所述第二采集单元处于空闲状态下根据所述第一音频信息产生时间和所述第二音频信息产生时间对所述第一音频信息对应的文本数据和所述第二音频信息对应的文本数据进行排序以形成一文本文件，包括：

其中，所述预设时间为从开始采集音频信息至对文本数据进行排序形成文本文件的时间。预设时间可以为根据经验进行设定的值，也可以为根据主观想法进行设定的值。本实施例对此不进行限制。

具体的，若满足第一采集单元处于空闲状态下，且经过预设时间，则对文本数据进行排序形成文本文件；若满足第二采集单元处于空闲状态下，且经过预设时间，则对文本数据进行排序形成文本文件；若满足第一采集单元和第二采集单元处于空闲状态下，且经过预设时间，则对文本数据进行排序形成文本文件。

在一个具体的例子中，通话过程中加入一种模式，就是“录音记录”模式，也就是把录音到的音频信息通过语音识别功能翻译成文字，并标注具体的说话时间。语音通话过程中，当点击录音记录模式后，系统分为两部分，一部分就是普通的录音功能，会把听到的声音直接录制下来；另一部分是将录制下来的音频文件在后台进行杂音处理，也就是把不符合人声的声音去除掉，采集到声音后，通过语音识别技术翻译成文字。例如可以是用户A和用户B两人进行语音通话，通常通话的时候会有时间，记录的时候，根据时间来记录对话，按时间顺序计入，若用户A先开始说话，则第一采集单元采集用户A说的话、记录用户A说话的时间以及将用户A说的话以文本的形式进行记录，用户A说完用户B开始说话的时候，第二采集单元会采集用户B说的话、记录用户B说话的时间以及将用户B说的话以文本的形式进行记录。将根据音频信息对应的文本数据按照时间的顺序进行排序，形成一文本文件，例如：用户A：…，用户B：…，用户A：…，用户B：…，用户A：…。

本实施例的技术方案，通过于第一采集单元处于工作状态下获取第一音频信息、第一音频信息产生时间，并于第一采集单元处于空闲状态根据第一音频信息形成与第一音频信息对应的文本数据；于第二采集单元处于工作状态下获取第二音频信息、第二音频信息产生时间，并于第二采集单元处于空闲状态根据第二音频信息形成与第二音频信息对应的文本数据；于第一采集单元和/或第二采集单元处于空闲状态下根据第一音频信息产生时间和第二音频信息产生时间对第一音频信息对应的文本数据和第二音频信息对应的文本数据进行排序以形成一文本文件。避免了由于记忆力有限而导致忘记语音通话过程中的一些重要内容的情况，或者避免了由于采用对语音通话进行录音的方式记录语音通话内容、边听取录音边拿笔和纸进行记录将录音内容整理成稿，导致语音记录过程非常繁琐的情况，能够使得语音的记录更加便捷，提升用户体验。

实施例二

图2为本发明实施例二提供的一种语音记录的方法的流程图，本实施例以前述实施例一为基础进行优化，提供了优选的语音记录的方法，具体是，还包括：对文本数据中的错误文字数据进行标记，并将标记的所述错误文字数据与对应所述错误文字数据的音频信息建立映射关系，其中，所述文本数据包括正确文字数据和错误文字数据。

相应的，本实施例的方法具体包括如下步骤：

S210，于第一采集单元处于工作状态下获取第一音频信息、所述第一音频信息产生时间，并于所述第一采集单元处于空闲状态根据所述第一音频信息形成与所述第一音频信息对应的文本数据。

S220，于第二采集单元处于工作状态下获取第二音频信息、所述第二音频信息产生时间，并于所述第二采集单元处于空闲状态根据所述第二音频信息形成与所述第二音频信息对应的文本数据。

S230，于所述第一采集单元和/或所述第二采集单元处于空闲状态下根据所述第一音频信息产生时间和所述第二音频信息产生时间对所述第一音频信息对应的文本数据和所述第二音频信息对应的文本数据进行排序以形成一文本文件。

S240，对文本数据中的错误文字数据进行标记，并将标记的所述错误文字数据与对应所述错误文字数据的音频信息建立映射关系，其中，所述文本数据包括正确文字数据和错误文字数据。

具体的，点击所述错误文字数据时，采用语音转化软件对与错误文字数据关联链接的音频信息进行二次识别，并在文档中对二次识别出来的文字信息进行可编辑显示。

具体的，在对文本数据进行排序时，文本数据包括了正确文字数据和错误文字数据。因此，本发明采用对错误文字数据进行标记，例如可以是，可以对错误文字数据进行红色下划线标记，或者进行改变字体颜色进行标记，也或者是通过批注的方式进行标记。同时，将该标记的错误文字数据与对应错误文字数据的音频信息进行关联链接，当点击在错误文字数据时，将对应所述错误文字数据的音频信息进行二次识别，并在文档中对二次识别出来的文字信息数据进行可编辑显示。这样，就可以通过可编辑显示中对错误文字数据进行更正编辑，以得到更正的文字信息数据，并用所述更正的文字信息数据替换所述错误文字数据。

在一个具体的例子中，第一音频信息中所讲的内容是“你真好，一起去逛公园吧”，在对第一音频信息进行识别转换后，得到的内容是“你正好，一起去关公员板”，那么可以看到，其中“正好”和“关公员板”是错误文字数据，因此，在形成文本文件时，会对错误文字数据“正好”和“关公员板”进行标记。可以由人工来对错误文字数据进行更正，更正的方法就是点击在文本文件中标记出来的错误文字数据，由于错误文字数据关联链接第一音频信息，那么将对第一音频信息进行二次识别转换，并在文本文件中进行可编辑显示，比如，显示为“真好、整好、真、针、挣、证……”，从可编辑内容中有正确的文字，那么可以直接点击“真好”来进行选择，那么之后“真好”将替换错误文字数据“正好”，如果是可编辑内容中没有正确的对应文字，比如显示的是“整好、真、针、挣、证……”，那么可以先点击“真”，那么接下来会自动地再显示与“真”配对的文字，如“好、豪、号……”，此时，可以再选择“好”，以此来完成错误文字信息的更正。也可以是，将对应所述错误文字数据的音频信息插入文本文件中，通过人工点击音频信息，直接手动更改错误文字数据。

本实施例的技术方案，通过对文本数据中的错误文字数据进行标记，并将标记的所述错误文字数据与对应所述错误文字数据的音频信息建立映射关系。能够使得语音的记录更加便捷、准确，提升用户体验。

实施例三

图3为本发明实施例三提供的一种语音记录的装置的结构示意图。本实施例可适用于语音记录的情况，该装置可采用软件和/或硬件的方式实现，如图3所示，所述语音记录的装置包括第一文本数据形成模块310、第二文本数据形成模块320和文本文件形成模块330。

其中，第一文本数据形成模块310，用于于第一采集单元处于工作状态下获取第一音频信息、所述第一音频信息产生时间，并于所述第一采集单元处于空闲状态根据所述第一音频信息形成与所述第一音频信息对应的文本数据；

第二文本数据形成模块320，用于于第二采集单元处于工作状态下获取第二音频信息、所述第二音频信息产生时间，并于所述第二采集单元处于空闲状态根据所述第二音频信息形成与所述第二音频信息对应的文本数据；

文本文件形成模块330，用于于所述第一采集单元和/或所述第二采集单元处于空闲状态下根据所述第一音频信息产生时间和所述第二音频信息产生时间对所述第一音频信息对应的文本数据和所述第二音频信息对应的文本数据进行排序以形成一文本文件。

可选的，还包括：

第一对应关系建立模块，用于建立所述第一音频信息对应的文本数据和所述第一音频信息产生时间之间的对应关系；

第二对应关系建立模块，用于建立所述第二音频信息对应的文本数据和所述第二音频信息产生时间之间的对应关系。

可选的，所述文本文件形成模块330具体用于：

可选的，还包括：

上述产品可执行本发明任意实施例所提供的方法，具备执行方法相应的功能模块和有益效果。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李承敏;王文斌;叶巧莉;包振毅
技术所有人：上海与德科技有限公司
我是此专利的发明人

上一篇：一种数据处理方法和装置与流程
上一篇：一种柔性臂仿生机器人的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。