外语音频信息的处理方法及装置与流程

文档序号：11134019阅读：574来源：国知局

本发明实施例涉及软件领域，具体涉及一种外语音频信息的处理方法及装置。

背景技术：

随着软件应用的不断发展，越来越多的用户开始使用APP软件来学习外语。例如华尔街英语，51talk，喜马拉雅等等。这些外语学习软件一般通过外语情景对话的方式，帮助用户提高外语听说的能力。但用户在使用时，如果遇到外语音频中有不熟悉的单词时，可能导致与其上下文相关的外语音频对话理解发生偏差的情况，对用户的外语学习造成困难。

在实现本发明的过程中，发明人发现：当用户发生对外语音频中单词不了解的情况时候，一般都采用先猜测其中文含义，再通过翻译软件根据中文翻译为英文相应读音的单词，与外语音频中的单词相比较，进行学习。这种方式耗时较长，猜测中文含义再翻译为英文也有可能导致错误而无法学习到正确的英文。也有些用户通过查找软件相关的英文书面教程的方式来学习不了解的单词，但现有的软件大多数还无法直接提供配套的书面教程，都需要用户花费时间去查找相关的资料信息。这些情况都导致了用户在学习时遇到不熟悉的单词时无法及时获得相关的单词信息，使得学习效率较低的情况。

技术实现要素：

本发明实施例的发明目的是针对现有技术的缺陷，提供了一种外语音频信息的处理方法及装置，用于解决学习外语音频在遇到不熟悉的单词时无法及时获取相关信息的问题。

根据本发明实施例的一个方面，提供了一种外语音频信息的处理方法，包括：响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息；对外语音频信息进行识别处理，将外语音频信息转换为对应的外语内容；利用对话框显示对应外语内容的相关信息。

可选地，响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息进一步包括：响应于用户单击指定按钮操作，执行开始录制外语音频；用户点击指定按钮的时间为开始时间；响应于用户松开指定按钮操作，结束录制外语音频；用户松开指定按钮的时间为结束时间；获取录制得到的外语音频信息。

可选地，响应于用户单击指定按钮操作，执行开始录制外语音频进一步包括：响应于用户单击指定按钮操作，开始录制用户重复外语的读音；用户重复外语的读音为外语音频。

可选地，响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息进一步包括：根据用户设置的开始时间和结束时间，截取位于开始时间和结束时间之间的外语学习软件播放的外语音频的波形。

可选地，外语内容相关信息包括：外语单词、外语音标、语义、近义词和/或反义词。

根据本发明实施例的另一个方面，提供了一种外语音频信息的处理装置，包括：获取模块，用于响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息；转换模块，用于对外语音频信息进行识别处理，将外语音频信息转换为对应的外语内容；显示模块，用于利用对话框显示对应外语内容的相关信息。

可选地，获取模块还包括：开始模块，用于响应于用户单击指定按钮操作，执行开始录制外语音频；用户点击指定按钮的时间为开始时间；结束模块，用于响应于用户松开指定按钮操作，结束录制外语音频；用户松开指定按钮的时间为结束时间；获取模块进一步用于：获取录制得到的外语音频信息。

可选地，开始模块进一步用于：响应于用户单击指定按钮操作，开始录制用户重复外语的读音；用户重复外语的读音为外语音频。

可选地，获取模块还包括：截取模块，用于根据用户设置的开始时间和结束时间，截取位于开始时间和结束时间之间的外语学习软件播放的外语音频的波形。

可选地，外语内容相关信息包括：外语单词、外语音标、语义、近义词和/或反义词。

根据本发明实施例提供的外语音频信息的处理方法及装置，响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息。对外语音频信息进行识别处理，将外语音频信息转换为对应的外语内容，并利用对话框显示对应外语内容的相关信息，及时准确的提供给用户外语音频的相关信息，帮助用户进一步理解不熟悉的外语音频，节省用户查找时间。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明提供的外语音频信息的处理方法实施例一的流程图；

图2示出了本发明提供的外语音频信息的处理方法实施例二的流程图；

图3示出了本发明提供的外语音频信息的处理装置实施例一的功能框图；

图4示出了本发明提供的外语音频信息的处理装置实施例二的功能框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

外语音频一般有其限定的情景、主题，通过对话或单人朗读的方式，提供给用户一段外语语音内容。用户通过去听外语音频中的每个单词的读音，理解其中的含义，进而提升外语的听力水平。

图1示出了本发明提供的外语音频信息的处理方法实施例一的流程图。如图1所示，外语音频信息的处理方法包括如下步骤：

步骤S101，响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息。

用户在根据自己需要获取外语音频时，需要设置获取的开始时间和结束时间。开始时间和结束时间的设置通过用户手动设置。如用户可以通过输入开始时间点和结束时间点的方式进行设置，界面显示两个时间点的输入框，用户输入开始时间1:30，结束时间1:45。也可以通过显示整个外语音频的时间长度，手动挪动时间点的方式进行设置，如界面上显示出整个外语音频的时间轴，同时设置两条时间点的线条，用户手动挪动开始时间点的线条设置开始时间，挪动结束时间点的线条设置结束时间。用户还可以单击指定的按钮，用户点击指定按钮的时间即开始时间。当用户松开指定按钮的时间记录为结束时间。具体的指定按钮可以为本发明实施例中新指定的按钮，也可以使用终端设备现有的按钮。以上设置开始时间和结束时间的方式可根据实际情况进行设置，此处不做具体限定。

外语音频为用户当前正在播放的外语音频，用户可以在听取外语音频时，随时进行录制。以用户单击指定按钮为例，进行说明。当用户单击指定按钮后，响应于用户单击指定按钮操作，开始对外语音频进行录制，至用户松开指定按钮。此时，响应于用户松开指定按钮操作，结束对外语音频的录制。从中获取录制得到的外语音频信息。

除对当前正在播放的外语音频进行录制外，还可以随时随地地录制用户自己的语音。如录制用户重复自己不理解的单词的外语读音。用户先单击指定按钮，响应于用户单击指定按钮操作，开始执行录制。此时用户重复外语读音，重复后，用户松开指定按钮，响应于用户松开指定按钮操作，结束录制。获取用户重复的外语音频信息。

步骤S102，对外语音频信息进行识别处理，将外语音频信息转换为对应的外语内容。

对获取的外语音频信息进行识别处理，得到外语音频信息中包含的外语内容。识别时采用外语音识别技术，可以采用现有的如Google、Nuance公司开发的商业语言识别引擎，对外语音频进行分析处理，得到对应的外语内容。

步骤S103，利用对话框显示对应外语内容的相关信息。

在得到外语音频信息对应的外语内容后，还可以对该外语内容做进一步的检索。如连接云端服务器，检索获取该外语内容对应的外语音标、中文语义、近义词、反义词等，还可以检索得到使用该外语内容的例句等等，并将这些信息利用对话框的方式显示出来，用户可以更方便的了解该外语内容的相关信息。

进一步，在获取到位于开始时间和结束时间之间的外语音频信息后，将该外语音频信息加入用户预设的音频列表中。当用户选中该外语音频时，还可以自动循环播放该外语音频，以方便用户强化听力训练。

根据本发明实施例提供的外语音频信息的处理方法，响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息。对外语音频信息进行识别处理，将外语音频信息转换为对应的外语内容，并利用对话框显示对应外语内容的相关信息，及时准确的提供给用户外语音频的相关信息，帮助用户进一步理解不熟悉的外语音频，节省用户查找时间。

图2示出了本发明提供的外语音频信息的处理方法实施例二的流程图。如图2所示，本实施例中，方法包括如下步骤：

步骤S201，根据用户设置的开始时间和结束时间，截取位于开始时间和结束时间之间的外语学习软件播放的外语音频的波形。

用户在听外语音频后，对其中不理解的音频部分，可以进行截取。截取时需要先设置音频的开始时间和结束时间。如用户可以通过输入开始时间点和结束时间点的方式进行设置，界面显示两个时间点的输入框，用户输入开始时间1:30，结束时间1:45。也可以通过显示整个外语音频的时间长度，手动挪动时间点的方式进行设置，如界面上显示出整个外语音频的时间轴，同时设置两条时间点的线条，用户手动挪动开始时间点的线条设置开始时间，挪动结束时间点的线条设置结束时间。用户还可以单击指定的按钮，用户点击指定按钮的时间即开始时间。当用户松开指定按钮的时间记录为结束时间。具体的指定按钮可以为本发明实施例中新指定的按钮，也可以使用终端设备现有的按钮。以上设置开始时间和结束时间的方式可根据实际情况进行设置，此处不做具体限定。

在用户设置开始时间和结束时间后，截取位于开始时间和结束时间之间的外语音频的波形，即音频信号。

步骤S202，对外语音频波形进行识别处理，将外语音频转换为对应的外语内容。

对获取的外语音频的波形进行识别处理，识别处理时对外语音频的波形的每帧语音进行整理，若干帧的语音组合后通过语音识别为单词，进而得到对应的外语内容。

步骤S203，利用对话框显示对应外语内容的相关信息。

本步骤可参考方法实施例一步骤S103的描述，在此不再赘述。

根据本发明实施例提供的外语音频信息的处理方法，根据用户设置的开始时间和结束时间，截取位于开始时间和结束时间之间的外语学习软件播放的外语音频的波形，可以更直观的反映外语音频中的音调、音节结尾等信息，帮助用户更准确的得到其对应的外语内容。

图3示出了本发明提供的外语音频信息的处理装置实施例一的功能框图。如图3所示，外语音频信息的处理装置包括如下模块：

获取模块310，用于响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息。

获取模块310获取外语音频时，先设置获取的开始时间和结束时间。开始时间和结束时间的设置可由用户手动设置。如用户可以通过输入开始时间点和结束时间点的方式进行设置，界面显示两个时间点的输入框，用户输入开始时间1:30，结束时间1:45，获取模块310获取用户输入的两个时间。也可以通过获取模块310显示整个外语音频的时间长度，用户手动挪动时间点的方式进行设置，如界面上显示出整个外语音频的时间轴，获取模块310同时设置两条时间点的线条，用户手动挪动开始时间点的线条设置开始时间，挪动结束时间点的线条设置结束时间，获取模块310得到开始时间和结束时间。获取模块310还可以响应于用户单击指定的按钮进行设置开始时间和结束时间。如用户点击指定按钮的时间即开始时间。当用户松开指定按钮的时间记录为结束时间。具体的指定按钮可以为本发明实施例中新指定的按钮，也可以使用终端设备现有的按钮。以上设置开始时间和结束时间的方式可根据实际情况进行设置，此处不做具体限定。

外语音频为用户当前正在播放的外语音频，用户可以在听取外语音频时，执行获取模块310随时进行外语音频的录制。以获取模块310响应于用户单击指定按钮为例，进行说明。

获取模块310进一步包括了开始模块311和结束模块312。开始模块311响应于用户单击指定按钮操作，开始对外语音频进行录制，至用户松开指定按钮。此时，结束模块312响应于用户松开指定按钮操作，结束对外语音频的录制。获取模块310获取到录制的外语音频信息。

除对当前正在播放的外语音频进行录制外，获取模块310还可以随时随地地录制用户自己的语音。如获取模块310录制用户重复自己不理解的单词的外语读音。开始模块312进一步用于响应于用户单击指定按钮操作，开始执行录制。此时用户重复外语读音，重复后，用户松开指定按钮，结束模块312响应于用户松开指定按钮操作，结束录制。获取模块310获取到用户重复的外语音频信息。

转换模块320，用于对外语音频信息进行识别处理，将外语音频信息转换为对应的外语内容。

转换模块320对获取模块310获取到的外语音频信息进行识别处理，得到外语音频信息中包含的外语内容。转换模块320识别时采用外语语音识别技术，可以采用现有的如Google、Nuance公司开发的商业语言识别引擎，对外语音频进行分析处理，得到对应的外语内容。

显示模块330，用于利用对话框显示对应外语内容的相关信息。

执行转换模块320得到外语音频信息对应的外语内容后，显示模块330还可以对该外语内容做进一步的检索。如显示模块330连接云端服务器，检索获取该外语内容对应的外语音标、中文语义、近义词、反义词等，还可以检索得到使用该外语内容的例句等等。检索获得相关的信息后，显示模块330将这些信息利用对话框的方式显示出来，用户可以更方便的了解该外语内容的相关信息。

进一步，在获取模块310获取到位于开始时间和结束时间之间的外语音频信息后，获取模块310还可以将该外语音频信息加入用户预设的音频列表中。当用户选中该外语音频时，获取模块310还可以自动循环播放该外语音频，以方便用户强化听力训练。

根据本发明实施例提供的外语音频信息的处理装置，响应于用户设置的开始时间和结束时间，获取位于开始时间和结束时间之间的外语音频信息。对外语音频信息进行识别处理，将外语音频信息转换为对应的外语内容，并利用对话框显示对应外语内容的相关信息，及时准确的提供给用户外语音频的相关信息，帮助用户进一步理解不熟悉的外语音频，节省用户查找时间。

图4示出了本发明提供的外语音频信息的处理装置实施例二的功能框图。如图4所示，本实施例中外语音频信息的处理装置与图3相比，获取模块310中还包括了：截取模块313。

截取模块313，用于根据用户设置的开始时间和结束时间，截取位于开始时间和结束时间之间的外语学习软件播放的外语音频的波形。

用户在听外语音频后，对其中不理解的音频部分，可以通过截取模块313进行截取。截取模块313截取时需要先设置音频的开始时间和结束时间。如用户可以通过输入开始时间点和结束时间点的方式进行设置，界面显示两个时间点的输入框，用户输入开始时间1:30，结束时间1:45，截取模块313获取用户输入的两个时间。也可以通过截取模块313显示整个外语音频的时间长度，手动挪动时间点的方式进行设置，如界面上显示出整个外语音频的时间轴，同时设置两条时间点的线条，用户手动挪动开始时间点的线条设置开始时间，挪动结束时间点的线条设置结束时间，截取模块313得到开始时间和结束时间。截取模块313还可以响应于用户单击指定的按钮进行设置开始时间和结束时间。如用户点击指定按钮的时间即开始时间。当用户松开指定按钮的时间记录为结束时间。具体的指定按钮可以为本发明实施例中新指定的按钮，也可以使用终端设备现有的按钮。以上设置开始时间和结束时间的方式可根据实际情况进行设置，此处不做具体限定。

截取模块313在用户设置开始时间和结束时间后，截取位于开始时间和结束时间之间的外语音频的波形，即音频信号。

转换模块320还用于对截取模块313获取的外语音频波形进行识别处理。转换模块320识别处理时对外语音频波形的每帧语音进行整理，若干帧的语音组合后通过语音识别为单词，进而得到对应的外语内容。

根据本发明实施例提供的外语音频信息的处理装置，根据用户设置的开始时间和结束时间，截取位于开始时间和结束时间之间的外语学习软件播放的外语音频的波形，可以更直观的反映外语音频中的音调、音节结尾等信息，帮助用户更准确的得到其对应的外语内容。

上述说明示出并描述了本申请的若干优选实施例，但如前所述，应当理解本申请并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述发明构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围，则都应在本申请所附权利要求的保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李云龙;
技术所有人：乐视控股（北京）有限公司;乐视致新电子科技（天津）有限公司;
我是此专利的发明人

上一篇：一种从海量数据中高效计算多个维度用户数的方法与制造工艺
上一篇：一种信息同步更新的方法及系统与制造工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。