一种智能播放视频中语音信息的方法及装置与流程

文档序号：12279845阅读：351来源：国知局

本发明涉及视频播放技术领域，特别涉及一种智能播放视频中语音信息的方法及装置。

背景技术：

通过各种类型的视频来学习外语，是非常流行的一种外语学习方式。通过跟读的模式可以很好的对比出用户本人的口语的不足，不看字幕只是听视频中语音也可以很好的锻炼外语听力能力。但是，除了专门的外语教学视频之外，针对一般的外语视频，用户需要频繁的按下暂停键和后退键，来学习其中某一句或几句的外语语句。这对于用户而言，长时间内频繁的操作会带给用户疲劳的感受，不言而喻用户体验是不够友善的。还有儿童在学习语言时，具有很强的模仿倾向，但是除了教学视频之外的其他视频中，因为对话内容是紧密相连的，儿童通常没有足够的时间去模仿。如何妥善的解决上述问题，就成了业界亟待解决的课题。

技术实现要素：

本发明提供一种智能播放视频中语音信息的方法及装置，用以帮助语言学习者通过观赏非语言教学视频来学习听力和口语，提高了语言学习者的用户体验。

根据本发明实施例的第一方面，提供一种智能播放视频中语音信息的方法，包括：

分析视频中的语句信息；

根据所述语句信息，识别出所述视频中的所有整句；

在一个整句播放结束后，在满足预设的继续播放条件的情况下，继续播放所述视频的下一个整句。

在一个实施例中，所述在一个整句播放结束后，在满足预设的继续播放条件的情况下，继续播放所述视频的下一个整句，包括：

在一个整句播放结束后，重复播放所述整句；

统计播放所述整句的次数；

当所述次数达到预设的终止阈值时，终止播放所述整句。

在一个实施例中，所述在一个整句播放结束后，在满足预设的继续播放条件的情况下，继续播放所述视频的下一个整句，还包括：

在一个整句播放结束后，统计出所述整句的播放时长；

根据所述整句的播放时长和预设的扩大系数，设置出暂停所述整句的暂停时长；

在当一个整句结束时，在暂停所述暂停时长之后，继续播放所述视频的下一个整句。

在一个实施例中，所述在当一个整句结束时，暂停所述暂停时长之后，继续播放所述视频的下一个整句，包括：

在所述暂停时长的时间间隔内，获取用户输入的语音信息；

当用户输入的语音信息与所述整句的语音信息的相似度大于或等于预设的相似度阈值时，继续播放所述视频的下一个整句。

在一个实施例中，所述在当一个整句结束时，暂停所述暂停时长之后，继续播放所述视频的下一个整句，还包括：

在所述暂停时长的时间间隔内，获取用户输入的语音信息；

当用户输入的语音信息与所述整句的语音信息的相似度低于预设的相似度阈值时，标记所述整句为用户需要注意的整句；

询问用户是否重复播放所述整句；

根据用户的输入信息，判断是否重复播放所述整句。

根据本发明实施例的第二方面，提供一种智能播放视频中语音信息的装置，包括：

分析模块，用于分析视频中的语句信息；

识别模块，用于根据所述语句信息，识别出所述视频中的所有整句；

播放模块，用于在一个整句播放结束后，在满足预设的继续播放条件的情况下，继续播放所述视频的下一个整句。

在一个实施例中，所述播放模块，包括：

第一播放子模块，用于在一个整句播放结束后，重复播放所述整句；

第一统计子模块，用于统计播放所述整句的次数；

终止子模块，用于当所述次数达到预设的终止阈值时，终止播放所述整句。

在一个实施例中，所述播放模块，还包括：

第二统计子模块，用于在一个整句播放结束后，统计出所述整句的播放时长；

设置子模块，用于根据所述整句的播放时长和预设的扩大系数，设置出暂停所述整句的暂停时长；

第二播放子模块，用于在当一个整句结束时，在暂停所述暂停时长之后，继续播放所述视频的下一个整句。

在一个实施例中，所述第二播放子模块，还用于在所述暂停时长的时间间隔内，获取用户输入的语音信息；当用户输入的语音信息与所述整句的语音信息的相似度大于或等于预设的相似度阈值时，继续播放所述视频的下一个整句。

在一个实施例中，所述第二播放子模块，还用于在所述暂停时长的时间间隔内，获取用户输入的语音信息；当用户输入的语音信息与所述整句的语音信息的相似度低于预设的相似度阈值时，标记所述整句为用户需要注意的整句；询问用户是否重复播放所述整句；根据用户的输入信息，判断是否重复播放所述整句。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明一示例性实施例示出的一种智能播放视频中语音信息的方法的流程图；

图2为本发明一示例性实施例示出的一种智能播放视频中语音信息的方法的步骤S13的实施方式一的流程图；

图3为本发明一示例性实施例示出的一种智能播放视频中语音信息的方法的步骤S13的实施方式二的流程图；

图4为本发明一示例性实施例示出的一种智能播放视频中语音信息的方法的步骤S33的实施方式一的流程图；

图5为本发明一示例性实施例示出的一种智能播放视频中语音信息的方法的步骤S33的实施方式二的流程图；

图6为本发明一示例性实施例示出的一种智能播放视频中语音信息的装置的框图；

图7为本发明一示例性实施例示出的一种智能播放视频中语音信息的装置的播放模块63的框图；

图8为本发明另一示例性实施例示出的一种智能播放视频中语音信息的装置的播放模块63的框图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

图1是根据一示例性实施例示出的一种智能播放视频中语音信息的方法流程图，如图1所示，该智能播放视频中语音信息的方法，包括以下步骤S11-S13：

在步骤S11中，分析视频中的语句信息；

在步骤S12中，根据所述语句信息，识别出所述视频中的所有整句；

在步骤S13中，在一个整句播放结束后，在满足预设的继续播放条件的情况下，继续播放所述视频的下一个整句。

在一个实施例中，视频包括任意类型的有台词的视频。首先，需要分析视频中的语句信息，剔除掉视频中背景音乐和与视频中人物对话无关的声音信息，排除掉干扰语音信息之后，可加强分析视频中的语句信息的正确率。接着，根据所述语句信息，识别出所述视频中的所有整句，并根据音色等信息，标记出不同人物对应的所有对话内容。进一步的，可以根据语句信息和词汇信息，标记出某个场景下的所有语句和出现某个词汇的所有语句。

在播放视频的过程中，在某一个整句播放结束后，判断是否满足预设的继续播放条件。在满足预设的继续播放条件的情况下，继续播放所述视频的下一个整句。

其中，预设的继续播放条件的具体判定方式一为下述的技术方案：

在播放视频的过程中，某一个整句播放结束后，系统立即执行重复播放所述整句的操作，同时统计播放所述整句的次数，当所述次数达到预设的终止阈值时，终止播放所述整句。进一步的，可以根据某一个整句的复杂程度和整句持续长度来设置不同的终止阈值。例如，对播放时长在10秒以内的整句的预设的终止阈值为3次，对播放时长在10秒以上且在20秒以内的整句的预设的终止阈值为2次，对播放时长在20秒以上且在30秒以内的整句的预设的终止阈值为3次。

其中，预设的继续播放条件的具体判定方式二为下述的技术方案：

在播放视频的过程中，在某一个整句播放结束后，统计出所述整句的播放时长。根据所述整句的播放时长和预设的扩大系数，设置出暂停所述整句的暂停时长。人们在重复该整句的时候，因为不熟悉等原因，通常复述该整句需要比视频中的该整句更长的时长。例如，通过大次数的测试发现，设置该扩大系数为1.2到1.5之间，可以很好的满足人们的复述需求。在当一个整句结束时，在暂停所述暂停时长之后，以便给用户留有充足的时长来复述该整句，在判定满足继续播放该视频下一个整句的条件下，然后继续播放所述视频的下一个整句。

进一步的，继续播放该视频下一个整句的具体判定方式一为下述的技术方案：

在所述暂停时长的时间间隔内，系统获取用户输入的语音信息。当用户输入的语音信息与所述整句的语音信息的相似度大于或等于预设的相似度阈值时，继续播放所述视频的下一个整句。

进一步的，继续播放该视频下一个整句的具体判定方式二为下述的技术方案：

在所述暂停时长的时间间隔内，获取用户输入的语音信息。当用户输入的语音信息与所述整句的语音信息的相似度低于预设的相似度阈值时，标记所述整句为用户需要注意的整句，以备用户在观看完该视频以后重点复习用户自己掌握程度不高的整句。接着，系统通过对话框的方式，询问用户是否重复播放所述整句，根据用户的输入信息，系统判断是否重复播放所述整句。

本发明可帮助语言学习者通过观赏非语言教学视频来学习听力和口语，提高了语言学习者的用户体验。

在一个实施例中，如图2所示，步骤S13包括如下步骤S21-S23：

在步骤S21中，在一个整句播放结束后，重复播放所述整句；

在步骤S22中，统计播放所述整句的次数；

在步骤S23中，当所述次数达到预设的终止阈值时，终止播放所述整句。

在一个实施例中，为了视频观看者可以更好的获取视频中的语言信息，尤其是对视频中语言种类掌握程度不熟练的视频观看者，重复播放同一个整句，可以有效的帮助视频观看者掌握该整句的语言信息，进而帮助视频观看者更好的掌握该种类的语言。具体的实施步骤为在识别某一个整句是否第一次播放，然后重复播放该整句，每一次重复播放都将该整句的播放的次数加一，实时统计播放该整句的次数，并实时判断播放该整句的次数的数值与预设的终止阈值的数值的大小关系。当所述次数达到预设的终止阈值时，终止播放所述整句。

在一个实施例中，如图3所示，步骤S13还包括如下步骤S31-S33：

在步骤S31中，在一个整句播放结束后，统计出所述整句的播放时长；

在步骤S32中，根据所述整句的播放时长和预设的扩大系数，设置出暂停所述整句的暂停时长；

在步骤S33中，在当一个整句结束时，在暂停所述暂停时长之后，继续播放所述视频的下一个整句。

在一个实施例中，统计某一个整句的播放时长，不妨假设该整句的播放时长为10秒。然后获取预设的扩大系数，不妨假设该预设的扩大系数为1.4。则根据该整句的播放时长10秒和该预设的扩大系数1.4，设置出在该整句播放结束之后，暂停该整句的暂停时长。不妨假设该整句的暂停时长为该整句的播放时长与该预设的扩大系数的乘积，则该整句的暂停时长为14秒。故在该整句播放结束之后，在经过14秒的暂停之后，该14秒的暂停时间是为了留给充足的时间来让视频观看者复述该整句，继续播放该视频的下一个整句。

在一个实施例中，如图4所示，步骤S33包括如下步骤S41-S42：

在步骤S41中，在所述暂停时长的时间间隔内，获取用户输入的语音信息；

在步骤S42中，当用户输入的语音信息与所述整句的语音信息的相似度大于或等于预设的相似度阈值时，继续播放所述视频的下一个整句。

在一个实施例中，获取用户在暂停时长的时间间隔内输入的语音信息，不妨假设该语音信息为A，该整句的语音信息为B，预设的相似度阈值为α。计算出该语音该信息A与该整句的语音信息B的相似度β，当相似度β的数值大于或等于相似度α的数值时，系统判断用户输入的语音信息B与该整句的语音信息A的相似程度很高，即用户基本对该整句的掌握程度较高。接着系统继续播放该视频的下一个整句。

在一个实施例中，如图5所示，步骤S33还包括如下步骤S51-S54：

在步骤S51中，在所述暂停时长的时间间隔内，获取用户输入的语音信息；

在步骤S52中，当用户输入的语音信息与所述整句的语音信息的相似度低于预设的相似度阈值时，标记所述整句为用户需要注意的整句；

在步骤S53中，询问用户是否重复播放所述整句；

在步骤S54中，根据用户的输入信息，判断是否重复播放所述整句。

在一个实施例中，获取用户在暂停时长的时间间隔内输入的语音信息，不妨假设该语音信息为A，该整句的语音信息为B，预设的相似度阈值为α。计算出该语音该信息A与该整句的语音信息B的相似度β，当相似度β的数值低于相似度α的数值时，标记该整句为用户需要注意的整句，以提醒用户该整句为用户掌握程度较差的整句。接着系统询问用户是否需要重复播放该整句，用户可以根据自己的意愿来进行输入。系统根据用户的输入信息进行判断，重复播放该整句或者是播放下一个整句。

在一个实施例中，图6是根据一示例性实施例示出的一种智能播放视频中语音信息的装置框图。如图6示，该装置包括分析模块61、识别模块62和播放模块63。

该分析模块61，用于分析视频中的语句信息；

该识别模块62，用于根据所述语句信息，识别出所述视频中的所有整句；

该播放模块63，用于在一个整句播放结束后，在满足预设的继续播放条件的情况下，继续播放所述视频的下一个整句。

如图7所示，该播放模块63包第一播放子模块71、第一统计子模块72和终止子模块73。

该第一播放子模块71，用于在一个整句播放结束后，重复播放所述整句；

该第第一统计子模块72，用于统计播放所述整句的次数；

该第终止子模块73，用于当所述次数达到预设的终止阈值时，终止播放所述整句。

如图8所示，该播放模块63还包括第二统计子模块81、设置子模块82和第二播放子模块83。

该第二统计子模块81，用于在一个整句播放结束后，统计出所述整句的播放时长；

该设置子模块82，用于根据所述整句的播放时长和预设的扩大系数，设置出暂停所述整句的暂停时长；

该第二播放子模块83，用于在当一个整句结束时，在暂停所述暂停时长之后，继续播放所述视频的下一个整句。

该第二播放子模块83，还用于在所述暂停时长的时间间隔内，获取用户输入的语音信息；当用户输入的语音信息与所述整句的语音信息的相似度大于或等于预设的相似度阈值时，继续播放所述视频的下一个整句。

该第二播放子模块83，还用于在所述暂停时长的时间间隔内，获取用户输入的语音信息；当用户输入的语音信息与所述整句的语音信息的相似度低于预设的相似度阈值时，标记所述整句为用户需要注意的整句；询问用户是否重复播放所述整句；根据用户的输入信息，判断是否重复播放所述整句。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张新亮;
技术所有人：天脉聚源（北京）传媒科技有限公司;
我是此专利的发明人

上一篇：一种基于延时传送的直播色情内容审核系统及方法与流程
上一篇：一种智能播放视频的方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。