音频信息播放方法、装置、存储介质及电子设备与流程

文档序号:14007930阅读:123来源:国知局
音频信息播放方法、装置、存储介质及电子设备与流程

本申请属于通信技术领域,尤其涉及一种音频信息播放方法、装置、存储介质及电子设备。



背景技术:

点读设备可以根据点读对象的坐标或者编码等方式,对点读对象进行识别和定位。其中,编码方式为在书本上印刷编码,然后利用点读笔识别编码以确定内容,再根据内容播放对应的音频。坐标方式为利用点读笔点击点读机的位置以确定坐标,确认坐标后结合点读设备当前页面播放对应的音频。即,相关技术中,需要借助点读笔或者点读机来实现点读对象的识别和定位。



技术实现要素:

本申请提供一种音频信息播放方法、装置、存储介质及电子设备,选取音频信息更加方便。

第一方面,本申请实施例提供一种音频信息播放方法,应用于电子设备,所述方法包括:

通过摄像头获取实景动画;

检测所述实景动画中用户的动作;

当检测到的当前动作为预设对象选取动作时,在所述实景动画中确定所述当前动作所选中的目标对象;

对所述目标对象对应的音频信息进行播放。

第二方面,本申请实施例提供一种音频信息播放装置,所述装置包括:

拍摄单元,用于通过摄像头获取实景动画;

检测单元,用于检测所述实景动画中用户的动作;

目标对象获取单元,用于对所述目标对象对应的音频信息进行播放。

播放单元,用于根据所述目标对象的内容播放对应的音频信息。

第三方面,本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的音频信息播放方法。

第四方面,本申请实施例提供一种电子设备,包括处理器和存储器,所述存储器有计算机程序,所述处理器通过调用所述计算机程序,用于执行上述的音频信息播放方法。

本申请实施例提供的音频信息播放方法、装置、存储介质及电子设备,通过摄像头获取实景动画;检测实景动画中用户的动作;当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象;对目标对象对应的音频信息进行播放。通过摄像头拍摄获取实景动画,其中包括用户的选取动作,通过选取动作选取目标对象,然后播放目标对对应的音频信息,操作方便灵活。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的音频信息播放装置的应用场景示意图;

图2为本申请实施例提供的音频信息播放装置的应用场景示意图;

图3为本申请实施例提供的音频信息播放方法的第一种流程示意图;

图4为本申请实施例提供的音频信息播放方法的第二种流程示意图;

图5为本申请实施例提供的音频信息播放方法的第三种流程示意图;

图6为本申请实施例提供的音频信息播放方法的第四种流程示意图;

图7为本申请实施例提供的音频信息播放方法的第五种流程示意图;

图8为本申请实施例提供的音频信息播放装置的第一种结构示意图;

图9为本申请实施例提供的音频信息播放装置的第二种结构示意图;

图10为本申请实施例提供的音频信息播放装置的第三种结构示意图;

图11为本申请实施例提供的音频信息播放装置的第四种结构示意图;

图12为本申请实施例提供的音频信息播放装置的第五种结构示意图;

图13为本申请实施例提供的电子设备的结构示意图;

图14为本申请实施例提供的电子设备的另一结构示意图。

具体实施方式

请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。

在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下的多种步骤及操作亦可实施在硬件当中。

本文所使用的术语“模块”可看做为在该运算系统上执行的软件对象。本文的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文的装置及方法可以以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。

本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

在一种实施方式中,终端可以先获取点读样本,点读样本可以是拍摄的照片,也可以是获取的文字图片。在获取到点读样本之后,终端可以获取多媒体样本,多媒体样本是录制的音频文件或视频文件。然后,终端可以将获取到的点读样本和多媒体样本相关联。例如,终端将照片a和音频a关联,将照片b和音频b关联,将照片c和视频c关联。在将点读样本和多媒体样本关联之后,终端可以将这些样本数据保存在预设数据库中。

可以理解的是,在一些实施方式中,点读样本和多媒体样本之间可以是一一对应的关系,也可以是一对多的关系,或者多对一的关系等等,本实施例对此不做具体限定。

在使用点读功能时,用户可以先使用移动终端拍摄一张照片或者从相册中选取一张照片。用户拍摄得到的照片或者选取的照片就是需要进行点读的对象。在获取到需要进行点读的对象之后,终端可以在预设数据库中查找与该需要进行点读的对象匹配的照片。若在预设数据库中存在与该需要进行点读的对象匹配的照片,那么终端就可以查找与之关联的多媒体文件,并播放该多媒体文件。

在一种实施方式中,例如点读样本为照片a,该照片中包含三段文字,每一段文字都关联了一段音频。那么,当用户拍摄得到的照片与预设数据库中的照片a匹配时,由于照片a中包含有三段文字,且每段文字均关联有对应的一段音频,那么用户可以通过具体选取照片a中的某段文字的方式,选择播放其对应的音频。或者,用户也可以不作具体的选择,那么终端可以顺序播放三段文字对应的音频。

请参阅图1,例如,用户使用终端拍摄得到一张照片x,终端在预设数据库中查找到与照片x匹配的为照片a。照片a中包含三段文字,其中第一段文字关联音频甲,第二段文字关联音频乙,第三段文字关联音频丙。例如,如图1所示,用户在屏幕上圈选了第二段文字所在的区域,那么终端可以对应播放音频乙。

可以理解的是,本实施例可以在移动终端上实现对某一对象(如照片)中的文本进行点读的功能,这种方式具有成本低、便捷性好等有益效果。

可以理解的是,本申请实施例的执行主体可以是诸如智能手机或平板电脑等的终端设备。

基于上述电子设备实现点读,请参阅图2,图2为本申请实施例提供的音频信息播放装置的另一应用场景示意图。例如,用户在纸质或另一电子设备的三段文字中,用手指圈选其中第二段文字,同时使用终端拍摄该操作得到一个实景动画y,其中实景动画y中的圆圈为手指圈选的实景动画,终端根据该实景动画y,从中提取出背景图像,背景图像包括三段文字,还从实景动画y中提取出手势实景动画,得到一个圈选范围,根据该圈选范围得到背景图像的点读范围,识别该点读范围内的内容,得到第二段文字,最后播放该第二段文字对应的音频。

本申请实施例提供一种音频信息播放方法,该音频信息播放方法的执行主体可以是本申请实施例提供的音频信息播放装置,或者集成了该音音频信息播放装置的电子设备,其中该音频信息播放装置可以采用硬件或者软件的方式实现。

本申请实施例将从音频信息播放装置的角度进行描述,该音频信息播放装置具体可以集成在电子设备中。该音频信息播放方法包括:通过摄像头获取实景动画;检测实景动画中用户的动作;当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象;对目标对象对应的音频信息进行播放。

具体的,请参阅图3,图3为本申请实施例提供的音频信息播放方法的第一种流程示意图。本申请实施例提供的音频信息播放方法应用于电子设备,具体流程可以如下:

步骤101,通过摄像头获取实景动画。

通过电子设备如智能手机的摄像头拍摄获取实景动画,可以是实时的拍摄获取,也可以是之前拍摄获取的。实景动画包括连续多帧图像,能够提供比单一图像更多的信息。

步骤102,检测实景动画中用户的动作。

通过运动目标检测从实景动画中检测得到用户的动作。具体的,运动目标检测主要包括基于帧间差分的方法、基于光流场的方法、基于背景差的方法。

其中帧间差分法是基于运动图像序列中相邻两帧图像具有较强的相关性而提出的检测方法,具有很强的自适应性。但是如果物体灰度分布均匀,这种方法会造成目标重叠部分形成较大空洞,严重时造成目标分割不连通,从而检测不到目标。

光流场法是基于对光流的估算进行检测分割的方法,光流中既包括被观察物体的运动信息,也包括有关的结构信息。光流场的不连续性可以用来将图像分割成对应于不同运动物体的区域。但多数光流法的计算复杂、耗时,难以满足实时监测的需求。

背景差法是运动检测中最常用的一种方法,它将输入图像与背景图像进行比较,直接根据灰度变化等统计信息的变化来分割运动目标。差分法一般计算量小实用价值大,但受光线、天气等外界条件影响较大。其基本思想是将当前图像与背景相减,若像素差值大于某一阈值,则判断此像素为运动目标上的点。其最重要的一步就是背景建模,需要估计出一个不带有运动目标的背景模型,通过计算当前帧与该背景模型的差来确定运动目标的位置。

步骤103,当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象。

预设对象选取动作包括点选取动作、线选取动作和圈选选取动作等。点选取动作可以为用户手指固定在其中一个位置,对应该位置为选取的内容。线选取动作可以为用户手指沿直线滑动选取,滑动对应的位置为选取的内容。圈选选取动作可以为用户手指画一个圆圈,圆圈内的内容为选取的内容。当检测到的用户当前动作为预设对象选取动作中的一个时,在实景动画中,根据当前动作确定选中的目标对象。目标对象可以是文字,也可以是图案。

请参阅图4,图4为本申请实施例提供的音频信息播放方法的第二种流程示意图。在本实施方式中,在实景动画中确定当前动作所选中的目标对象的步骤,包括如下流程:

步骤1031,从实景动画中确定背景图像。

利用实景动画识别技术,从拍摄获取的实景动画中提取出背景图像。其中,背景图像为实景动画中的静态背景图像,静态背景图像基本没有变化,只是跟随摄像角度的变化而改变,不会改变其本身的内容。静态背景图像可以包括文字、图案等内容。背景图像可以利用实景动画中不同帧图像之间的差异拼接出背景图像,也可以从实景动画中查找是否有完整的背景图像,如通过手指选取文章的其中一个段落,获取手指没有遮挡文章时图像,从而得到背景图像。

步骤1032,确定当前动作的控制点,以及控制点的移动轨迹。

当前动作可以为手势选取动作,也可以为选取棒选取动作。先确定当前动作的控制点,如手势选取动作中的手指头,选取棒选取动作中选取棒的端点,手指头具有明显的特征,可以通过识别是否为手指头而确定控制点,选取棒的端点为自由端,通过与选取棒的棒身关系确定控制点,也可以提前设置好选取棒端点的样式,如手掌形、三角形等,也可以设置led灯等辅助识别,通过识别特别的样式或led或两者的结合从而确定控制点。

然后根据实景动画识别技术获取该控制点的移动轨迹。

步骤1033,若移动轨迹的移动距离小于预设距离,则获取控制点对应移动轨迹的初始位置或终点位置。

得到控制点的移动轨迹后,识别该移动轨迹移动的距离。若该移动轨迹移动的距离小于预设距离,则认为该控制点基本没有移动,为点选取目标对象,对应的获取控制点对应移动轨迹的初始位置或终点位置。

预设距离可以根据电子设备的显示屏大小而设定,如为显示屏横向宽度的1/20。也可以根据背景图像中内容来确定,先是被背景图像中的内容,得到两个内容之间的距离,预设距离为两个内容之间的距离,如背景图像中的内容为多个图案,得到两个图案之间的空白间距,预设距离等于空白间距。还可以根据背景图像的相对位置变化来确定预设距离,如为背景图像宽度的1/10之一。

步骤1034,在背景图像中确定初始位置或终点位置所选中的目标对象。

得到初始位置或终点位置后,确定该初始位置或终点位置对应背景图像的相对位置。得到相对位置后,确定相对位置的触发点坐标,根据该触发点坐标确定选取范围。如触发点坐标为选取范围,触发点坐标及触发点周边的坐标为选取范围,周边的坐标可以以触发点坐标为中心,以一个预设的长度如10个坐标点的长度为半径获取。

还可以,预先设置有对应该背景图像的预存信息。先将背景图像分成多个触发对象,每个触发对象包括一个触发点集合,若触发点坐标与一个触发点集合内的一个触发点坐标匹配,则确定该触发点集合为选取范围。

在一些实施方式中,可以根据实景动画的其他部分确定选取范围,如手势选取,识别到手指头为控制点后,识别手掌的方向,触发点以及手掌的相对方向为选取范围,如手掌在控制点的左侧,则确定触发点及触发点的右侧为选取范围。

请参阅图5,图5为本申请实施例提供的音频信息播放方法的第三种流程示意图。在本实施方式中,在实景动画中确定当前动作所选中的目标对象的步骤,还可以包括如下流程:

步骤1031,从实景动画中确定背景图像。

利用实景动画识别技术,从拍摄获取的实景动画中提取出背景图像。其中,背景图像为实景动画中的静态背景图像,静态背景图像基本没有变化,只是跟随摄像角度的变化而改变,不会改变其本身的内容。静态背景图像可以包括文字、图案等内容。背景图像可以利用实景动画中不同帧图像之间的差异拼接出背景图像,也可以从实景动画中查找是否有完整的背景图像,如通过手指选取文章的其中一个段落,获取手指没有遮挡文章时图像,从而得到背景图像。

步骤1032,确定当前动作的控制点,以及控制点的移动轨迹。

当前动作可以为手势选取动作,也可以为选取棒选取动作。先确定当前动作的控制点,如手势选取动作中的手指头,选取棒选取动作中选取棒的端点,手指头具有明显的特征,可以通过识别是否为手指头而确定控制点,选取棒的端点为自由端,通过与选取棒的棒身关系确定控制点,也可以提前设置好选取棒端点的样式,如手掌形、三角形等,也可以设置led灯等辅助识别,通过识别特别的样式或led或两者的结合从而确定控制点。

然后根据实景动画识别技术获取该控制点的移动轨迹。

步骤1035,若移动轨迹的移动距离大于预设距离,则获取移动轨迹对应背景图像的相对位置点集合。

得到控制点的移动轨迹后,识别该移动轨迹移动的距离。若该移动轨迹移动的距离大于预设距离,则认为该控制点在移动,为线选取或滑动选取目标对象,对应的获取移动轨迹对应背景图像的相对位置点集合。

步骤1036,根据相对位置点集合获取相应的触发点集合。

得到相对位置点集合后,对应显示屏,根据相对位置点集合获取相应的触发点集合。

步骤1037,在背景图像中确定触发点集合所选中的目标对象。

根据该触发点集合确定选取范围。背景图像中的一个图案对应多个触发点,将触发点集合中的触发点得到对应的多个图案,其中可以先将触发点集合中的触发点去重,或多个图案中去重,得到选取范围。例如,手指划过一行文字,触发点集合内包括该一行文字的触发点集合。

得到选取范围后,在背景图像中,确定选取范围内的图案为目标对象。目标对象可以为图形,也可以为文字。

请参阅图6,图6为本申请实施例提供的音频信息播放方法的第四种流程示意图。在本实施方式中,在背景图像中确定初始位置或终点位置所选中的目标对象的步骤,可以包括如下流程:

步骤1131,根据初始位置或终点位置获取相应的触发点。

从实景动画中确定背景图像,确定当前动作的控制点,以及控制点的移动轨迹,若移动轨迹的移动距离小于预设距离,则获取控制点对应移动轨迹的初始位置或终点位置。根据初始位置或终点位置得到相对位置后,根据相对位置获取对应背景图像的触发点。触发点为对应显示屏的坐标位置。

步骤1132,判断触发点的坐标是否与待选对象的坐标匹配。

判断触发点的坐标是否有与其匹配的待选对象。如预先将背景图像的内容分割成多个子区域,每个子区域对应一个待选对象,同时每个子区域包括一个触发点集合,即一个坐标点集合。

步骤1133,若不匹配,则获取触发点周边的坐标,得到周边坐标集合。

若述触发点的坐标与待选对象的坐标匹配,即该触发点没有对应的待选对象,触发点设置在待选对象的旁边,如下方、左侧或右侧等。此时,获取该触发点周边的坐标,得到周边坐标集合。

根据该触发点得到周边坐标集合。如周边的坐标集合可以以触发点坐标为中心,以一个预设的长度如6个坐标点的长度为半径获取。

在一些实施方式中,可以根据实景动画的其他部分确定选取范围,如手势选取,识别到手指头为控制点后,识别手掌的方向,触发点以及手掌的相对方向为选取范围,如手掌在控制点的左侧,则确定触发点及触发点的右侧为选取范围。

步骤1134,判断周边坐标集合内的坐标是否与待选对象的坐标匹配。

将周边坐标集合内的坐标与待选对象的坐标比对,然后查看是否有与周边坐标集合内坐标匹配的待选对象。

步骤1135,若匹配,则确定待选对象为目标对象。

若有与周边坐标集合内坐标匹配的待选对象,则确定该待选对象为目标对象。如果有多个待选对象,则可以根据待选对象为触发点坐标的距离判断,距离最短的为目标对象。

请参阅图7,图7为本申请实施例提供的音频信息播放方法的第五种流程示意图。在本实施方式中,当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象的步骤,还可以包括如下流程:

步骤1136,当检测到的当前动作为圈选动作时,确定当前动作对应实景动画圈选的选取范围。

若当前动作为圈选动作,如通过手指或选取棒画个圆圈,则该圆圈对应的为选取范围。通过实景动画识别技术获取该选取范围。

步骤1137,确定选取范围内的待选对象的数量。

因为选取范围为圈选的,选取范围内对应的待选对象可能一个也可能多个,则需要确定选取范围内的待选对象的数量。若待选对象的数量为1,则确定该待选对象为目标对象。

步骤1138,若待选对象的数量大于1,则分别获取各个待选对象在选取范围内的面积占相应待选对象总面积的面积比。

若待选对象的数量大于1,说明有两个或更多的待选对象在选取范围内。此时,分别获取各个待选对象在选取范围内的面积、以及各个待选对象的总面积,然后计算各个待选对象在选取范围内的面积占相应待选对象总面积的面积比。可以通过各个待选对象对应的坐标点的数量来计算,如获取各个待选对象的坐标点集合,然后根据坐标点的数量确定总面积。然后获取选项范围的坐标点集合,计算各个待选对象在选取范围有多少个坐标点,然后根据这些坐标点确定各个待选对象在选取范围内的面积。

步骤1139,选取面积比最大的待选对象为目标对象。

面积比越大,说明待选对象在选取范围内的可能性越大。因此选取面积比最大的待选对象为目标对象。

在一些实施方式中,还可以根据待选对象的中心点与选取范围的中心点的重合度来确定目标对象。重合度越高,说明圈选时,是以该待选对象为中心点圈选。

步骤104,对目标对象对应的音频信息进行播放。

得到目标对象后,可以识别目标对象的内容,如通过图像识别技术,得到目标对象对应文字信息,然后播放该文字信息对应的音频信息。其中可以先查看本地数据库中是否有该文字信息对应的音频信息,如果没有可以通过服务器或网络获取该文字信息对应的音频信息。如果目标对象对应的为图形,则通过比对该图形,查找到与该图形匹配的音频信息。

例如,将一本书中的一篇文章放置在桌子上,然后用手指圈选一段文字,通过智能手机的摄像头拍摄该文章以及手指圈选的动作,得到手指圈选该文字的实景动画,然后从该实景动画中提取出包括该文章的背景图像,以及圈选动作的当前动作,接着确定该背景图像圈选的范围,并从中确定包括该一段文字的目标对象,然后识别目标对象内的该一段文字,最后播放该一段文字对应的音频信息。还可以,如家长想讲解一篇文章,通过家长或小朋友选取文章的内容播放对应的音频,不再是在智能手机的显示屏上选取,保护眼睛。

由上可知,本申请实施例提供的音频信息播放方法,通过摄像头获取实景动画;检测实景动画中用户的动作;当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象;对目标对象对应的音频信息进行播放。通过摄像头拍摄获取实景动画,其中包括用户的选取动作,通过选取动作选取目标对象,然后播放目标对对应的音频信息。操作方便灵活,不再是通过显示屏选取播放内容,而是直接在实体物品中选取,不再需要一直看显示屏就能实现点读功能,可以保护眼睛。

请参阅图8,图8为本申请实施例提供的音频信息播放装置的第一种结构示意图。其中该音频信息播放装置应用于电子设备,该音频信息播放装置500包括拍摄单元501、检测单元502、目标对象获取单元503和播放单元504。其中:

拍摄单元501,用于通过摄像头获取实景动画。

通过电子设备如智能手机的摄像头拍摄获取实景动画,可以是实时的拍摄获取,也可以是之前拍摄获取的。实景动画包括连续多帧图像,能够提供比单一图像更多的信息。

检测单元502,用于检测实景动画中用户的动作。

通过运动目标检测从实景动画中检测得到用户的动作。具体的,运动目标检测主要包括基于帧间差分的方法、基于光流场的方法、基于背景差的方法。

其中帧间差分法是基于运动图像序列中相邻两帧图像具有较强的相关性而提出的检测方法,具有很强的自适应性。但是如果物体灰度分布均匀,这种方法会造成目标重叠部分形成较大空洞,严重时造成目标分割不连通,从而检测不到目标。

光流场法是基于对光流的估算进行检测分割的方法,光流中既包括被观察物体的运动信息,也包括有关的结构信息。光流场的不连续性可以用来将图像分割成对应于不同运动物体的区域。但多数光流法的计算复杂、耗时,难以满足实时监测的需求。

背景差法是运动检测中最常用的一种方法,它将输入图像与背景图像进行比较,直接根据灰度变化等统计信息的变化来分割运动目标。差分法一般计算量小实用价值大,但受光线、天气等外界条件影响较大。其基本思想是将当前图像与背景相减,若像素差值大于某一阈值,则判断此像素为运动目标上的点。其最重要的一步就是背景建模,需要估计出一个不带有运动目标的背景模型,通过计算当前帧与该背景模型的差来确定运动目标的位置。

目标对象获取单元503,用于对目标对象对应的音频信息进行播放。

预设对象选取动作包括点选取动作、线选取动作和圈选选取动作等。点选取动作可以为用户手指固定在其中一个位置,对应该位置为选取的内容。线选取动作可以为用户手指沿直线滑动选取,滑动对应的位置为选取的内容。圈选选取动作可以为用户手指画一个圆圈,圆圈内的内容为选取的内容。当检测到的用户当前动作为预设对象选取动作中的一个时,在实景动画中,根据当前动作确定选中的目标对象。目标对象可以是文字,也可以是图案。

请参阅图9,图9为本申请实施例提供的音频信息播放装置的第二种结构示意图。在本实施方式中,目标对象获取单元503包括背景图像确定子单元5031、第一获取子单元5032、第二获取子单元5033和目标对象确定子单元5034。其中:

背景图像确定子单元5031,用于从实景动画中确定背景图像。

利用实景动画识别技术,从拍摄获取的实景动画中提取出背景图像。其中,背景图像为实景动画中的静态背景图像,静态背景图像基本没有变化,只是跟随摄像角度的变化而改变,不会改变其本身的内容。静态背景图像可以包括文字、图案等内容。背景图像可以利用实景动画中不同帧图像之间的差异拼接出背景图像,也可以从实景动画中查找是否有完整的背景图像,如通过手指选取文章的其中一个段落,获取手指没有遮挡文章时图像,从而得到背景图像。

第一获取子单元5032,用于获取当前动作的控制点,以及控制点的移动轨迹。

当前动作可以为手势选取动作,也可以为选取棒选取动作。先确定当前动作的控制点,如手势选取动作中的手指头,选取棒选取动作中选取棒的端点,手指头具有明显的特征,可以通过识别是否为手指头而确定控制点,选取棒的端点为自由端,通过与选取棒的棒身关系确定控制点,也可以提前设置好选取棒端点的样式,如手掌形、三角形等,也可以设置led灯等辅助识别,通过识别特别的样式或led或两者的结合从而确定控制点。

然后根据实景动画识别技术获取该控制点的移动轨迹。

第二获取子单元5033,用于若移动轨迹的移动距离小于预设距离,则获取控制点对应移动轨迹的初始位置或终点位置。

得到控制点的移动轨迹后,识别该移动轨迹移动的距离。若该移动轨迹移动的距离小于预设距离,则认为该控制点基本没有移动,为点选取目标对象,对应的获取控制点对应移动轨迹的初始位置或终点位置。

预设距离可以根据电子设备的显示屏大小而设定,如为显示屏横向宽度的1/20。也可以根据背景图像中内容来确定,先是被背景图像中的内容,得到两个内容之间的距离,预设距离为两个内容之间的距离,如背景图像中的内容为多个图案,得到两个图案之间的空白间距,预设距离等于空白间距。还可以根据背景图像的相对位置变化来确定预设距离,如为背景图像宽度的1/10之一。

目标对象确定子单元5034,用于在背景图像中确定初始位置或终点位置所选中的目标对象。

得到初始位置或终点位置后,确定该初始位置或终点位置对应背景图像的相对位置。得到相对位置后,确定相对位置的触发点坐标,根据该触发点坐标确定选取范围。如触发点坐标为选取范围,触发点坐标及触发点周边的坐标为选取范围,周边的坐标可以以触发点坐标为中心,以一个预设的长度如10个坐标点的长度为半径获取。

还可以,预先设置有对应该背景图像的预存信息。先将背景图像分成多个触发对象,每个触发对象包括一个触发点集合,若触发点坐标与一个触发点集合内的一个触发点坐标匹配,则确定该触发点集合为选取范围。

在一些实施方式中,可以根据实景动画的其他部分确定选取范围,如手势选取,识别到手指头为控制点后,识别手掌的方向,触发点以及手掌的相对方向为选取范围,如手掌在控制点的左侧,则确定触发点及触发点的右侧为选取范围。

请参阅图10,图10为本申请实施例提供的音频信息播放装置的第三种结构示意图。在本实施方式中,目标对象获取单元503包括背景图像确定子单元5031、第一获取子单元5032、第三获取子单元5035、第四获取子单元5036和目标对象确定子单元5034。其中:

背景图像确定子单元5031,用于从实景动画中确定背景图像。

第一获取子单元5032,用于获取当前动作的控制点,以及控制点的移动轨迹。

第三获取子单元5035,用于若移动轨迹的移动距离大于预设距离,则获取移动轨迹对应背景图像的相对位置点集合。

得到控制点的移动轨迹后,识别该移动轨迹移动的距离。若该移动轨迹移动的距离大于预设距离,则认为该控制点在移动,为线选取或滑动选取目标对象,对应的获取移动轨迹对应背景图像的相对位置点集合。

第四获取子单元5036,根据相对位置点集合获取相应的触发点集合。

得到相对位置点集合后,对应显示屏,根据相对位置点集合获取相应的触发点集合。

目标对象确定子单元5034,用于在背景图像中确定触发点集合所选中的目标对象。

根据该触发点集合确定选取范围。背景图像中的一个图案对应多个触发点,将触发点集合中的触发点得到对应的多个图案,其中可以先将触发点集合中的触发点去重,或多个图案中去重,得到选取范围。例如,手指划过一行文字,触发点集合内包括该一行文字的触发点集合。

得到选取范围后,在背景图像中,确定选取范围内的图案为目标对象。目标对象可以为图形,也可以为文字。

请参阅图11,图11为本申请实施例提供的音频信息播放装置的第四种结构示意图。在本实施方式中,目标对象获取单元503还包括触发点获取子单元5131、第一判断子单元5132、坐标集合获取子单元5133和第二判断子单元5134。其中:

触发点获取子单元5131,用于根据初始位置或终点位置获取相应的触发点。

从实景动画中确定背景图像,确定当前动作的控制点,以及控制点的移动轨迹,若移动轨迹的移动距离小于预设距离,则获取控制点对应移动轨迹的初始位置或终点位置。根据初始位置或终点位置得到相对位置后,根据相对位置获取对应背景图像的触发点。触发点为对应显示屏的坐标位置。

第一判断子单元5132,用于判断触发点的坐标是否与待选对象的坐标匹配。

判断触发点的坐标是否有与其匹配的待选对象。如预先将背景图像的内容分割成多个子区域,每个子区域对应一个待选对象,同时每个子区域包括一个触发点集合,即一个坐标点集合。

坐标集合获取子单元5133,用于若触发点的坐标与待选对象的坐标不匹配,则获取触发点周边的坐标,得到周边坐标集合。

若述触发点的坐标与待选对象的坐标匹配,即该触发点没有对应的待选对象,触发点设置在待选对象的旁边,如下方、左侧或右侧等。此时,获取该触发点周边的坐标,得到周边坐标集合。

根据该触发点得到周边坐标集合。如周边的坐标集合可以以触发点坐标为中心,以一个预设的长度如6个坐标点的长度为半径获取。

在一些实施方式中,可以根据实景动画的其他部分确定选取范围,如手势选取,识别到手指头为控制点后,识别手掌的方向,触发点以及手掌的相对方向为选取范围,如手掌在控制点的左侧,则确定触发点及触发点的右侧为选取范围。

第二判断子单元5134,用于判断周边坐标集合内的坐标是否与待选对象的坐标匹配。

将周边坐标集合内的坐标与待选对象的坐标比对,然后查看是否有与周边坐标集合内坐标匹配的待选对象。

目标对象确定子单元5034,还用于若周边坐标集合内的坐标与待选对象的坐标匹配,则确定待选对象为目标对象。

若有与周边坐标集合内坐标匹配的待选对象,则确定该待选对象为目标对象。如果有多个待选对象,则可以根据待选对象为触发点坐标的距离判断,距离最短的为目标对象。

请参阅图12,图12为本申请实施例提供的音频信息播放装置的第五种结构示意图。在本实施方式中,目标对象获取单元503包括选取范围确定子单元5135、数量确定子单元5136、面积比获取子单元5137和目标对象确定子单元5034。其中:

选取范围确定子单元5135,用于当检测到的当前动作为圈选动作时,确定所述当前动作对应所述实景动画圈选的选取范围。

若当前动作为圈选动作,如通过手指或选取棒画个圆圈,则该圆圈对应的为选取范围。通过实景动画识别技术获取该选取范围。

数量确定子单元5136,用于确定所述选取范围内的待选对象的数量。

因为选取范围为圈选的,选取范围内对应的待选对象可能一个也可能多个,则需要确定选取范围内的待选对象的数量。若待选对象的数量为1,则确定该待选对象为目标对象。

面积比获取子单元5137,用于若待选对象的数量大于1,则分别获取各个待选对象在选取范围内的面积占相应待选对象总面积的面积比。

若待选对象的数量大于1,说明有两个或更多的待选对象在选取范围内。此时,分别获取各个待选对象在选取范围内的面积、以及各个待选对象的总面积,然后计算各个待选对象在选取范围内的面积占相应待选对象总面积的面积比。可以通过各个待选对象对应的坐标点的数量来计算,如获取各个待选对象的坐标点集合,然后根据坐标点的数量确定总面积。然后获取选项范围的坐标点集合,计算各个待选对象在选取范围有多少个坐标点,然后根据这些坐标点确定各个待选对象在选取范围内的面积。

目标对象确定子单元5034,用于选取面积比最大的待选对象为目标对象。

面积比越大,说明待选对象在选取范围内的可能性越大。因此选取面积比最大的待选对象为目标对象。

在一些实施方式中,还可以根据待选对象的中心点与选取范围的中心点的重合度来确定目标对象。重合度越高,说明圈选时,是以该待选对象为中心点圈选。

播放单元504,用于根据目标对象的内容播放对应的音频信息。

得到目标对象后,可以识别目标对象的内容,如通过图像识别技术,得到目标对象对应文字信息,然后播放该文字信息对应的音频信息。其中可以先查看本地数据库中是否有该文字信息对应的音频信息,如果没有可以通过服务器或网络获取该文字信息对应的音频信息。如果目标对象对应的为图形,则通过比对该图形,查找到与该图形匹配的音频信息。

由上可知,本申请实施例提供的音频信息播放装置,通过摄像头获取实景动画;检测实景动画中用户的动作;当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象;对目标对象对应的音频信息进行播放。通过摄像头拍摄获取实景动画,其中包括用户的选取动作,通过选取动作选取目标对象,然后播放目标对对应的音频信息。操作方便灵活,不再是通过显示屏选取播放内容,而是直接在实体物品中选取,不再需要一直看显示屏就能实现点读功能,可以保护眼睛。

具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。

本申请实施例中,音频信息播放装置与上文实施例中的音频信息播放方法属于同一构思,在音频信息播放装置上可以运行音频信息播放方法实施例中提供的任一方法,其具体实现过程详见音频信息播放方法的实施例,此处不再赘述。

本申请实施例还提供一种电子设备。请参阅图13,电子设备600包括处理器601以及存储器602。其中,处理器601与存储器602电性连接。

处理器600是电子设备600的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器602内的计算机程序,以及调用存储在存储器602内的数据,执行电子设备600的各种功能并处理数据,从而对电子设备600进行整体监控。

存储器602可用于存储软件程序以及单元,处理器601通过运行存储在存储器602的计算机程序以及单元,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器601对存储器602的访问。

在本申请实施例中,电子设备600中的处理器601会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器602中,并由处理器601运行存储在存储器602中的计算机程序,从而实现各种功能,如下:

通过摄像头获取实景动画;

检测实景动画中用户的动作;

当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象;

对目标对象对应的音频信息进行播放。

在一些实施方式中,处理器601还用于执行以下步骤:

从实景动画中确定背景图像;

确定当前动作对应的控制点,以及控制点的移动轨迹;

若移动轨迹的移动距离小于预设距离,则获取控制点对应移动轨迹的初始位置或终点位置;

在背景图像中确定初始位置或终点位置所选中的目标对象。

在一些实施方式中,处理器601还用于执行以下步骤:

若移动轨迹的移动距离大于预设距离,则获取移动轨迹对应背景图像的相对位置点集合;

根据相对位置点集合获取相应的触发点集合;

在背景图像中确定触发点集合所选中的目标对象。

在一些实施方式中,处理器601还用于执行以下步骤:

根据初始位置或终点位置获取相应的触发点;

判断触发点的坐标是否与待选对象的坐标匹配;

若不匹配,则获取触发点周边的坐标,得到周边坐标集合;

判断周边坐标集合内的坐标是否与待选对象的坐标匹配;

若匹配,则确定待选对象为目标对象。

在一些实施方式中,处理器601还用于执行以下步骤:

当检测到的当前动作为圈选动作时,确定当前动作对应实景动画圈选的选取范围;

确定选取范围内的待选对象的数量;

若待选对象的数量大于1,则分别获取各个待选对象在选取范围内的面积占相应待选对象总面积的面积比;

选取面积比最大的待选对象为目标对象。

由上述可知,本申请实施例提供的电子设备,通过摄像头获取实景动画;检测实景动画中用户的动作;当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象;对目标对象对应的音频信息进行播放。通过摄像头拍摄获取实景动画,其中包括用户的选取动作,通过选取动作选取目标对象,然后播放目标对对应的音频信息,操作方便灵活。

请一并参阅图14,在一些实施方式中,电子设备600还可以包括:显示器603、射频电路604、音频电路605以及电源606。其中,其中,显示器603、射频电路604、音频电路605以及电源606分别与处理器601电性连接。

显示器603可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器603可以包括显示面板,在一些实施方式中,可以采用液晶显示器(liquidcrystaldisplay,lcd)、或者有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板。

射频电路604可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。

音频电路605可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。

电源606可以用于给电子设备600的各个部件供电。在一些实施方式中,电源606可以通过电源管理系统与处理器601逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图14中未示出,电子设备600还可以包括摄像头、蓝牙单元等,在此不再赘述。

本申请实施例还提供一种存储介质,存储介质存储有计算机程序,当计算机程序在计算机上运行时,使得计算机执行上述任一实施例中的应用程序管控方法,比如:通过摄像头获取实景动画;检测实景动画中用户的动作;当检测到的当前动作为预设对象选取动作时,在实景动画中确定当前动作所选中的目标对象;对目标对象对应的音频信息进行播放。

在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(readonlymemory,rom)、或者随机存取记忆体(randomaccessmemory,ram)等。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

需要说明的是,对本申请实施例的音频信息播放方法而言,本领域普通测试人员可以理解实现本申请实施例音频信息播放方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如音频信息播放方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。

对本申请实施例的音频信息播放装置而言,其各功能单元可以集成在一个处理芯片中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,存储介质譬如为只读存储器,磁盘或光盘等。

以上对本申请实施例所提供的一种音频信息播放方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1