获取音频信息的方法、装置、存储介质及电子设备与流程

文档序号:14474234阅读:174来源:国知局
获取音频信息的方法、装置、存储介质及电子设备与流程

本申请属于通信技术领域,尤其涉及一种获取音频信息的方法、装置、存储介质及电子设备。



背景技术:

现有的点读设备根据点读对象的坐标或者编码等方式对点读对象进行识别和定位。其中编码方式点读方式为,在书本上印刷编码,然后利用点读笔识别编码以确定内容,然后根据内容播放对应的音频。其中坐标方式点读方式为,利用点读笔点击点读机的位置以确定坐标,确认坐标后结合点读机当前页面播放对应的音频。即需要借助点读笔或者点读机才能实现点读对象的识别和定位。



技术实现要素:

本申请提供一种获取音频信息的方法、装置、存储介质及电子设备,能够提升对图像的识别率,进而得到准确的音频信息。

第一方面,本申请实施例提供一种获取音频信息的方法,应用于电子设备,所述方法包括步骤:

当识别到预设图像的信息缺失超过预设识别阈值时,从所述预设图像中提取关键字信息和目标图案信息;

将所述关键字信息和所述目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;

根据所述第二参数在所述第一参数对应的音频链接集合中选取相应的目标链接数据;

获取所述目标链接数据对应的音频信息。

第二方面,本申请实施例提供一种获取音频信息的装置,所述装置包括:

文字图案获取单元,用于当识别到预设图像的信息缺失超过预设识别阈值时,从所述预设图像中提取关键字信息和目标图案信息;

参数设定单元,用于将所述关键字信息和所述目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;

目标链接获取单元,用于根据所述第二参数在所述第一参数对应的音频链接集合中选取相应的目标链接数据

音频获取单元,获取所述目标链接数据对应的音频信息。

第三方面,本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的获取音频信息的方法。

第四方面,本申请实施例提供一种电子设备,包括处理器和存储器,所述存储器有计算机程序,所述处理器通过调用所述计算机程序,用于执行上述的获取音频信息的方法。

本申请实施例提供的获取音频信息的方法、装置、存储介质及电子设备,当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息;将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据;获取目标链接数据对应的音频信息。本申请在通过电子设备实现点读时,通过关键字信息或目标图案信息中的一个获取音频链接集合,然后再根据另一个进行筛选,得到目标链接数据,提升对信息少的预设图像的识别率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的获取音频信息的装置的应用场景示意图;

图2为本申请实施例提供的获取音频信息的装置的另一应用场景示意图;

图3为本申请实施例提供的获取音频信息的方法的流程示意图;

图4为本申请实施例提供的获取预设图像的图案信息的流程示意图;

图5为本申请实施例提供的根据背景色获取图案信息的流程示意图;

图6为本申请实施例提供的选取第一参数的流程示意图;

图7为本申请实施例提供的获取音频链接集合的流程示意图;

图8为本申请实施例提供的选取相应目标链接数据的流程示意图;

图9为本申请实施例提供的获取音频信息的装置的第一种结构示意图;

图10为本申请实施例提供的获取音频信息的装置的第二种结构示意图;

图11为本申请实施例提供的获取音频信息的装置的第三种结构示意图;

图12为本申请实施例提供的获取音频信息的装置的第四种结构示意图;

图13为本申请实施例提供的获取音频信息的装置的第五种结构示意图;

图14为本申请实施例提供的获取音频信息的装置的第六种结构示意图;

图15为本申请实施例提供的获取音频信息的装置的第七种结构示意图;

图16为本申请实施例提供的电子设备的结构示意图;

图17为本申请实施例提供的电子设备的另一结构示意图。

具体实施方式

请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是根据所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。

在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理子单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。

本文所使用的术语“单元”可看做为在该运算系统上执行的软件对象。本文所述的不同组件、单元、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。

本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是某些实施例还包括没有列出的步骤或单元,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

在本申请的一种实施方式中,可实现通过电子设备实现点读。电子设备可以先获取点读样本,点读样本可以是图片、照片或者编码等。其中,电子设备可以为移动终端,如手机、平板电脑、笔记本电脑等,本申请实施例对此不进行限定。

在获取到点读样本之后,电子设备可以获取多媒体样本,多媒体样本可以是音频文件或者视频文件等。然后,电子设备可以将获取到的点读样本和多媒体样本相关联。例如,电子设备将照片a和音频a关联,将照片b和音频b关联,将照片c和视频c关联。在将点读样本和多媒体样本关联之后,电子设备可以将这些样本数据保存在预设数据库中。

可以理解的是,在一些实施方式中,点读样本和多媒体样本之间可以是一一对应的关系,也可以是一对多的关系,或者多对一的关系等等,本实施例对此不做具体限定。

在使用电子设备点读功能时,用户可以先使用移动电子设备拍摄一张照片或者从相册中选取一张照片或者扫描某个编码。用户拍摄得到的照片或者选取的照片或者扫描得到的编码就是需要进行点读的对象(即待点读对象)。在获取到需要进行点读的对象之后,电子设备可以在预设数据库中查找与该需要进行点读的对象匹配的照片或者编码。若在预设数据库中存在与该需要进行点读的对象匹配的照片或编码,那么电子设备就可以查找与之关联的多媒体文件,并播放该多媒体文件。

在一种实施方式中,例如点读样本为照片a,该照片中包含三段文字,每一段文字都关联了一段音频。那么,当用户拍摄得到的照片与预设数据库中的照片a匹配时,由于照片a中包含有三段文字,且每段文字均关联有对应的一段音频,那么用户可以通过具体选取照片a中的某段文字的方式,选择播放其对应的音频。或者,用户也可以不作具体的选择,那么电子设备可以顺序播放三段文字对应的音频。

请参阅图1,比如,用户使用电子设备拍摄得到一张照片x,电子设备在预设数据库中查找到与照片x匹配的为照片a。照片a中包含三段文字,其中第一段文字关联音频甲,第二段文字关联音频乙,第三段文字关联音频丙。例如,用户在屏幕上圈选了第二段文字所在的区域,那么电子设备可以对应播放音频乙。

可以理解的是,本实施例可以在电子设备上实现对某一对象(如照片)中的文本进行点读的功能,这种方式具有成本低、便捷性好等有益效果。

基于上述通过电子设备实现点读,请参阅图2,图2为本申请实施例提供的获取音频信息的装置的另一应用场景示意图。例如获取音频信息的装置获取预设图像(例如,待点读对象),然后该识别预设图像,当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息;将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据;获取目标链接数据对应的音频信息,最后将目标音频信息播放出去。

本申请实施例提供一种获取音频信息的方法,该获取音频信息的方法的执行主体可以是本申请实施例提供的获取音频信息的装置,或者集成了该获取音频信息的装置的电子设备,其中该获取音频信息的装置可以采用硬件或者软件的方式实现。

本申请实施例将从获取音频信息的装置的角度进行描述,该获取音频信息的装置具体可以集成在电子设备中。该获取音频信息的方法包括:当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息;将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据;获取目标链接数据对应的音频信息。

请参阅图3,图3为本申请实施例提供的获取音频信息的方法的流程示意图。本申请实施例提供的获取音频信息的方法应用于电子设备,具体流程可以如下:

步骤101,当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息。

预设图像可以电子设备的摄像头拍摄获取,也可以接收其他设备传输的预设图像获取。还可以将预设图像预先存储在电子设备内,然后通过应用软件调用将预设图像显示。

识别预设图像得到预设图像的信息,当该信息缺失超过预设识别阈值,使得无法快速找到对应的音频信息。例如,获取的预设图像不完整,如通过摄像头获取的课本页不完整,只获取了一部分课本页,该部分课本页只占60%,预设识别阈值可以设为整体课本页的70%。也可以是,获取的预设图像不清晰,通过摄像头拍摄课本页时,手抖动造成预设图像模糊,部分文字或图案无法识别到,从而识别到的信息无法快速找到对应的音频信息时,预设识别阈值可以为文字识别率60%,即识别到的文字占总文字的60%。当预设图像具有快速识别信息时如数字编码、二维码,则直接判定信息缺失超过预设识别阈值。

当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息。

在从预设图像中提取关键字信息和目标图案信息的步骤之前,先从预设图像中提取文字信息和图案信息。

请一并参阅图4,图4为本申请实施例提供的获取预设图像的图案信息的流程示意图。在本实施例中,获取预设图像的图案信息的方法,包括以下步骤:

步骤201,将预设图像分成多个区域。将预设图像分成足够多的区域,可以等比例的分成多个区域。

步骤202,在每一区域上设置多个采样点,根据多个采样点获取多个颜色样本。在所有区域都设置多个采样点,然后通过这些采样点获取颜色样本。采样点越多,效果越好。

步骤203,根据各种颜色的颜色样本的数量确定背景色。

获取的颜色样本包括多种颜色,如果其中一个颜色样本数量所占的比例大于一定比例,例如50%,则认定该颜色样本为背景色。如果预设图像为彩色画面,而且使用了大量渐进色,则如果在一定颜色范围内的颜色样本数量所占的比例大于一定比例,例如60%,则认定该颜色范围内的颜色样本为背景色。还可以根据颜色样本所占的比例和位置确定背景色,例如在预设图像的上部其中一个颜色样本数量所占的比例大于一定比例,例如55%,在预设图像的下部另一个颜色样本数量所占的比例大于一定比例,例如55%,则认定该预设图像包括两个背景色。

步骤204,根据背景色获取图案信息。

图案信息可以包括背景色以及背景色的位置。将预设图像中的背景色区域去除,剩下的区域通过区域之间的间隔距离划分成多个子区域,每个子区域为一个图案信息。

步骤205,从图案信息中提取目标图案信息。

将图案信息与数据库中的预存图案比较,若相同,则将图案信息设为目标图案。

预先在数据库中存储预存图案,然后将图案信息与预存图案进行比较,若相同,则将图案信息设为目标图案,其中相同的判定标准有多种,例如两者的相似度达到70%则认为相同。

请一并参阅图5,图5为本申请实施例提供的根据背景色获取图案信息的流程示意图。在本实施例中,根据背景色获取图案信息包括以下步骤:

步骤2041,若区域内的采样点获取颜色样本为背景色的比例小于预设比例阈值,则确定区域为取图区域。

一个区域内,颜色样本为背景色的采样点占整个区域内所有采样点的比例大于一定比例如90%,则确定该区域为背景色区域,后续获取图案信息则跳过该区域。

一个区域内,颜色样本为背景色的采样点占整个区域内所有采样点的比例小于预设比例阈值如60%,则确定该区域为取图区域,后续获取图案信息则在该区域内获取。

步骤2042,在取图区域内获取各个显示点的颜色,并对应形成矩阵数据表。

在取图区域内获取各个显示点的颜色,显示点可以为像素点。然后形成一个显示点对应一个颜色数据值,将这些颜色数据值形成一个矩阵数据表。

步骤2043,在矩阵数据表内,将颜色为背景色的显示点对应的音频链接设为第一数据,将颜色不为背景色的显示点对应的音频链接设为第二数据,得到待选矩阵数据表。

在矩阵数据表内,每个颜色数据值对应一个显示点的颜色,如果颜色数据值为背景色,则将该颜色数据值设为第一数据,如白色对应的音频链接,如果颜色不为背景色,则将该颜色数据值设为第一数据,如黑色对应的音频链接,从而得到一个待选矩阵数据表。将其转成图像,则为白底黑线条的图像,去除了很多干扰。此时,可以通过待选矩阵数据表将一些边缘数据剔除,如通过第一数据得到具有边缘线条的图形,该图形外还具有一些第二数据,这部分的第二数据为获取预设图像时不需要的图像,此时可以将其剔除。

步骤2044,在待选矩阵数据表内,根据第一数据将待选矩阵数据表划分成多个图案区域,根据图案区域内第二数据的位置获取图案信息。

在待选矩阵数据表内,将待选矩阵数据表划分成多个图案区域,可以通过第一数据划分,因为第一数据对应的图像为底色,如果第一数据两侧都具有第二数据,两个第二数据之间的第一数据都超过一定的宽度,如整个区域同方向宽度的5%,则将其划分开,通过该方法将待选矩阵数据表划分成多个图案区域。然后将图案区域转成图形,将第二数据对应的点连起来,形成一个图形,则该图形为图案信息。

从文字信息中提取关键字信息,可以首先从预设图像中获取文字信息,以及文字信息中各个文字的字体大小和在预设图像的位置信息;若各个文字对应的字体大小包括至少两种,则将字体最大的文字设为预设关键字;若预设关键字的数量没有超过预设字数,则直接将预设关键字设为关键字信息;若预设关键字的数量超过预设字数,则根据预设关键字的位置信息进行筛选,得到关键字信息。例如,预设关键字的位置在预设图像的边缘,则将其剔除。预设关键字在预设图像的上方优于在预设图像的下方。

关键字信息还包括页码信息,根据页码信息的存储位置,如整体图像的底部中间、底部外侧、外侧边的中间等,若在这些区域识别到数字,则将该数字设为关键字信息,且为页码信息的关键字信息。

在一些实施方式中,从文字信息中提取关键字信息,可以将文字信息中的文字与数据库中的预存文字比较,若相同,则将文字设置为关键字信息。预先在数据库中存储预存文字,该预存文字可以将预设图像对应的内容确定在一个的范围内,例如语文、数学、第一册、故事书等。还可以通过网络获取预存文字。然后将之前识别到的文字与数据库中的预存文字比较,若相同,则将文字设置为关键字信息。

在一些实施方式中,在数据库中,设置快查关键字信息集合和快查图案集合,里面存储的关键字信息和图案可以快速查找到对应的音频链接集合,而且该音频链接集合内的数据量较少,关键字信息和图案如书名、作者名字、定价、车标图形、二维码等。

步骤102,将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数。

请一并参阅图6,图6为本申请实施例提供的选取第一参数的流程示意图。在本实施例中,选取第一参数包括以下步骤:

步骤3021,分别获取关键字信息和目标图案信息获取对应链接信息集合的历史时长;

步骤3022,将关键字信息和目标图案信息中历史时长更短的信息作为第一参数。

通过关键字信息和目标图案信息获取对应连接信息集合的历史时长,选择两者中的一个为第一参数。根据关键字信息获取对应的音频链接,并形成一个音频链接集合,同样的,根据目标图案信息获取对应的音频链接,并形成一个音频链接集合,然后根据两者获取相应音频链接集合的历史时长,将其中一个设为第一参数,另一个设为第二参数。

还可以关键字信息可以包括多个关键字,可以预先存储各个关键字的概率,然后计算需要查找的多个关键字的时长,同样的,目标图案信息可以包括多个图案信息,可以预先存储各个图案信息的概率,然后计算需要查找的多个目标图案的时长,然后设置关键字信息和目标图案信息中的一个为第一参数。

还可以同时开始根据关键字信息和目标图案信息获取对应数据集合,当其中一个数据集合先查找完成,则将对应的关键字信息或目标图案信息设为第一参数,另一个为第二参数。

步骤103,根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据。

先根据第一参数获取对应的音频链接集合,然后在音频链接集合内根据第二参数进行筛选,得到相应的目标连接数据,不需要再在数据库中搜索。

请一并参阅图7,图7为本申请实施例提供的获取音频链接集合的流程示意图。在本实施例中,第一参数包括多个子参数,获取第一参数对应的音频链接集合,包括以下步骤:

步骤301,获取各个子参数的搜索效率值,将多个子参数根据搜索效率值设置搜索顺序。

搜索效率值包括搜索数据库得到对应的音频链接的数量、时间等。例如,第一参数为关键字信息,关键字信息为多个关键字,然后获取每个关键字信息的搜索效率值,搜索效率值可以为搜索数据库得到对应的音频链接的数量。然后将多个关键字根据得到对应的音频链接的数量设置搜索顺序。

步骤302,利用搜索顺序中排名超过预设排名的子参数,在数据库中搜索得到对应的音频链接,并形成初始链接集合。

利用搜索顺序中排名超过预设排名如第三的子参数,在数据库中分别利用排名第一和第二的子参数搜索得到对应的音频链接,并形成初始链接集合。

步骤303,利用搜索顺序中排名在预设排名之下的子参数,在初始链接集合中进行筛选,得到音频链接集合。

然后利用其它子参数,在初始链接集合中进行筛选,通过筛选得到音频链接集合,初始链接集合的数据量明显少于数据库,可以提高搜索效率。

请一并参阅图8,图8为本申请实施例提供的选取相应目标链接数据的流程示意图。在本实施例中,根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据,包括下列步骤:

步骤311,在音频链接集合内根据第二参数进行筛选,得到多个待选数据。

步骤312,将多个待选数据展示。

步骤313,根据确认指令,从多个待选数据中确定确认指令相应的目标链接数据。

在音频链接集合内根据第二参数进行筛选还无法精确得到目标链接数据,但是得到了多个比较接近的待选数据,然后将这多个待选数据展示,如通过显示屏显示,接着根据确认指令,从多个待选数据中确定确认指令相应的目标链接数据。如接到用户的点击指令,点击坐标为其中一个待选数据的坐标,则确认该待选数据为目标链接数据,同时将两者关联。

在一些实施方式中,将多个待选数据展示具体的为,若多个待选数据的数量超过预设个数,则根据各个待选数据中关键字信息的权重和目标图案信息的相似度,获取各个待选数据的权重值;从多个待选数据中挑选预设个数权重值最大的待选数据进行展示。

例如关键字信息包括不同字体大小的关键字信息,则字体大的关键字信息的权重大于字体小的关键字信息,在预设图像中间的关键字信息的权重大于预设图像侧边的关键字信息的权重,上下相邻的关键字信息中,上面的关键字信息的权重大于下面的关键字信息的权重。然后根据待选数据中关键字信息的权重和目标图案信息的相似度,按一定比例如各50%组成待选数据的权重值,最后从多个待选数据中挑选预设个数如5个权重值最大的待选数据进行展示。

步骤104,根据目标链接数据获取目标音频信息。

目标链接数据为对应目标音频信息的地址,然后根据该地址获取目标音频信息的存储位置,然后通过调用播放软件播放该目标音频信息。该目标连接数据对应的音频信息可以包括多个音频,预设图像包括多个点读区域时,多个音频与多个点读区域一一对应。例如,有一些卡片,卡片上有文字信息和图画信息,还可以有唯一数字编码、条形码或二维码等快速识别信息,然后通过电子设备如智能手机拍摄该卡片得到卡片图像,然后根据快速识别信息从数据库中,查找到与该卡片吻合的音频音信,当文字信息或图画信息被点击时,播放对应的音频。当小朋友拿智能手机拍摄卡片时,因为拍摄角度或手抖等原因,造成缺少了快速识别信息或无法识别出快速识别信息,此时通过获取卡片图像的关键字信息和目标图案信息,然后从数据库中查找到卡片对应的音频信息,音频信息包括对应多个点击区域的音频,然后根据点击位置,从多个音频中确定其中被点击的区域对应的音频。

本申请实施例提供的获取音频信息的方法,当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息;将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据;获取目标链接数据对应的音频信息。通过关键字信息或目标图案信息中的一个获取音频链接集合,然后再根据另一个进行筛选,得到目标链接数据,提升对信息少的预设图像的识别率,提高了识别效率。

为便于更好地实施本申请实施例提供的获取音频信息的方法,本申请实施例还提供一种获取音频信息的装置。其中名词的含义与上述获取音频信息的方法相同,具体实现细节可以参考方法实施例中的说明。

请参阅图9,图9为本申请实施例提供的获取音频信息的装置的第一种结构示意图。其中该获取音频信息的装置应用于电子设备,该获取音频信息的装置500包括文字图案获取单元501、参数设定单元502、目标链接获取单元503和音频获取单元504。其中:

文字图案获取单元501,用于当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息。

预设图像可以电子设备的摄像头拍摄获取,也可以接收其他设备传输的预设图像获取。接收其他设备传输预设图像获取可以通过无线方式或有线方式。无线方式包括蓝牙、nfc、wifi网络和移动网络等方式,移动网络包括2g、3g和4g等网络。有线方式包括通过数据线连接其他设备获取预设图像。还可以将预设图像预先存储在电子设备内,然后通过应用软件调用将预设图像显示。

识别预设图像得到预设图像的信息,当该信息缺失超过预设识别阈值,使得无法快速找到对应的音频信息。例如,获取的预设图像不完整,如通过摄像头获取的课本页不完整,只获取了一部分课本页,该部分课本页只占60%,预设识别阈值可以设为整体课本页的70%。也可以是,获取的预设图像不清晰,通过摄像头拍摄课本页时,手抖动造成预设图像模糊,部分文字或图案无法识别到,从而识别到的信息无法快速找到对应的音频信息时,预设识别阈值可以为文字识别率60%,即识别到的文字占总文字的60%。当预设图像具有快速识别信息时如数字编码、二维码,则直接判定信息缺失超过预设识别阈值。

当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息。

请参阅图10,图10为本申请实施例提供的获取音频信息的装置的第二种结构示意图。在本实施方式中,文字图案获取单元501包括划分子单元5011、采样子单元5012、背景色获取子单元5013、图案信息获取子单元5014和目标图案信息获取子单元5015。其中:

划分子单元5011,用于将预设图像分成多个区域。将预设图像分成足够多的区域,可以等比例的分成多个区域。

采样子单元5012,用于在每一区域上设置多个采样点,根据多个采样点获取多个颜色样本。在所有区域都设置多个采样点,然后通过这些采样点获取颜色样本。采样点越多,效果越好。

背景色获取子单元5013,用于根据各种颜色的颜色样本的数量确定背景色;

图案信息获取子单元5014,用于根据背景色获取图案信息。

图案信息可以包括背景色以及背景色的位置。将预设图像中的背景色区域去除,剩下的区域通关之间的间隔距离划分成多个子区域,每个子区域为一个图案信息。

目标图案信息获取子单元5015,用于从图案信息中提取目标图案信息。

将图案信息与数据库中的预存图案比较,若相同,则将图案信息设为目标图案。

预先在数据库中存储预存图案,然后将图案信息与预存图案进行比较,若相同,则将图案信息设为目标图案,其中相同的判定标准有多种,例如两者的相似度达到70%则认为相同。

请参阅图11,图11为本申请实施例提供的获取音频信息的装置的第三种结构示意图。在本实施方式中,图案信息获取子单元5014包括取图区域确定模块541、第一矩阵形成模块542、第二矩阵形成模块543和图案信息获取模块544。其中:

取图区域确定模块541,用于若区域内的采样点获取颜色样本为背景色的比例小于预设比例阈值,则确定区域为取图区域。

一个区域内,颜色样本为背景色的采样点占整个区域内所有采样点的比例大于一定比例如90%,则确定该区域为背景色区域,后续获取图案信息则跳过该区域。

一个区域内,颜色样本为背景色的采样点占整个区域内所有采样点的比例小于预设比例阈值如60%,则确定该区域为取图区域,后续获取图案信息则在该区域内获取。

第一矩阵形成模块542,用于在取图区域内获取各个显示点的颜色,并对应形成矩阵数据表。

在取图区域内获取各个显示点的颜色,显示点可以为像素点。然后形成一个显示点对应一个颜色数据值,将这些颜色数据值形成一个矩阵数据表。

第二矩阵形成模块543,用于在矩阵数据表内,将颜色为背景色的显示点对应的音频链接设为第一数据,将颜色不为背景色的显示点对应的音频链接设为第二数据,得到待选矩阵数据表。

在矩阵数据表内,每个颜色数据值对应一个显示点的颜色,如果颜色数据值为背景色,则将该颜色数据值设为第一数据,如白色对应的音频链接,如果颜色不为背景色,则将该颜色数据值设为第一数据,如黑色对应的音频链接,从而得到一个待选矩阵数据表。将其转成图像,则为白底黑线条的图像,去除了很多干扰。此时,可以通过待选矩阵数据表将一些边缘数据剔除,如通过第一数据得到具有边缘线条的图形,该图形外还具有一些第二数据,这这部分的第二数据为获取预设图像时不需要的图像,此时可以将其剔除。

图案信息获取模块544,用于在待选矩阵数据表内,根据第一数据的范围将待选矩阵数据表划分成多个图案区域,根据图案区域内第二数据的位置获取图案信息。

在待选矩阵数据表内,将待选矩阵数据表划分成多个图案区域,可以通过第一数据划分,因为第一数据对应的图像为底色,如果第一数据两侧都具有第二数据,两个第二数据之间的第一数据都超过一定的宽度,如整个区域同方向宽度的5%,则将其划分开,通过该方法将待选矩阵数据表划分成多个图案区域。然后将图案区域转成图形,将第二数据对应的点连起来,形成一个图形,则该图形为图案信息。

请参阅图12,图12为本申请实施例提供的获取音频信息的装置的第四种结构示意图。在本实施方式中,文字图案获取单元501包括文字信息获取子单元5016、预设关键字获取子单元5017和关键字信息筛选子单元5018。其中:

文字信息获取子单元5016,用于从预设图像中获取文字信息,以及文字信息中各个文字的字体大小和在预设图像的位置信息;

预设关键字获取子单元5017,用于若各个文字对应的字体大小包括至少两种,则将字体最大的文字设为预设关键字;

关键字信息筛选子单元5018,用于若预设关键字的数量超过预设字数,则根据预设关键字的位置信息进行筛选,得到关键字信息。

例如,预设关键字的位置在预设图像的边缘,则将其剔除。预设关键字在预设图像的上方优于在预设图像的下方。

关键字信息还包括页码信息,根据页码的存储位置,如整体图像的底部中间、底部外侧、外侧边的中间等,在这些区域识别到数字则将该数字设为关键字信息,且为页码的关键字信息。

在一些实施方式中,文字图案获取单元501还可以将文字信息中的文字与数据库中的预存文字比较,若相同,则将文字设置为关键字信息。预先在数据库中存储预存文字,该预存文字可以将预设图像对应的内容确定在一个的范围内,例如语文、数学、第一册、故事书等。还可以通过网络获取预存文字。然后将之前识别到的文字与数据库中的预存文字比较,若相同,则将文字设置为关键字信息。

在一些实施方式中,文字图案获取单元501还可以将图案信息与数据库中的预存图案比较,若相同,则将图案信息设为目标图案。

预先在数据库中存储预存图案,然后将图案信息与预存图案进行比较,若相同,则将图案信息设为目标图案,其中相同的判定标准有多种,例如两者的相似度达到70%则认为相同。

在一些实施方式中,文字图案获取单元501还用于,在数据库中,设置快查关键字信息集合和快查图案集合,里面存储的关键字信息和图案可以快速查找到对应的音频链接集合,而且该音频链接集合内的数据量较少,关键字信息和图案如书名、作者名字、定价、车标图形、二维码等。

参数设定单元502,用于将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数。

请参阅图13,图13为本申请实施例提供的获取音频信息的装置的第五种结构示意图。在本实施方式中,参数设定单元502包括历史时长获取子单元5021和参数设置子单元5022。其中:

历史时长获取子单元5021,用于分别获取关键字信息和目标图案信息获取对应链接信息集合的历史时长;

参数设置子单元5022,用于将关键字信息和目标图案信息中历史时长更短的信息作为第一参数。

通过关键字信息和目标图案信息获取对应连接信息集合的历史时长,选择两者中的一个为第一参数。

根据关键字信息获取对应的音频链接,并形成一个音频链接集合,同样的,根据目标图案信息获取对应的音频链接,并形成一个音频链接集合,然后根据两者获取数据集合的时长,将其中一个设为第一参数,另一个设为第二参数。例如,同时开始根据关键字信息和目标图案信息获取对应数据集合,当其中一个数据集合先查找完成,则将对应的关键字信息或目标图案信息设为第一参数,另一个为第二参数。

还可以关键字信息可以包括多个关键字,可以预先存储各个关键字的概率,然后计算需要查找的多个关键字的时长,同样的,目标图案信息可以包括多个图案信息,可以预先存储各个图案信息的概率,然后计算需要查找的多个目标图案的时长,然后设置关键字信息和目标图案信息中的一个为第一参数。

还可以同时开始根据关键字信息和目标图案信息获取对应数据集合,当其中一个数据集合先查找完成,则将对应的关键字信息或目标图案信息设为第一参数,另一个为第二参数。

目标链接获取单元503,用于根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据。

先根据第一参数获取对应的音频链接集合,然后在音频链接集合内根据第二参数进行筛选,得到相应的目标连接数据,不需要再在数据库中搜索。

请参阅图14,图14为本申请实施例提供的获取音频信息的装置的第六种结构示意图。在本实施方式中,目标链接获取单元503包括顺序设置子单元5031、搜索子单元5032和第一筛选子单元5033。其中:

顺序设置子单元5031,用于获取第一参数包括的多个子参数的搜索效率值,并将多个子参数根据搜索效率值设置搜索顺序。

搜索效率值包括搜索数据库得到对应的音频链接的数量、时间等。例如,第一参数为关键字信息,关键字信息为多个关键字,然后获取每个关键字信息的搜索效率值,搜索效率值可以为搜索数据库得到对应的音频链接的数量。然后将多个关键字根据得到对应的音频链接的数量设置搜索顺序。

搜索子单元5032,用于利用搜索顺序中排名超过预设排名的子参数,在数据库中搜索得到对应的音频链接,并形成初始链接集合。

利用搜索顺序中排名超过预设排名如第三的子参数,在数据库中分别利用排名第一和第二的子参数搜索得到对应的音频链接,并形成初始链接集合。

第一筛选子单元5033,用于利用搜索顺序中排名在预设排名之下的子参数,在初始链接集合中进行筛选,得到音频链接集合。

然后利用其它子参数,在初始链接集合中进行筛选,通过筛选得到音频链接集合,初始链接集合的数据量明显少于数据库,可以提高搜索效率。

请参阅图15,图15为本申请实施例提供的获取音频信息的装置的第七种结构示意图。在本实施方式中,目标链接获取单元503包括第二筛选子单元5034、展示子单元5035和确定子单元5036。其中:

第二筛选子单元5034,用于在音频链接集合内根据第二参数进行筛选,得到多个待选数据;

展示子单元5035,用于将多个待选数据展示;

确定子单元5036,用于根据确认指令,从多个待选数据中确定确认指令相应的目标链接数据。

在音频链接集合内根据第二参数进行筛选还无法精确得到目标链接数据,但是得到了多个比较接近的待选数据,然后将这多个待选数据展示,如通过显示屏显示,接着根据确认指令,从多个待选数据中确定确认指令相应的目标链接数据。如接到用户的点击指令,点击坐标为其中一个待选数据的坐标,则确认该待选数据为目标链接数据,同时将两者关联。

在一些实施方式中,展示子单元,还用于若多个待选数据的数量超过预设个数,则根据各个待选数据中关键字信息的权重和目标图案信息的相似度,获取各个待选数据的权重值;从多个待选数据中挑选预设个数权重值最大的待选数据进行展示。

例如关键字信息包括不同字体大小的关键字信息,则字体大的关键字信息的权重大于字体小的关键字信息,在预设图像中间的关键字信息的权重大于预设图像侧边的关键字信息的权重,上下相邻的关键字信息中,上面的关键字信息的权重大于下面的关键字信息的权重。然后根据待选数据中关键字信息的权重和目标图案信息的相似度,按一定比例如各50%组成待选数据的权重值,最后从多个待选数据中挑选预设个数如5个权重值最大的待选数据进行展示。

音频获取单元504,用于根据目标链接数据获取目标音频信息。

目标链接数据为对应目标音频信息的地址,然后根据该地址获取目标音频信息的存储位置,然后通过调用播放软件播放该目标音频信息。该目标连接数据对应的音频信息可以包括多个音频,预设图像包括多个点读区域时,多个音频与多个点读区域一一对应。例如,有一些卡片,卡片上有文字信息和图画信息,还可以有唯一数字编码、条形码或二维码等快速识别信息,然后通过电子设备如智能手机拍摄该卡片得到卡片图像,然后根据快速识别信息从数据库中,查找到与该卡片吻合的音频音信,当文字信息或图画信息被点击时,播放对应的音频。当小朋友拿智能手机拍摄卡片时,因为拍摄角度或手抖等原因,造成缺少了快速识别信息或无法识别出快速识别信息,此时通过获取卡片图像的关键字信息和目标图案信息,然后从数据库中查找到卡片对应的音频信息,音频信息包括对应多个点击区域的音频,然后根据点击位置,从多个音频中确定其中被点击的区域对应的音频。

本申请实施例提供的获取音频信息的装置,当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息;将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据;获取目标链接数据对应的音频信息。通过关键字信息或目标图案信息中的一个获取音频链接集合,然后再根据另一个进行筛选,得到目标链接数据,提升对信息少的预设图像的识别率,提高了识别效率。

具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。

本申请实施例中,获取音频信息的装置与上文实施例中的获取音频信息的方法属于同一构思,在获取音频信息的装置上可以运行获取音频信息的方法实施例中提供的任一方法,其具体实现过程详见获取音频信息的方法的实施例,此处不再赘述。

本申请实施例还提供一种电子设备。请参阅图16,电子设备600包括处理器601以及存储器602。其中,处理器601与存储器602电性连接。

处理器600是电子设备600的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器602内的计算机程序,以及调用存储在存储器602内的数据,执行电子设备600的各种功能并处理数据,从而对电子设备600进行整体监控。

存储器602可用于存储软件程序以及单元,处理器601通过运行存储在存储器602的计算机程序以及单元,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器601对存储器602的访问。

在本申请实施例中,电子设备600中的处理器601会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器602中,并由处理器601运行存储在存储器602中的计算机程序,从而实现各种功能,如下:

当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息;

将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;

根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据;

获取目标链接数据对应的音频信息。

在一些实施方式中,处理器601还用于执行以下步骤:

分别获取关键字信息和目标图案信息获取对应链接信息集合的历史时长;

将关键字信息和目标图案信息中历史时长更短的信息作为第一参数。

在一些实施方式中,第一参数包括多个子参数,处理器601还用于执行以下步骤:

获取各个子参数的搜索效率值,将多个子参数根据搜索效率值设置搜索顺序;

利用搜索顺序中排名超过预设排名的子参数,在数据库中搜索得到对应的音频链接,并形成初始链接集合;

利用搜索顺序中排名在预设排名之下的子参数,在初始链接集合中进行筛选,得到音频链接集合。

在一些实施方式中,处理器601还用于执行以下步骤:

在音频链接集合内根据第二参数进行筛选,得到多个待选数据;

将多个待选数据展示;

根据确认指令,从多个待选数据中确定确认指令相应的目标链接数据。

在一些实施方式中,处理器601还用于执行以下步骤:

将预设图像分成多个区域;

在每一区域上设置多个采样点,根据多个采样点获取多个颜色样本;

根据各种颜色的颜色样本的数量确定背景色;

根据背景色获取图案信息;

从图案信息中提取目标图案信息。

在一些实施方式中,处理器601还用于执行以下步骤:

若区域内的采样点获取颜色样本为背景色的比例小于预设比例阈值,则确定区域为取图区域;

在取图区域内获取各个显示点的颜色,并对应形成矩阵数据表;

在矩阵数据表内,将颜色为背景色的显示点对应的音频链接设为第一数据,将颜色不为背景色的显示点对应的音频链接设为第二数据,得到待选矩阵数据表;

在待选矩阵数据表内,根据第一数据将待选矩阵数据表划分成多个图案区域,根据图案区域内第二数据的位置获取图案信息。

在一些实施方式中,处理器601还用于执行以下步骤:

从预设图像中获取文字信息,以及文字信息中各个文字的字体大小和在预设图像的位置信息;

若各个文字对应的字体大小包括至少两种,则将字体最大的文字设为预设关键字;

若预设关键字的数量超过预设字数,则根据预设关键字的位置信息进行筛选,得到关键字信息。

由上述可知,本申请实施例提供的电子设备,当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息;将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据;获取目标链接数据对应的音频信息。通过关键字信息或目标图案信息中的一个获取音频链接集合,然后再根据另一个进行筛选,得到目标链接数据,提升对信息少的预设图像的识别率。

请一并参阅图17,在一些实施方式中,电子设备600还可以包括:显示器603、射频电路604、音频电路605以及电源606。其中,其中,显示器603、射频电路604、音频电路605以及电源606分别与处理器601电性连接。

显示器603可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器603可以包括显示面板,在一些实施方式中,可以采用液晶显示器(liquidcrystaldisplay,lcd)、或者有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板。

射频电路604可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。

音频电路605可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。

电源606可以用于给电子设备600的各个部件供电。在一些实施方式中,电源606可以通过电源管理系统与处理器601逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图17中未示出,电子设备600还可以包括摄像头、蓝牙单元等,在此不再赘述。

本申请实施例还提供一种存储介质,存储介质存储有计算机程序,当计算机程序在计算机上运行时,使得计算机执行上述任一实施例中的应用程序管控方法,比如:当识别到预设图像的信息缺失超过预设识别阈值时,从预设图像中提取关键字信息和目标图案信息;将关键字信息和目标图案信息中一个信息作为第一参数,另一个信息作为第二参数;根据第二参数在第一参数对应的音频链接集合中选取相应的目标链接数据;获取目标链接数据对应的音频信息。

在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(readonlymemory,rom)、或者随机存取记忆体(randomaccessmemory,ram)等。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

需要说明的是,对本申请实施例的获取音频信息的方法而言,本领域普通测试人员可以理解实现本申请实施例获取音频信息的方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如获取音频信息的方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。

对本申请实施例的获取音频信息的装置而言,其各功能单元可以集成在一个处理芯片中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,存储介质譬如为只读存储器,磁盘或光盘等。

以上对本申请实施例所提供的一种获取音频信息的方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1