一种信息识别方法、装置及移动终端的制作方法

文档序号:7754626阅读:103来源:国知局
专利名称:一种信息识别方法、装置及移动终端的制作方法
技术领域
本发明涉及多媒体技术领域,尤其涉及一种信息识别方法、装置及移动终端。
背景技术
在终端上播放视频时,用户有时 希望终端能够识别视频流中的文字信息。特别是有的视频节目具有时效性,稍纵即逝,无法再次播放,而且终端受屏幕尺寸限制,所以文字信息识别显得很重要。在实现本发明过程中,发明人发现现有技术中至少存在如下问题当用户观看不同电视台的节目或者同样的终端处在不同的环境下时,显示屏的设置(例如亮度,对比度,饱和度等)会不同,这时会影响文字信息识别的成功率。

发明内容
本发明实施例提供一种信息识别方法、装置及移动终端,以提高文字识别的成功率。一方面,本发明实施例提供了一种信息识别方法,所述信息识别方法包括获取当前播放的电视台的台标信息的映射表;根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的信息进行比较,获取修正后的滤波器参数;利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别。可选的,在本发明的一实施例中,所述获取当前播放的电视台的台标信息的映射表,包括当终端开机时,或者当播放的电视台为新电视台时,或者当需要进行视频中的文字信息识别时,获取当前播放的电视台的台标信息的映射表。可选的,在本发明的一实施例中,所述获取当前播放的电视台的台标信息的映射表,包括从终端本地获取所述当前播放的电视台的台标信息的映射表,或者从网络侧设备获取所述当前播放的电视台的台标信息的映射表。可选的,在本发明的一实施例中,所述台标信息的映射表包括频率点和/或信道号-台标位置-台标图片和/或台标中的文字信息。可选的,在本发明的一实施例中,所述根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,包括根据所述台标信息的映射表,获取所述当前播放的电视台的频率点和/或信道号,然后根据所述台标信息的映射表中的台标位置截取当前播放的电视台的台标图片,利用所述台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标图片和/或台标中的文字信息进行比较,获取修正后的滤波器参数。可选的,在本发明的一实施例中,所述文字信息包括电话号码、网址、文本字符。
可选的,在本发明的一实施例中,所述信息识别方法还包括根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式。可选的,在本发明的一实施例中,所述根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式,包括当所述文字信息为电话号码时,将所述电话号码存储成可拨打格式的电话号码;和/或当所述文字信息为网址时,将所述网址存储成可链接格式的网址;和/或当所述文字信息为文本字符时,将所述文本字符存储成文字编辑版的格式。另一方面,本发明实施例提供了一种信息识别装置,所述信息识别装置包括映射表获取单元,用于获取当前播放的电视台的台标信息的映射表;识别训练单元,用于根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的文字信息 进行比较,获取修正后的滤波器参数;文字识别单元,用于利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别。可选的,在本发明的一实施例中,所述映射表获取单元,用于当终端开机时,或者当播放的电视台为新电视台时,或者当需要进行视频中的文字信息识别时,获取当前播放的电视台的台标信息的映射表。 可选的,在本发明的一实施例中,所述映射表获取单元,用于从终端本地获取所述当前播放的电视台的台标信息的映射表,或者从网络侧设备获取所述当前播放的电视台的台标信息的映射表。可选的,在本发明的一实施例中,所述映射表获取单元获取的台标信息的映射表包括频率点和/或信道号-台标位置-台标图片和/或台标中的文字信息。可选的,在本发明的一实施例中,所述识别训练单元,用于根据所述台标信息的映射表,获取所述当前播放的电视台的频率点和/或信道号,然后根据所述台标信息的映射表中的台标位置截取当前播放的电视台的台标图片,利用所述台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标图片和/或台标中的文字信息进行比较,获取修正后的滤波器参数。可选的,在本发明的一实施例中,所述文字识别单元识别出的文字信息包括电话号码、网址、文本字符。可选的,在本发明的一实施例中,所述信息识别装置还包括分类存储单元,用于根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式。可选的,在本发明的一实施例中,所述分类存储单元,具体用于当所述文字信息为电话号码时,将所述电话号码存储成可拨打格式的电话号码;和/或当所述文字信息为网址时,将所述网址存储成可链接格式的网址;和/或当所述文字信息为文本字符时,将所述文本字符存储成文字编辑版的格式。再一方面,本发明实施例提供了一种移动终端,所述移动终端包括上述信息识别
>J-U ρ α装直。上述技术方案具有如下有益效果因为采用获取当前播放的电视台的台标信息的映射表;根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的信息进行比较,获取修正后的滤波器参数;利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别的技术手段,所以克服了显示屏的设置(例如亮度,对比度,饱和度等)不同的影响,提高了文字识别的成功率。且对于一些对滤波器参数设置不懂的用户而言,由于台标信息的映射表储存在设备端或者服务器端,通过获取该映射表进行文字识别训练,极大的提高了其进行文字识别的能力,使文字识别更加方便化,更容易被用户所接受。



为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I为本发明实施例一种信息识别方法流程图;图2为本发明实施例一种台标信息的映射表示意图;图3为本发明实施例台标信息的映射表中的台标图片示意图;图4为本发明实施例截取当前播放的电视台的台标图片示意图;图5为本发明实施例截取当前播放的电视台的信息图片示意图;图6为本发明实施例识别出的文字信息示意图;图7为本发明实施例一种信息识别装置结构示意图;图8为本发明实施例另一种信息识别装置结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在本发明实施例中,需要建立一张台标信息的映射表这个台标信息的映射表可以存在终端中,也可以由电视节目运营商存在网络侧,终端每次开机后向网络侧请求,网络侧发送给终端。考虑到电视台一般不会轻易变更台标,电视节目运营商也不会轻易变更节目播放的频点和信道,所以可以预期这种映射关系会相对稳定,很长一个时期都不会变化。如图I所示,为本发明实施例一种信息识别方法流程图,所述信息识别方法包括101、获取当前播放的电视台的台标信息的映射表;102、根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的文字信息进行比较,获取修正后的滤波器参数;103、利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别。可选的,在本发明的一实施例中,所述获取当前播放的电视台的台标信息的映射表,可以包括当终端开机时,或者当播放的电视台为新电视台时,或者当需要进行视频中的文字信息识别时,获取当前播放的电视台的台标信息的映射表。可选的,在本发明的一实施例中,所述获取当前播放的电视台的台标信息的映射表,可以包括从终端本地获取所述当前播放的电视台的台标信息的映射表,或者从网络侧设备获取所述当前播放的电视台的台标信息的映射表。可选的,在本发明的一实施例中,所述台标信息的映射表可以包括频率点和/或信道号-台标位置-台标图片和/或台标中的文字信息。如图2所示,为本发明实施例一种台标信息的映射表示意图,至少包括频率点和信道号之一、台标位置、以及台标图片和台标中的文字信息之一。可选的,在本发明的一实施例中,所述根据所 述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,可以包括根据所述台标信息的映射表,获取所述当前播放的电视台的频率点和/或信道号,然后根据所述台标信息的映射表中的台标位置截取当前播放的电视台的台标图片,利用所述台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标图片和/或台标中的文字信息进行比较,获取修正后的滤波器参数。如图3所示,为本发明实施例台标信息的映射表中的台标图片示意图;如图4所示,为本发明实施例截取当前播放的电视台的台标图片示意图。通过本发明实施例上述方案可以识别出文字信息CCTV音乐。台标中可能没有图形字符,只是有一些文本字符,这个时候进行文字识别训练,即通过识别视频流中的文本字符来和台标的原始文本字符相比较,可以校正滤波器参数。另外,很多台标中可能没有文本字符,但是有一些图形字符,这个时候进行文字识别训练仍然是可行的,即通过识别视频流中的图形来和台标的原始图形相比较,仍然可以校正滤波器参数。如图5所示,为本发明实施例截取当前播放的电视台的信息图片示意图;如图6所示,为本发明实施例识别出的文字信息示意图。通过本发明实施例上述方案可以识别出文字信息“好知道了”。可以通过OCR (Optical Character Recognition,光学字符识别)识别出上述文字信息。可选的,在本发明的一实施例中,所述文字信息可以包括电话号码、网址、文本字符等。可选的,在本发明的一实施例中,所述信息识别方法还可以包括根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式。可选的,在本发明的一实施例中,所述根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式,可以包括当所述文字信息为电话号码时,将所述电话号码存储成可拨打格式的电话号码;和/或当所述文字信息为网址时,将所述网址存储成可链接格式的网址;和/或当所述文字信息为文本字符时,将所述文本字符存储成文字编辑版的格式。本发明上述方法实施例因为采用获取当前播放的电视台的台标信息的映射表;根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的信息进行比较,获取修正后的滤波器参数;利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别的技术手段,所以克服了显示屏的设置(例如亮度,对比度,饱和度等)不同的影响,提高了文字识别的成功率。不论各个电视台播放视频是否一样,或者同样的播放终端,因为用户处在不同的环境下,显示屏的设置是否一样,都可以提高文字识别的成功率。且对于一些对滤波器参数设置不懂的用户而言,由于台标信息的映射表储存在设备端或者服务器端,通过获取该映射表进行文字识别训练,极大的提高了其进行文字识别的能力,使文字识别更加方便化,更容易被用户所接受。另一方面,对应于上述方法实施例,如图7所示,为本发明实施例一种信息识别装置结构示意图,所述信息识别装置包括映射表获取单元701,用于获取当前播放的电视台的台标信息的映射表;识别训练单元702,用于根据所述台标信息的映射表,对所述当前播放的电视台的 台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的文字信息进行比较,获取修正后的滤波器参数;文字识别单元703,用于利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别。可选的,在本发明的一实施例中,所述映射表获取单元701,用于当终端开机时,或者当播放的电视台为新电视台时,或者当需要进行视频中的文字信息识别时,获取当前播放的电视台的台标信息的映射表。可选的,在本发明的一实施例中,所述映射表获取单元701,用于从终端本地获取所述当前播放的电视台的台标信息的映射表,或者从网络侧设备获取所述当前播放的电视台的台标信息的映射表。可选的,在本发明的一实施例中,所述映射表获取单元701获取的台标信息的映射表包括频率点和/或信道号-台标位置-台标图片和/或台标中的文字信息。可选的,在本发明的一实施例中,所述识别训练单元702,用于根据所述台标信息的映射表,获取所述当前播放的电视台的频率点和/或信道号,然后根据所述台标信息的映射表中的台标位置截取当前播放的电视台的台标图片,利用所述台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标图片和/或台标中的文字信息进行比较,获取修正后的滤波器参数。可选的,在本发明的一实施例中,所述文字识别单元703识别出的文字信息包括电话号码、网址、文本字符。可选的,如图8所示,为本发明实施例另一种信息识别装置结构示意图。该信息识别装置不但包括上述映射表获取单元701、识别训练单元702、文字识别单元703,还包括分类存储单元704,用于根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式。可选的,所述分类存储单元704,具体用于当所述文字信息为电话号码时,将所述电话号码存储成可拨打格式的电话号码;和/或当所述文字信息为网址时,将所述网址存储成可链接格式的网址;和/或当所述文字信息为文本字符时,将所述文本字符存储成文字编辑版的格式。另外,再一方面,本发明实施例还提供一种移动终端,所述移动终端包括上述信息识别装置。本发明上述装置实施例因为采用映射表获取单元获取当前播放的电视台的台标信息的映射表;识别训练单元根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的信息进行比较,获取修正后的滤波器参数;文字识别单元利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别的技术手段,所以克服了显示屏的设置(例如亮度,对比度,饱和度等)不同的影响,提高了文字识别的成功率。例如,各个电视台播放节目品质不一样,造成用户观看其节目时的亮度,对比度,饱和度等等都不一样,这将最终影响文字识别成功率;又如,即使同样的播放终端,当用户处在不同的环境下时,由于显示屏的设置(亮度,对比度,饱和度等等)一样,其结果也会最终会影响文字识别的成功率,而应用本发明上述方案后,不论各个电视台播放视频是否一样,或者同样的播放终端,因为用户处在不同的环境下,显示屏的设置是否一样,都可以提高文字识别的成功率。且对于一些对滤波器参数设置不懂的用户而言,由于台标信息的映射表储存在设备端或者服务器端,通过获取该 映射表进行文字识别训练,极大的提高了其进行文字识别的能力,使文字识别更加方便化,更容易被用户所接受。本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(iIlustrativelogical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列(FPGA)或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、⑶-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电脑、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。以上所述的具体实施方式
,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式
而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含 在本发明的保护范围之内。
权利要求
1.一种信息识别方法,其特征在于,所述信息识别方法包括 获取当前播放的电视台的台标信息的映射表; 根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的信息进行比较,获取修正后的滤波器参数; 利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别。
2.如权利要求I所述信息识别方法,其特征在于,所述获取当前播放的电视台的台标信息的映射表,包括 当终端开机时,或者当播放的电视台为新电视台时,或者当需要进行视频中的文字信息识别时,获取当前播放的电视台的台标信息的映射表。
3.如权利要求I所述信息识别方法,其特征在于,所述获取当前播放的电视台的台标信息的映射表,包括 从终端本地获取所述当前播放的电视台的台标信息的映射表,或者从网络侧设备获取所述当前播放的电视台的台标信息的映射表。
4.如权利要求I所述信息识别方法,其特征在于,所述台标信息的映射表包括频率点和/或信道号-台标位置-台标图片和/或台标中的文字信息。
5.如权利要求4所述信息识别方法,其特征在于,所述根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的信息进行比较,获取修正后的滤波器参数,包括 根据所述台标信息的映射表,获取所述当前播放的电视台的频率点和/或信道号,然后根据所述台标信息的映射表中的台标位置截取当前播放的电视台的台标图片,利用所述台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标图片和/或台标中的文字信息进行比较,获取修正后的滤波器参数。
6.如权利要求I所述信息识别方法,其特征在于,所述文字信息包括电话号码、网址、文本字符。
7.如权利要求I或6所述信息识别方法,其特征在于,所述信息识别方法还包括 根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式。
8.如权利要求7所述信息识别方法,其特征在于,所述根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式,包括 当所述文字信息为电话号码时,将所述电话号码存储成可拨打格式的电话号码;和/或 当所述文字信息为网址时,将所述网址存储成可链接格式的网址;和/或 当所述文字信息为文本字符时,将所述文本字符存储成文字编辑版的格式。
9.一种信息识别装置,其特征在于,所述信息识别装置包括 映射表获取单元,用于获取当前播放的电视台的台标信息的映射表; 识别训练单元,用于根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的信息进行比较,获取修正后的滤波器参数; 文字识别单元,用于利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别。
10.如权利要求9所述信息识别装置,其特征在于,所述映射表获取单元,用于当终端开机时,或者当播放的电视台为新电视台时,或者当需要进行视频中的文字信息识别时,获取当前播放的电视台的台标信息的映射表。
11.如权利要求9所述信息识别装置,其特征在于,所述映射表获取单元,用于从终端本地获取所述当前播放的电视台的台标信息的映射表,或者从网络侧设备获取所述当前播放的电视台的台标信息的映射表。
12.如权利要求9所述信息识别装置,其特征在于,所述映射表获取单元获取的台标信息的映射表包括频率点和/或信道号-台标位置-台标图片和/或台标中的文字信息。
13.如权利要求12所述信息识别装置,其特征在于,所述识别训练单元,用于根据所述台标信息的映射表,获取所述当前播放的电视台的频率点和/或信道号,然后根据所述台标信息的映射表中的台标位置截取当前播放的电视台的台标图片,利用所述台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标图片和/或台标中的文字信息进行比较,获取修正后的滤波器参数。
14.如权利要求9所述信息识别装置,其特征在于,所述文字识别单元识别出的文字信息包括电话号码、网址、文本字符。
15.如权利要求9或14所述信息识别装置,其特征在于,所述信息识别装置还包括 分类存储单元,用于根据类型对识别出的文字信息进行分类,并将所述文字信息存储成与其类型对应的格式。
16.如权利要求15所述信息识别装置,其特征在于,所述分类存储单元,用于当所述文字信息为电话号码时,将所述电话号码存储成可拨打格式的电话号码;和/或当所述文字信息为网址时,将所述网址存储成可链接格式的网址;和/或当所述文字信息为文本字符时,将所述文本字符存储成文字编辑版的格式。
17.—种移动终端,其特征在于,所述移动终端包括如权利要求9-16中任一所述信息识别装置。
全文摘要
本发明提供一种信息识别方法、装置及移动终端,所述信息识别方法包括获取当前播放的电视台的台标信息的映射表;根据所述台标信息的映射表,对所述当前播放的电视台的台标图片进行文字识别训练,将训练的结果和所述台标信息的映射表中的台标中的信息进行比较,获取修正后的滤波器参数;利用所述修正后的滤波器参数,对所述当前播放的电视台的节目中出现的文字信息进行识别。所述信息识别装置包括映射表获取单元、识别训练单元、文字识别单元。所述移动终端包括上述信息识别装置。本发明克服了显示屏的设置(例如亮度,对比度,饱和度等)不同的影响,提高了文字识别的成功率。
文档编号H04N21/435GK102957963SQ20111023598
公开日2013年3月6日 申请日期2011年8月17日 优先权日2011年8月17日
发明者叶敏华, 石俊 申请人:浪潮乐金数字移动通信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1