影像识别翻译装置及方法

文档序号:6561058阅读:326来源:国知局
专利名称:影像识别翻译装置及方法
技术领域
本发明涉及一种翻译装置,尤其涉及一种将所见物体中的文字翻译为指 定语言的装置。
背景技术
目前翻译机的操作都是由使用者以输入按键的方式,将所要查询的文 字键入翻译机内,再由翻译机在其内建的资料库中搜寻对应的翻译,并将 查询结果显示在屏幕上供使用者査看。随着电子科技的快速发展,市场上 的消费类电子产品都整合了多项功能以提升其竞争力,除了一般的拍照、 通话、上网等功能之外,现在连翻译功能都可整合在手机或个人数字助理 等便携式电子装置上,而传统翻译机输入文字的方式也从按键输入发展为 手写、语音输入等方式,如此不仅可以方便使用者快速输入文字,也提供 给使用者多样化的选择。然而,以按键逐字输入或是以手写输入的方式非常耗费时间,无法应 付随时而来的需要。此外,在现在的电子产品讲究轻、薄、短、小的潮流 下,在电子产品上装设键盘可能会因为按键太小而造成使用上的不方便, 若改为较大型的键盘或手写板则会增加电子产品的体积,而降低产品的便 携性及竞争力。此外,使用传统翻译机査询文字的功能是建立在使用者了解所见文 字的字母或者发音的前提下,且需配合适用的输入法或麦克风,才能顺 利地输入,查找文字的翻译。然而当使用者到国外出差或者旅游时,则 有可能会因为连所见文字的字母都看不懂,而无从査询其翻译,相当地 不方便。

发明内容
本发明的目的是提供一种影像识别和翻译装置,包括以相机等影像获 取装置拍摄图片,再利用内建的文字识别模块及翻译模块将图片中的文字 翻译,并将翻译结果显示在屏幕上。
本发明的另一个目的是提供一种影像识别及翻译方法,首先拍摄想要 翻译的图片或看到的文字,在识别出其中的文字后,对照翻译为合适的语 言,从而让使用者了解图片中的文字内容。
为了达到上述目的,根据本发明的一个方面,提供一种影像识别和翻译装 置,包括影像获取单元、文字识别模块、翻译模块及显示单元。其中所述影像获取单元用于拍摄影像,所述影像中包括属于第一语言中的至少一个文字;文 字识别模块则用于识别影像中的文字。此外,翻译模块用于将识别出的文字翻译为第二语言;显示单元用于显示所述翻译为第二语言的文字。
根据本发明的另一个方面,还提供了一种用于便携式电子装置中的影像识别翻译方法,该方法包括以下步骤首先拍摄一个影像,此影像中包括 属于第一语言的至少一个文字,接着识别影像中的文字,然后将识别出的 文字翻译为第二语言,最后显示翻译为第二语言的文字。
本发明因采用结合影像获取单元、文字识别及翻译模块的结构,因 此当使用者看到想要翻译的文字时,只要将包括这些文字的影像拍摄下 来,即可识别及翻译为指定的语言,而达到方便使用者了解文字内容的 目的。
本发明的影像识别和翻译装置及方法至少具有下列优点1. 支持各国文字,避免使用者因看不懂文字,无法键入文字或念出文字 以查询其翻译所造成的困扰。2. 使用相机拍摄,可达到随拍即用,快速翻译的功效,縮短使用者输入 文字的时间。3. 不需使用键盘输入,因此可以缩小装置的体积,提供使用者随身携带 的便利性。4. 可整合在现有的手机、个人数字助理上,不会额外增加装置的生产成 本。


下面结合附图对本发明作进一步描述图1为根据本发明的一个具体实施方式
的影像识别和翻译装置框图; 图2为根据本发明的一个具体实施方式
的影像识别和翻译方法流程图。
具体实施方式
为了使本发明的内容更为明了,下面特举实施例作为本发明确实能 够据以实施的范例。图1为根据本发明的一个较佳实施例的影像识别和翻译装置框图。 参照图1,本实施例的影像识别和翻译装置IOO例如是一个手机、个人数 字助理、智能电话或翻译机,而其内部则包括有影像获取单元110、文字 识别模块120、翻译模块130、显示单元140、存储单元150、语音播放 单元160,从而能够为使用者即时翻译所见图案中的文字。影像获取单元110用于拍摄影像,文字识别模块120用于识别所拍 影像中的文字,翻译模块130则接着将识别出的文字翻译为指定的语言, 最后显示单元140则将翻译出的文字显示出来。此外,存储单元150可 用于记录所翻译出的文字,让使用者能够随时査询,而语音播放单元160 则可将翻译完成之文字以语音播放的形式告知使用者。图2是根据本发明的较佳实施例的影像识别和翻译方法流程图。同 时参照图1和图2,本实施例详细介绍如何将物体上的文字通过本发明之 影像识别和翻译装置IOO翻译成使用者所指定的语言。在步骤S110中,首先,当使用者看到想要翻译的图片或者文字,例 如海报、标示牌或者是餐厅的菜单等,即可以先用影像获取单元110将 此物体拍摄为影像,此影像包括属于第一语言(例如是英文)的至少一 个文字。其中,此影像获取单元110例如是一个电荷耦合器件 (Charge-Coupled Device, CCD)相机或者是一个互补金属氧化物半导体 Complementary Metal Oxide Semiconductor, CMOS)相机,但不限于此。在步骤S120中,在拍摄完成之后,影像识别和翻译装置100中内建 的文字识别模块120即会开始识别影像中的文字。其中,使用者可以根
据其需要,在影像中圈选一个范围,而文字识别模块120就可只识别此 范围内的文字,因此能够縮短文字识别的时间,提高文字识别的正确率。在步骤S130中,接着由影像识别和翻译装置100中内建之翻译模块 130将文字识别模块120所识别出的文字翻译为指定的第二语言(例如中 文)。其中,使用者可以在影像识别和翻译装置IOO选取或设定所要翻 译的语言,所述语言可包括有中文、英文、法文、西班牙文等各国语言, 可视翻译模块130所能支持的语言种类及数目而定,并不限制其范围。在步骤S140中,在翻译完成后,即可将翻译完成的文字显示在影像 识别和翻译装置100的显示单元140上。其中,此显示140可以是一个 液晶显示(Liquid Crystal Display, LCD)屏幕,而其显示方式可以是仅单 纯地显示文字,或者是显示出原影像,并将翻译文字覆盖在原影像中所 翻译文字之上等方式,亦不限制其范围。此外,在本发明的另一个较佳实施例中,还可以将翻译完成的文字 以语音播放方式播放,让使用者了解其发音是与他人沟通,而此翻译完 成的文字也可以存储,作为将来学习或参考用,相当方便。以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不 局限于上述特定的实施方式,本领域技术人员可以在所附权利要求的范围 内做出各种变形或修改。因此本发明的保护范围以权利要求书所界定的范 围为准。
权利要求
1.一种影像识别翻译装置,包括-影像获取单元,用于拍摄一个影像,所述影像中包括属于第一语言的至少一个文字;-文字识别模块,用于识别所述影像中的所述至少一个文字;-翻译模块,用于将识别出的所述影像中的所述至少一个文字翻译为第二语言;以及-显示单元,用于显示所述翻译为第二语言的至少一个文字。
2. 根据权利要求1中所述的影像识别翻译装置,其特征在于,还包括-语音播放单元,用于语音播放所述翻译为第二语言的至少一个文字。
3. 根据权利要求1中所述的影像识别翻译装置,其特征在于,还包括..-存储单元,用于存储所述翻译为第二语言的至少一个文字。
4. 根据权利要求1中所述的影像识别翻译装置,其特征在于,该装 置包括手机、个人数字助理、智能电话或翻译机。
5. 根据权利要求1中所述的影像识别翻译装置,其特征在于,所述 影像获取单元包括电荷藕合器件(Charge-Coupled Device, CCD)相机或 互补金属氧化物半导体(Complementary Metal Oxide Semiconductor, CMOS)相机。
6. 根据权利要求1中所述的影像识别翻译装置,其特征在于,其中 所述显示单元包括液晶显示(Liquid Crystal Display, LCD)屏幕。
7. 根据权利要求1中所述的影像识别翻译装置,其特征在于,其中 所述显示单元显示所述翻译为第二语言的至少一个文字的方式为单纯地 显示文字。
8. 根据权利要求1中所述的影像识别翻译装置,其特征在于,其中 所述显示单元显示所述翻译为第二语言的至少一个文字的方式为显示所 述影像,并将所述翻译为第二语言的至少一个文字分别覆盖在所述影像中 与之对应的属于第一语言的至少一个文字上。
9. 一种在便携式电子装置中用于影像识别和翻译的方法,包括以下拍摄影像,所述影像中包括属于第一语言的至少一个文字; b.识别所述影像中的属于第一语言的至少一个文字;c. 将识别出的所述影像中的属于第一语言的至少一个文字翻译为第 ~^语曰;d. 显示所述翻译为第二语言的至少一个文字。
10. 根据权利要求9中所述方法,其特征在于,还包括-播放所述翻译为第二语言的至少一个文字。
11. 根据权利要求9中所述方法,其特征在于,还包括 -存储所述翻译为第二语言的至少一个文字。
12. 根据权利要求9中所述方法,其特征在于,其中识别该属于第一 语言的至少一个文字的步骤还包括bl.从所述影像中圈选出所要翻译的至少一个文字; b2.识别所述圈选出的至少一个文字。
13. 根据权利要求9中所述的方法,其特征在于,所述便携式电子装 置包括手机、个人数字助理、智能电话或翻译机。
14. 根据权利要求9中所述的方法,其特征在于,所述便携式电子装 置中的影像获取单元包括电荷藕合器件(Charge-Coupled Device, CCD) 相机或互补金属氧化物半导体(Complementary Metal Oxide Semiconductor, CMOS )相机。
15.根据权利要求9中所述的方法,其特征在于,所述便携式电子装置 中的显示单元包括液晶显示(Liquid Crystal Display, LCD)屏幕。
全文摘要
一种影像识别及翻译装置和方法,所述方法是籍由一个影像获取单元拍摄一个影像,并用一个文字识别模块识别所述影像中的文字,接着用一个翻译模块将识别出的文字翻译为指定的语言,最后用显示单元显示出所翻译出文字。本发明不仅可避免使用者因看不懂文字而无法查询的困扰,还能够方便使用者输入文字,而达到随拍即用,快速翻译的目的。
文档编号G06K9/20GK101127036SQ20061011557
公开日2008年2月20日 申请日期2006年8月14日 优先权日2006年8月14日
发明者吴炯宪, 李明伦, 王斌铨 申请人:英华达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1