撷取图像文字的翻译系统及其方法

文档序号：7924882阅读：175来源：国知局

专利名称：撷取图像文字的翻译系统及其方法
技术领域：
一种翻译系统及其方法，特别是指一种能撷取图像文字后进行翻译的系统及其方法。
背景技术：
近年来，现代人越来越重视知识交流与休闲活动，观看节目、DVD电影或进行游戏成为许多人休闲生活中不可或缺的一环。但是随着国际化的发展趋势，信息的传播比以往更广阔，常会在影视或其他节目上出现许多不同语言，例如韩文的节目、英文的电影或日文的游戏等，接收不同语言的机会大幅的增加。
目前当使用者观看影片或节目出现不同语言的字词或句子时，只能将想查询的字词或句子抄写下来再使用字典或用其他翻译软件进行翻译，例如当使用者观看英语新闻节目遇到字词或句子，只能记下来后再进行查询，造成查询上的不方《更。
已知技术的翻译软件大多使用于电脑、PDA(个人数字助理)或手机中，对于出现在影片播放中的语言需要进行翻译时，仍然需M助如电脑、PDA或手机等电子装置的翻译软件或是字典，另外，已知技术的影片语言学习软件大多是市面上已翻译完成的影片，使用者无法自行选择有兴趣的影片来进行学习，只能选择市面上有翻译学习的影片，若使用者观看影片或节目想要进行语言学习则无法实现。
综上所述，可知现有技术中长期以来一直存在影片播;故中无法翻译的问题，因此有必要提出改进的技术手段，来解决此问题
发明内容
有鉴于现有技术存在的影片播放中无法翻译问题，本发明揭露一种撷取
图像文字的翻译系统及其方法，其中
本发明所揭露的撷取图像文字的翻译系统，至少包含图像撷取4莫块、文字块撷取模块、文字辨识模块、翻译模块及嵌入模块，其中图像擷取模块是用以撷取图像得到视频信号，并将视频信号进行格式转换得到图档；文字块撷取才莫块是用以撷取图档(ImageFile)的特定文字范围形成文字辨识块；文字辨识才莫块是用以对文字辨识块进行文字辨识得到文字资料；翻译才莫块是用以将文字资料进行翻译得到翻译资料；嵌入模块是用以将翻译资料嵌入视频信号的合适范围或替代文字辨识块的文字范围。
本发明所揭露的撷取图像文字的翻译方法，其步骤至少包括擷取图像得到视频信号，并将视频信号进行格式转换得到图档，接着撷取图档的特定文字范围形成文字辨识块，对文字辨识块进行文字辨识得到文字资料，再将文字资料进行翻译得到翻译资料，最后将翻译资料嵌入视频信号的合适范围或替代文字辨识块的文字范围。
本发明所揭露的系统与方法如上，与现有4支术之间的差异在于本发明通过撷取图像的视频信号转换成图档后，撷取图档中的文字进行文字辨识与翻译，最后将翻译资料嵌入视频信号或替代文字范围的技术手段。
通过上述的技术手段，本发明可以达成影片播;故中能进行翻译的技术功效。

图1为本发明撷取图像文字的翻译第一实施例系统方框图。图2为本发明撷取图像文字的翻译第二实施例系统方框图。图3为本发明撷取图像文字的翻译第一实施例方法流程图。图4至图7为本发明撷取图像文字的翻译系统在第一实施例中的示意图。图8为本发明撷取图像文字的翻译第二实施例方法流程图。
具体实施方式
以下将配合附图及实施例来详细说明本发明的实施方式，藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
在说明本发明的实施例之前，配合附图对本发明撷取图像文字的翻译系统及其方法作进一步的il明，请参阅图1，图1为本发明撷取图像文字的翻
译第一实施例系统方框图。本实施例中，撷取图像文字的翻译系统100包含图像撷^4莫块110、文字块撷取模块120、文字辨识模块130、翻译模块140 及嵌入模块150。
其中，图像撷^ 块110是负责撷取图像得到视频信号160，并将得到的视频信号160进行格式转换得到图档，而图像包含节目、DVD影片或游戏等输出的图像，适用于以电视为显示装置所输出图像的视频信号160皆为本发明所指，因此图像撷:^a莫块110会擷取影片或节目的视频信号160，之后将撷取得到的视频信号160进行格式转换以得'到图档。藉由图像撷取模块110 可以撷取影片或节目所有图像的视讯信号160，并经由格式转换得到用来进行文字辨识的图档。
文字块撷取;f莫块120负责撷取图档的特定文字范围形成文字辨识块，也就是文字块撷取模块120会将图像撷模块110撷取图像形成的图档进行特定文字范围的撷取，形成文字辨识块。值得注意的是，图档的特定文字范围的位置可以由系统预先设定，例如图像的文字位置位于图像下方，也就是可以预先设定系统撷取图档的特定文字范围是图档下方的位置，当文字块撷取模块120得到图档时会自动撷取图档下方的特定文字范围来形成文字辨识块；因此文字块撷取才莫块120的目的在于撷取图档中的文字块，利用文字块撷取 -漠块120可先滤除其余非文字块的部份，避豈进行文字辨识时it无用信息干扰。
文字辨识模块130负责对文字辨识块中的文字进4亍辨识得到文字资料，文字辨识模块130通过例如是字体修整、分割单字、单字细线化、萃取特征点、比对等步骤对文字辨识块中的文字进行辨识，得到文字资料，文字辨识块中的文字可以是中文、英文、日文或韩文等各种文字，只要是文字辨识模块130可以辨识得到文字资料皆为本发明所指。
翻译才莫块140负责将文字辨识;漠块130辨识得到的文字资料进行翻译得
6到翻译资料，文字资料与翻译资料可以是中文、英文、日文或韩文等语言的
资料，但文字资料与翻译资料必须互为不同语言，翻译4莫块140进行翻译是指将文字资料翻译后得到与文字资料不同的语言，例如是文字资料为中文，由翻译模块140进行翻译后得到英文的翻译资料，而翻译模块140要将文字资料翻译为何种语言的翻译资料可以由系统预先设定，本发明不予以限定。
嵌入模块150负责将翻译模块140翻译完成的翻译资料嵌入到视频信号 160合适范围或替代文字辨识块的文字范围，也就是嵌入才莫块150会将翻译资料嵌入到视频信号160的合适范围，合适范围可以是预先设定系统嵌入至视频信号160的哪个位置，例如是预先设定嵌入至视频信号160的下方位置，或是嵌入才莫块150会将翻译资料以替代文字辨识块文字范围的方式嵌入。嵌入模块150的目的在于完成翻译后让使用者看到的是已翻译完成的图像，亦可以是配上翻译资料的图像或是文字资料与翻译资料同时呈现的图像。
通过上述撷取图像文字的翻译系统的运作，可以藉由撷取图像的视频信号转换成图档后，撷取图档中的文字进行文字辨识与翻译，最后将翻译资料嵌入视频信号或替代文字范围的方式，可以解决影片播放中无法翻译的问题。
请参阅图2，图2为本发明撷取图像文字的翻译第二实施例系统方框图，值得注意的是，图2中标号与图1相同的元件，与第一实施例中所提及的元件操作大致相同，以下针对第二实施例与第一实施例相异处进行说明。
在第二实施例中，撷取图像文字的翻译系统100增加了接收模块170，接收模块170是负责接收使用者的第一控制辨令与第二控制指令，而第一控制指令与第二控制指令是使用者以无线遥控器输入，第一控制指令用以撷取使用者指定撷取的图像，也就是当影片播放时，有想要翻译的图像出现，可以使用无线遥控器发出第一控制指令，接收模块170接收第一控制指令后，图像擷^f莫块110会依据第一控制指令撷取图像得到视频信号160并将视频信号160进行格式转换得到图档。
第二控制指令用以撷取图档中使用者指定撷取的特定文字范围，也就是当使用者撷取得到图像的图档后，使用者使用无线遥控器发出第二控制指令，接收模块170接收第二控制指令后，文字块撷取模块120会依据第二控制指令撷取图档的特定文字范围形成文字辨识块。
与第一实施例相比，第二实施例的撷取图像文字的翻译系统100增加了接收^t块170，目的在于可以提供使用者依据使用者的需求自行控制所想要指定撷取图像的视频信号160，以及指定撷取欲进行翻译的文字块。
以下将举实施例具体说明本发明，然其并非用以限定本发明，本领域技术人员可依照本发明的精神对下述实施例稍做修改，仍属于本发明的范围。
图3所示为本发明撷取图像文字的翻译第一实施例方法流程图，图4至图7为本发明撷取图像文字的翻译系统在第一实施例中的示意图。以下将同时配合图3至图7说明本发明撷取图像文字的翻译在第一实施例中的操作步骤和实施例。
先说明本发明撷取图像文字的翻译系统的背景，撷取图像文字的翻译系统可以应用于语言学习中，例如是看影片学英语，已知技术的影片语言学习，是将翻译语言字幕预先处理并分别储存原始语言字幕与翻译语言字幕供使用者自行操作使用，但这些可以进行语言学习的影片不一定是"f吏用者有兴趣的影片，若使用者对于有趣的影片或节目有兴趣想要进行语言学习时则无法实现，而本发明所提供的系统及方法不需要预先处理翻译字幕，使用者即可任意选择喜欢的影片或节目进行翻译，解决现有技术中影片或节目必须预先进 4亍翻译处理的问题。
请参阅图4与图5，撷取图像文字的翻译系统100会擷取图像得到视频信号，并将视频信号进行格式转换得到图档46o(步骤301)，其中若撷取图像是一整部影片时，撷取图像文字的翻译系统IOO会将图像擷取进行翻译，本实施例只以撷取其中一幕的图像作为说明，但本发明可适用于翻译一整部影片或一部分的节目皆可，本发明不予以限定，而图档400可以是由节目、影片或游戏的图像撷取得到的视频信号经过格式转换所得到的，适用于以电视作为显示装置输出的视频信号皆可为本发明所用。
接着，撷取图像文字的翻译系统IOO会撷取图档400的特定文字范围形成文字辨识块410(步骤302)，而特定文字范围的位置可以是由系统预先设定，如本实施例是设定为图档400下方的范围为文字块，因此撷取图像文字的翻译系统100会自动撷取文字块得到文字辨识块410。
撷取图像文字的翻译系统100得到文字辦识块410后进行文字辨识得到文字资料420 "我们是好朋友"(步骤303),然后撷取图像文字的翻译系统100 会将文字资料420 "我们是好朋友"进行翻译得到翻译资料430 "We are goodfriends"(步骤304)。
请参阅图6，撷取图像文字的翻译系统100将翻译资料430 "We are good friends"替代文字资料420的位置得到翻译完成的图档400(步骤305)，或是如图7所示，撷取图像文字的翻译系统100也可将翻译资料430 "We are good friends"嵌入到文字资料420 "我们是好朋友"的合适范围，例如是上方位置，形成文字资料420与翻译资料430可在视频信号中同时对照。
除了上述实施例的外，本发明也可于另一实施例，增加了让使用者可自行选择所需要的图像与文字块，也就是本发明撷取图像文字的翻译第二实施例，请参阅图8，图8所示为本发明撷取图像文字的翻译第二实施例方法流程图，第二实施例中所提及的步骤与第一实施例的步骤大致相同，以下针对第二实施例与第一实施例方法步骤相异处进行-沈明。
首先，撷取图像文字的翻译系统100接收使用者以第一控制指令擷取图像(步骤801)，其中第一控制指令是使用者以无线遥控器输入的，然后撷取图像文字的翻译系统100依据第一控制指令撷琳图像得到视频信号，并将视频信号进行格式转换得到图档(步骤802)。
得到图档后，撷取图像文字的翻译系统100接收使用者以第二指令撷取图档的特定文字范围(步骤803)，其中第二控制指令是使用者以无线遥控器输入的，然后撷取图档的特定文字范围形成文字辨识块(步骤804)。藉由提供使用者自行操控欲进行翻译的图像与文字块，让使用者可自由选择部分图像或部分的文字块进行翻译。
综上所述，可知本发明与现有技术之间的差异在于具有撷取图像的视频信号转换成图档后，撷取图档中的文字进行文字辨识与翻译，最后将翻译资料嵌入视频信号或替代文字范围的技术手段，藉由此技术手段可以解决现有技术所存在影片播放中无法翻译的问题，进两达成影片播放中能进行翻译的技术功效。
虽然本发明所揭露的实施方式如上，但所述的内容并非用以直接限定本发明的保护范围。任何熟知本发明所属技术领域中技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式上及细节上作些许的更改。本发明的保护范围，仍须以所附;fr又利要求的保护范围的界定为准。
权利要求
1、一种撷取图像文字的翻译系统，其特征在于，至少包含一图像撷取模块，用以撷取图像得到一视频信号，并将该视频信号进行格式转换得到一图档；一文字块撷取模块，用以撷取该图档的特定文字范围形成一文字辨识块；一文字辨识模块，用以对该文字辨识块进行文字辨识得到一文字资料；一翻译模块，用以将该文字资料进行翻译得到一翻译资料；及一嵌入模块，用以将该翻译资料嵌入该视频信号的合适范围或替代该文字辨识块的该文字范围。
2、如权利要求1所述的擷取图像文字的翻译系统，其特征在于，还包含一接收模块，用以接收一使用者的一第一控制指令，以及接收该使用者的一第二控制指令，其中该第一控制指令为撷取图像，该第二控制指令为撷取该图档的特定文字范围。
3、如权利要求2所述的撷取图像文字的翻译系统，其特征在于，该第一控制指令与该第二控制指令是该使用者以一无线遥控器输入。
4、如权利要求1所述的撷取图像文字的翻译系统，其特征在于，该图档的特定文字范围的位置是由系统预先设定。
5、一种撷取图像文字的翻译方法，其特征在于，至少包含下列步骤(a) 撷取图像得到一视频信号，并将该视频信号进行格式转换得到一图档；(b) 撷取该图档的特定文字范围形成一文字辨识块；(c) 对该文字辨识块进行文字辨识得到一文字资料；(d) 将该文字资料进行翻译得到一翻译资料；及(e) 将该翻译资料嵌入该视频信号的合适范围或替代该文字辨识块的该文字范围。
6、如权利要求5所述的撷取图像文字的翻译方法，其特征在于，在步骤(a)之前，还包括接收一使用者以一第一控制指令撷取图像。
7、如权利要求5所述的撷取图像文字的翻译方法，其特征在于，在步骤(b)之前，还包括接收该使用者以一第二控制指令撷取该图档的特定文字范围。
8、如权利要求6所述的撷取图像文字的翻译方法，其特征在于，该第一控制指令是该使用者以一无线遥控器输入。
9、如权利要求7所述的撷取图像文字的翻译方法，其特征在于，该第二控制指令是该使用者以一无线遥控器输入。
10、如权利要求5所述的撷取图像文字的翻译方法，其特征在于，该图档的特定文字范围的位置是由系统预先设定。
全文摘要
一种撷取图像文字的翻译系统及其方法，其通过撷取图像的视频信号转换成图档后，撷取图档中的文字进行文字辨识与翻译，最后将翻译资料嵌入视频信号或替代文字范围的技术手段，可以解决现有技术中所存在的影片播放中无法翻译的问题，藉此可以达成在影片播放中能进行翻译的技术功效。
文档编号H04N5/278GK101674420SQ20081021151
公开日2010年3月17日申请日期2008年9月10日优先权日2008年9月10日
发明者刘晓安, 邱全成申请人:英业达股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邱全成;刘晓安
技术所有人：英业达股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。