阅读声译器的制作方法

文档序号:6412285阅读:305来源:国知局
专利名称:阅读声译器的制作方法
技术领域
本发明属于一种在计算机技术领域中,突破现行的输入和输出方式,实现在阅读过程中即时读出求译语种语词释义,进行双语种或多语种语词翻译的阅读声译器。
现行电子词典产品作为计算机技术应用的一个分支,以其方便携带、方便使用的特点已经流行了近十年,而且市场很好。每年全世界的销售总量超过百万台。随着市场竞争日益激烈,各厂家新产品陆续出台,有的增加手写方式输入,有的增加真人发音,以追求完美的发声效果,纷纷以增加功能来吸引客户。但是这些措施投入大,收效小,因为这种附加功能的发展再多,也无助于电子词典对其最基本功能——省时省事即时翻译效果的改进。
从目前电子词典的发展趋势看,各厂家的注意力集中在两个发展方向上一是提高翻译能力,使词汇量达到了五万以上,基本上满足日常使用的需要;二是改进翻译语词的输入方式,例如增加手写输入,而这些输入方式的改进也仅是针对汉字输入做的。
实际上,在阅读过程中使用电子词典帮助翻译的繁琐操作,才是影响阅读速度的重要的因素。以中国人阅读英语资料为例,每查一个英语单词的汉语语词及释义,读者眼睛必须离开英语文本,调过头来操作电子词典,按键输入英语单词检索,看屏幕找到所要的汉语语词及释义,再调过头来在文本中找到原来阅读的地方。这个过程至少要用一分钟。如若一页文本中查找五个英语单词的汉语语词及释义,阅读的思绪、求知的渴望被中断五次,试想,读这篇文章还有何情趣可言!对其它语种之间的互译情况也大体如此。实际上专家作过统计,一般人用电子词典查五个生词的时间,就已经超过了阅读一页文本的时间。
这就是风行一时的电子词典,给千百万用户带来的实际困惑。
如今,电子词典存在的缺点,已经逐渐被人们所感受,并由此影响了电子词典曾经有过的“挡不住的诱惑力”,产品滞销,市场萎缩。
本发明的目的是提出一种突破现行输入和输出方式,实现即时翻译的全新产品技术方案和新方法技术方案;使应用计算机技术帮助阅读翻译的电脑产品,在科学性、实用性、方便性上真正地更新换代。
这里,“待译语种”指读者未知某语词释义的语种,即被扫描文本的语种,本发明用A表示;“求译语种”指操作者希望听到释义声音的那一语种,本发明用B表示。
本发明是一种即时读出求译语词释义的双语种或多语种阅读声译器,包括(1)待译A语种文字语词信息输入装置;(2)与待译A语种文字语词信息对应的求译B语种文字语词数据库及检索装置;(3)B语种对应文字的语词释义显示装置;(4)该声译器采用光电图象扫描装置,作为待译A语种文字语词信息的输入装置(1);(5)在待译A语种文字语词信息输入装置和与待译A语种文字语词信息对应的求译B语种文字语词数据库及检索装置(2)之间有A语种语词图象信息识别装置,该识别装置具有A语种语词单元信息选择功能;(6)B语种语词发声数据库及发声装置,用以替代B语种对应文字语词释义显示装置(3),或与其并行设置;由以上装置组成的双语种或多语种阅读声译器。
该阅读声译器中,与待译A语种文字语词信息对应的求译B语种文字语词数据库及检索装置(2),可以是可选择的B、C、D、E等多种语种文字语词数据库及检索装置(2),组成“一对多”语种可任意选择的阅读声译器。
该阅读声译器中,在其前置的光电图象扫描装置、及其后置的对应求译语种文字的语词数据库及其检索装置之间,有可选择待译的B、C、D、E等多种语种文字语词图象信息识别装置(5),组成“多对一”或“多对多”语种阅读声译器。
该阅读声译器中,与待译A语种的语词信息对应的求译B、C、D、E等语种文字语词数据库及检索装置和语音数据库(2)可以是各自独立的、灵活插入取出的IC卡,可以通过接口与声译器主机插接,组成可求译B、C、D、E等各语种及其文字语词按多种专业分类的数据库的多用声译器。
该阅读声译器中,待译A、B、C、D、E等语种文字的语词图像信息识别装置(5)可以是独立的、灵活插入取出的IC卡,可以通过接口与声译器主机插接,组成可选择待译语种的“多对一”阅读声译器。
本发明方法是一种光电输入和语音输出的助读方法,利用光电图像扫描装置,输入待译语种的语词信号,和利用求译语种的语词发声数据库及发声器读出对应语词释义,采用以下步骤(1)待译A语种的文字图像,通过光电图像扫描装置转换为扫描电信号并将信号数字化后,输入文字图像识别装置;(2)文字图像识别装置利用图像识别软件对经过数字化的文字图像,选出最接近扫描基准线的文字信息,进行识别以获得对应语词的、可编辑处理的字符串,并加以整理获得待译的A语种语词单元数据;(3)待译的A语种语词单元在求译的B语种语词数据及检索装置中,利用翻译软件获得求译的B语种对应的语词释义数据;(4)求译B语种的语词释义数据在B语种语词发声数据库及检索装置中,利用检索软件获得对应的语词发声数据;(5)语词发声数据启动发声器读出对应语词释义的声音;至此,实现光电语词图像扫描输入和音读输出。
在所述的步骤(2)中使用的图像识别软件,还具有容错校正的模糊识别功能,能够自动得到最相近语词信息,纠正在扫描过程中失去的或发生的待译语词的拼写错误;并具有该语种语词单元的信息选择功能,即可以选择出所需语词单元信息。
在所述的步骤(3)中使用的翻译软件,具有对同一语词含有两个以上义项及释义,按使用频度由高而低的顺序排列的功能,即频度高的优先输出发声。当读者认为词义可取时,通过按动开关停止继续发声;否则将自动输出第二个、第三个释义的声音,直至最后一个。
本发明阅读声译器区别于现有技术的突出的实质性特点是
一、以书面语言的基本单位“语词”为对译单元,这里“语词”是指单词,以及搭配形式与释义确定的词组和成语等;二、不用键盘,采用光电图像扫描技术和装置输入待译语词,对扫描输入的信号通过软件处理加工,自动选择需翻译的词语,具有容错纠错功能;三、眼睛不用离开文本、采用发声器即时读出求译的语词释义,当有多个释义时,发声按实用频度高低为序,自高到低读出,中途按键即停。
本发明产品采用的硬件须按功能要求专门设计制作,也可以采用笔形图像扫描器加阅读声译器主机和专业词典的PCMCIA卡组成本发明声译器产品。笔形图像扫描器的功能是将纸上的待译语词利用光电装置转化为二进制电子图像数据。该扫描器中有发光管、光敏芯片、数字采集电路、磨擦轮、光栅轮、开关等。扫描器的图像读入端设有基准线,以便对准输入的文字。其图像的采集方法是,根据移动扫描器的速度、摩擦轮带动光栅轮转动,使文字图像采集电路依光栅转动的节拍,来采集反映在光敏芯片上的光电信息,将纸上的明暗图像转化为用二进制表示的电子图像。
阅读声译器的主机部分主要有计算机系统、液晶显示屏、备用的英文字母键盘、发声喇叭、由CPU、存贮芯片、发声电路、显示驱动电路、输入输出电路、加或不加的PCMCIA驱动电路等构成的主机板等。
以英—汉双语翻译为例,其工作程序是利用图像识别软件对由扫描装置传来的电子图像进行识别,将该待译语词的英文字母信息,转换为ASCII码形式寄存,并使之组合成一完整的英文单词,利用机内英语词典的数据,查出对应该英语单词的汉语义项及释义数据,再启动汉字发音程序,将对应释义读出来,使用者即可在扫描过后极短的时间内,听到该英文单词对应的汉语含义。
PCMCIA卡主要是用来存放各类词典信息,各种待译语种的文字图像识别软件,各种求译语种的语音信息的。使用PCMCIA卡可以存入多个语种,每个语种又可按不同专业的词汇设计不同的PCMCIA卡,一部阅读声译器配用多块可插接的PCMCIA卡,可扩展声译器的使用范围,供各语种、各专业的读者使用。
本发明阅读声译器产品可以分体为扫描装置和声读主机等几个连接部分,通过数据线电缆联接或通过分设于扫描装置与声译器主机内的发射接收装置实现无线联接;也可以将几个分体部分集成为一体,成为一种更小巧手持的电子整机产品,例如制成一支笔形产品。变换电子图像识别软件,可以适用不同的待译语种;变换求译语种语词数据库及检索装置,可以适用不同的求译语种。对应的待译语种语词电子图像识别软件,和求译语种语词数据库及检索装置,可以单独制成IC卡,与声译器插接配合使用,则声译器可以成为多语种的和多专业词汇的声译器。随着技术进步,可以将世界上各种语种编制成待译语种电子图像识别软件和求译语种语词数据库及检索装置集成为一体,就成为“全球通”“大一统”式的声译器。人们在阅读不同语种及各种专业的文字语词时,按动转换选择开关,可以手持扫描装置对准不知释义的语词一划,便可听到译出的声音,从而为世界各国和各民族人民在互阅书面文字或学习时,提供极大的方便条件。
本发明阅读声译器的原理如

图1所示的框图所示。
本发明阅读声译器的产品实施例如附图2、3所示图2是分体产品,图3是一体化产品,其中标号表示(1)主机,(2)显示屏,(3)IC卡插口,(4)扫描装置,(5)开关,(6)数据线电缆,(7)IC卡,(8)电源插头,(9)电源导线,(10)键盘,(11)喇叭,(12)扫描基准线。
结合图2、3对本发明阅读声译器产品加以具体说明;图2表示的分体产品,扫描装置(4)与主机(1)分体,可用数据线电缆(6)联接,也可以通过发射接收装置实现无线联接,主机(1)上备有键盘(10)、喇叭(11)和显示屏(2);主机(1)侧面可设一个或多个IC卡插口(3),IC卡(7)可插入插口(3);主机(1)及扫描装置(4)的电源可由电源导线(9)与插头(8)外接或在扫描装置(4)、主机(1)内部设置充电电源。
图3表示为一整体产品,主机(1)与扫描装置(4)并为一体,省去了备用键盘(10),使整体结构简单、紧凑。
本发明在扫描装置的光电信号采集端设置基准线(12),便于使用时对准待译语词,也为机内软件选择语词单元提供方便条件。
权利要求
1.一种即时读出求译语词释义的双语种或多语种阅读声译器,包括(1)待译A语种文字语词信息的输入装置;(2)与待译A语种文字语词信息对应的求译B语种文字语词数据库及检索装置;(3)B语种对应文字的语词释义显示装置;其特征在于该声译器还包括(4)该声译器采用光电图像扫描装置,作为待译的A语种文字语词信息的输入装置(1);(5)在待译A语种文字语词信息输入装置和与待译A语种文字语词信息对应的求译B语种文字语词数据库及检索装置(2)之间有A语种语词图像信息识别装置,该识别装置具有A语种语词单元信息选择功能;(6)B语种语词发声数据库及发声装置,用以替代B语种对应文字语词释义显示装置(3),或与其并行设置;由以上装置组成的双语种或多语种阅读声译器。
2.如权利要求1所述的声译器,其特征在于与待译A语种文字语词信息对应的求译B语种文字语词数据库及检索装置(2)可以是可选择的B、C、D、E等多种语种文字语词数据库及检索装置(2),组成“一对多”语种可任意选择的阅读声译器。
3.如权利求1所述的声译器,其特征在于在其前置的光电图像扫描装置、及其后置的对应求译语种文字的语词数据库及其检索装置之间,可选择待译的B、C、D、E等多种语种文字语词图像信息识别装置(5),该识别装置具有该同语种语词单元信息选择功能,组成“多对一”语种阅读声译器。
4.如权利要求1所述的声译器,其特征在于;与待译A语种文字的语词信息对应的求译B、C、D、E等语种文字语词数据训及检索装置(2)可以是各自独立的IC卡,可以通过接口与声译器插接,组成可求译B、C、D、E等各种及其文字语词按多种专业分类的数据库的多用声译器。
5.如权利要求1所述的声译器,其特征在于待译A、B、C、D、E等语种的语词图像信息识别装置(5)是独立的IC卡,可以通过接口与声译器插接,组成可选择待译语种的阅读声译器。
6.如权利要求1或2或3或4或5所述的声译器,其特征在于扫描图、装置与声译器主机分体设置,通过数据线电缆联接或通过分设于其上的发射、接收装置实现无线连接。
7.一种阅读声译器的工作程序,利用光电图像扫描装置,输入待译语种的语词信号,和利用求译语种的语词发声数据库及发声器读出对应语词释义,其特征在于采用以下步骤(1)待译A语种的语词图像,通过光电图像扫描装置转换为扫描电信号并将信号数字化后,输入文字图像识别装置;(2)文字图像识别装置利用图像识别软件对经过数字化的文字图像,进行识别以获得对应语词的可编辑处理的字符串,并加以整理获得待译的A语种语词数据信号;(3)待译的A语种语词信号在B语种语词数据库及检索装置中,利用翻译软件获得求译的B语种对应的语词释义数据信号;(4)求译B语种的语词释义数据信号在B语种语词发声数据库及检索装置中,利用检索软件获得对应的语词发声数据信号;(5)语词发声数据信号启动发声器读出对应语词释义的声音;通过以上步骤实现语词图像光电扫描输入和音读输出。
8.如权利要求7所述工作程序,其特征在于在所述的步骤(2)中使用的图像识别软件,具有容错校对的模糊识别功能,能够自动得到最相近语词信息,纠正在扫描过程中丢失的或发生的待译语词的拼写错误。
9.如权利要求7所述的工作程序,其特征在于在所述的步骤(2)中使用的图像识别软件,具有该语种语词单元的信息选择功能,可以逐个地选择语词单元输入。
10.如权利要求7或8或9所述的工作程序,其特征在于在所述的步骤(3)中使用的翻译软件,具有对同一语词含有的两个以上义项及释义,按使用频度由高而低的顺序排列的功能,即频度高的优先输出发声。
全文摘要
阅读声译器,包括:采用光电图象扫描装置作待译A语种语词信息输入装置;与待译A语种语词信息对应的求译B语种语词数据库及检索装置;B语种对应语词释义显示装置;在待译A语种语词信息输入装置和与待译A语种语词信息对应的求译B语种语词数据库及检索装置之间有A语种语词图象信息识别装置,该识别装置具有A语种语词单元信息选择功能;B语种语词发声数据库及发声装置;由以上装置组成的阅读声译器,可以即时获得求译语词的语音释义。
文档编号G06F17/30GK1180205SQ9711688
公开日1998年4月29日 申请日期1997年9月5日 优先权日1997年9月5日
发明者王永民 申请人:王永民
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1