多语种随身听式电子书读书机的制作方法

文档序号:6453353阅读:216来源:国知局
专利名称:多语种随身听式电子书读书机的制作方法
技术领域
本发明涉及一种电脑,具体涉及一种专用于朗读电子书、随身听式掌上型电脑。
语音合成技术,或者更准确地说是文本到语音的变换技术,即TTS(Text to Speech)技术,研究的是如何将文本数据变换成语音。该技术自从计算机诞生起,就开始被人们研究和应用。例如,美国微软公司的最新的操作系统Window XP运行在个人计算机上,就支持将英文或中文的文本数据变换成语音。申请号为96103478.X的“电脑阅读机”专利实际上就是一种基于个人计算机平台的TTS计算机。常见的TTS技术包括基于规则的合成技术、模拟发音器官的合成技术和语音元素联结式合成技术。其中,语音元素联结式合成技术是目前最接近人的发音质量的技术,但是由于它需要巨大的存储容量,在本发明实施例中所采用的WTS701处理器商品化之前,联结式合成技术一直只能在个人计算机和服务器上应用。但是目前的个人计算机(包括笔记本计算机),体积大,成本高,不适合掌上移动环境和更广泛地应用TTS技术。目前的通用掌上电脑均不支持联结式语音合成。在一个掌上型设备中,支持多语种的语音合成,也是目前未解决的问题。同时,TTS技术离完美还有较大的距离,它将会在变换的正确性、多语速及语速人性化、多音调及音调人性化、多语种、可靠性、设备微型化等方向不断地发展。
通用的掌上型电脑一般采用单处理器和含有独立的随机存储器的体系结构,如何降低成本、减少体积、降低功耗、还要满足系统功能需要,来选择商品化的处理器和设计读书机这种专用型掌上型电脑的体系结构,是当前所要解决技术问题的关键之一。
电子书数据与控制数据的存储以及存储体系构造技术,它涉及到如何选择不同的存储介质来存储不同类型的数据,从而构造合理的存储体系,同时建立有效的存储电子书数据的文件系统来高速地检索访问数据。而硬盘、软盘、各种光盘、ROM芯片、EEPROM芯片、纸张和卡片是以前人们主要选取的电子书数据存储介质。例如,申请号为96103478.X采用的是软盘和CD盘。专利号为9220011.4的“文字语音阅读机”采用的是编码卡片。对于播放轨迹的保存,有的是根本不保存,有的是保存在随机存储器内(缺点是掉电就丢失),有的是存储在硬盘上,如Window XP的TTS软件,不适合掌上型设备。
本发明采用的技术方案是多语种随身听式电子书读书机采用以异构多处理器与闪存存储器为核心的体系结构,即含有一个主处理器和一个或多个进行文本到语音转换的语音处理器,以及专设一个用来存储电子书文本数据、电子书文件索引系统的闪存存储器,主处理器采用通信接口,与语音处理器联结,每个语音处理器又与发音装置联结,本发明还含有与个人计算机通信的接口、访问存储器控制电路、键盘、电源电路,键盘联结在主处理器上,主处理器和个人计算机通信接口的控制信号首先联结到访问存储器控制电路,形成新的控制信号,再联结到闪存存储器,主处理器和个人计算机通信接口的数据与地址信号,也联结到闪存存储器。
上述技术方案中,主处理器采用通信接口,还可经过信号电平转换器再与语音处理器联结。
上述技术方案中,主处理器和个人计算机通信接口的控制信号、数据与地址信号还可经过信号电平转换器后再联结到闪存存储器。
上述技术方案中,用来存储播放轨迹的数据存储器可内设在主处理器内,也可独立于主处理器外。
上述技术方案中,主处理器采用微芯公司的PIC系列处理器,语音处理器采用WTS701处理器。
典型工作过程一个电子书文本数据文件转换成语音的工作过程如下首先,主处理器通过键盘接收到用户发来的读书命令;接着,主处理器在闪存存储器找到和打开该文件,并且以一句话为一个单位,确定该句话的语种后,选择活跃该对应语种的语音处理器,再发“转换”命令给该对应语种的语音处理器;然后,主处理器从闪存存储器,读设定数量的文本数据到主处理器的数据存储器,在做停顿和语音预处理后,将数据发往语音处理器;主处理器反复这个过程,一直将整个文件发送给语音处理器后,就发送一个“转换完成”的命令。语音处理器在接收到“转换”命令后,就开始工作,边接收数据,边分析每个字或单词所对应的语音元素,然后在自己的多级存储器中找到该语音元素,输出到喇叭和耳机;当它收到“转换完成”的命令后,就停止工作,处于“休闲”状态。
个人计算机访问闪存存储器的工作过程分成“直接访问”和“中转访问”两种模式。“直接访问”模式是让主处理器处于“休闲”状态,个人计算机直接访问闪存存储器;“中转访问”模式是让主处理器处于“中转”状态,个人计算机将数据和命令首先发给主处理器,主处理器然后访问闪存存储器,再将访问结果回传给主处理器。依照不同的接口类型,可以选择其中一种模式,或者两种都选。
本发明的有益效果是不需要人预先录音读物就可朗读电子书;由于采取了以异构多处理器与闪存存储器为核心的体系结构,使得读书机可以支持单语种,也可支持多语种,并且读书机体积小、功耗低,适合掌上型应用;由于采取的是语音元素联结式合成方法,发音自然、质量高;由于应用了闪存技术,存储电子书的数据容量大;通过与个人计算机相联,能方便快速地对电子书数据进行更换;可以数字调音量、调语速、调音调,读书播放控制方便易用。
图2与图3合起来为本发明实施电路图。
读书机内专设一个闪存存储器,用来存储电子书文本数据和电子书文件索引系统。主处理器内设一个EEPROM类存储器,用来存储播放轨迹数据。这两个存储器都具在有掉电情况下不丢失数据的特点。主处理器和语音处理器均有程序存储器和随机数据存储器。


图1是本发明的电原理框图。读书机中,电源电路提供直流3.3V和直流5V供电,语音处理器和闪存存储器采用直流3.3V供电,电平转换器采用直流3.3V和直流5V供电,主处理器和访问存储器的控制电路采用直流5V供电。主处理器,经过信号电平转换器,采取某种工业标准的通信接口与语音处理器联结。例如I2C接口、(SPI)串行外设接口等。在每一时刻,只有一个语音处理器处于工作状态,由主处理器通过“语音处理器选择控制信号”进行选择,相应此时就朗读该语种的电子书。
发音装置(喇叭和耳机)与每个语音处理器联结。键盘联结在主处理器上。访问存储器的信号分成控制信号、地址与数据信号两类。主处理器和个人计算机通信接口的控制信号首先联结到访问存储器控制电路,形成的新的控制信号,经过信号电平转换器,联结到闪存存储器。主处理器和个人计算机通信接口的地址与数据信号,直接经过信号电平转换器,联结到闪存存储器。
主处理器的功能主处理器担任,访问存储了电子书数据的闪存存储器、进行停顿等语音预处理、与语音处理器通信、响应键盘、进行读书播放运行控制等任务。
语音处理器与高的发音质量语音处理器将主处理器送来的文本数据,转换成为语音送到发音装置。高的发音质量主要依赖语音处理器采取好的语音合成方法。目前语音元素联结式合成方法是工业界最好的方法。另外语音处理器必须功耗小和体积小。
存储体系读书机采用了大容量的闪存芯片,可以根据容量的需要,不断升级。它与两个处理器内嵌的各种存储器构成读书机存储体系的基础平台。
下面描述读书机中各部分的存储任务分配●语音元素语音处理器的语音元素存储器●语音合成程序语音处理器程序存储器●主控程序主处理器程序存储器●电子书数据与文件系统闪存存储器●静态播放控制参数闪存存储器●动态播放控制参数与播放轨迹主处理器数据存储器存储文本的编码标准中文电子书文本基于UNICODE或者BIG5编码;英文电子书数据基于ASCII编码。其它语种的电子书文本基于UNICODE编码。
读书播放控制与控制键盘使用者通过键盘设置多种播放方式,控制语速、音量、音调。
与个人计算机的接口用来更换电子书数据、设置播放方式及各种控制参数,采取从个人计算机下载的方式进行。与个人计算机的接口可以采用并口、USB接口、以太网络接口等。实施方案给出的是采用增强型并口(EPP),具有成本低、传输速率高的特点。
参见图2、图3本发明的实施电路图。它是一个支持中文、(和/或)英文的读书机电路图。
主处理器采用微芯公司的PIC系列处理器。PIC系列处理器具有成本低、封装类型多和产品线丰富等特点,是作为读书机的主处理器的理想选择。
中文语音处理器采用华邦公司的WTS701M类处理器。英文语音处理器采用华邦公司的WTS701E类处理器。
WTS701处理器采取语音元素联结式合成技术,且发音元素的音频存储采用未压缩的模拟波形,无压缩损耗,具有高的和自然的发音质量。WTS701处理器典型工作电流为35mA,支持节电方式管理(典型闲态电流1uA),功耗小。采取TSOP56封装。
主处理器通过(SPI)串行外设接口与语音处理器联结。
在图2中,主处理器U3采用PIC16F874A。中文语音处理器UC1采用WTS701M类芯片;在图3中,英文语音处理器UE1采用WTS701E类芯片。在图2中,闪存存储器U2采用K9F2808Q0B芯片,存储容量为16MB。U8、U9、U10和U11为电平转换器,采用74LVXC3245。U4为74HC374,U5为7404,U7为7432,它们组成了访问存储器控制电路。J1为并口插座,它提供了与与个人计算机的接口。喇叭规格为8欧姆、0.25W。耳机规格为8欧姆。
在图3中,读书机采取DC6V供电输入,SW-P为电源开关。UP1为1117M3-3.3,它从3脚输入直流6V,从2脚输出直流3.3V,1脚接地。UP2为MIC2920A-5,它从1脚输入直流6V,从3脚输出直流5V。2脚接地。图3还给出了一个四乘四的矩阵键盘,RK0至RK7为限流电阻,它们的一端联结矩阵键盘,另一端联结主处理器U3的RB端口(从34脚至40脚),U3的RB0-RB1为输出、RB4-RB7为输入。
主处理器U3的RC端口(从15脚至18脚、从23脚至26脚),以SPI接口的形式,经过U10和U9进行3.3V信号与5V信号之间的电平变换,与UC1和UE1语音处理器WTS701相联。U3的RC1、RC3、RC5为输出,RC2、RC4、RC6为输入,RC4、RC6脚未用。相对应,与U3接口的语音处理器UC1和UE1的26、6、13脚为输出,14、15、16脚为输入。主处理器U3的RE端口的RE0(8脚)和RE1(9脚),输出到U11的21脚和20脚,电平变换后由U11的3脚和4脚输出,分别作为芯片选择信号,控制UC1和UE1语音处理器(25脚)。在某一时刻,RE0和RE1最多只能一个为“低”选择合适的语音处理器。
U3的RA端口(从2脚至6脚)是访问闪存存储器U2的控制端口,RA3为输入。RA0、RA1和RA2为输出,RA4脚未用。U3的RA0、RA1和RA2脚为U5或U7的输入,U7的输出3脚与U3的RA3相联。U3的RD端口(从19脚至22脚、从27脚至30脚)是多向端口,它是访问闪存存储器U2的数据与地址端口。U3的1脚为输入脚,它起电源加电复位功能。U3的13、14脚联结外置晶振。
闪存存储器U2的IO端口(从29脚至32脚、从41脚至44脚)是多向端口,它接收来自个人计算机或者主处理器的命令、地址和数据,也输出数据。控制反馈信号U2的7脚为输出,受控信号U2的8、9、16、17、18、19脚为输入。13、36、6脚接地。U2的7、8脚联结外置晶振。
J2为耳机插座。语音处理器U1的42、46、54脚为输出,42脚直接联结喇叭,46脚联结耳机插座,54脚经过电容C14后联结耳机插座。
U8在2脚的控制下,起3.3V信号与5V信号之间的多向变换,它的A端口(从3脚至10脚)和B端口(从14脚至21脚)均为多向端口。U9起3.3V信号到5V信号的变换,它的A端口(从3脚至10脚)为输入端口,B端口(从14脚至21脚)为输出端口。U10和U11主要起5V信号到3.3V信号之间的变换,它的A端口(从3脚至10脚)为输出端口,B端口(从14脚至21脚)为输入端口。
J1是联结个人计算机并口的电缆插座,2脚至9脚为多向地址和数据信号脚,1、14、15、16、17脚为输出控制信号脚,11和12为输入信号脚,从18脚至25脚接地。
主处理器采用微芯公司的PIC系列中具有4个输入/输出接口以上、且具有EEPROM数据存储器的处理器,例如,PIC16F874A。工作主频4MHz至20MHz。
在语音处理器上,中文语音处理器采用WTS701M类处理器。英文语音处理器采用WTS701E类处理器。WTS701处理器典型工作电流为35mA,采用直流3.3V供电,支持节电方式管理(典型闲态电流1uA),功耗小。采取TSOP56封装。工作主频23.576MHz。
闪存存储器芯片,可以根据容量的需要,选用三星公司或者东芝公司的“与非”型闪存芯片。
存储文本的编码标准中文电子书文本基于UNICODE或者BIG5编码;英文电子书数据基于ASCII编码。
在读书播放控制上,播放的方式可以设置为,循环播放/非循环播放、连续播放多个文件/只播单个文件,分类播放,断点续播/起点播放等组合形式。语速分成4级,第1级最慢,第4级最快。音量分成8级,第1级为0db,第8级为28db,级与级之间相差4db。音调分成7级,缺省值为1级。
设置如下控制按键●播放(S0键)●暂停/重播为同1键,在播放状态下,将暂停播放。在暂停状态下,将恢复播放。(S1键)●停止播放(S2键)●模式1/模式2(S3键)●上1个文件(S8键)●下1个文件(S4键)
●上1个字(S9键)●下1个字(S5键)●音量增大(S6键)●音量减小(S10键)●语速增快/音调增高在模式1时,是语速增快功能;在模式2时,是音调增高功能。(S7键)●语速降低/音调降低在模式1时,是语速降低功能;在模式2时,是音调降低功能。(S11键)●类型1播放类型1的第1个文件,否则如果没有该类型文件,就播放第1号文件。(S12键)●类型2播放类型2的第1个文件,否则如果没有该类型文件,就播放第1号文件。(S13键)●类型3播放类型3的第1个文件,否则如果没有该类型文件,就播放第1号文件。(S14键)●类型4播放类型4的第1个文件,否则如果没有该类型文件,就播放第1号文件。(S15键)●电源开/关在读书机体积设计方面,当印制电路板设计为单面放置元器件、多层布线的印制电路板时,整机体积(长×宽×厚)小于12.7cm×8.2cm×3.2cm。当印制电路板设计为多面放置元器件、多层布线的印制电路板后,体积会更小。在读书机功耗设计方面,读书机采取直流6V供电,典型工作电流为150mA。
权利要求
1.一种多语种随身听式电子书读书机,其特征在于采用以异构多处理器与闪存存储器为核心的体系结构,即含有一个主处理器和一个或多个进行文本到语音转换的语音处理器,以及专设一个用来存储电子书文本数据、电子书文件索引系统的闪存存储器,主处理器采用通信接口,与语音处理器联结,每个语音处理器又与发音装置联结,本发明还含有与个人计算机通信的接口、访问存储器控制电路、键盘、电源电路,键盘联结在主处理器上,主处理器和个人计算机通信接口的控制信号首先联结到访问存储器控制电路,形成新的控制信号,再联结到闪存存储器,主处理器和个人计算机通信接口的数据与地址信号,也联结到闪存存储器。
2.根据权利要求1所述的多语种随身听式电子书读书机,其特征在于主处理器采用微芯公司的PIC系列处理器。
3.根据权利要求1所述的多语种随身听式电子书读书机,其特征在于语音处理器采用WTS701处理器。
4.根据权利要求1所述的多语种随身听式电子书读书机,其特征在于主处理器采用通信接口,还可经过信号电平转换器再与语音处理器联结。
5.根据权利要求1所述的多语种随身听式电子书读书机,其特征在于主处理器和个人计算机通信接口的控制信号、数据与地址信号还可经过信号电平转换器后,再联结到闪存存储器。
6.根据权利要求1所述的多语种随身听式电子书读书机,其特征在于用来存储播放轨迹的数据存储器可内设在主处理器内,也可独立于主处理器外。
全文摘要
本发明提供的是多语种随身听式电子书读书机。该读书机包括一个主处理器、多个进行文本到语音转换的语音处理器、存储电子书的闪存存储器、与个人计算机的通信接口、键盘、电源、发音装置等。主处理器采用通信接口,与多个语音处理器联结,语音处理器再联结发音装置,键盘联结在主处理器上,主处理器和个人计算机通信接口的控制信号和数据与地址信号联结到闪存存储器。该读书机通过与个人计算机通信可以方便地更换读书机上的电子书数据。该读书机具有多语种、体积小、存储容量大、发音质量高、保存读书轨迹数据、数字调音量、调语速、调音调等特点,应用广泛。
文档编号G06F15/16GK1474295SQ0312466
公开日2004年2月11日 申请日期2003年7月21日 优先权日2003年7月21日
发明者胡忠东 申请人:胡忠东
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1