智能型联想式中文语音卡的制作方法

文档序号：2821514阅读：338来源：国知局

专利名称：智能型联想式中文语音卡的制作方法
技术领域：
本实用新型涉及一种语音卡，特别是一种智能型联想式中文语音卡，属于电子语音合成技术领域。
语音技术在电子产品中的应用相当广泛，语音技术作为一个附加模块已寄生到众多的电子产品中，作为一项附加功能已得到很广泛的普及，以提高产品的附加值。语音模块(语音卡)大多由接口电路、语音库、内置管理软件的控制电路及发音电路连接而成，并通过接口电路与计算机连接。目前的语音卡大多存在硬件电路元件多、结构复杂的缺点。所用的语音库有两种一种是语句音库，其优点是语音清晰流畅，连贯性好，但存在的缺点同样明显只能发出已录在语音库中的固定语句，不具备通用性，需要的音素的存贮容量大。另一种是单字语音库，其优点是可以发出任意汉字、数字组合的语句，语音库的容量小，具备通用性，但存在的缺点是语言生硬，不连贯，难以表达中文多音字和语言中音调的变化。例如中国专利公报公开的一种名称为“计算机语音发声卡”、专利号为“ZL92205166．6”的实用新型专利，由接口电路、语音库、发音电路、还原频率产生器及驱动处理模块，语音库中存贮有可显示字符的语音代码，所述各部分都经过接口电路与计算机总线插座连接。存在电路元器件多、结构复杂、性能不稳定、成本高的缺点。
本实用新型的目的，是为了克服现有技术语卡结构复杂、性能不稳定、成本高及语音库占用内存多的缺点，提供一种结构简单、性能稳定、成本低廉、音库容量小、音质连贯的智能型联想式中文语音卡。
本实用新型的目的可以通过采取如下措施达到智能型联想式中文语音卡，其结构特点是由语音库芯片、CPU芯片、语音合成芯片、放音电路组成，CPU芯片的一个I／O口连接语音库芯片的输出端，CPU芯片PA口作为数据端口连接语音合成芯片的数据线、PB口作为握手信号端连接语音合成芯片的握手控制端、INIT控制端连接语音合成芯片的INIT控制端，语音合成芯片的输出端连接放音电路的输入端；语音库芯片存贮了采用LPC算法压缩语音库，包括向量表和音素库两部分，其中向量表由包含了国家标准GB2312-80汉字字符集中所有的汉字和常用的词组、短语的发音向量表及包含ASCII字符集中常用字符的发音向量表；CPU芯片内置将输入字符信息转换成中文字词或语句，并控制放音电路发出声音的管理软件。
本实用新型的目的还可通过采取如下措施达到语音库由向量表和音素库组成，向量表由七个矢量表组成，其中1)矢量表1为GB2312-80汉字字符集中第16-57区所有字符对应的向量表，存贮空间为0-2C00H，向量表的地址信息对应矢量表2的首地址；2)矢量表2为常用汉字字符矢量表，存贮空间为74000-7F6A9H，查常用汉字字符发音音素时，先由国标信息在矢量表1中查得对应矢量2的地址信息，再在矢量表2中查是字或词组的半素始地址；3)矢量表3为GB2312-80汉字字符集中第1-3区汉字字符对应矢量表，存贮空间为3800-3AE9H，以国标为关键字查表，对应矢量表1的后一部分；4)矢量表4为GB2312-80汉字字符集中第56-87区特殊汉字字符对应矢量表，存贮空间为3000-35D7H，以国标为关键字查表，对应矢量表1的一部分；5)矢量表5为ASCII字符对应矢量表，存贮空间为3D00-3DFFH，以ASCII字符为关键字对应矢量表7；6)矢量表6为提示语表，存贮空间为7F800-7F9CBH，为指向提示语音素的矢量表，内含几十条提示语；7)矢量表7为ASCII字符矢量表，存贮空间7FA00-7FB7AH。
本实用新型具有以下几个优点1．语音库容量小，支持GB2312-80中任意汉字组成的语句发声。
2．有效解决汉字发声的多音字问题。
3．语音、语调流畅，音质清晰。
4．具有很强的通用性，可作为一个标准的发声模块加入任意产品中，用于各种类型的语句发声。
以下结合附图对本实用新型进行详细描述

图1是本实用新型的结构框图。
图2是本实用新型实施例1的结构框图。
图3是本实用新型实施例1语音芯片3的外形图。
图4是本实用新型实施例1的电气原理图。
图5是本实用新型实施例1的管理软件流程图。
图1至图5构成本实用新型的实施例1。从
图1可知，本实用新型由语音库芯片1、CPU芯片2、语音合成芯片3、放音电路4连接而成。从图2可知，本实施例中CPU芯片2采用型号为8031的单片机、语音合成芯片3采用型号为TSP50C04的语音IC，语音合成芯片3中内置功放电路，放音电路4为一喇叭、其输入端连接语音合成芯片3的语音输出端，CPU芯片2的PA0-PA3端线作为四位数据线连接语音合成芯片3的数据线，语音IC的B0、B1作为握手信号线连接单片机2的握手信号线Host-ready、Syn-ready；从图3可知，语音合成芯片3是一个16脚的IC，其中VCC、GND接电源(工作电压5V)；PA4～PA7空闲，PA0～PA3作四位数据线；PB0(Host-ready)、PB1(Syn-ready)作握手信号，DA1为推挽驱动电路输出端，可直接驱动32欧喇叭，INIT为复位脚、低电平复位，当持续低电平时，IC进入省电模式，0SC1、0SC2外接接晶振，其频率为9．68MHZ；从图4可知，语音库芯片1是一块并口ROM，其容量为4MBIT，包括19根地址线和8根数据线，其中地址线与管理CPU芯片2的P0、P1、P2．0-P2．3相连，使CPU芯片2的P0、P1、P2口作为地址线读语音库芯片1中的音素地址，数据线与CPU芯片2的P0口相连；CPU芯片2的P3．0和P3．1与语音合成芯片3的PB0和PB1相连作握手信号线，CPU芯片2的P3．4-P3．7与语音合成芯片3的PA0-PA3相连作数据信号线；语音合成芯片3的DA端口为功放信号输出端，与放音电路4(喇叭)的信号输入端连接，驱动该喇叭发音。
从图4可知，本实用新型设置一外接插座JP，插座JP连接CPU芯片2的第10、11、12号引脚，使用本实用新型时，将插座JP与应用器件的外接插线对接即可。
从图5可知，CPU芯片2内置的软件工作流程如下
正常工作时，CPU芯片2首先查需发音信息的音素地址信息，通过读语音库各矢量表可查得发音信息音素在音库中的始地址、长度等信息。然后CPU根据查得来的信息读语音库找出语音音素的地址，同时与语音合成芯片3通讯，把读到的音素送往语音合成IC。语音合成芯片3对音素解码，输入语音音素，输出语音PWM波形，PWM波形送经功放输出口DA输出驱动喇叭发音。
本实施例语音芯片3与CPU芯片2的通讯协议如下1．数据格式(1)发送握手信号；(2)连续发送一个语音的数据，将一个字节分两次传输，高四位在前；(3)当一个语音的全部数据发送完，再被发送一个结束标志。
2．数据交换时序 PB1Syn-ready(1)准备发音，CPU芯片2复位语音合成IC(INIT置高)，并将PB0置低电平；(2)CPU芯片2检测PB1线电平，当电平为高时，表明语音合成芯片TSP50C04空闲，可以接受数据；(3)CPU芯片2在数据线上建立数据(4位)，然后将PB0置成高电平，通知语音合成芯片TSP50C04读取数据；(4)语音合成芯片TSP50C04取数据后将PB1置成低电平，通知CPU芯片2；(5)CPU芯片2确认数据取走后，将PB0置成低电平，准备下一次通讯握手；(6)语音合成芯片TSP50C04处理数据完后将PB1置成高电平，等待下一个数据。
连续发送重复执行2---6，送完最后一个数据再送一个“FF，FF”，表明用户通讯结束。如用户希望发送另一段语音数据，按1～6通讯，重新发送握手信号。
向量表包含了国家标准GB2312-80汉字字符集中所有的汉字和常用的词组、短语的发音矢量表及ASCII字符集中常用字符的发音矢量表，所述矢量表可概括为1)常用汉字字符部分，这一部分包含GB2312-80汉字字符集区位码表中常用汉字字符及其常用词组、短语，它们以国标码为关健字组成两个向量表，其中，向量表1以第一个汉字国标码大小顺序排列，对应地址处可计算得向量表2中对应地址，再在向量表2中对应地址处始把各汉字、词组、短语的国标码和音素信息列表；2)不常用汉字字符部分，这一部分包含GB2312-80汉字字符集区位码表其余所有的汉字字符，这些字符的信息位于向量表2的中部，分别把汉字国标码和音素信息列表；3)特殊汉字字符部分，这一部分包含GB2312-80汉字字符集区位码表1-15区的大部分汉字字符，这些字符的信息在向量表2的后部；4)ASCII字符部分，这一部分包含ASCII字符表中的大部分ASCII字符，从地址0X3D00H开始建向量表5，以ASCII字符为关键字，对应向量表7的地址，在向量表7中把发音音素信息列表。
一个字要发音，就要找到它的发音音素。而在音库中怎样找到音素呢就是通过矢量表来寻找。在本实用新型的语音库中，一个字是以ASCII码或国标GB2312-80国家标准字符集来标志，矢量表也就是以ASCII码或国标为关键字，一一对应他们的音素始地址及音素长度。具体查表方法如下
查矢量表一例如要查“阿”，它是16区的常用汉字字符，在矢量表一中地址为((30-30)*94+(22-21))*3，即003H。(“3022”是“阿”的国标)查矢量表二例如要查“阿”，它是16区的常用汉字字符。在矢量表一中查得矢量表一中地址是003H，读3BYTE数分别为“1D，08，00”可算得“阿”在矢量表二中地址“(1D0000／4+0008)H=74008H。然后读74008H处比较国标，在74012处有“02，30，22，58，00，0F，00，00”国标相同(3022)，则“阿”的音素信息可算出音素始地址(0F0000／4+0000)H=3C00H。音素长度0058H。
查矢量表三以国表为关键字。如查“1”字符，其国表为“22，21”在表三中比较在3896H处有“22，21，1F，F0，32”国标相同，可算出在矢量表一中地址为(1F0000／4+32F0)=7F2F0H查矢量表四查法与查矢量表三相同。只是查表的地址从3000H开始。
查矢量表五查法与查矢量表三相同。只是查表的地址从3D00H开始，并且不是以国标为关键字，而是ASCII码为关键字。对应矢量表七中地址。
查矢量表六此表是提示语表，无规则可找。
查矢量表七由表五查得地址读数，算出音素信息(始地址，长度)。
从向量表到语音音素首地址的计算如下它的格式如02，30，23，6A，00，0F，70，01。它的第一个Byte数字(02)代表它后是跟一个汉字的国标码(30，23)(“埃”的国标)。如果第一Byte是(01)侧代表它后是跟一个ASCII字符。随后的两Byte数字(6A，00)，代表这个汉字(埃)(ASCII)的发音音素长度，长度的计算方法为第一Byte为低位数字，第二Byte数字为高位数字。所以，“埃”的音素长度是006AH。后三个Byte数字代表这个汉字的发音首地址，首地址计算方法是取第一Byte的数字做一个六位数的高两位，后四位补零；把第二Byte的数字做一个四位数的低两位，第三Byte的数字做四位数的高两位。然后，拿这个四位的数加上前面生成的六位数除去4的结果，所得的数即是发音地址。所以，“埃”的语音音素始地址是(0F0000／4)+0170=03C170。又如04，30，22，52，4C，BC，00，01，00，00。04代表有两个汉字的国标(30，22，52，4C)(“阿姨”)。语音音素长度为00BCH，语音音素首地址为(010000／4)+0000=004000H 则有(1)X=01，是一个ASCII字符的向量；X=02，是一个汉字的向量；X=04，是两个汉字的向量，X=06，是三个汉字的向量；X=08，是四个汉字的向量；X=0A，是五个汉字的向量；X=0C，是六个汉字的向量；X=0E，是七个汉字的向量。
(2)Y是汉字字符的国标(ASCII码)。
(3)Z是代表向量的音素长度。音素长度是一个四位数，Z2是高两位，Z1是低两位，即Z2Z1。
(4)M是代表向量的音素首地址。这个地址是一个六位数，由M1作为高两位，后四位补0，除4后，加上由M2，M3组成的四位数M3M2为即得结果。即首地址=M*4000+M*100+M1(十六进制数)本实用新型适用于如下几个系列产品消费类产品游戏机、发声玩具、电子词典、电视机、洗衣机、微波炉、报时针等。
控制类产品机械控制、自动售货机、电梯，以及汽车驾驶等警告、提示系统。
通讯类产品应答电路、语音信箱、语音服务等。
仪表类产品出租车计价器、电子称、气体报警器等报数、纠错提示、操作说明。
权利要求1．智能型联想式中文语音卡，其特征是由语音库芯片(1)、CPU芯片(2)、语音合成芯片(3)、放音电路(4)组成，CPU芯片(2)的一个I／O口连接语音库芯片(1)的输出端，CPU芯片(2)的PA口作为数据端口连接语音合成芯片(3)的数据线、PB口作为握手信号端连接语音合成芯片(3)的握手控制端、INIT控制端连接语音合成芯片(3)的INIT控制端，语音合成芯片(3)的输出端连接放音电路(4)的输入端；语音库芯片(1)存贮了采用LPC算法压的缩语音库，包括向量表和音素库两部分，其中向量表由包含了国家标准GB2312-80汉字字符集中所有的汉字和常用的词组、短语的发音向量表及包含ASCII字符集中常用字符的发音向量表；CPU芯片(2)内置将输入字符信息转换成中文字词或语句，并控制放音电路发出声音的管理软件。
2．根据权利要求1所述的智能型联想式中文语音卡，其特征是语音库由向量表和音素库组成，向量表由七个矢量表组成，其中1)矢量表1为GB2312-80汉字字符集中第16-57区所有字符对应的向量表，存贮空间为0-2C00H，向量表的地址信息对应矢量表2的首地址；2)矢量表2为常用汉字字符矢量表，存贮空间为74000-7F6A9H，查常用汉字字符发音音素时，先由国标信息在矢量表1中查得对应矢量2的地址信息，再在矢量表2中查是字或词组的半素始地址；3)矢量表3为GB2312-80汉字字符集中第1-3区汉字字符对应矢量表，存贮空间为3800-3AE9H，以国标为关键字查表，对应矢量表1的后一部分；4)矢量表4为GB2312-80汉字字符集中第56-87区特殊汉字字符对应矢量表，存贮空间为3000-35D7H，以国标为关键字查表，对应矢量表1的一部分；5)矢量表5为ASCII字符对应矢量表，存贮空间为3D00-3DFFH，以ASCII字符为关键字对应矢量表7；6)矢量表6为提示语表，存贮空间为7F800-7F9CBH，为指向提示语音素的矢量表，内含几十条提示语；7)矢量表7为ASCII符矢量表，存贮空间7FA00-7FB7AH。
3．根据权利要求1或2所述的智能型联想式中文语音卡，其特征是CPU片(2)采用型号为8031的单片机，语音合成芯片(3)采用型号为TSP50C04的语音IC，语音合成芯片(3)中内置功放电路，放音电路(4)为一喇叭、其输入端连接语音合成芯片(3)的语音输出端，CPU芯片(2)的PA0-PA3端线作为四位数据线连接语音合成芯片(3)的数据线，语音合成芯片(3)的B0、B1作为握手信号线连接单片机(2)的握手信号线Host-ready、Syn-ready；语音合成芯片(3)是一个16脚的IC，其中语音合成芯片3是一个16脚的IC，其中VCC、GND接电源；PA4～PA7空闲，PA0～PA3作四位数据线；PB0、PB1作握手信号，DA1为推挽驱动电路输出端，可直接驱动32欧喇叭，INIT为复位脚、低电平复位，OSC1、OSC2外接接晶振，其频率为9．68MHZ；语音库芯片(1)是一块并ROM，包括19根地址线和8根数据线，其中地址线与CPU芯片(2)的P0、P1、P2．0-P2．3相连，使CPU芯片(2)的P0、P1、P2口作为地址线读语音库芯片(1)中的音素地址，数据线与CPU芯片(2)的P0口相连；CPU芯片(2)的P3．0和P3．1与语音合成芯片(3)的PB0和PB1相连作握手信号线，CPU芯片(2)的P3．4-P3．7与语音合成芯片(3)的PA0-PA3相连作数据信号线；语音合成芯片(3)的DA端口为功放信号输出端，与放音电路(4)的信号输入端连接，驱动该喇叭发音。
4．根据权利要求3所述的智能型联想式中文语音卡，其特征是CPU芯片(2)内置的软件的工作流程为CPU芯片(2)首先查需发音信息的音素地址信息，通过读语音库各矢量表可查得发音信息音素在音库中的始地址、长度等信息；然后CPU根据查得来的信息读语音库找出语音音素的地址，同时与语音合成芯片(3)通讯，把读到的音素送往语音合成芯片(3)；语音合成芯片(3)对音素解码，输入语音音素，输出语音PWM波形，PWM波形送经功放输出口DA输出驱动喇叭发音。
5．根据权利要求3所述的智能型联想式中文语音卡，其特征是语音芯片(3)与CPU芯片(2)的通讯协议如下1)数据格式①发送握手信号；②连续发送一个语音的数据，将一个字节分两次传输，高四位在前；③当一个语音的全部数据发送完，再被发送一个结束标志。2)数据交换时序①准备发音，CPU芯片2复位语音合成芯片(3)，并将PB0置低电平；②CPU芯片(2)检测PB1线电平，当电平为高时，表明语音合成芯片TSP50C04空闲，可以接受数据；③CPU芯片(2)在数据线上建立数据，然后将PB0置成高电平，通知语音合成芯片TSP50C04读取数据；④语音合成芯片TSP50C04取数据后将PB1置成低电平，通知CPU芯片(2)；⑤CPU芯片(2)确认数据取走后，将PB0置成低电平，准备下一次通讯握手；⑥语音合成芯片TSP50C04处理数据完后将PB1置成高电平，等待下一个数据。
专利摘要本实用新型涉及一种智能型联想式中文语音卡,由语音库芯片、CPU芯片、语音合成芯片、放音电路组成,语音库芯片存贮了采用LPC算法压缩语音库,包括向量表和音素库两部分,其中向量表由包含了国家标准GB2312－80汉字字符集中所有的汉字和常用的词组、短语的发音向量表及包含ASCII字符集中常用字符的发音向量表;具有音质清晰、语言流畅、自动识别汉字中的多音字的优点,整个音库包括向量区和音素区,容量小,具有极强通用性,可作为一个标准件用于需具备语音发声的电子信息产品中。
文档编号G10L13/00GK2429890SQ00228658
公开日2001年5月9日申请日期2000年6月30日优先权日2000年6月30日
发明者曾凯申请人:曾凯

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾凯
技术所有人：曾凯
我是此专利的发明人

上一篇：带语音识别和语音合成器的中文寻呼机的制作方法
上一篇：一种新型吉它变调器的制作方法