具有语音拨号功能的蜂窝电话的制作方法

文档序号：2820747阅读：306来源：国知局

专利名称：具有语音拨号功能的蜂窝电话的制作方法
技术领域：
本发明涉及蜂窝电话，尤其是具有语音拨号功能的蜂窝电话。
相关技术的描述具有语音拨号功能的蜂窝电话使用一个语音识别设备，该语音识别设备提取如输入语音信号的频率这样的特征，以便识别输入的语音。一般地，语音识别设备要处理大量的输入语音信号，这可能引起设备超过负荷。
一个已知的用于解决超负荷问题的语音拨号方法是利用包括数字信号处理器(DSP)和非易失性存储器(例如闪存或EEPROM(电可擦除和编程只读存储器))的免提装置。免提装置中的DSP从输入的语音信号提取特征数据，并把提取出的特征数据存储在非易失性存储器(例如，一个语音识别存储器)中作为参考特征数据。当收到一个语音拨号命令时，DSP将输入语音信号的特征数据与登记在语音识别存储器中的参考特征数据进行比较以便识别输入语音信号，并把语音识别结果提供给蜂窝电话。蜂窝电话于是根据语音识别结果拨打电话号码。语音识别存储器被划分为三个存储区第一存储区用于索引数据；第二存储区用于存储从蜂窝电话话筒输入的语音信号信息；第三存储区用于存储从免提装置话筒输入的语音信号信息。

图1是采用现有技术的语音识别存储器的存储器图。如图所示，语音识别存储器被划分为三个存储区Mi、Mhs和Mhf。存储区Mi存储索引数据，存储区Mhs存储参考特征数据Fhs1和Fhs2以及从蜂窝电话手机输入的语音信号的语音回放数据VP1。存储区Mhf存储参考特征数据Fhf1和Fhf2以及从免提装置输入的语音信号的语音回放数据VP2。
将语音识别存储器划分为具有同样结构的存储区Mhs和Mhf的原因是尽管某个词由同一用户说出，但是从免提装置输出的特征数据可能不同于从蜂窝电话手机输出的特征数据。因此，蜂窝电话手机的参考特征数据Fhs1和Fhs2与免提装置的参考特征数据Fhf1和Fhf2被分别存储在存储区Mhs和Mhf。进一步，传统的语音识别存储器把语音回放数据VP1和VP2分别存储在各自的存储区Mhs和Mhf，因此降低了存储的效率。
然而，由于语音回放数据VP1和VP2用于回放使用者说出的词语的语音，因此没有必要分别存储语音回放数据VP1和VP2。更确切地说，把从语音回放数据VP1和VP2中挑选出的一个数据存储在语音识别存储器中是更可取的。
通常，用于存储语音回放数据VP1和VP2的存储区域在容量上远远大于存储特征数据Fhs1、Fhs2、Fhf1和Fhf2的存储区域。因此，对语音识别存储器来说，拥有相同用途的两个语音回放存储区域VP1和VP2是不经济的。此外，具有高存储容量的语音识别存储器增加了耗电量，这可能引起电话电池可服务时长的降低。
发明概要本发明的目的是提供一种可使其语音识别存储器得到十分有效管理的具有语音拨号功能的蜂窝电话。
为了达到以上目的，本发明提供了一种能连接到免提装置的蜂窝电话，它并且具有用于从输入语音信号中提取特征数据以便识别语音信号的语音识别装置，以及用来存储特征数据的存储器。存储器被划分为用于存储索引数据的第一存储区、用于存储从蜂窝电话输入的特征数据的第二存储区、用于存储从免提装置输入的特征数据的第三存储区、和用于存储语音回放数据的第四存储区。第四存储区包括一个用于存储语音回放数据的存储区域和另一个用于存储电话号码的存储区域。
更可取的是，索引数据包含存储从蜂窝电话输入的特征数据的第一地址、存储从免提装置输入的特征数据的第二地址、和存储电话号码和语音回放数据的第三地址。
附图简述本发明前述的和其它的目的、特征和优点在通过结合附图进行的以下详细描述后将变的更加明显图1是表示根据现有技术语音识别存储器的存储器图的图表；图2是应用本发明的具有语音拨号功能的蜂窝电话框图；图3是表示根据本发明实施例语音识别存储器的存储器图的图表；
图4是在语音登记过程中用于控制图3中的语音识别存储器的流程图；图5是在语音识别过程中用于控制图3中的语音识别存储器的流程图。
优选实施例详述本发明的优选实施例通过参考附图在下文中详细描述。为了透彻理解本发明，本发明将针对具体的实施例做说明性的描述。然而，应当注意到本发明能够通过这里的描述被本领域的技术人员实现。在下面的描述中，对那些在不必要地描述后可能混淆本发明的熟知的功能或结构将不做详细描述。
本发明通过利用从被包含在蜂窝电话中的声码器(语音编码器)输出的分组数据来识别输入语音信号。因此，蜂窝电话在没有免提装置的DSP协助下能够识别语音信号。
图2说明一个采用本发明具有语音拨号功能的便携式蜂窝电话。由于RF(射频)电路和DTMF(双音多频)电路与本发明无关，已经把它们从图中移除。
参看图2，从话筒30输入的模拟语音信号通过模拟-数字(A/D)转换器转变为数字PCM(脉冲编码调制)信号。声码器45压缩从A/D转换器20输出的PCM信号并且输出预定的分组数据PKT。在CDMA蜂窝电话中，声码器45能够通过8Kbps QCELP(Qualcomm Code ExcitedLinear Predictive Coding，即高通码激励线性预测编码)、13KbpsQCELP、和8Kbps EVRC(Enhanced Variable Rate Coding，即增强可变速率编码)实现，在GSM(全球系统移动通信)蜂窝电话中，它可通过 RPE-LTP(Regular Pulse Excitation with Long TermPrediction，即具有长期预测的正规脉冲激励)编码器得以实现。
把从声码器45输出的分组数据PKT加到控制蜂窝电话全部操作的微处理器50上。在由非易失性存储器(例如，闪存或EEPROM)构成的第一存储器60中存储控制程序和初始服务数据。在由RAM(随机访问存储器)构成的第二存储器65中临时存储在蜂窝电话操作过程中产生的各种数据，例如用于输入语音信号、登记或识别的分组数据。
语音识别设备85输出从传输速率为20字节/秒的输入语音信号的分组数据中提取的特征数据。特征数据用于语音识别并包括几十到几百个包含输入语音信号的频率特征和强度的字节。语音识别设备85可以通过硬件或软件来实现。当语音识别设备85通过软件实现时，软件程序可以存储在第一存储器60中。微处理器50把从声码器45输出的分组数据PKT传送到语音识别设备85，并根据从语音识别设备85输出的索引数据拨打一个电话号码。另外，微处理器50在其内部存储器中存储第一存储器60的地址(从声码器45输出的分组数据就存储在该第一存储器60里)，并且通过使用该地址来从第一存储器60中读出该分组数据从而通知使用者语音被完全识别。为了方便起见，将被读出的分组数据称为语音回放数据VP。声码器45把语音回放数据VP转变为PCM信号并把它加到数字-模拟(D/A)转换器75上，D/A转换器75把输入的PCM信号转变为模拟信号，并将转变后的模拟信号通过扬声器80输出。通知语音识别完成的消息可以替代语音回放数据而存储在第一存储器60中。
免提装置连接器500把蜂窝电话连接到免提装置(未显示)并从免提装置的话筒输入的语音信号传送至A/D转换器20，该转换器将输入语音信号转换为数字信号。
免提装置连接器500被连接至微处理器50上的指定端口，使其能够判定输入语音信号是从蜂窝电话的话筒30上接收还是从免提装置的话筒上接收。微处理器50和免提装置连接器500形成一种用于检测输入语音信号源的装置。
图3说明根据本发明的语音识别存储器(即第一存储器60)的存储器图。如图示，第一存储器60被划分为存储索引数据的存储区SA1、存储从蜂窝电话输入的语音信号信息的第二存储区SA2、存储从免提装置输入的语音信号信息的存储区SA4、及存储语音回放数据VP和一个电话号码的共同存储区SA3。第二存储区SA2存储从与索引数据相联的蜂窝电话手机输入的语音信号的参考特征数据Fhs1和Fhs2。第三存储区SA3存储语音回放数据VP和电话号码，第四存储区SA4存储从与索引数据相关联的免提装置输入的语音信号的参考特征数据Fhf1和Fhf2。索引数据I1可以包括存储特征数据Fhs1、Fhs2、Fhf1和Fhf2的地址，以及存储电话号码和语音回放数据VP的地址。假如蜂窝电话有一个单独的地址生成器，则第一存储区SA1是不必要的。
如图3所示，第二存储区SA2和第四存储区SA4每一个又被划分为两个存储区域以用于分别存储参考特征数据Fhs1和Fhs2，以及Fhf1和Fhf2。这是因为语音信号尽管是同一个使用者发出的，但使用者发出的语音信号可能彼此不同。因此，对于使用者发出的同一个词要两次提取参考特征数据，并把特征数据分别存储在两个存储区域。
图4是语音登记过程中控制第一存储器60的流程图。如果使用者通过话筒30说出某个词(例如使用者希望与其通话的人的名字)，语音识别装置85识别从话筒30输入的语音信号。当使用者通过免提装置的话筒发出该单词的音时，语音识别装置85识别从免提装置经由免提装置连接器500接收的语音信号。微处理器50在步骤100从输入的语音信号中提取参考特征数据，并在步骤110通过检查蜂窝电话是否与免提装置连接来判定接收到的语音信号的源。如果蜂窝电话没有与免提装置连接，根据参考数据是由蜂窝电话手机产生的判断，微处理器50在第一存储器60的第二存储区SA2中存储参考特征数据Fhs1和Fhs2(步骤120)。可是，如果蜂窝电话连接到免提装置，则微处理器50在第一存储器60的第四存储区SA4存储参考特征数据Fhf1和Fhf2(步骤130)。在存储了特征数据以后，微处理器50控制语音识别装置85在第三存储区SA3存储输入语音信号作为语音回放数据VP，语音回放数据与其相应的电话号码放在一起(步骤140)。
图5是在语音识别过程中控制第一存储器60的流程图。如果使用者说出登记在蜂窝电话中的名字以便通过语音拨打电话，则语音识别装置85从输入语音信号中提取特征数据，接着把特征数据与登记在第一存储器中60的参考特征数据相比较。如果输入特征数据与参考特征数据相似，则语音识别装置85把对应于特征数据的索引数据与它们之间的差值一起输出到微处理器50。
参考图2和图5，微处理器50从语音识别装置85提取输入语音信号的特征数据(步骤209)，并通过检查蜂窝电话是否连接到免提装置来判定特征数据源(步骤210)。如果接收的特征数据来源于蜂窝电话手机，微处理器50控制语音识别装置85读取来自第一存储器60的第二存储区SA2的参考特征数据Fhs1和Fhs2，并且将它们与接收到的特征数据相比较以便产生索引数据和它们之间的差值(步骤220)。可是，如果接收到的特征数据来源于免提装置，则微处理器50控制语音识别装置85读取来自第一存储器60的第四存储区SA4的参考特征数据Fhf1和Fhf2，并且将它们与接收到的特征数据相比较以便产生索引数据和它们之间的差值(步骤230)。此后，微处理器50从语音识别装置85接收索引数据和它们的差值(步骤240)，并且根据从语音识别装置85输出的索引数据从第三存储区SA3读取语音回放数据VP(步骤250)。读取的语音回放数据VP输出到扬声器80去。结果，微处理器50根据索引数据从第三存储区SA3读取电话号码(步骤260)，并在步骤270拨打读取的电话号码。
如上所述，蜂窝电话有效地管理语音识别存储器，从而导致制造费用和电源消耗的降低。
虽然本发明是通过结合实际上被看作最可操作和最优的实施例来阐述的，我们可以明白本发明不局限于阐述的实施例，恰恰相反，它将覆盖所附的权利要求书的精神和范围内的各种修改。
权利要求
1.能够连接到免提装置的蜂窝电话，它具有用于从输入语音信号中提取特征数据以便识别输入语音信号的语音识别装置，包括存储器，它被划分为三个存储区，第一存储区用于存储从蜂窝电话输入的特征数据，第二存储区用于存储从免提装置输入的特征数据，第三存储区用于存储语音回放数据。
2.权利要求1要求的蜂窝电话，其中所述的第三存储区包含一个用于存储语音回放数据存储区域和另一个用于存储电话号码的存储区域。
3.权利要求1要求的蜂窝电话，更进一步包含用于判定特征数据是来源于蜂窝电话还是来源于免提装置的装置。
4.权利要求3要求的蜂窝电话，更进一步包含第一地址生成器，用于产生手机存储器地址或免提装置存储器地址以便根据所述判定装置的输出来登记或识别特征数据。第二地址生成器，用于产生语音回放存储器地址，以使得蜂窝电话输入语音和免提装置输入语音通过登记蜂窝电话和免提装置输入语音的唯一一种输入语音来共享语音回放数据。
5.能够连接到免提装置的蜂窝电话，它具有声码器，蜂窝电话包含语音识别存储器，包含第一存储区，用于登记从蜂窝电话输入的特征数据；第二存储区，用于登记从免提装置输入的特征数据；和第三存储区，用于登记语音回放数据；用于判定特征数据来源于蜂窝电话还是来源于免提装置的装置；语音识别装置，用于通过处理从声码器输出的分组数据来从语音信号中提取特征数据、根据判定装置的输出把提取出的特征数据与登记的特征数据进行比较、以及当提取的特征数据相似于登记的特征数据时输出具有这样一个地址的索引数据，该特征数据就存储在该地址中；以及微处理器，用于读存储语音回放数据的地址、读取和输出语音回放数据、根据索引数据读取电话号码、并拨打所读取的电话号码。
6.权利要求5要求的蜂窝电话，其中的第三存储区包含存储语音回放数据的存储区域和存储电话号码的另一存储区域。
7.在具有语音拨号功能的的蜂窝电话中用于在语音登记过程中控制语音识别存储器的方法，包括步骤从输入语音信号中提取特征数据；判定所提取的特征数据是接收自蜂窝电话手机还是接收自蜂窝电话免提装置；根据所述的判定在两个存储区中的一个存储区存储所提取的特征数据；并且将语音回放数据存储于不同于用于存储所提取的特征数据的两个存储区的第三存储区中。
8.在具有语音拨号功能的蜂窝电话中用于在语音识别过程中控制语音识别存储器的方法，包括步骤从一个输入语音信号中提取输入特征数据；判定所提取的特征数据是接收自蜂窝电话手机还是蜂窝电话免提装置；根据所述的判定从语音识别存储器的两个存储区之一读取参考特征数据；比较读出的参考特征数据与输入特征数据；根据所述的比较来产生索引数据；根据所产生的索引数据从语音识别存储器的第三存储区读取语音回放数据并把它输出到扬声器；根据索引数据从第三存储区读取电话号码信息；并且拨打所读取的电话号码。
全文摘要
具有语音拨号功能的蜂窝电话可以有效地管理语音识别存储器。蜂窝电话能够连接到一个免提装置,并有一个从输入话音信号中提取特征数据以便识别语音信号的语音识别设备,和一个存储扩展特征数据的存储器。存储器被划分为用于存储从蜂窝电话输入的特征数据的第一存储区、用于存储从免提装置输入的特征数据的第二存储区、和用于存储语音回放数据的第三存储区。第三存储区包括一个用于存储语音回放数据的存储区域和另一个用于存储与语音回放数据相关联的电话号码的存储区域。
文档编号G10L15/28GK1272996SQ98807475
公开日2000年11月8日申请日期1998年7月21日优先权日1997年7月21日
发明者金德焕, 陈瑞镛申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金德焕;陈瑞镛
技术所有人：三星电子株式会社
我是此专利的发明人

上一篇：改进的弦乐器的制作方法
上一篇：在语音通信系统中语音增强的方法和装置的制作方法