口授系统的制作方法

文档序号：2820381阅读：251来源：国知局

专利名称：口授系统的制作方法
技术领域：
本发明涉及一种口授系统(dictation system)，它包括一种将语音信号存储于存储部件中的手持式口授装置，此装置包含将语音信号压缩成压缩语音信号的数据压缩部件和在存储部件内存储压缩语音信号的存储部件。本发明还涉及一种在该口授系统中使用的口授装置、一种复读装置和一种可拆卸式固态存储单元。首段中定义的口授系统在本技术领域是众所周知的。
现有技术中的口授系统通过丢弃常见于语音信号中的无音周期来实现数据压缩。进而，可以保存一个指示信号，表示无音周期的长度和它在语音信号中的位置。在复读时，通过在所压缩的语音信号中所标记的地方插入相应的无语音周期，从而再生语音的副本。
本发明的目的在于提供一种改进的口授系统。根据本发明的口授系统，其特征在于数据压缩部件被设计成对语音信号至少以可用两种不同的数据压缩模式之一进行数据压缩，当用该至少两种不同的数据压缩模式对同一语音信号进行数据压缩时会得到不同的压缩比。用户可选择所说的至少两种不同的数据压缩模式。数据压缩部件还可进一步生成包含压缩语音信号部分的数据文件，该数据文件包含一个文件头。该数据压缩部件还生成用于标识所选的数据压缩模式的标识信号并将该标识信号存于所述文件头中。本发明基于下列认识口授装置中的存储器容量有限。而存储部件中应最好存储数目不断增长的口授段，这在本领域中通过丢弃语音信号中的无语音周期来实现。利用更强有力的压缩技术可获得更高的压缩比。更具体地说，有损耗的压缩技术产生高数据压缩比。但是，较高的压缩比会导致数据展开时所恢复的语音信号的质量下降。本发明提出这样一种口授系统，它允许用户从两种或多种数据压缩模式中选择其一，手持式口授装置据此可对语音信号进行压缩。用户可在一个内存单元中可口授和存储的语音段数目与语音信号的重现质量之间作出权衡。假如用户希望内存部件中存储较多的语音段，他就应选择具有较高数据压缩比的数据压缩模式；假如用户更注重语音复读质量，他就应选择较低压缩比的数据压缩模式。
从属权利要求定义了口授系统，手持式口授装置，复读装置及可拆卸式固态内存单元的较佳实施例。
参照下列实施例附图的说明，我们将弄清楚并阐明本发明的这些和其他方面。

图1表示手持式口授装置的一种实施例。
图2表示用手持式口授装置的存储卡的一种实施例。
图3表示手持式口授装置的电路图。
图4表示手持式口授装置中处理器生成的信号块序列。
图5是以桌面机或PC机形式实现的复读装置的一个实施例。
图1是手持式口授装置1的正面视图，开关2位于该装置外壳的侧面，外壳底部设有电池舱3(没画出)。可以从外壳背面取放电池，壳的正面有滑动开关4，用于在不同口授模式之间进行切换。该装置还有几个按钮按钮5是录音按钮，按钮6是LETTER(语句)按钮，按钮7是MODE(模式)按钮，按钮8是INSERT(插入)按钮，按钮9是DELETE(删除)按钮。开关10是录音模式开关。开关11是灵敏度开关。装置1还提供显示有关口授的各种信息用的LCD显示器，例如，语音段的录制时间、剩余录制时间、录制模式、语音段数目等。
外壳内设有麦克风13和扬声器18。壳的侧面装有音量控制旋钮14。另外，该装置上侧有一插槽，用于插入存储卡15。
存储卡15也示于图2中。存储卡15具有一个固态存储器20及多个与固态存储器20相连的电气端子22。固态存储器20可以是，例如，EEPROM或快速可擦式存储器。电气端子22在电气上能与PC机上的符合国际标准的PCMCIA接口相接。
图3表示装置1的电气结构及其与存储卡15的配合。装置1包括数字信号处理器30，该处理器30具有与端子34相接的数字输入/输出端32，而端子34在电气上又与插入槽16中的存储卡15的端子22相接。麦克风13连接处理器30的模拟输入端36。若需要的话，可通过放大器38相接。处理器30还包括模拟输出端40，它通过放大器42与扬声器18相接。图3中用参考数字44所指的各种旋钮和按钮与处理器30的控制输入端46相接。另外，处理器30的控制输出端48与用于控制显示器12上显示信息的显示控制单元50相接。
用户把存储卡15插入装置1的插槽16中，直到存储卡15的端子22与装置1的插槽中的端子34相接触。现在，存储卡就在电气和机械上与装置1相接。
处理器30能通过输入端36接受模拟语音信号并通过A/D转换器将语音信号转换成数字语音信号。进而，通过用户的选择，处理器30能对该数字语音信号用至少两种不同的数据压缩步骤之一进行处理。假设处理器30能对该语音信号进行两种数据压缩处理，每种压缩处理步骤在对同一语音信号压缩后得到的压缩比是各不相同的。该数据压缩处理步骤可以是无损耗的。这意味着实际上没有丢失任何数据。且在解压数据时可得到与原有语音一模一样的语音信号。无损耗数据压缩方法的一个例子是线性预测编码，随后是对线性预测编码器的输出进行的Huffman编码，数据压缩也可是带损耗的。一种带损耗数据压缩方法是本领域所熟知的分波段编码(subband coding)，并应用于DCC数字式磁记录系统中。在带损耗数据压缩方法中，听不到的那部分语音信息实际上被丢弃了。数据解压就是恢复原始语音信号。既然在数据压缩时被丢弃的那部分语音是听不见的，那么在再现语音信号时用户听到的语音信号就和原有的一样。
处理器30既能执行无损耗数据压缩处理步骤，也能执行带损耗的数据压缩处理步骤，这是处理器30能实现的两种不同数据压缩步骤。作为一种替代，处理器30能执行两种不同的无损耗数据压缩步骤，它们分别产生不同的数据压缩比。另外一种替代是，处理器30能对语音信号执行两种不同的无损耗数据压缩处理步骤，它们产生不同的数据压缩比。这儿给出后一种可能性的一个例子与用于DCC中一样，给处理器30配备一个简单分波段编码器。可用简单的该分波段编码器是因为要求用于编码语音信号的分波段数目较少，因为语音信号的带宽比宽带音频信号小得多，只需较少数目的分波段，例如5，而不是用于DCC分波段编码器的32。通过在对简化的分波段编码器进行位分配操作时改变其位池(bitpool)，就可以简单化的分波段编码器得到不同压缩比。关于这方面的信息请参考列于本说明书末尾的文件(1)，(2)，(3a)，(3b)。
当用户想往装置中灌录一段语音时，按一下LETTER按钮6，此按钮表示用户想存储一段语音，另外用户可按动MODE按钮7，以便选择不同的模式。如该语音段是否具有(高)优先权，或该语音段是否受保护以免被覆盖。随后用户启动按钮10来选择录制模式。选择录制模式意味着用户选择了数据压缩模式。若用户想让录制音质较好，他/她就选择产生最低数据压缩比的数据压缩模式，这样存储器20将存储这一语音段的更多信息用于所述口授，结果是存储器能存储的语音段数目更少。如果用户想在存储器存储尽可能多的语音段，他/她就选择具有较高数据压缩比的数据压缩模式，结果是存储的语音段的音质较差。
所压缩的信息包括在信息块(或“文件”)Bi、Bi+1、Bi+2，…中。如图4所示。每一信息块Bi具有一信息头(用HDR表示)，和信息体(用IP表示)。另外，在信息头中存有一标识信号，信号块的头部HDR中的标识信号标识对语音信号的压缩模式，以便生成存储在同一信号块的信息体IP部分的数据压缩信息。信号块的序列号提供给处理器30的数字输出端32，然后存于存储卡15的存储器20中。
这里应当指出，处理器30能生成尽可能长的信号块用来完整记录每一语音段的信息。处理器30也能产生固定长度的信号块，这样，一个语音段的数据压缩信息就存储在由处理器30产生的多个连续的信号块中。
如果用户想得到存储在存储器20中的语音段，处理器30能恢复存储器20中的压缩数据信息并对存于存储器20中的压缩数据信息执行数据解压操作。显然，数据解压操作就是在口授阶段执行的数据压缩操作的逆操作。在后面用图5说明复读装置的实施例时，将进一步解释处理器30执行的数据解压操作。得到语音信号副本后，经处理器进行数/模转换，供给输出端40，用于扬声器18重放。
为将存储于存储卡15上存储器20中的语音段复读出来，将装置1上的存储卡15拔出，插入桌面的复读装置50中，见图5。复读装置52包含一数字信号处理器53，它具有数字输入端54，与端子56相连，当将存储卡插入该装置52中的插入槽(没画出)时，该端子56在电气上和存储卡15的管脚22相连。扬声器58经放大器62与处理器53的模拟输出端60相连。处理器53还包括与显示器68上控制显示信息的显示控制单元66相连的控制输出端64。键盘70与处理器53的控制输入端72相连。
用户将存储卡15插入复读装置52的插槽(没画出)中。直到存储卡15的端子22与复读装置52的插槽中的端子56相接触，现在存贮卡在机械和电气上就与装置52相连。
按动键盘70上的RETRIEVE(恢复)键，存储卡15上存储器20中的信息就被读出，并保存在数字信号处理器53的内部存储器中。处理器对从存储卡中恢复的信息能执行至少两种不同的数据解压操作。显然，处理器53执行的解压模式正好与处理器30在口授阶段执行的压缩模式相反。处理器53从信号块头部HDR中检索到标识信号，并按此标识信号执行数据解压操作，结果得到数字化语音信号的副本。
处理器53进一步将数字语音信号副本进行数/模转换转换成模拟语音信号，并将模拟语音信号经输出端60供给扬声器58，这样打字员或别人就能听到需要复读的语音信号。
打字员用键盘70打出由扬声器播出的语音段，于是就得到了该语音段的打字形式。
复读装置52的另一实施例，采用具有充分大的存储容量的个人计算机时，该装置可配上语音识别算法，使该装置在对语音信号识别后从语音信号生成字符文件，借助显示器68能见到字符文件的内容。这样打字员就能一边阅读显示屏幕68上的文本检查错误，一边监听从扬声器58出来的语音，同时还可通过键盘70改正文本中的错误。
前面介绍了一个无损耗数据压缩方法的例子，即线性预测编码，后随Huffman编码。不言而喻，处理器53肯定能执行相应的Huffman解码，后随相应的线性预测解码，用于再生原语音信号。
前面也介绍了一种带损耗的数据压缩方法的实例，即分波段编码。不言而喻，处理器53应能执行相应的分波段解码操作，用于再生成原语音信号的副本。
尽管本说明描述了本发明及其优选实施方案，应当相信，并不局限于上述这些例子。因此，本领域的技术人员可在不超出本发明权利要求规定的范围内作各种明显的改动。进一步讲，本发明在于这儿公开的特性所蕴含的每个新特性或各种特性的组合。
相关文档(1)欧洲专利申请号402,973(PHN13.241)(2)欧洲专利申请号400,755(PHQ89.018A)(3a)欧洲专利申请号457,390(PHN13.328)(3b)欧洲专利申请号457,391(PHN13.329)
权利要求
1.一种口授系统，包括一种用于将语音信号存于存储部件中的手持式口授装置，该装置包含能将语音信号压缩成数据压缩语音信号的数据压缩部件，和在存储部件中存储数据压缩语音信号的存储部件，其特征在于数据压缩部件被设计成至少可用两种不同的数据压缩模式之一对语音信号进行数据压缩，当对同一语音信号用至少两种不同的数据压缩模式进行压缩时会得到不同的数据压缩比，用户可选择所述至少两种不同的数据压缩模式，数据压缩部件还可生成包含数据压缩语音信号部分的数据文件，该数据文件包含一个文件头，数据压缩部件还适于生成用于标识所选择的数据压缩模式的标识信号并将其保存于文件头中。
2.权利要求1的口授系统，其特征在于存储部件包括用于存储该数据文件的可拆卸式固态存贮单元，该固态存储单元带有连接部件，用于将存储单元与手持式口授装置在机械和电气上相连。
3.权利要求2的口授系统，其特征在于连接部件还被设计成在机械和电气上将该存储单元与PC机相连。
4.权利要求3的口授系统，其特征在于连接部件被设计成在机械和电气上将该存储单元与该PC机的国际标准接口相连。
5.权利要求4的口授系统，其特征在于所述接口就是PCMCLA接口。
6.权利要求2-5中任一项权利要求的口授系统，其特征在于固态存储单元包括一种EEPROM。
7.权利要求2-5中的任一项权利要求的口授系统，其特征在于固态存储单元包括快速可擦式存储单元。
8.权利要求1-5中任一项权利要求的口授系统，其特征在于固态存储单元包括一个后备电池。
9.前述权利要求中任一项权利要求的口授系统，其特征在于数据压缩部件被设计成至少可用两种不同的数据压缩模式之一对语音信号进行数据压缩处理，所述至少两种数据压缩模式中至少有一种是带损耗的数据压缩模式。
10.用于前述任一项权利要求的口授系统中的手持式口授装置，该装置包括将语音信号压缩成数据压缩语音信号的数据压缩部件，其特征在于，该数据压缩部件被设计成至少能用两种不同的数据压缩模式之一对语音信号进行数据压缩处理，该至少两种不同的数据压缩模式所得的压缩比是不同的，用户可选择所说的至少两种不同的数据压缩模式，该数据压缩部件还可生成包含数据压缩语音信号部分的数据文件，该数据文件包括一个文件头，该数据压缩部件还生成用于标识被选的数据压缩模式的标识信号并将该标识信号保存于所述文件头中。
11.权利要求10的手持式口授装置，其特征在于，它具有与可拆卸式固态存储单元的连接部件在机械上和电气上相连的连接部件。
12.权利要求11的手持式口授装置，其特征在于连接部件是按照一种国际标准接口制造的。
13.权利要求12的手持式口授装置，其特征在于所述的接口是PCMCLA接口。
14权利要求10-13中任一项权利要求的手持式口授装置，其特征在于数据压缩部件适于用至少两种不同的数据压缩模式之一对语音信号进行数据压缩，所说的至少两种不同的数据压缩模式中至少有一种是带损耗的数据压缩模式。
15.用于复读语音信息的复读装置，其特征在于它包括用于对存储于存储部件中的数据压缩语音信号进行解压操作的数据解压部件，所述数据压缩语音信号由至少两种不同数据压缩模式中的一种进行数据压缩而成，对于相同语音信号，用该至少两种不同的数据压缩模式进行数据压缩得到不同的数据压缩比，该数据压缩语音信号作为数据文件存于存储部件中，该数据文件包含数据压缩语音信号部分，数据文件还包括存有标识信号的文件头，该标识信号表示对语音信号进行数据压缩时所选的数据压缩模式，数据解压部件能从文件头中检索到该标识信号，并按此标识信号的要求用至少两种不同数据解压模式中的一种对文件中的数据压缩语音信息进行解压操作，以便得到该语音信号的副本。
16.权利要求15的复读装置，其特征在于存储部件是可拆卸式固态存储单元，该复读装置具有与该固态存储单元的连接部件在机械上、电气上相连的连接部件。
17.权利要求16的复读装置，其特征在于该连接部件是按照一种国际标准接口的要求制造的。
18.权利要求17的复读装置，其特征在于所述接口是PCMCIA接口。
19.可拆卸式固态存储单元，包含数据压缩语音信号，所述数据压缩语音信号是采用至少两种不同的数据压缩模式中的一种进行数据压缩的，当对相同的语音信号用至少两种不同的数据压缩模式进行数据压缩时所得到的数据压缩比是不同的，该数据压缩语音信号以数据文件形式存于存储部件中，该数据文件包含数据压缩语音信号部分，该数据文件包括存有标识信号的文件头，该标识信号识别对语音信号进行数据压缩时所选的数据压缩模式。
20.权利要求19的固态存储单元，其特征在于它具有将该存储器与PC机在机械、电气上相连的连接部件。
21.权利要求20的固态存储单元，其特征在于该连接部件将该存储单元与PC机的一种国际标准接口在机械、电气上相连。
22.权利要求21的固态存储单元，其特征在于所述的接口是PCMCIA接口。
全文摘要
此处公开的口授系统包括一种将语音信号存于存储部件(15,20)的手持式口授装置(1),该装置包含能将语音信号压缩成数据压缩语音信号的数据压缩部件(30)和存储数据压缩语音信号在存储器部件内的存储部件。数据压缩部件(30)被设计成以至少可用两种不同的数据压缩模式之一对语音信号进行数据压缩,当用至少两种不同的数据压缩模式对同一语音信号进行压缩时将得到不同的数据压缩比。用户可选择至少所述两种不同的数据压缩模式。数据压缩部件(30)还适于生成包含数据压缩语音信号部分的数据文件(Bi),数据文件包含一文件头(HDR)。数据压缩部件还适于生成用于标识被选数据压缩模式的标识信号并将该标识信号保存于文件头中。
文档编号G10L19/00GK1185854SQ97190285
公开日1998年6月24日申请日期1997年1月24日优先权日1996年2月12日
发明者H·博尔德尔申请人:菲利浦电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：H.博尔德尔
技术所有人：皇家菲利浦电子有限公司
我是此专利的发明人

上一篇：具有减少复杂性的合成滤波器的celp语音编码器的制作方法
上一篇：减小复杂性的信号传输系统的制作方法