在汽车中通过语音再现文本信息的方法

文档序号：2830230阅读：351来源：国知局

专利名称：在汽车中通过语音再现文本信息的方法
技术领域：
本发明涉及一种在汽车中通过语音再现文本信息的方法。
背景技术：
在汽车中已知例如导航系统这样的现有系统，它们可以通过语音
信号声学地再现被存储为文本模块(Textbausteine )的信息。这些系统限于存储的基本文本元素(Basis-Textelement)，并且只有作为基础的文本元素可以通过语音被再现。不可能扩展这种系统。
此外，已知其中可以在汽车中通过语音再现从外部接收的文本信息的系统。在此一个重要的问题是不能通过语音无疑义地和可理解地再现这些文本信息。

发明内容
因此，本发明要解决的技术问题是提供一种方法，利用该方法可以改善在汽车中通过语音再现文本信息。
该技术问题通过具有权利要求1的特征的方法解决。
具体实施例方式
在根据本发明的方法中，在汽车中通过语音信号再现文本信息。要再现的文本信息作为文本元素在汽车外部的单元中被提供。文本元素原则上也可以在该汽车外部的单元中产生。
此外，为各文本元素产生并提供特定发音信息。文本元素和特定发音信息将被传输或被传送到汽车内部的处理单元。特定发音信息被分配给相应的文本元素。在考虑特定发音信息的情况下，通过汽车中的电子语音装置再现文本元素。通过该方式，可以通过汽车中的显著改善的语音再现来通知多个不同和个性化的文本信息。尤其通过利用作为特定发音信息提供的辅助信息而从外部优化文本信息，可以显著提高语音信号的无疑义性和可理解性。由此还可以无疑义地和可理解地再现极为复杂的文本。
优选地，在汽车外部将特定发音信息分配给相应的文本元素。由此可以提高待再现文本的灵活性。此外还可以显著减少汽车中所需要的电子存储空间。
但是，也可以在汽车内部将特定发音信息分配给相应的文本元素。
优选地，发音信息被存储在数据库中，其中依据需要搜索该数据库以查找所需要的各个信息。
优选地，文本元素和特定发音信息在汽车运行时被传送到汽车中，尤其是无线地传送。
优选地，特定发音信息和/或针对文本信息的分配是以标准化格式被产生的。优选地，在此可以是，特定发音信息和/或针对文本信
息的分配是以SSML (语音合成标记语言)语言来产生的。
优选地，在汽车内部的单元或处理单元中，在基本的投入使用之前，并且因此在提供给语音输出系统的最终用户之前，基本文本元素与对应的基本发音信息被存储。
优选地，将被传送到汽车中的文本元素与基本文本元素比较，并且在与文本元素的特定发音信息不同时考虑被传送到汽车中的文本元素用于文本的正确语音输出。
优选地，通过数字广播介质，尤其是通过数字广播网络来传输文本元素和特定发音信息。
在文本元素下包括单个词以及句子成分或整个句子。还可以在一个文本元素下包括多个句子。
通过根据存储的模板和发音方案(Ausspracheschemata )朗读文本信息，语音合成根据文本信息产生语音信号。作为基础的用于语音输出的软件被称为语音合成或文本转语音(TTS)引擎。TTS引擎可以通过向文本添加对于发音中的各个词或句子结构、如语法的发音信
息而被支持。这例如可以被用于导航系统中。TTS引擎具有以下优点人们可以在没有自然的朗读者的情况下工作，而且还可以事后产生新的所谓的提示，即文本输出。通过优化的TTS引擎所产生的音频文件被存储在汽车中，并通过事件被询问，相当于当前的导航输出，其中例如根据达到与下一目标之间相距特定距离而通过语音信号说明应当在200m之后向左拐弯。句子成分由存储在汽车中的模块 (Bausteinen )动态地组合而成。这些基本文本元素作为基本的信息被存储在系统中，以便能够一般性地在文本信息的语音输出方面保证基本功能。但是，这是文本元素的固定地预先给出的有限集合，其对于极为不同的文本信息和表示来说是不够的。
现在，通过根据本发明的方法或其优选实施方式可以优化极为不同的文本信息的语音输出，其中通过基本上在汽车外部在汽车外部的单元中进行该优化而实现。于是，在优化中，产生特定于TTS引擎的转换脚本(Transskript)，即发声法(Lautsprache )。该转换脚本可以动态地被传送到汽车中，或者可以在传送之后被存储在汽车中。然后，在汽车中进行声音的音频输出。要读出的具有辅助内容或特定发音信息的文本可以在汽车中通过TTS引擎与所谓的离车转换 (Offboardumsetzung )类似地^皮转换为音频输出。由此可以获得的重要优点是，事后可以将新的多种不同文本信息内容提供到汽车中，并且以改进的语音输出通过该系统而再现出来。从而，可以尤其通过广播介质无线地传送文本消息内容，并且通过语音信号在汽车中无疑义地输出文本消息内容。于是，作为特定发音信息在外部产生的辅助内容可以用于汽车中的无疑义的发音，并且保证对可理解性的显著改善。针对发音优化的内容也可以通过通信业务被传送到汽车。
TTS引擎可以解释优化并且执行令人满意的输出。此外，通过本方法显著减少了所需要的存储空间，因为在这种系统中存储作为基本的词基(Wortbasis)的大量具有相应基本发音信息的基本文本元空间的10到100倍。因此，优选地，离车地或在汽车外部针对语音
表示来优化文本信息，并产生音频文件，并在汽车中只输出音频文件。
于是，优选地，以标准化形式来描述语音优化
(Sprachoptimierung)，从而不同的TTS引擎可以相同地解释内容。这尤其是在消息被动态引入的情况下尤其有利，因为这些消息必须由所有接收器处理。语音优化的一种可能的标准是SSML语言，由其例如可以定义一个子集，并且相应的接收器系统支持该子集并且发送单元提供该子集。
特别有利的是，将自动优化作为极为不同的文本信息的语音输出的基础。例如在此可以规定，持续更新为通信业务发出的文本信息，从而对内容手动检查发音特性是非常费事的。通过自动优化可以改善这一点。
关于自动优化的一种示例性方式在于，首先输入文本，并且发音数据库被加载以特定发音信息。然后，将所传送的文本的文本元素与基本文本元素进行比较，并为该文本补充相应的发音规则。由于既存在已经为基本文本元素事先存储和分配的发音信息，又有特定于用该文本传送的文本元素的发音信息，因此整个文本可以基于各个发音信息，并且用最佳可能的发音说出整个文本。即使传送无法通过基本文本元素认识或没有被基本文本元素覆盖的文本部分，也可以无疑义地和清楚地通过语音信号表示这些几乎不认识的文本元素，因为也为这些文本元素分配了特定发音信息，这些特定发音信息是个别离车产生的，并且附加地作为辅助信息被一起传送。
于是，整个文本的输出可以自动进行或者在由汽车使用者所确定的时刻被再现。因此，汽车使用者可以自己确定再现的时刻和持续时间。
此外可以规定，可以通过编辑进行后处理，尤其是手动的后处理。由此可以实现再次改进，并且似乎启动学习^t式。
权利要求
1. 一种在汽车中通过语音再现文本信息的方法，其中执行以下步骤a)在汽车外部的单元中提供文本元素；b)为各文本元素产生并提供特定发音信息；c)将所述文本元素和所述特定发音信息传送到汽车内部的处理单元；d)将所述特定发音信息分配给相应的文本元素；e)在考虑所述特定发音信息的情况下，通过汽车中的电子语音装置再现所述文本元素。
2. 根据权利要求1所述的方法，其特征在于，在汽车外部将所述特定发音信息分配给相应的文本元素。
3. 根据权利要求1所述的方法，其特征在于，在汽车内部将所述特定发音信息分配给相应的文本元素。
4. 根据上述权利要求之一所述的方法，其特征在于，所述发音信息被存储在数据库中，其中所述数据库依据需要而被搜索。
5. 根据上述权利要求之一所述的方法，其特征在于，所述文本元素和所述特定发音信息在汽车运行时被传送到汽车中，尤其是无线地传送。
6. 根据上述权利要求之一所述的方法，其特征在于，所述特定发音信息和/或针对文本元素的分配是以标准化格式产生的。
7. 根据权利要求6所述的方法，其特征在于，所述特定发音信息和/或针对文本元素的分配是以SSML语言来产生的。
8. 根据上述权利要求之一所述的方法，其特征在于，在汽车内部的单元中，在语音输出系统的基本投入运行之前，存储基本文本元素与对应的基本发音信息。
9. 根据权利要求8所述的方法，其特征在于，将被传送到汽车中的文本元素与基本文本元素相比较，并且在不同时考虑文本元素的特定发音信息用于文本的语音输出。
10. 根据上述权利要求之一所述的方法，其特征在于，通过广播介质，尤其是通过数字广播网络来传输所述文本元素和所述特定发音信息。
全文摘要
本发明涉及一种在汽车中通过语音信号再现文本信息的方法，其中执行以下步骤a)在汽车外部的单元中提供文本元素；b)为各文本元素产生并提供特定发音信息；c)将文本元素和特定发音信息传送到汽车内部的处理单元；d)将特定发音信息分配给相应的文本元素；e)在考虑这些特定发音信息的情况下，通过汽车中的电子语音装置再现文本元素。
文档编号G10L13/08GK101523483SQ200780038207
公开日2009年9月2日申请日期2007年10月19日优先权日2006年11月29日
发明者S·泽尔朔普申请人:奥迪股份公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S.泽尔朔普
技术所有人：奥迪股份公司
我是此专利的发明人

上一篇：一种不可见数字水印的嵌入方法
上一篇：用于可变地折射超声和/或光的系统的制作方法