利用单一声学模型和自动口音检测实现的基于文本规则的多口音言语识别的制作方法

文档序号：11161271阅读：来源：国知局

技术特征：

1.一种言语识别系统，其包括：

带口音语音和变换ID生成单元，所述带口音语音和变换ID生成单元包括带口音子字符串的数据库，并且所述带口音语音和变换ID生成单元接收元数据和与所述元数据相关联并且处于第一ID数据空间中的ID数据，并且提供各自唯一地与同某种语言相关联的多种不同口音中的相关联口音相关联的多个修改的单词，并且处理所述多个修改的单词，并提供所述多个修改的单词的多个口音校正的语音数据，其中所述口音校正的语音数据中的每一个被处理以提供处于第二ID数据空间中的各自唯一地与所述多个口音校正的语音数据中的相关联数据相关联的多个变换ID；

言语特征提取器单元，所述言语特征提取器单元接收并处理用户输入言语并且提供与所述用户输入言语相关联的所提取的言语数据；

话音识别逻辑单元，所述话音识别逻辑单元接收所提取的言语数据、所述多个变换ID和所述多个口音校正的语音数据，并且提供对应于终端的终端标识符以及口音数据，对于所述口音数据，音标中的一个与同所述用户输入言语相关联的所提取的言语数据最佳地匹配；

口音检测和逆向ID变换单元，所述口音检测和逆向ID变换单元接收所述终端标识符并且提供处于所述第一ID数据空间中的确认ID；以及

口音结果加权逻辑单元，所述口音结果加权逻辑单元接收所检测到的口音数据并且与所检测到的口音数据的过去值进行比较以提供所识别的言语数据。

2.如权利要求1所述的言语识别系统，其中所述带口音语音和变换ID生成单元包括提供所述多个口音校正的语音数据的字素到语音单元。

3.如权利要求1或2中任一项所述的言语识别系统，其中所述带口音语音和变换ID生成单元包括变换ID分配器，所述变换ID分配器接收所述口音校正的语音数据和所述ID数据并且提供处于所述第二ID数据空间中的所述多个变换ID。

4.如权利要求3所述的言语识别系统，其中所述话音识别逻辑单元包括上下文单元，所述上下文单元包括与所述某种语言相关联的语法文件。

5.一种访问带口音子字符串的数据库的言语识别方法，其包括：

接收元数据和与所述元数据相关联并且处于原始ID空间中的ID数据，并且提供各自唯一地与同某种语言相关联的多种不同口音中的相关联口音相关联的多个修改的单词，并且处理所述多个修改的单词以提供所述多个修改的单词的多个口音校正的语音数据，其中所述口音校正的语音数据中的每一个被处理以提供处于变换ID空间中的各自唯一地与所述多个口音校正的语音数据中的相关联数据相关联的多个变换ID；

在言语特征提取器单元中接收用户输入言语并且处理所接收的输入言语以提供与所述用户输入言语相关联的所提取的言语数据；

处理所提取的言语数据、所述多个变换ID和所述多个口音校正的语音数据，并且提供对应于终端的终端标识符以及口音数据，对于所述口音数据，音标中的一个与同所述用户输入言语相关联的所提取的言语数据最佳地匹配；

处理所述终端标识符以提供处于所述原始ID数据空间中的确认ID；以及

将所检测到的口音数据与所检测到的口音数据的过去值进行比较以提供所识别的言语数据。

6.如权利要求5所述的方法，其中提供所述多个口音校正的语音数据的步骤包括对所述多个修改的单词进行字素到语音处理以提供所述多个口音校正的语音数据。

7.一种由言语识别系统执行的言语识别方法，所述言语识别系统包括言语控制装置、处理器和存储可由所述处理器执行的指令的存储装置，所述方法包括：

在包括带口音子字符串的数据库的带口音语音和变换ID生成单元处接收元数据；

通过所述带口音语音和变换ID生成单元生成包括在所述元数据中的单词的口音校正的语音数据，所述口音校正的语音数据基于存储在所述数据库中的所述带口音子字符串而表示包括在所述元数据中的所述单词的不同发音；

在话音识别引擎处接收源自由用户输入到所述言语识别系统的话语的所提取的言语数据；

在所述话音识别引擎处接收所述口音校正的语音数据；

在所述话音识别引擎处确定所提取的言语数据中标识所识别的话语的一个或多个终端ID；

在所述话音识别引擎处生成标识在所识别的话语中检测到的口音的口音数据；

基于所述一个或多个终端ID和所述口音数据来生成所识别的言语数据；以及

将所识别的言语数据输出到所述言语控制装置。

8.如权利要求7所述的方法，其还包括：在加权结果单元处接收所述口音数据和包括先前生成的口音数据的历史数据，并且将所述口音数据与所述历史数据进行比较，所识别的言语数据进一步基于所述口音数据与所述历史数据的所述比较。

9.如权利要求8所述的方法，其中将所述口音数据与所述历史数据进行比较包括确定由所述口音数据标识的口音是否与在最近识别的言语数据中标识的口音相匹配。

10.如权利要求7-9中任一项所述的方法，其中所述元数据对应于存储在以下各项中的一项或多项上的文本条目：所述言语识别系统的所述存储装置、向所述言语识别系统提供输入的用户的移动装置,以及托管与向所述言语识别系统提供输入的所述用户相关联的用户简档的外部服务。

11.如权利要求7-9中任一项所述的方法，其还包括：在所述带口音语音和变换ID生成单元处接收对应于包括在所述元数据中的所述单词的ID数据，并且在所述带口音语音和变换ID生成单元处生成所述口音校正的语音数据的变换ID。

12.如权利要求11所述的方法，其中所述口音校正的语音数据包括带口音单词，每个带口音单词对应于包括在所述元数据中的相关联的原始单词，所述变换ID中的每一个对应于不同口音单词并且基于该带口音单词的口音和与该带口音单词相关联的原始单词的ID数据而生成。

13.如权利要求12所述的方法，其中所识别的言语数据和所述一个或多个终端ID与所述元数据的单词和所述元数据的所述单词的所述ID数据匹配。

14.如权利要求7-13中任一项所述的方法，其中所述话音识别逻辑单元包括上下文单元，所述上下文单元包括与针对用户标识的语言相关联的语法文件。

15.如权利要求14所述的方法，其中所述语言基于历史数据和由所述用户输入的话语中的一个或多个来自动地标识。

16.如权利要求15所述的方法，其中基于由所述用户对所述语言的选择来标识所述语言。

17.如权利要求7-16中任一项所述的方法，其中所述言语识别系统包括车辆的车载计算系统，并且其中言语控制装置包括所述车载计算系统的显示器和所述车辆中的车辆系统中的一个或多个。

18.一种由言语识别系统执行的言语识别方法，所述言语识别系统包括言语控制装置、处理器和存储能够由所述处理器执行的指令的存储装置，所述方法包括：

接收元数据和处于原始ID空间中的与所述元数据相关联的ID数据；

提供各自唯一地与所述元数据和同某种语言相关联的多种不同口音中的相关联口音相关联的多个修改的单词，并且处理所述多个修改的单词以提供所述多个修改的单词的多个口音校正的语音数据；

处理所述口音校正的语音数据以提供处于变换ID空间中的各自唯一地与所述多个口音校正的语音数据中的相关联数据相关联的多个变换ID；

接收用户输入言语数据，并且处理所接收的输入言语数据，以提供与所述用户输入言语数据相关联的所提取的言语数据；

处理所提取的言语数据、所述多个变换ID和所述多个口音校正的语音数据，并且提供对应于终端的终端标识符，并提供与同所述用户输入言语数据相关联的所提取的言语数据最佳地匹配的音标的口音数据；

处理所述终端标识符，以提供处于所述原始ID数据空间中的变换ID；以及

将所检测到的口音数据与所检测到的口音数据的过去值进行比较，以提供所识别的言语数据。

完整全部详细技术资料下载

当前第2页1 2 3