名称的语音识别方法、语音识别系统和语音识别设备的制作方法

文档序号:2828096阅读:187来源:国知局
名称的语音识别方法、语音识别系统和语音识别设备的制作方法
【专利摘要】本发明提供了一种名称的语音识别方法、一种名称的语音识别系统和一种名称的语音识别设备,其中,名称的语音识别方法,包括:获取所述名称的语音字符串;根据所述语音字符串创建单词查找树;判断所述单词查找树是否与预存的名称信息匹配;以及在判定所述名称信息与所述预存的名称信息匹配时向用户提示所述名称的语音识别结果。通过本发明的技术方案,提高了语音识别过程中的识别准确率和识别效率,同时,降低了对于用户发出语音指令的语调、语速和音色的要求,提升了用户的使用体验。
【专利说明】名称的语音识别方法、语音识别系统和语音识别设备

【技术领域】
[0001] 本发明涉及语音识别【技术领域】,具体而言,涉及一种名称的语音识别方法、一种名 称的语音识别系统和一种名称的语音识别设备。

【背景技术】
[0002] 随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展,并且正在日益 改变人类的生产和生活方式,被广泛应用于诸如语音输入系统、语音控制系统和智能对话 查询系统等领域。
[0003] 语音识别技术是通过识别和解析过程把语音信号转变为相应的文本或命令的技 术,其具体过程包括:
[0004] (1)采集和预处理步骤:未知语音经过话筒变换成电信号后加在识别系统的输入 端,经过预处理过程对电信号进行降噪和滤波等处理,以初步提高信噪比;
[0005] (2)识别步骤:对经过预处理的电信号进行识别处理,根据用户的语音特定建立 语音模型,根据语音模型对电信号进行分析,抽取电信号中包括的语音特征,在此基础上建 立语音识别所需的模板。而计算机在识别过程中需要根据语音识别的模型,将计算机中预 存储的语音模板和输入的语音特征进行匹配,按照预定的匹配策略找出最优的匹配模板;
[0006] (3)后处理步骤:根据模板的映射表和定义获知语音特征对应的文本信息。
[0007] 其中,识别步骤作为语音识别的重要步骤通常有以下几个指标作为衡量标准:
[0008] (1)词汇表范围:语音设备能够识别的单词或词组的范围;
[0009] (2)说话人限制:语音设备能够识别指定语音、语调和音色的语音信息;
[0010] (3)训练要求:语音设备是否经过大量语音信号的识别训练过程;
[0011] (4)识别率:语音设备能够平均正确识别的百分数,取决于前三个参数。
[0012] 相关技术中,名称作为最主要的语音识别对象之一,针对上述语音识别参数而言 存在以下问题:
[0013] (1)将连续的语音信息分解为词、音素等单位,语音识别过程较慢因此要求用户语 速不能过快;
[0014] (2)语音信息量大,受用户发出语音指令的方式影响,会对识别过程产生影响甚至 误判;
[0015] (3)单个字母或词、字的语音特性受上下文影响,会影响语音识别的误判;
[0016] (4)语音的混淆音影响,具体地,如同音字、前后鼻音、平翘舌音和混淆音,都会影 响语音识别的误判;
[0017] (5)环境噪声和干扰对语音识别过程产生严重影响。
[0018] 因此,如何设计名称的语音识别方案提高识别过程的准确率和识别效率成为亟待 解决的技术问题。


【发明内容】

[0019] 本发明正是基于上述技术问题至少之一,提出了一种新的名称的语音识别方案和 一种语音识别设备。
[0020] 有鉴于此,本发明提出了一种名称的语音识别方法,包括:获取所述名称的语音字 符串;根据所述语音字符串创建单词查找树;判断所述单词查找树是否与预存的名称信息 匹配;以及在判定所述名称信息与所述预存的名称信息匹配时向用户提示所述名称的语音 识别结果。
[0021] 在该技术方案中,通过根据语音字符串创建单词查找树(trie树),实现了名称的 快速和准确查找,由于识别效率高且速度快,故识别过程受到环境噪声影响极小,具体地, 将名称的语音字符串中的单个字符依次生成单词查找树中的节点,并且将每个节点拓展为 相关信息,例如,名称的全拼、简拼、容易拼错的汉字拼音组合、容易读错的汉字拼音组合以 及名称中的相关职位信息等,将有连接关系的节点根据生成顺序和映射模板转换为文本信 息,最终将所有的文本信息列表向用户进行提示。
[0022] 其中,单词查找树具备节省存储空间和查询速度极快的特点,具体地,单词查找树 包括汉字查找树和字母查找树,例如用户输入的名称为中文名称则同时生产汉字查找树和 字母查找树,也同时向用户提示汉字查找树和字母查找树生成的语音识别结果,或者生成 汉字查找树,在生成的汉字查找树中没有语言识别结果时,则生成字母查找树完成语音识 别过程,而在用户输入的名称为外文名称时仅生成字母查找树,向用户提示字母查找树生 成的语音识别结果。
[0023] 在上述技术方案中,优选地,根据所述语音字符串创建单词查找树,包括以下具体 步骤:在获取到所述语音字符串后,创建至少一个词元字符串;选择最接近所述语音字符 串的所述词元字符串作为最优词元字符串;根据所述最优词元字符串的创建顺序将所述词 元字符串通过分隔符划分为至少一个单个字符串;根据所述至少一个单个字符串和所述至 少一个单个字符串的划分顺序创建所述单词查找树。
[0024] 在该技术方案中,通过在创建的至少一个词元字符串中选择最接近的最优词元字 符串,并以最优词元字符串创建单词查找树,实现了精准识别模式,同时提高了识别效率, 具体地,对一个最有词元字符串进行分割和生成单词查找树处理,同样的,对每个单个字符 串进行拓展处理,拓展信息作为该单个字符串的子节点。
[0025] 在上述技术方案中,优选地,根据所述至少一个单个字符串和所述至少一个单个 字符串的划分顺序创建单词查找树,包括以下具体步骤:根据所述每个单个字符串创建第 一类单词查找树的节点,其中,先划分得到的所述单个字符串为第一类母节点,后划分得到 的所述单个字符串作为所述第一类母节点的第一类子节点。
[0026] 在上述技术方案中,优选地,判断所述单词查找树是否与预存的名称信息匹配,包 括以下具体步骤:在所述第一类单词查找树不与所述预存的所述名称信息匹配时,根据所 述语音字符串创建第二类单词查找树;判断所述第二类单词查找树是否与所述预存的名称 信息匹配。
[0027] 在该技术方案中,通过在所述第一类单词查找树不与预存的名称信息匹配时,创 建第二类单词查找树继续进行语音识别,增加了语音识别过程的多样性,更便于为用户提 供准确的识别结果,具体地,如第一类单词查找树生成了汉字查找树或字母查找树,遍历汉 字查找树和字母查找树后均为得到语音识别结果,此时,创建第二类单词查找树,例如字 符查找树,也即在名称中加入了字符信息,如语音输入信息为"Lily'suncle",在遍历包 括Lily的第一类单词查找树后,并未获得用户需要的语音信息,此时,创建例如"Lily's" 的第二类单词查找树,会生成包括诸如"李丽的叔叔"、"丽丽的叔叔"、"李莉的叔叔"以及 "Lily'suncle"等字符串的第二类单词查找树,并将所有的语音识别结果提示给用户。
[0028] 在上述技术方案中,优选地,根据所述语音字符串创建第二类单词查找树,包括以 下具体步骤:在获取到所述语音字符串后,创建所述至少一个词元字符串;创建每个所述 词元字符串的至少一个混淆音字符串;根据所述至少一个混淆音字符串的创建顺序将所述 至少一个混淆音字符串通过分隔符划分为至少一个单个混淆音字符串;将通过所述分隔符 划分的所述至少一个单个混淆音字符串中的相同单个混淆音字符串放置于所述单词查找 树的一个节点位置,其中,先划分得到的所述单个混淆音字符串为第二类母节点,后划分得 到的所述单个混淆音字符串作为所述第二类母节点的第二类子节点。
[0029] 在该技术方案中,通过创建基于混淆音的单词查找树,可以提高语音识别效率 和丰富的语音识别结果,具体地,以汉语发音为例,当语音设备获取用户的语音指令为 "zhang",会生成"zhang"的全部混淆音字符串,例如"zang"、"zhan"和"zan"等,对"zang"、 "zhan"和"zan"进行字符划分后,生成包括"zang"、"zhan"和"zan"的单词查找树,并将 单词查找树的生成结果提示给用户,这种识别方式降低了对用户的发音准确度和语速的要 求,提升了用户的使用体验。
[0030] 根据本发明的另一方面,还提出了一种名称的语音识别系统,包括:获取单元,用 于获取所述名称的语音字符串;创建单元,用于根据所述语音字符串创建单词查找树;判 断单元,用于判断所述单词查找树是否与预存的名称信息匹配;以及提示单元,用于在判定 所述名称信息与所述预存的名称信息匹配时向用户提示所述名称的语音识别结果。
[0031] 在该技术方案中,通过根据语音字符串创建单词查找树(trie树),实现了名称的 快速和准确查找,由于识别效率高且速度快,故识别过程受到环境噪声影响极小,具体地, 将名称的语音字符串中的单个字符依次生成单词查找树中的节点,并且将每个节点拓展为 相关信息,例如,名称的全拼、简拼、容易拼错的汉字拼音组合、容易读错的汉字拼音组合以 及名称中的相关职位信息等,将有连接关系的节点根据生成顺序和映射模板转换为文本信 息,最终将所有的文本信息列表向用户进行提示。
[0032] 其中,单词查找树具备节省存储空间和查询速度极快的特点,具体地,单词查找树 包括汉字查找树和字母查找树,例如用户输入的名称为中文名称则同时生产汉字查找树和 字母查找树,也同时向用户提示汉字查找树和字母查找树生成的语音识别结果,或者生成 汉字查找树,在生成的汉字查找树中没有语言识别结果时,则生成字母查找树完成语音识 别过程,而在用户输入的名称为外文名称时仅生成字母查找树,向用户提示字母查找树生 成的语音识别结果。
[0033] 在上述技术方案中,优选地,所述创建单元还用于,在获取到所述语音字符串后, 创建至少一个词元字符串;所述名称的语音识别系统,还包括:选择单元,用于选择最接近 所述语音字符串的所述词元字符串作为最优词元字符串;划分单元,用于根据所述最优词 元字符串的创建顺序将所述词元字符串通过分隔符划分为至少一个单个字符串;所述创建 单元还用于,根据所述至少一个单个字符串和所述至少一个单个字符串的划分顺序创建所 述单词查找树。
[0034] 在该技术方案中,通过在创建的至少一个词元字符串中选择最接近的最优词元字 符串,并以最优词元字符串创建单词查找树,实现了精准识别模式,同时提高了识别效率, 具体地,对一个最有词元字符串进行分割和生成单词查找树处理,同样的,对每个单个字符 串进行拓展处理,拓展信息作为该单个字符串的子节点。
[0035] 在上述技术方案中,优选地,所述创建单元还用于,根据所述每个单个字符串创建 第一类单词查找树的节点,其中,先划分得到的所述单个字符串为第一类母节点,后划分得 到的所述单个字符串作为所述第一类母节点的第一类子节点。
[0036] 在上述技术方案中,优选地,所述创建单元还用于,在所述第一类单词查找树不与 所述预存的所述名称信息匹配时,根据所述语音字符串创建第二类单词查找树;所述判断 单元还用于,判断所述第二类单词查找树是否与所述预存的名称信息匹配。
[0037] 在该技术方案中,通过在所述第一类单词查找树不与预存的名称信息匹配时,创 建第二类单词查找树继续进行语音识别,增加了语音识别过程的多样性,更便于为用户提 供准确的识别结果,具体地,如第一类单词查找树生成了汉字查找树或字母查找树,遍历汉 字查找树和字母查找树后均为得到语音识别结果,此时,创建第二类单词查找树,例如字 符查找树,也即在名称中加入了字符信息,如语音输入信息为"Lily'suncle",在遍历包 括Lily的第一类单词查找树后,并未获得用户需要的语音信息,此时,创建例如"Lily's" 的第二类单词查找树,会生成包括诸如"李丽的叔叔"、"丽丽的叔叔"、"李莉的叔叔"以及 "Lily'suncle"等字符串的第二类单词查找树,并将所有的语音识别结果提示给用户。
[0038] 在上述技术方案中,优选地,所述创建单元还用于,在获取到所述语音字符串后, 创建所述至少一个词元字符串;所述创建单元还用于,创建每个所述词元字符串的至少一 个混淆音字符串;所述划分单元还用于,根据所述至少一个混淆音字符串的创建顺序将所 述至少一个混淆音字符串通过分隔符划分为至少一个单个混淆音字符串;所述创建单元还 用于,将通过所述分隔符划分的所述至少一个单个混淆音字符串中的相同单个混淆音字符 串放置于所述单词查找树的一个节点位置,其中,先划分得到的所述单个混淆音字符串为 第二类母节点,后划分得到的所述单个混淆音字符串作为所述第二类母节点的第二类子节 点。
[0039] 在该技术方案中,通过创建基于混淆音的单词查找树,可以提高语音识别效率 和丰富的语音识别结果,具体地,以汉语发音为例,当语音设备获取用户的语音指令为 "zhang",会生成"zhang"的全部混淆音字符串,例如"zang"、"zhan"和"zan"等,对"zang"、 "zhan"和"zan"进行字符划分后,生成包括"zang"、"zhan"和"zan"的单词查找树,并将 单词查找树的生成结果提示给用户,这种识别方式降低了对用户的发音准确度和语速的要 求,提升了用户的使用体验。
[0040] 根据本发明的第三方面,还提出了一种名称的语音识别设备,包括:如上述任一项 技术方案所述的名称的语音识别系统。
[0041] 通过以上技术方案,提高了语音识别过程中的识别准确率和识别效率,同时,降低 了对于用户发出语音指令的语调、语速和音色的要求,提升了用户的使用体验。

【专利附图】

【附图说明】
[0042] 图1示出了根据本发明的一个实施例的名称的语音识别方法的示意流程图;
[0043] 图2示出了根据本发明的实施例的名称的语音识别系统的示意框图;
[0044] 图3示出了根据本发明的另一个实施例的名称的语音识别方法的示意流程图;
[0045] 图4示出了根据本发明的一个实施例的名称的语音识别方法的单词查找树的示 意图;
[0046] 图5示出了根据本发明的另一个实施例的名称的语音识别方法的单词查找树的 示意图。

【具体实施方式】
[0047] 为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实 施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施 例及实施例中的特征可以相互组合。
[0048] 在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可 以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开 的具体实施例的限制。
[0049] 图1示出了根据本发明的实施例的名称的语音识别方法的示意流程图。
[0050] 如图1所示,根据本发明的实施例的名称的语音识别方法,包括:步骤102,获取所 述名称的语音字符串;步骤104,根据所述语音字符串创建单词查找树;步骤106,判断所述 单词查找树是否与预存的名称信息匹配;步骤108,以及在判定所述名称信息与所述预存 的名称信息匹配时向用户提示所述名称的语音识别结果。
[0051] 在该技术方案中,通过根据语音字符串创建单词查找树(trie树),实现了名称的 快速和准确查找,由于识别效率高且速度快,故识别过程受到环境噪声影响极小,具体地, 将名称的语音字符串中的单个字符依次生成单词查找树中的节点,并且将每个节点拓展为 相关信息,例如,名称的全拼、简拼、容易拼错的汉字拼音组合、容易读错的汉字拼音组合以 及名称中的相关职位信息等,将有连接关系的节点根据生成顺序和映射模板转换为文本信 息,最终将所有的文本信息列表向用户进行提示。
[0052] 其中,单词查找树具备节省存储空间和查询速度极快的特点,具体地,单词查找树 包括汉字查找树和字母查找树,例如用户输入的名称为中文名称则同时生产汉字查找树和 字母查找树,也同时向用户提示汉字查找树和字母查找树生成的语音识别结果,或者生成 汉字查找树,在生成的汉字查找树中没有语言识别结果时,则生成字母查找树完成语音识 别过程,而在用户输入的名称为外文名称时仅生成字母查找树,向用户提示字母查找树生 成的语音识别结果。
[0053] 在上述技术方案中,优选地,根据所述语音字符串创建单词查找树,包括以下具体 步骤:在获取到所述语音字符串后,创建至少一个词元字符串;选择最接近所述语音字符 串的所述词元字符串作为最优词元字符串;根据所述最优词元字符串的创建顺序将所述词 元字符串通过分隔符划分为至少一个单个字符串;根据所述至少一个单个字符串和所述至 少一个单个字符串的划分顺序创建所述单词查找树。
[0054] 在该技术方案中,通过在创建的至少一个词元字符串中选择最接近的最优词元字 符串,并以最优词元字符串创建单词查找树,实现了精准识别模式,同时提高了识别效率, 具体地,对一个最有词元字符串进行分割和生成单词查找树处理,同样的,对每个单个字符 串进行拓展处理,拓展信息作为该单个字符串的子节点。
[0055] 在上述技术方案中,优选地,根据所述至少一个单个字符串和所述至少一个单个 字符串的划分顺序创建单词查找树,包括以下具体步骤:根据所述每个单个字符串创建第 一类单词查找树的节点,其中,先划分得到的所述单个字符串为第一类母节点,后划分得到 的所述单个字符串作为所述第一类母节点的第一类子节点。
[0056] 在上述技术方案中,优选地,判断所述单词查找树是否与预存的名称信息匹配,包 括以下具体步骤:在所述第一类单词查找树不与所述预存的所述名称信息匹配时,根据所 述语音字符串创建第二类单词查找树;判断所述第二类单词查找树是否与所述预存的名称 信息匹配。
[0057] 在该技术方案中,通过在所述第一类单词查找树不与预存的名称信息匹配时,创 建第二类单词查找树继续进行语音识别,增加了语音识别过程的多样性,更便于为用户提 供准确的识别结果,具体地,如第一类单词查找树生成了汉字查找树或字母查找树,遍历汉 字查找树和字母查找树后均为得到语音识别结果,此时,创建第二类单词查找树,例如字 符查找树,也即在名称中加入了字符信息,如语音输入信息为"Lily'suncle",在遍历包 括Lily的第一类单词查找树后,并未获得用户需要的语音信息,此时,创建例如"Lily's" 的第二类单词查找树,会生成包括诸如"李丽的叔叔"、"丽丽的叔叔"、"李莉的叔叔"以及 "Lily'suncle"等字符串的第二类单词查找树,并将所有的语音识别结果提示给用户。
[0058] 在上述技术方案中,优选地,根据所述语音字符串创建第二类单词查找树,包括以 下具体步骤:在获取到所述语音字符串后,创建所述至少一个词元字符串;创建每个所述 词元字符串的至少一个混淆音字符串;根据所述至少一个混淆音字符串的创建顺序将所述 至少一个混淆音字符串通过分隔符划分为至少一个单个混淆音字符串;将通过所述分隔符 划分的所述至少一个单个混淆音字符串中的相同单个混淆音字符串放置于所述单词查找 树的一个节点位置,其中,先划分得到的所述单个混淆音字符串为第二类母节点,后划分得 到的所述单个混淆音字符串作为所述第二类母节点的第二类子节点。
[0059] 在该技术方案中,通过创建基于混淆音的单词查找树,可以提高语音识别效率 和丰富的语音识别结果,具体地,以汉语发音为例,当语音设备获取用户的语音指令为 "zhang",会生成"zhang"的全部混淆音字符串,例如"zang"、"zhan"和"zan"等,对"zang"、 "zhan"和"zan"进行字符划分后,生成包括"zang"、"zhan"和"zan"的单词查找树,并将 单词查找树的生成结果提示给用户,这种识别方式降低了对用户的发音准确度和语速的要 求,提升了用户的使用体验。
[0060] 图2示出了根据本发明的实施例的名称的语音识别系统的示意框图。
[0061] 如图2所示,根据本发明的实施例的名称的语音识别系统200,包括:获取单元 202,用于获取所述名称的语音字符串;创建单元204,用于根据所述语音字符串创建单词 查找树;判断单元206,用于判断所述单词查找树是否与预存的名称信息匹配;以及提示单 元208,用于在判定所述名称信息与所述预存的名称信息匹配时向用户提示所述名称的语 音识别结果。
[0062] 在该技术方案中,通过根据语音字符串创建单词查找树(trie树),实现了名称的 快速和准确查找,由于识别效率高且速度快,故识别过程受到环境噪声影响极小,具体地, 将名称的语音字符串中的单个字符依次生成单词查找树中的节点,并且将每个节点拓展为 相关信息,例如,名称的全拼、简拼、容易拼错的汉字拼音组合、容易读错的汉字拼音组合以 及名称中的相关职位信息等,将有连接关系的节点根据生成顺序和映射模板转换为文本信 息,最终将所有的文本信息列表向用户进行提示。
[0063] 其中,单词查找树具备节省存储空间和查询速度极快的特点,具体地,单词查找树 包括汉字查找树和字母查找树,例如用户输入的名称为中文名称则同时生产汉字查找树和 字母查找树,也同时向用户提示汉字查找树和字母查找树生成的语音识别结果,或者生成 汉字查找树,在生成的汉字查找树中没有语言识别结果时,则生成字母查找树完成语音识 别过程,而在用户输入的名称为外文名称时仅生成字母查找树,向用户提示字母查找树生 成的语音识别结果。
[0064] 在上述技术方案中,优选地,所述创建单元204还用于,在获取到所述语音字符串 后,创建至少一个词元字符串;所述名称的语音识别系统,还包括:选择单元210,用于选择 最接近所述语音字符串的所述词元字符串作为最优词元字符串;划分单元212,用于根据 所述最优词元字符串的创建顺序将所述词元字符串通过分隔符划分为至少一个单个字符 串;所述创建单元204还用于,根据所述至少一个单个字符串和所述至少一个单个字符串 的划分顺序创建所述单词查找树。
[0065] 在该技术方案中,通过在创建的至少一个词元字符串中选择最接近的最优词元字 符串,并以最优词元字符串创建单词查找树,实现了精准识别模式,同时提高了识别效率, 具体地,对一个最有词元字符串进行分割和生成单词查找树处理,同样的,对每个单个字符 串进行拓展处理,拓展信息作为该单个字符串的子节点。
[0066] 在上述技术方案中,优选地,所述创建单元204还用于,根据所述每个单个字符串 创建第一类单词查找树的节点,其中,先划分得到的所述单个字符串为第一类母节点,后划 分得到的所述单个字符串作为所述第一类母节点的第一类子节点。
[0067] 在上述技术方案中,优选地,所述创建单元204还用于,在所述第一类单词查找树 不与所述预存的所述名称信息匹配时,根据所述语音字符串创建第二类单词查找树;所述 判断单元206还用于,判断所述第二类单词查找树是否与所述预存的名称信息匹配。
[0068] 在该技术方案中,通过在所述第一类单词查找树不与预存的名称信息匹配时,创 建第二类单词查找树继续进行语音识别,增加了语音识别过程的多样性,更便于为用户提 供准确的识别结果,具体地,如第一类单词查找树生成了汉字查找树或字母查找树,遍历汉 字查找树和字母查找树后均为得到语音识别结果,此时,创建第二类单词查找树,例如字 符查找树,也即在名称中加入了字符信息,如语音输入信息为"Lily'suncle",在遍历包 括Lily的第一类单词查找树后,并未获得用户需要的语音信息,此时,创建例如"Lily's" 的第二类单词查找树,会生成包括诸如"李丽的叔叔"、"丽丽的叔叔"、"李莉的叔叔"以及 "Lily'suncle"等字符串的第二类单词查找树,并将所有的语音识别结果提示给用户。
[0069] 在上述技术方案中,优选地,所述创建单元204还用于,在获取到所述语音字符串 后,创建所述至少一个词元字符串;所述创建单元204还用于,创建每个所述词元字符串的 至少一个混淆音字符串;所述划分单元212还用于,根据所述至少一个混淆音字符串的创 建顺序将所述至少一个混淆音字符串通过分隔符划分为至少一个单个混淆音字符串;所述 创建单元204还用于,将通过所述分隔符划分的所述至少一个单个混淆音字符串中的相同 单个混淆音字符串放置于所述单词查找树的一个节点位置,其中,先划分得到的所述单个 混淆音字符串为第二类母节点,后划分得到的所述单个混淆音字符串作为所述第二类母节 点的第二类子节点。
[0070] 在该技术方案中,通过创建基于混淆音的单词查找树,可以提高语音识别效率 和丰富的语音识别结果,具体地,以汉语发音为例,当语音设备获取用户的语音指令为 "zhang",会生成"zhang"的全部混淆音字符串,例如"zang"、"zhan"和"zan"等,对"zang"、 "zhan"和"zan"进行字符划分后,生成包括"zang"、"zhan"和"zan"的单词查找树,并将 单词查找树的生成结果提示给用户,这种识别方式降低了对用户的发音准确度和语速的要 求,提升了用户的使用体验。
[0071] 结合图3至图5,对根据本发明的实施例的名称的语音识别方法进行具体说明。
[0072] 如图3所示,根据本发明的实施例的名称的语音识别方法,包括:步骤302,预处理 过程;步骤304,语音识别过程;步骤306,后处理过程;步骤3041,精准识别;步骤3042,模 糊音识别;步骤3043,混淆音识别;步骤3043,分词识别。
[0073] 具体地,在接收到用户输入数据时,首先进行存储。存储的时候,尽可能扩展数据 的信息,例如:人名的全拼、简拼、容易拼错的汉字拼音组合、容易读错的汉字拼音组合等。 对于具有职位信息的数据,还需要增加职位称呼的扩展信息,例如:总经理、研发总监、产品 经理、销售区域经理等。
[0074] 本系统使用的存储结构为trie树。trie树具有节省存储空间、查询速度快的特 点。trie树插入的内容包括名称以及对应的扩展信息,叶子节点绑定对应人名的id信息。
[0075] 其中,trie树结构设计包括多种实施方式:
[0076] 实施方式一:
[0077] 单词查找树为汉字查找树,汉字查找树的中间节点存储了人名的每一个字符(汉 字),叶子节点存储了符合该姓名的实体列表,汉字查找树在存储的准确人名的时候,还存 储了人名的昵称,为以后的识别和纠错提供数据支持。
[0078] 汉字查找树包括以下【具体实施方式】:
[0079] 如图4所示,Ci表示人名的一个字符,上图中最左边的人名是由C1、C2和C3顺序 连接组成的。
[0080] 图4中根节点的中间叶子节点表示人名的昵称,一般是去掉姓之后的字符串,如 果去掉姓之后仅剩一个汉字,则不存储,叶子节点存储的list(j)表示符合该人名的实体 列表。
[0081] 实施方式二:
[0082] 单词查找树为拼音查找树,拼音树的中间节点存储人名全拼(包括准确全拼和模 糊拼音)的每一个字母,和汉字树一样,叶子节点存储符合该全拼的的实体列表。模糊音的 扩展规则如表1所示,规则涵盖前后两个发音的互转。
[0083] 表 1
[0084]

【权利要求】
1. 一种名称的语音识别方法,其特征在于,包括: 获取所述名称的语音字符串; 根据所述语音字符串创建单词查找树; 判断所述单词查找树是否与预存的名称信息匹配;以及 在判定所述名称信息与所述预存的名称信息匹配时向用户提示所述名称的语音识别 结果。
2. 根据权利要求1所述的名称的语音识别方法,其特征在于,根据所述语音字符串创 建单词查找树,包括以下具体步骤: 在获取到所述语音字符串后,创建至少一个词元字符串; 选择最接近所述语音字符串的所述词元字符串作为最优词元字符串; 根据所述最优词元字符串的创建顺序将所述词元字符串通过分隔符划分为至少一个 单个字符串; 根据所述至少一个单个字符串和所述至少一个单个字符串的划分顺序创建所述单词 查找树。
3. 根据权利要求2所述的名称的语音识别方法,其特征在于,根据所述至少一个单个 字符串和所述至少一个单个字符串的划分顺序创建单词查找树,包括以下具体步骤: 根据所述每个单个字符串创建第一类单词查找树的节点,其中,先划分得到的所述单 个字符串为第一类母节点,后划分得到的所述单个字符串作为所述第一类母节点的第一类 子节点。
4. 根据权利要求3所述的名称的语音识别方法,其特征在于,判断所述单词查找树是 否与预存的名称信息匹配,包括以下具体步骤: 在所述第一类单词查找树不与所述预存的所述名称信息匹配时,根据所述语音字符串 创建第二类单词查找树; 判断所述第二类单词查找树是否与所述预存的名称信息匹配。
5. 根据权利要求4所述的名称的语音识别方法,其特征在于,根据所述语音字符串创 建第二类单词查找树,包括以下具体步骤: 在获取到所述语音字符串后,创建所述至少一个词元字符串; 创建每个所述词元字符串的至少一个混淆音字符串; 根据所述至少一个混淆音字符串的创建顺序将所述至少一个混淆音字符串通过分隔 符划分为至少一个单个混淆音字符串; 将通过所述分隔符划分的所述至少一个单个混淆音字符串中的相同单个混淆音字符 串放置于所述单词查找树的一个节点位置,其中,先划分得到的所述单个混淆音字符串为 第二类母节点,后划分得到的所述单个混淆音字符串作为所述第二类母节点的第二类子节 点。
6. -种名称的语音识别系统,其特征在于,包括: 获取单元,用于获取所述名称的语音字符串; 创建单元,用于根据所述语音字符串创建单词查找树; 判断单元,用于判断所述单词查找树是否与预存的名称信息匹配;以及 提示单元,用于在判定所述名称信息与所述预存的名称信息匹配时向用户提示所述名 称的语音识别结果。
7. 根据权利要求6所述的名称的语音识别系统,其特征在于,所述创建单元还用于,在 获取到所述语音字符串后,创建至少一个词元字符串; 所述名称的语音识别系统,还包括: 选择单元,用于选择最接近所述语音字符串的所述词元字符串作为最优词元字符串; 划分单元,用于根据所述最优词元字符串的创建顺序将所述词元字符串通过分隔符划 分为至少一个单个字符串; 所述创建单元还用于,根据所述至少一个单个字符串和所述至少一个单个字符串的划 分顺序创建所述单词查找树。
8. 根据权利要求7所述的名称的语音识别系统,其特征在于,所述创建单元还用于, 根据所述每个单个字符串创建第一类单词查找树的节点,其中,先划分得到的所述单个字 符串为第一类母节点,后划分得到的所述单个字符串作为所述第一类母节点的第一类子节 点。
9. 根据权利要求8所述的名称的语音识别系统,其特征在于,所述创建单元还用于,在 所述第一类单词查找树不与所述预存的所述名称信息匹配时,根据所述语音字符串创建第 二类单词查找树; 所述判断单元还用于,判断所述第二类单词查找树是否与所述预存的名称信息匹配。
10. 根据权利要求9所述的名称的语音识别系统,其特征在于,所述创建单元还用于, 在获取到所述语音字符串后,创建所述至少一个词元字符串; 所述创建单元还用于,创建每个所述词元字符串的至少一个混淆音字符串; 所述划分单元还用于,根据所述至少一个混淆音字符串的创建顺序将所述至少一个混 淆音字符串通过分隔符划分为至少一个单个混淆音字符串; 所述创建单元还用于,将通过所述分隔符划分的所述至少一个单个混淆音字符串中的 相同单个混淆音字符串放置于所述单词查找树的一个节点位置,其中,先划分得到的所述 单个混淆音字符串为第二类母节点,后划分得到的所述单个混淆音字符串作为所述第二类 母节点的第二类子节点。
11. 一种名称的语音识别设备,其特征在于,包括:如权利要求6至10中任一项所述的 名称的语音识别系统。
【文档编号】G10L15/28GK104485107SQ201410743432
【公开日】2015年4月1日 申请日期:2014年12月8日 优先权日:2014年12月8日
【发明者】薛会萍 申请人:畅捷通信息技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1