语音识别装置及其控制方法

文档序号:9867721阅读:1088来源:国知局
语音识别装置及其控制方法
【专利说明】语音识别装置及其控制方法
[0001]相关申请的交叉引用
[0002]本申请要求于2014年11月21日在韩国知识产权局提交的韩国专利申请N0.10-2014-0163670的优先权,并在此引入其全部公开的内容。
技术领域
[0003]下文描述涉及语音识别装置及其控制方法,更具体地,涉及通过针对用户话语来生成令牌网络来校正用户话语的识别误差的语音识别装置,及控制该语音识别装置的方法。
【背景技术】
[0004]由于电子技术的发展以及各种的用户需求,已经开发了各种类型的电子装置。近几年,已经出现了用于通过用户语音来控制电子装置的技术。已经开发出了各种交互接口来通过用户话语控制电子装置,并且该各种交互接口已经用于各种电子装置。
[0005]—般而言,语音识别装置可以执行通过语音识别器来识别用户话语的处理。由于在语音识别器中产生的用户话语识别中的误差,该误差会传播到随后的使用该识别器的识别结果的处理过程,并因此可能向用户提供错误服务。
[0006]为了校正语音识别装置中的语音识别误差,已经提出了通过以下方式来校正语音识别误差的方法:应用用于网页浏览等的对拼写中的打字错误进行校正的技术,或使用一种噪声信道来构成语音识别结果和原始用户话语。
[0007]然而,因为语音识别装置中的语音识别误差是响应于用户实际上说出的词被错误地识别为与该词相似的另一个词而导致的,该被错误识别的词可能未被错误拼写。因此,用于网页浏览的对拼写错误的表达进行校正的技术可能未被正确地应用。构成噪声信道的方法不能校正关于在噪声信道的训练中未被使用的表达的错误。
[0008]因此,需要一种响应于即使在语音识别装置中产生语音识别误差也校正语音识别误差的技术。

【发明内容】

[0009]示例实施例克服了上述缺点和上文未描述的其它缺点。此外,并不需要示例实施例来克服上述缺点,并且示例实施例可以并不克服任何上述问题。
[0010]—个或多个示例实施例涉及能够对由于识别用户话语导致的话语识别误差进行校正的语音识别装置及其控制方法。
[0011]根据示例实施例的方案,控制语音识别装置的方法包括:通过识别用户话语来生成多个识别令牌;从多个预存的令牌中搜索与识别令牌中的每一个相似的相似令牌和具有与识别令牌一起使用的历史的外围令牌;使用识别令牌、相似令牌和外围令牌来生成令牌网络;以及,计算构成令牌网络的令牌之间的转移概率并且使用计算出的转移概率来生成针对已校正的用户话语的文本数据。
[0012]可以通过按令牌的预定的单位划分内容列表、语言资料库、话语日志来生成多个预存的令牌。搜索可以包括:响应于在多个预存的令牌中存在识别令牌,使用预存的令牌之间的预存的相似度来搜索相似令牌。
[0013]搜索可以包括:响应于在多个预存的令牌中不存在识别令牌,使用字符串搜索算法来搜索相似令牌。
[0014]搜索可以包括:响应于在多个预存的令牌中不存在识别令牌,搜索外围令牌。
[0015]生成多个识别令牌可以包括:通过识别用户话语来生成针对用户话语的文本数据;以及,通过按预定的单位划分所生成的针对用户话语的文本数据来生成多个识别令牌。生成令牌网络可以包括:通过将相似令牌和外围令牌布置为与多个识别令牌中的每一个相对应来生成令牌网络。
[0016]生成针对已校正的用户话语的文本数据可以包括:使用针对预存的内容列表、语言资料库和话语日志的语言模型来计算令牌之间的转移概率。
[0017]生成针对已校正的用户话语的文本数据可以包括:通过向语言模型指派预定的权重来计算令牌之间的转移概率;以及基于计算出的令牌之间的转移概率来搜索令牌网络上的最佳路径。
[0018]搜索最佳路径可以包括:使用Viterbi和A星算法中的至少一个来搜索最佳路径。
[0019]方法还可以包括:计算出现已校正的用户话语的概率;以及响应于出现已校正的用户话语的概率小于或等于预定值,输出再次讲话请求消息。
[0020]根据示例实施例的方案,语音识别装置包括:语音识别器,被配置为识别用户话语;存储单元,被配置为存储多个令牌;令牌网络生成器,被配置为根据识别出的用户话语来生成多个识别令牌,在存储在存储单元中的多个令牌中搜索与识别令牌中的每一个相似的相似令牌和具有与识别令牌一起使用的历史的外围令牌,以及使用识别令牌、类似令牌和外围令牌来生成令牌网络;以及处理器,被配置为响应于通过语音识别器识别用户话语来控制令牌网络生成器生成令牌网络,计算构成令牌网络的令牌之间的转移概率,以及使用计算出的转移概率来生成针对已校正的用户话语的文本数据。
[0021]存储单元可以存储通过按令牌的预定的单位划分内容列表、语言资料库、话语日志来生成的多个令牌以及令牌之间的相似度,并且令牌网络生成器可以响应于在多个令牌中存在识别令牌来使用令牌之间的相似度搜索相似令牌。
[0022]令牌网络生成器可以响应于在多个令牌中不存在识别令牌来使用字符串搜索算法搜索相似令牌。
[0023]令牌网络生成器可以响应于在多个令牌中不存在识别令牌来搜索外围令牌。
[0024]处理器可以响应于通过语音识别器识别用户话语来生成针对用户话语的文本数据,并且令牌网络生成器可以通过按预定的单位划分所生成的针对用户话语的文本数据来生成多个识别令牌,并且通过将相似令牌和外围令牌布置为与多个识别令牌中的每一个相对应来生成令牌网络。
[0025]存储单元还可以存储针对内容列表、语言资料库和话语日志的语言模型,并且处理器可以使用存储的语言模型来计算令牌之间的转移概率。
[0026]处理器可以通过向语言模型指派预定的权重来计算令牌之间的转移概率,并且通过基于计算出的令牌之间的转移概率搜索令牌网络上的最佳路径来生成针对已校正的用户话语的文本数据。
[0027]处理器可以使用Viterbi和A星算法中的至少一个来搜索最佳路径。
[0028]语音识别装置还可以包括被配置为显示图像的显示器和被配置为输出声音的音频输出单元中的至少一个。处理器可以计算出现已校正的用户话语的概率,并且响应于出现已校正的用户话语的概率小于或等于预定值,控制显示器和音频输出单元中的至少一个输出再次讲话请求消息。
[0029]根据各种示例实施例,可以准确并高效地校正由于在语音识别装置中识别用户话语而导致的各种类型的话语识别误差。
[0030]在【具体实施方式】部分中将阐述示例实施例的附加方案和优点,并且根据【具体实施方式】部分,示例实施例的附加方案和优点将变得明显,或者,通过示例实施例的实践可以认识到示例实施例的附加方案和优点。
【附图说明】
[0031]通过参照附图描述特定示例实施例,本公开的上述和/或其它方案将会更加清楚,在附图中:
[0032]图1是示出了根据示例实施例的语音识别装置的配置的框图;
[0033]图2是示出了根据示例实施例的语音识别装置的配置的框图;
[0034]图3是示出了根据示例实施例的语音识别装置的配置的详细框图;
[0035]图4是示出了根据示例实施例的识别令牌和相似令牌的图;
[0036]图5是示出了根据示例性实施例的识别令牌、相似令牌和外围令牌的图;
[0037]图6是示出了根据示例实施例的令牌网络的图;
[0038]图7是示出了根据示例实施例的在令牌网络上的最佳搜索结果的图;
[0039]图8是示出了根据示例实施例的语音识别装置的配置的框图;
[0040]图9是示出了根据示例实施例的语音识别装置的控制方法的流程图;
[0041]图10是示出了根据示例实施例的语音识别装置的控制方法的流程图;
[0042]图11是示出了根据示例实施例的识别令牌和相似令牌的图;
[0043]图12是示出了根据示例实施例的识别令牌、相似令牌和外围令牌的图;
[0044]图13是示出了根据示例性实施例的令牌网络的图;以及
[0045]图14是示出了根据示例性实施例的在令牌网络上的最佳搜索结果的图。
【具体实施方式】
[0046]下面将详细参考示例实施例,示例实施例的示例在附图中示出,其中全文中相同的附图标记指代相同的元件。下文通过参照附图描述实施例以解释本公开。
[0047]本文中参照属于示例实施例(以及中间结构)的示意性说明的典型实现来描述示例性实施例。因此,示例实施例不应当被解释为对本文中示出的区域的具体形状的限制。然而,这些发明构思按不同的形式来实现,并且本领域技术人员可以认识到,在不背离发明构思的原则和精神的前提下可以实现这些示例实施例的修改本发明构思的范围由权利要求及其等同体来限定。另外,由于不必要的细节会模糊本公开,因此不对熟知的功能或结构进行详细描述。
[0048]处理器通常可以被配置为负责对装置进行控制,并且可以与中央处理单元(CPU)、微处理器、控制器等等混合使用。处理器可以被配置为控制装置的全部操作,并且可以通过单片系统(SOC)或片上系统(SoC)来实现。
[0049]图1是示出了根据示例实施例的语音识别装置的配置的框图。参照图1,语音识别装置100可以包括语音识别器110、处理器120、令牌(token)网络生成器130和存储单元140。
[0050]语音识别器110可以识别用户话语。例如,响应于输入用户话语,语音识别器110可以识别用户话语并且向处理器120提供识别结果。处理器120可以生成针对用户话语的文本数据。在该示例中,语音识别器110可以包括语音识别传感器,该语音识别传感器包括麦克风等等。通过语音识别器110来识别用户话语的详细方法可以使用现有技术。因此,将省略语音识别的详细描述。
[0051]存储单元140可以存储信息,例如语音识别装置的操作需要的各种程序或数据。例如,存储单元140可以存储作为在语音
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1