语音识别装置及其控制方法_3

文档序号:9867721阅读:来源:国知局
施例描述了令牌网络生成器130和处理器120可以是分离的组件的示例,然而,配置并不限于此,并且令牌网络生成器130可以包括在处理器120中,并可以由一个组件来实现。
[0076]下文中,将会参照图3至图7详细描述语音识别装置100的配置和操作。将忽略与图1和图2中描述的部分重叠的部分的描述。
[0077]图3是示出了根据示例性实施例的响应于被包括在处理器中的令牌网络生成器的使用一个配置来实现的语音识别装置的详细框图,以及图4至图7是示出处理器的图,该处理器响应于用户说出了 “Jugunui taeyang chajajwo”但是被识别为“Jugeulrae taeyangchajajwo”,生成针对已校正的用户话语的文本。图11至图14是示出处理器的图,该处理器响应于用户说出了 “Remind me when breaking bad is on”但是被识别为“Remind bewhen back in bad is on”,生成针对已校正的用户话语的文本。
[0078]参照图3,语音识别装置300可以包括语音识别器310、处理器320以及存储单元
330。处理器320可以包括令牌划分模块321、相似令牌搜索模块322、外围令牌搜索模块323、网络生成模块324、令牌相似度计算模块325、转移概率计算模块326、以及最佳句子生成模块327 0
[0079]令牌相似度计算模块325可以计算存储在存储单元330中的多个令牌之间的相似度337。例如,根据令牌内容列表331、语言资料库332和话语日志333生成的多个令牌337可以存储在存储单元330中。令牌相似度计算模块325可以计算存储在存储单元330中的多个令牌之间的相似度,并且在存储单元330中将计算出的相似度存储为令牌之间的相似度338。
[0080]令牌划分模块321可以通过按预定的单位划分通过语音识别器310识别出的用户话语来生成多个识别令牌。预定的单位可以是音节单位、词单位、词素单位等等。
[0081]图4示出了生成了多个令牌并且搜索针对每个识别令牌的相似令牌的示例。在图4的示例中,用户说出“Jugunui taeyang chajajwo”,但是语音识别器310可能将用户话语识别成“Jugeulrae taeyang chajajwo”,并且令牌划分模块321可将通过由语音识别器301识别出的用户话语划分成5个令牌(例如“Jugeulrae”、“taeyang”、“chaj”、“a”、和“jwo”)来生成多个识别令牌。
[0082]类似地,图11示出了生成了多个令牌并且搜索针对每个识别令牌的相似令牌的示例。在图11的示例中,用户说出“Remind me when breaking bad is on”,但是语音识别器310可能将用户话语识别成“Remind be when back in bad is on”,并且令牌划分模块321可将通过由语音识别器310识别出的用户话语划分成8个令牌(例如“remind”、“be”、“when”、“back”、“in”、“bad”、“is”、和“on”)来生成多个识别令牌。
[0083]相似令牌搜索模块322可以在存储在存储单元330中的多个令牌337中搜索与识别令牌中的每一个相似的相似令牌。响应于在存储在存储单元330中的多个令牌337中存在识别令牌,相似令牌搜索模块322可以使用令牌之间的相似度338来搜索相似令牌。响应于在存储在存储单元330中的多个令牌337中不存在识别令牌,相似令牌搜索模块322可以使用字符串搜索算法来搜索相似令牌。
[0084]根据图4的示例可以看出,关于5个识别令牌(例如“Jugeulrae”、“taeyang”、“chaj”、“a”、和“jwo”)来搜索相似令牌。图4示出了,响应于5个令牌中的令牌“taeyang”、“chaj”、“a”、和“jwo”,在存储在存储单元330中的多个令牌337中可存在相同令牌,并且因此可以使用令牌之间的相似度338来搜索相似令牌。图4示出了,响应于“Jugeulrae”,在多个令牌337中可不存在相同令牌,并且因此可以使用字符串搜索算法来搜索相似令牌。
[0085]类似地,根据图11的示例可以看出,关于8个识别令牌(例如“remind”、“be”、“when”、“back”、“in”、“bad”、“is”、和“on”)来搜索相似令牌。图11示出了,响应于8个令牌中的令牌“remind”、“be”、“when”、“back”、“in”、“bad”、“is”、和 “on”,在存储在存储单元330中的多个令牌337中可存在相同令牌,并且因此可以使用令牌之间的相似度338来搜索相似令牌。在该示例实施例中,可以不通过字符串搜索算法来搜索相似令牌,该字符串搜索算法是响应于在多个令牌337中不存在相同令牌(如同在字典中不存在词)来使用的。
[0086]根据示例性实施例,可以通过限制相似令牌搜索模块322的搜索范围和最大搜索数量来缓解语音识别装置300的处理速度的降低。
[0087]例如,根据示例实施例,语音识别装置的用户或制造商可以限制相似令牌搜索模块322的相似令牌搜索范围。在该示例中,相似令牌搜索模块322可以在有限的范围内搜索相似令牌。例如,响应于搜索范围设置为2,关于一个识别令牌,相似令牌搜索模块322可以搜索与该一个识别令牌相似的一个或两个范围的令牌。在该示例中,相似令牌搜索模块322可以搜索与两个识别令牌相似的一个或两个范围的令牌。
[0088]图4示出了相似令牌搜索模块322的搜索范围设置为2。参照图4,可以看出,关于一个识别令牌,例如“Jugeulrae”,“jugeorae”可以被搜索为一个范围的相似令牌,并且“jukeum”和“ui”以及“jukgi”和“jeon”可以被搜索为两个范围的相似令牌。可以看出的是,关于两个识别令牌,例如“a”和“jwo”,“ajeossi”可以被搜索为一个范围的相似令牌。
[0089]图11也示出了相似令牌搜索模块322的搜索范围设置为2。参照图11,可以看出,关于两个识别令牌,例如“back”和“in”,“breaking”和“freaking”可以被搜索为一个范围的相似令牌。可以看出,关于两个识别令牌,例如“in”和“on”,“zone”可以被搜索为一个范围的相似令牌。
[0090]根据示例性实施例,语音识别装置的用户或制造商可以对在相似令牌搜索模块322中搜索的相似令牌的最大数量进行限制。例如,响应于最大数量设置为10,相似令牌搜索模块322可以关于一个识别令牌搜索最多到10个相似令牌。可以按相似度从高到低的顺序来执行相似令牌的搜索。
[0091]外围令牌搜索模块323可以搜索具有与识别令牌一起使用的历史的外围令牌。例如,处理器320可以通过按预定的单位划分存储在存储单元330中的内容列表331、语言资料库332和话语日志333来生成多个令牌337,并且因此处理器320可以在存储单元330中存储对在将多个令牌337从内容列表331、语言资料库332和话语日志333中划分出之前在每个令牌的外围存在哪些令牌进行指示的信息,来作为在令牌的外围使用的令牌历史339。因此,外围令牌搜索模块323可以使用在存储在存储单元330中的在令牌的外围使用的令牌历史来搜索外围令牌。
[0092]根据示例性实施例,响应于在存储在存储单元330中的多个令牌337中不存在识别令牌,外围令牌搜索模块323可以搜索外围令牌。例如,响应于在存储在存储单元330中的多个令牌337中不存在对应的识别令牌,外围令牌搜索模块323可以搜索正位于对应的识别令牌之前和之后的对应识别令牌的外围令牌。仅响应于在多个令牌337中不存在识别令牌来搜索外围令牌的原因是因为:响应于关于所有识别令牌搜索外围令牌需要很多时间。因此,通过只响应于在存储在存储单元330中的多个令牌337中不存在识别令牌来搜索外围令牌,可以提高语音识别装置300的处理速率。
[0093]图5示出了如图4所示的搜索相似令牌并且还搜索外围令牌的示例。可以看出,如图5的附图标记510所示,关于识别令牌511“jUgeUlrae”,搜索了相似令牌512,并且还搜索了外围令牌513。
[0094]例如,可以看出,因为在多个令牌337中不存在识别令牌“jugeulrae”,如图4中描述的,相似令牌搜索模块322可以使用字符串搜索算法搜索相似令牌512,并且外围令牌搜索模块323可以搜索如附图标记513所示的令牌来作为识别令牌“taeyang”的外围令牌,该识别令牌“taeyang”正位于识别令牌“jugeulrae”之后。
[0095]也就是说,因为“jugeulrae”是在多个令牌337中不存在的识别令牌,所以外围令牌搜索模块323可以搜索具有在“taeyang”(其位于“jugeulrae”的后面)之前使用的历史的外围令牌513,作为“jugeulrae”的备选。
[0096]图12示出了如图11所示的搜索相似令牌并且还搜索外围令牌的示例。可以看出,如图12的附图标记1210所示,关于识别令牌“back”和“in”,搜索了相似令牌1220并且还搜索了外围令牌1230。
[0097]例如,可以看出,因为在多个令牌中存在识别令牌“back”和“in”,所以,如图11中的描述,相似令牌搜索模块322可以搜索与识别令牌相似的相似令牌1220,并且外围令牌搜索模块323可以搜索如附图标记1230所示的令牌“kiss”、“of”和“three”来作为识别令牌“bad”的外围令牌,该识别令牌“bad”正位于识别令牌“back”和“in”之后。
[0098]可以在具体条件下搜索外围令牌。例如,可以考虑针对识别令牌“back”、“in”和“bad”的语言模型。也就是说,响应于将令牌“back”、“in”、“bad”等的实际使用的频率或概率考虑在内的语言模型的分数较低,可以搜索外围令牌。在示例实施例中,针对“bad”的语言模型的分数较低,并且因此可以搜索可能在“bad”的外围出现的
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1