利用语音输入以建构中文新词的方法及装置的制作方法

文档序号:6514962阅读:247来源:国知局
专利名称:利用语音输入以建构中文新词的方法及装置的制作方法
技术领域
本发明涉及一种语音辨识造词的方法,特别是涉及一种非特定语者(Speaker-Independent)语音输入以建构新词的方法及装置,解决语音辨识系统,特别是非特定语者中文语音辨识系统,面临词汇不足时,一个方便的增加新词汇的方式。
背景技术
语音辨识(speech recognition)毫无疑问的是一种热门的研究与商业课题。语音辨识通常是将输入的语音取出特征参数,再与资料库的样本相比对,找出与输入相异度低的样本取出。然而新词的出现,是语音辨识系统时常面临的问题。非特定语者中文语音辨识系统(Speaker-independentMandarin speech recognition)目前增加新词的方式,大致可分为以下二类1、键盘输入图1是键盘输入造词的方块示意图,包含键盘100、转换器102、词汇模组产生器104、音节到次音节模组辞典106、次音节模组108、语音辨识词汇模组110,将新词的中文字或其读音利用键盘键入系统,必先经过字转音的程序,再将对应的音节的次音节组(Sub-syllablemodels)串成词汇模组,之后交由语音辨识词汇模组建入资料库,缺点为需要键盘。
2、重新训练新词模型图2是重新训练新词模型的方块示意图,包含语音输入单元200、撷取单元202、训练词模组204与语音辨识词汇模组206。利用语音输入单元,搜集使用者该词汇的发音取出特征值,产生训练词的声学模型,最后将所得资料交由语音辨识词汇模组建入资料库,缺点是不易大量收集、且容易流于需要特定使用者语音(Speaker-dependent)才能辨识。
虽然,上面提出增加新词的技术,然而,目前为止,并没有一个使用语音方式增加新词的系统。当面临辞汇不足时,仍需靠键盘,或须经由收集语音特征的方式,来建立新词汇。
由此可见,上述现有的语音辨识系统显然仍存在有不便与缺陷,而亟待加以进一步改进。为了解决语音辨识系统存在的问题,相关厂商莫不费尽心思来谋求解决之道,但长久以来一直未见适用的设计被发展完成,而一般产品又没有适切的结构能够解决上述问题,此显然是相关业者急欲解决的问题。
有鉴于上述现有的语音辨识系统存在的缺陷,本发明人基于从事此类产品设计制造多年丰富的实务经验及专业知识,并配合学理的运用,积极加以研究创新,以期创设一种新型结构的利用语音输入以建构中文新词的方法及装置,能够改进一般现有的语音辨识系统,使其更具有实用性。经过不断的研究、设计,并经反复试作样品及改进后,终于创设出确具实用价值的本发明。

发明内容
本发明的目的在于,克服现有的语音辨识方法存在的缺陷,而提供一种新的利用语音输入以建构中文新词的方法及装置,所要解决的技术问题是使其可以解决语音辨识系统,特别是非特定语者中文语音辨识系统,面临词汇不足时,成为一个方便的增加新词汇的方式,从而更加适于实用。
本发明的另一目的在于,提供一种利用语音输入以建构中文新词的方法及装置,所要解决的技术问题是使其解决语音辨识系统,特别是非特定语者中文语音辨识系统,面临词汇不足时,成为一个方便的增加新词汇的方式,并提供一个人性化的使用界面而达到创造新词汇,从而更加适于实用。
本发明的目的及解决其技术问题是采用以下技术方案来实现的。依据本发明提出的一种利用语音输入以建构中文新词的方法,其包括以下步骤接收一语音讯号;撷取该语音讯号的一特征参数;根据一自然声学模型以判断与该特征参数相应的音节或字元;储存判断所得的音节或字元;以及进行上述步骤并组合所得到的所有音节或字元以建构新词。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。
前述的利用语音输入以建构中文新词的方法,其中所述的语音讯号是以透过已知词描述的方式输入。
前述的利用语音输入以建构中文新词的方法,其中所述的语音讯号是以注音描述方式输入。
前述的利用语音输入以建构中文新词的方法,其中所述的语音讯号是以拼音描述方式输入。
前述的利用语音输入以建构中文新词的方法,其中所述的储存该音节或字元的步骤包括接收一判断讯号;当该判断讯号表示该音节或字元为正确时,储存该音节或字元。
本发明的目的及解决其技术问题还采用以下的技术方案来实现。依据本发明提出的一种利用语音输入以建构中文新词的装置,适用于接收一语音讯号以决定要新增至资料库中的一新词,该利用语音输入以建构新词的装置包括一语音输入单元,接收外界输入的该语音讯号;一特征撷取单元,撷取该语音讯号的一特征参数;一描述限制单元,储存一声学模型、一词汇资料库与一语言模型;一语音辨识模组,接收该特征参数,利用该特征参数从该描述限制单元中取得相应的至少一描述语以及该描述语中与该新词相关的一相关音节或相关字元,并根据该相关音节或相关字元自该词汇资料库中取得相应的至少一音节或字元;一暂存单元,暂存该预测字汇做为该新词的其中一部份;一音节/字元确认单元,耦接至该语音辨识模组,判断与该新词相关的资料是否完全输入完毕;以及一组合单元,在与该新词相关的资料输入完毕后,组合该暂存单元中所储存的内容并输出组合结果为该新词。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。前述的利用语音输入以建构中文新词的装置,其中该音节/字元确认单元更包括提供一使用者界面以确认该音节或字元是否正确,并在确认该音节或字元正确时才储存至该暂存单元中。
本发明与现有技术相比具有明显的优点和有益效果。由以上技术方案可知,为了达到前述发明目的,本发明的主要技术内容如下本发明提出一种非特定语者中文语音输入以建构新词的方法及装置。中文的词是由一个个中文字(字元)所组成,使用者对麦克风逐一描述新词的每个字元或音节,此装置便将输入的语音讯号数位化,以及从数位化后的语音讯号中取得该特征参数,利用语音辨识模组将特征参数与声学模型、词汇资料库和语言模型作比对以判断相应的字元或音节,并将该字元与音节存入暂存单元,且经由使用者确认完成与否,若完成,则将暂存单元内储存的字元组与音节组交由组合单元组合为一新词汇。
依照本发明一个较佳实施例所述,上述的语音辨识模组更包括一确认模组以确认字汇的正确性。
本发明因采用语音输入创造新词的方式,因此使用界面人性化且使语音判读不会只能判读固定使用者。
综上所述,本发明特殊结构的利用语音输入以建构中文新词的方法及装置,其能够解决语音辨识系统,特别是非特定语者中文语音辨识系统,面临词汇不足时,提供一个方便的增加新词汇的方式,并提供一个人性化的使用界面而达到创造新词汇,从而更加适于实用。其具有上述诸多的优点及实用价值,并在同类产品及方法中未见有类似的结构设计及方法公开发表或使用而确属创新,其不论在产品或功能上皆有较大的改进,在技术上有较大的进步,并产生了好用及实用的效果,且较现有的语音输入系统具有增进的多项功效,从而更加适于实用,而具有产业的广泛利用价值,诚为一新颖、进步、实用的新设计。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并为了让本发明的上述和其他目的、特征和优点能更明显易懂,以下特举出多个较佳实施例,并配合附图,详细说明如下。


图1是现有习知键盘输入造词法方块示意图。
图2是现有习知重新训练新词模型的方块示意图。
图3是根据本发明利用语音输入以建构新词的装置方块图。
图4是根据本发明利用语音输入以建构新词的流程图。
100键盘 102转换器104词汇模组产生器106音节到次音节模组辞典108次音节模组110、206语音辨识词汇模组200语音输入单元 202撷取单元204训练词模组300描述语输入单元302特征参数撷取单元 304语音辨识模组306描述限制单元 308音节/字元确认单元310暂存单元 312组合单元400接收语音讯号 402撷取特征参数404进行语音辨识,产生数个候选字元或音节406使用者筛选正确结果408暂存区410新词输入完成否412组合新词模型具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的利用语音输入以建构中文新词的方法及装置其具体实施方式
、步骤、特征及其功效,详细说明如后。
请参阅图3所示,是根据本发明一较佳实施例,为本装置的方块图,用于语音输入造词系统包括一个描述语输入单元300用以输入语音并送至特征参数撷取单元302,特征参数撷取单元302用以撷取语音的特征参数并送至语音辨识模组304,语音辨识模组304的功能为将撷取单元302撷取的特征值与描述限制单元306内的资料作搜寻及比对的动作,其中描述限制单元306包含有声学模型、词汇资料库与语言模型。语音辨识模组304的输出,通常会有零至数个最可能的辨识结果,音节/字元确认单元308是需要和使用者互动,从中挑选出一个使用者认为对的答案,若都没有,则进入描述语输入单元300,请使用者(换个说法)再说一次。若有,将结果暂存至暂存单元310,但新词尚未输入完毕,则还是进入描述语输入单元300,进行下一个字元或音节的描述。当新词输入完毕,音节/字元确认单元308通知组合单元312进行词汇模型的组合。
依上述的实施例中,利用图4流程图说明,首先我们先接收语音讯号(步骤400),将接收的语音讯号转换成数位讯号后撷取出特征参数(步骤402),再进行语音辨识(步骤404),判定输入为何种描述语,根据描述语产生多数个候选字元或音节,经由使用者筛选正确结果(步骤406),使用者发觉无正确结果时,可回到图3描述语输入单元300装置,使用者可换个描述,再说一次,重新接收语音讯号(步骤400);或使用者可以决定放弃创造新词汇,则此流程结束;若使用者筛选完成,则将使用者筛选字元或音节放到暂存区(步骤408),下一步则要使用者确认新词输入完成否(步骤410),若未完成,则回到步骤400接收语音讯号重新该流程,若已完成,则把暂存区(步骤408)暂存资料组合新词模型(步骤412)。
上面实施方法步骤中,接收语音讯号(步骤400)里面,使用者可以是透过已知词的描述方式,例如“台湾的台”。或是利用注音的描述方式,例如“ㄊㄞ台二声台”。或是拼音的描述方式,例如“t-a-i-2”,进行描述。
又上面实施方法步骤中,进行语音辨识(步骤404),判定输入为何种描述语,根据描述语产生多数个候选字元或音节,实行流程为分析语音辨识结果,以找出对应字元或音节。若无法找到相对应字元或音节,可以回到本发明装置内描述语输入单元300再次重复该步骤。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的方法及技术内容作出些许的更动或修饰为等同变化的等效实施例,但是凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
权利要求
1.一种利用语音输入以建构中文新词的方法,其包括以下步骤接收一语音讯号;撷取该语音讯号的一特征参数;根据一自然声学模型以判断与该特征参数相应的音节或字元;储存判断所得的音节或字元;以及进行上述步骤并组合所得到的所有音节或字元以建构新词。
2.根据权利要求1所述的利用语音输入以建构中文新词的方法,其特征在于其中所述的语音讯号是以透过已知词描述的方式输入。
3.根据权利要求1所述的利用语音输入以建构中文新词的方法,其特征在于其中所述的语音讯号是以注音描述方式输入。
4.根据权利要求1所述的利用语音输入以建构中文新词的方法,其特征在于其中所述的语音讯号是以拼音描述方式输入。
5.根据权利要求1所述的利用语音输入以建构中文新词的方法,其特征在于其中所述的储存该音节或字元的步骤包括接收一判断讯号;当该判断讯号表示该音节或字元为正确时,储存该音节或字元。
6.一种利用语音输入以建构中文新词的装置,适用于接收一语音讯号以决定要新增至资料库中的一新词,其特征在于该利用语音输入以建构新词的装置包括一语音输入单元,接收外界输入的该语音讯号;一特征撷取单元,撷取该语音讯号的一特征参数;一描述限制单元,储存一声学模型、一词汇资料库与一语言模型;一语音辨识模组,接收该特征参数,利用该特征参数从该描述限制单元中取得相应的至少一描述语以及该描述语中与该新词相关的一相关音节或相关字元,并根据该相关音节或相关字元自该词汇资料库中取得相应的至少一音节或字元;一暂存单元,暂存该预测字汇做为该新词的其中一部份;一音节/字元确认单元,耦接至该语音辨识模组,判断与该新词相关的资料是否完全输入完毕;以及一组合单元,在与该新词相关的资料输入完毕后,组合该暂存单元中所储存的内容并输出组合结果为该新词。
7.根据权利要求6所述的利用语音输入以建构中文新词的装置,其特征在于其中该音节/字元确认单元更包括提供一使用者界面以确认该音节或字元是否正确,并在确认该音节或字元正确时才储存至该暂存单元中。
全文摘要
本发明是关于一种利用语音输入以建构中文新词的方法及装置,其目的是要解决语音辨识系统,特别是非特定语者中文语音辨识系统,面临词汇不足时,一个方便的增加新词汇的方式。中文的词是由一个个中文字所组成,因此,把构成词的字描述完成,就是描述词了。此方法是利用麦克风逐一输入描述中文字或其读音的语音讯号,从语音讯号中取得特征参数,利用声学模型、词汇资料库、语言模型与特征参数作比对以判断相应的字汇或音节,储存至暂存单元。使用者可确认完成与否,若完成,则将暂存单元内储存的字元组与音节组交由组合单元组合为一新词汇。
文档编号G06F17/28GK1815557SQ20051000734
公开日2006年8月9日 申请日期2005年2月4日 优先权日2005年2月4日
发明者黄良声, 蔡锦和, 王瑞璋, 沈家麟 申请人:台达电子工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1