协同识别语音命令的方法及其相关系统的制作方法

文档序号：2830811阅读：183来源：国知局

专利名称：协同识别语音命令的方法及其相关系统的制作方法
技术领域：
本发明是提供一种语音识别方法以及相关系统，尤指一种协同语音识别方法以及相关系统。
背景技术：
语音识别纟支术主要应用于通讯及计算才几方面。语音识别(或称语言识别) 技术是用来识别人类语言的声音并将其转换成数字信号使其可输入计算机以进行后续的处理。在实际应用上，语音命令系统可识别出数百个字汇以执行相对应的命令，如此即可免除若是使用键盘或鼠标所带来的繁复操作，常见的应用有离散听写系统。离散听写系统需要说话者于每个字之间停顿以便进行识别，虽然可通过连续识别来进行正常说话速度下的语音识别，但却需要相当可观的处理运算量。因此，如何发展出于任何说话速度下可识别大量字汇的系统已成为语音识别领域中的主要课题。语音识别技术已广泛应用在自动控制装置科技上，就电子计算器科学而言，「自动控制装置」一词是指软件自动控制装置，意即程序于不需使用者干预的情况下即可自行运作。一般而言，自动控制装置皆装设有人工智能以针对其有可能面对的状况进行相对应的操作。许多语音识别应用以及服务皆已被装设于电子装置之中，如移动电话、免持电子设备、语音声控拨号设备、车用语音导航等。然而在使用这些设备时，使用者大多都会面对到语音识别准确度低下的问题，在许多情况下，语音识别准确度可能会低于50%,即使在配合一些实质上可行的实验方法后，语音识别准确度可提升至80%左右，然而这些实验方法皆要经由大量复杂的计算过程后才能够达成语音识别准确度的提升，这通常限制了语音识别装置的应用。要同时达到自动控制装置设计简单化以及使其具有高语音识别准确度并不容易，且由于多数自动控制装置皆为独立运作的装置，因此为了提升语音识别准确度，自动控制装置通常需要具备有更多的计算资源以执行复杂的识别演算流程，然由上迷可知，此方法并不实用。发明内容本发明是提供一种协同识别语音命令的方法，其包含有产生语音命令，该语音命令用以指定目标机台执行指定操作；多个机台接收该语音命令，该多个机台包含该目标机台以及至少一从属机台；每一个机台针对该语音命令进行识别流程以分别产生相对应的识别结果；该从属机台发送该从属机台的该识别结果至该目标才几台；以及该目标^ia台评估该目标才几台的该识别结果以及由该从属机台所传来的该识别结果，以决定相对应该语音命令的最终识别结果。本发明还提供一种协同语音识别系统，其包含有从属机台，其包含有第一接收模块用来接收语音命令，该语音命令用以指定目标机台执行指定操作、第一语音识别模块用来产生相对应该语音命令的第一识别结果，以及第一传送模块用来发送该第一识別结果；以及目标机台，其包含有第二接收模块用来接收该语音命令以及该第一识别结果、第二语音识别模块用来产生相对应该语音命令的第二识別结果，以及评估模块用来评估该第一识别结果以及该第二识别结果，藉以决定相对应该语音命令的最终识别结果。本发明的优点在于通过该目标机台与该从属;^几台的协同识别可增加能用来进行语音命令识别的计算资源。该从属机台可直接位于该目标机台的附近, 或是可经由网络而与该目标机台进行远程通讯。

图l为本发明协同语音识别系统的区块图。图2为本发明从属机台的功能方块图。图3为图1目标机台的功能方块图。图4为本发明第一实施例协同语音识别系统的操作顺序图。图5为本发明第二实施例协同语音识别系统的操作顺序图。[主要元件标号说明]10 协同语音识别系统 20 使用者30 目标机台 32 第二接收4莫块34 第二语音识別模块 36 第二传送模块37 评估模块40 网络5 OA 第一从属机台52 第一接收模块56 第一传送模块38 反馈模块50 /人属才几台5 0B 第二从属机台54 第一语音识别^^莫块具体实施方式
请参阅图l,图1为本发明一协同语音识别系统10的方块图。协同语音识别系统10包含有网络40，用来于目标机台30、第一从属机台50A，以及第二从属机台50B之间进行信号的传输。网络40可为无线网络、有线网络，或者是结合两者的任一形式的网络。当使用者20针对目标机台30发出相对应指定搡作的语音命令时，目标机台30可与第一从属机台50A以及第二从属机台50B—起进行针对该语音命令的识别。若第一从属机台50A以及第二从属机台50B的位置在使用者20附近，则第一从属机台50A以及第二从属机台 50B可直接由使用者20接收该语音命令。反之，第一从属机台50A以及第二从属机台50B则是可经由目标机台30通过网络40接收到该语音命令。目标机台30、第一从属机台50A,以及第二从属机台50B可为自动控制装置或是任何其它可用来执行语音命令识别的机台。请参阅图2,图2为本发明从属机台50的功能方块图。从属机台50包含有第一接收模块52、第一语音识别模块54、以及传送模块56。第一接收模块52用来接收该语音命令，第一语音识别模块54用来产生相对应该语音命令的识别结果，而传送模块56则是用来发送该识别结果至目标机台30。此外，上述的第一从属机台50A以及第二从属机台50B皆可视为从属机台50, 意即第一从属机台50A以及第二从属机台50B具有与从属机台50相同的模块 (即第一接收模块52、第一语音识别模块54、以及传送模块56),但却不须是完全相同的装置。请参阅图3,图3为图1目标机台30的功能方块图。目标机台30具有与从属机台50相同的功能，且额外包含有用来评估目标机台30与第一从属机台50A以及第二从属机台50B所产生的识别结果的功能。目标机台30包含有第二接收模块32、第二语音识别模块34、第二传送模块36、评估模块37、以及反馈模块38。第二接收模块32用来由使用者20接收该语音命令以及于第一从属机台50A以及第二从属机台50B分别产生相对应的识别结果后，由第一从属机台50A以及第二从属机台50B接收相对应的识别结果。第二语音识别模块34用来产生目标机台30相对应该语音命令的识别结果。评估模块 37用来评估第一从属机台50A以及第二从属机台50B分别产生相对应的识别结果以及由第二语音识别模块34所产生的识別结果以决定最终识别结果。反馈模块38用来从使用者20接收反馈信息以判断目标机台30依据该最终识别结果所执行的操作是否符合该指定操作，并且用来微调评估模块37所使用的参数，藉以调整该最终识别结果，如此一来，协同语音命令识别系统IO可依据使用者20的反馈信息以持续针对该最终识别结果进行调整，以收提升语音识别准确度之效。上述的反馈调整流程为可省略的步骤，意即反馈模块38为可省略的系统元件。请参阅图4,图4为本发明第一实施例协同语音识别系统10的操作顺序图。于第一实施例中，由图4可知，目标机台30、第一从属机台50A、以及第二从属机台50B的位置皆位于使用者20附近，也就是说，每一个机台都可直接由使用者20接收到语音命令。当使用者20直接针对目标机台30发出语音命令时(箭头100)，第一从属机台50A(箭头102)以及第二从属机台50B(箭头102)亦可同时接收到该语音命令。接着，第一从属机台50A以及第二从属机台50B即分别产生相对应的识别结果(箭头112及箭头114),并且通过网络40分别传送相对应的识别结果至目标机台30(箭头122及箭头124),于此同时，目标机台30亦依据该语音命令产生相对应的识别结果，最后，目标机台30依据所接收到的所有识别结果而决定最终识别结果(箭头130)。值得一提的是，该语音命令的内容应包含目标机台30的指定以及目标机台30所需执行的指定操作，举例来说，此步骤可通过使用者20指定目标机台30的名称并接着陈述该指定操作的内容来完成，目标机台30的指定亦可依据协同语音识别系统10内部的默认值来完成，此外，目标机台30也可预先发出信号至第一从属机台50A与第二从属机台50B以告知其为执行该指定操作的机台。最后应注意的是，关于识别结果的传送，除上述实施例所述的方法外，第一从属机台50A与第二从属机台50B亦可以广播信号通讯方式分别传送相对应的识别结果至目标机台30。也就是说，在第一实施例中，有可能发生第一从属机台50A与第二从属机台50B没有接收到该语音命令的完整内容的情况，举例来说，若第一从属机台50A与第二从属机台50B没有获得目标机台30的名称的相关信息且协同语音识别系统10内部并无设定默认值，则第一从属机台50A与第二从属机台 50B可于上述的网络40上分别广播传送相对应的识别结果，接着目标机台30 再于网络40上通过广播信号的侦测以接收到第一从属机台5 OA与第二从属机台50B的识别结果；然而若是第一从属机台50A与第二从属机台50B无接收到该指定操作的相关信息，则第一从属机台50A与第二从属机台50B即停止识别并处于待机状态，在此情况下，目标机台30仅会依据自身的识别结果来执行相对应的操作。接下来，针对识别结果的评估进行更为详细的说明。当评估模块37针对目标机台30、第一从属机台50A,以及第二从属机台50B所分别产生的识别结果进行评估时，有许多评估方法可用来决定最终识别结果，举例来说，假设该语音命令是由三个不同单字所组成的一词组，评估模块37就会在所有识别结果中分别针对该词组的三个单字位置选出出现频率最高的单字以组成对应该词组的最终识别结果，除上述方法之外，评估模块37可使用其它已知技术中所揭露的评估方法来进行最终识别结果的评估，于此不再详述。请参阅图5,图5为本发明第二实施例协同语音识别系统10的操作顺序图。于第二实施例中，如图5所示，仅目标机台30须位于使用者20附近，也就是说，第一从属机台5OA,以及第二从属机台5OB可设置在任何地方。当使用者20直接向目标机台30发出语音命令时(箭头200),目标机台30会通过网络40 (箭头210)传送该语音命令至第一从属机台50A(箭头222)与第二从属机台50B(箭头224),而第一从属机台50A以及第二从属机台50B在接收到该语音命令后，第一从属机台50A以及第二从属机台50B即会分别产生相对应的识别结果(箭头232及箭头234),并且分别传送相对应的识别结果至网络40(箭头242及箭头244)，接着再回传至目标机台30(箭头250),于此同时，目标机台30亦依据该语音命令产生相对应的识别结果，最后，目标机台30依据所接收到的所有识别结果而决定最终识别结果(箭头260)。由上述第二实施例所述的方法可知，与目标机台30协同进行语音识别的从属机台可位于任何地方，只要该从属机台有连上网络40即可，如此一来，目标机台30利用世界各处有连接上网络40的从属机台来获得大量的计算资源，进而产生高准确度的语音识别结果。综上所述，本发明是提供使用多个机台协同进行语音识别以提升语音识别准确度的方法，也就是说，目标机台可通过具有高计算资源的从属机台的协助来提升语音识别准确度。此外，用来协助进行语音识别的从属机台可位于任何地方，只要它们可通过网络而连接上目标机台即可。以上所述仅为本发明的较佳实施例，凡依本发明权利要求范围所做的均等变化与修饰，皆应属本发明的涵盖范围。
权利要求
1.一种协同识别语音命令的方法，其包含有产生语音命令，该语音命令用以指定目标机台执行指定操作；多个机台接收该语音命令，该多个机台包含该目标机台以及至少一从属机台；每一个机台针对该语音命令进行识别流程以分别产生相对应的识别结果；该从属机台发送该从属机台的该识别结果至该目标机台；以及该目标机台评估该目标机台的该识别结果以及由该从属机台所传来的该识别结果，以决定相对应该语音命令的最终识别结果。
2. 根据权利要求1所迷的方法，其还包含该目标机台根据该最终识别结果执行操作；该目标机台接收反馈信息，藉以判断该目标机台已执行的该操作是否符合该指定操作；以及该目标机台根据该反馈信息微调该目标机台的评估算法，藉以调整该最终识别结果。
3. 根据权利要求1所述的方法，其中该多个机台接收该语音命令包含该目标机台直接由使用者接收该语音命令。
4. 根据权利要求3所述的方法，其还包含该目标机台通过数据网络传送该语音命令至该A/v属^L台；以及该从属机台通过该数据网络发送该从属机台的该识别结果至该目标机
5. 根据权利要求1所迷的方法，其中该多个机台接收该语音命令包含该从属机台直接由该使用者接收该语音命令。
6. 根据权利要求5所述的方法，其中该从属机台发送该从属机台的该识别结果至该目标机台包含该从属机台通过数据网络发送该从属机台的该识别结果至该目标机台。
7. 根据权利要求5所述的方法，其中该从属机台发送该从属机台的该识别结果至该目标机台包含该从属机台以广播信号通讯方式发送该从属机台的该识别结果至该目标机台。
8. —种协同语音识别系统，其包含有从属机台，其包含有第一接收模块，用来接收语音命令，该语音命令用以指定目标机台执行指定操作；第一语音识别模块，用来产生相对应该语音命令的第一识别结果；以及第一传送模块，用来发送该第一识别结果；以及目标机台，其包含有第二接收模块，用来接收该语音命令以及该第一识别结果；第二语音识别模块，用来产生相对应该语音命令的第二识别结果；以及评估模块，用来评估该第一识别结果以及该第二识别结果，藉以决定相对应该语音命令的最终识别结果。
9. 根据权利要求8所述的协同语音识别系统，其中该目标机台还包含反馈模块，用来接收反馈信息以判断该目标机台依据该最终识别结果所执行的操作是否符合该指定操作，并且用来微调该评估模块所使用的参数，藉以调整该最终识别结果。
10. 根据权利要求8所述的协同语音识别系统，其中该目标机台还包含第二传送模块，该目标机台通过该第二接收模块直接由使用者接收该语音命令并通过该第二传送模块直接传送该语音命令至该从属机台的该第一接收模块。
11. 根据权利要求IO所述的协同语音识别系统，其中该第二传送模块通过数据网络传送该语音命令至该从属机台的该第一接收对莫块。
12. 根据权利要求IO所述的协同语音识别系统，其中该从属机台通过该第一接收模块直接从该使用者接收该语音命令。
13. 根据权利要求12所述的协同语音识别系统，其中该从属机台通过数据网络由该第一传送模块发送该第一识别结果至该第二接收模块。
14. 根据权利要求12所述的协同语音识別系统，其中该从属机台以广播信号通讯方式通过该第一传送模块发送该第一识别结果至该第二接收模块。
全文摘要
一种协同识别语音命令的方法及其相关系统，其包含有产生语音命令藉以指定目标机台执行指定操作、多个机台接收该语音命令，该多个机台包含该目标机台以及至少一从属机台、每一个机台针对该语音命令进行识别流程以分别产生相对应的识别结果、该从属机台发送该从属机台的该识别结果至该目标机台，以及该目标机台评估该目标机台的该识别结果以及由该从属机台所传来的该识别结果，以决定相对应该语音命令的最终识别结果。
文档编号G10L15/00GK101266791SQ200810083778
公开日2008年9月17日申请日期2008年3月12日优先权日2007年3月12日
发明者胡志麟申请人:佳世达科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡志麟
技术所有人：佳世达科技股份有限公司
我是此专利的发明人

上一篇：木管乐器及其音管的制造方法
上一篇：小鼓张紧系统以及具有该张紧系统的小鼓的制作方法