利用语音识别实现字元输入的手持式装置及方法

文档序号：2829370阅读：419来源：国知局

专利名称：利用语音识别实现字元输入的手持式装置及方法
技术领域：
本发明有关于手持式装置，尤指一种可依语音识别实现字元输入的手持式装置及方法。
背景技术：
现今世界已迈入一资讯蓬勃发展的科技时代，各种资讯产品发展不仅极为迅速，且替人类带来了无限的便利性，实与我们的生活息息相关而不可分离。随着当前各类资讯产品的不断推陈出新，人们对于资讯产品的功能、品质要求也越来越高，而各家业者为迎合消费者的需求，不断地在资讯产品中加入新的功能，尤其是，这些资讯产品中的移动电话，已成为大多数人日常生活中即为重要的通讯工具，该移动电话除可通话外，亦可利用简讯传输，进行沟通，由此可知，现今资讯产品市场，其销售竞争的激烈程度，实不可言喻，以移动电话在市场上，充斥着无数厂牌的情形来看，若是无法迎合消费者越来越高的需求，将会在销售市场上被洮汰，故，移动电话的制造业者，未来新开发的产品是否提供更方便、更有效的功能，俨然已成为评价制造业者的制造技术，是否领先业界的重要指标之一。尤其是，简讯传输、电话簿及电子字典等功能的加入，令该移动电话必须使用其上现有的按键进行文字输入。
然，随着新功能不断地被加入移动电话，也一并为移动电话带来新的问题。例如移动电话的制造业者，为迎合消费者携带方便的需求，不断地缩小移动电话的体积，使得该移动电话不能和电脑拥有相同大小且按键数量相同的键盘，以目前现有的移动电话而言，其上的按键基本上只有0～9的数字键、*及#符号键与二个功能键，而且这些按键通常匹配若干个英文字母、注音符号或其他符号，令移动电话的按键在文字输入方面相当不便。为说明现有的输入方法的缺点，以下兹举二种常见的输入法说明(1)多次敲击输入法此种输入法对于一个英文单字中的每一个字母，大都必须在同一个按键按压若干次后，才会在移动电话的显示器上出现正确的字母，例如输出英文单字”student”，该移动电话必须先进入英文输入的模式下，在数字键”7”的位置上按压4次，而在该显示器将会依序出现7、p、q、s，等候一定时间后，再于数字键”8”的位置上按压1次，再等候一定时间，再于数字键”8”的位置上按压2次，再等候一定时间，再于数字键”3”的位置上按压1次，再等候一定时间，再于数字键”3”的位置上按压2次，再等候一定时间，再于数字键”6”的位置上按压2次，再等候一定时间，再于数字键”8”的位置上按压1次，最后再按压功能键确定输入，故，完成输出英文单字”student”在各数字键上的按压次数共计13次。
(2)智慧型(T9)输入法此种输入法输入每个单字的字母，只需按压各按键一次即可在该显示器上显示。例如英文单字”student”，只要依序在数字键7、8、8、3、3、6及8上各按压一次，且在每次按压数字键时，可不须等候，即可完成输入，并在显示器上显示，故，完成输出英文单字”student”在各数字键上的按压次数共计7次，且每次按压按键都不须等待。
此外，随着语音识别技术逐渐成熟，也纷纷在各种电子设备中加入语音识别技术，但由于人类语言的差异度及复杂性高，在各电子设备中实难以完全正确地的输入，故，一般电子设备(如电脑)内设有一语音识别库，藉由比对所接收到的语音讯息与该语音识别库中所存在的识别资料，来提高语音识别率，但在各类移动电话受到速度、储存容量等各种各样的限制，其识别率将远低于一般电脑。
故，由上述的两种输入法及语音识别技术可知，各该输入法所需输入的次数及花费的时间仍太多，而语音识别技术在移动电话的应用上有许多先天上的限制，尤其是，在简讯传输时，通常所输入的文字不只一个，使用该二输入法或语音识别技术所花费的时间将更多，在现在讲求效率的时代中，该二输入法与语音识别技术是非常不符时代潮流的作法，故，若能有一种更快速的输入法出现，相信是消费者及业者所乐见的。

发明内容
有鉴于前述的诸多缺点发明人经过长久努力研究与实验，终于开发设计出本发明的一种利用语音识别实现字元输入的手持式装置及方法，以期藉由本发明的提出，能够对社会大众有所贡献。
本发明的一个目的在于提供一种利用语音识别实现字元输入的手持式装置，该装置设有一语音采集单元、一语音识别单元、一存储单元、一显示单元及一输入单元，其中该语音采集模组对该装置外部产生的语音进行采集并产生一采集语音数据，该语音识别单元系利用该存储单元内所设的一语音识别数据库对该采集语音数据进行识别，用以产生出具有至少一个字元的一识别结果，该识别结果可被传送到该显示单元上的一输入画面显示出来，且这些字元可根据该输入单元所产生的一输入讯号，而被选择输入到该显示单元的一操作画面上。
本发明的另一个目的在于一种利用语音识别实现字元输入的方法，该方法是一手持式装置利用其所设的一语音采集单元对该装置外部的一语音进行采集，并将该语音转换成一语音数据，然后，该手持式装置所设的一语音识别单元接收该语音数据，并利用该手持式装置所设的一语音识别数据库对该采集语音数据进行识别，用以产生出具有至少一个字元的一识别结果，然后，该识别结果被传送到该手持式装置所设的一显示单元的一输入画面显示出来，再根据该手持式装置所设的一输入单元所产生的一输入讯号选取到对应该输入讯号的一字元，并将该字元输入到该显示单元的一操作画面上。
为便于对本发明的目的、技术特征及其功效，做更进一步的认识与了解，兹举实施例配合附图，详细说明如下

图1是本发明的架构示意图；图2是本发明的输入画面与操作画面的示意图；图3是本发明的动作流程图；图4是本发明的识别结果被输入到操作画面的动作流程图；图5是本发明的识别结果显示在显示单元的动作流程图。
具体实施例方式
本发明提供一种利用语音识别实现字元输入的手持式装置及方法，请参阅图1所示，该装置设有一语音采集单元1、一语音识别单元2、一存储单元3、一显示单元4及一输入单元5，其中该语音采集单元1对该装置外部产生的语音进行采集并产生一采集语音数据，该语音识别单元2利用该存储单元3内所设的一语音识别数据库30对该采集语音数据进行识别，用以产生出具有至少一个字元的一识别结果302，该识别结果302可被传送到该显示单元4上的一输入画面40显示出来，且这些字元可根据该输入单元5所产生的一输入讯号，而被选择输入到该显示单元4的一操作画面42上。
在本发明中，该输入单元5可为一键盘、一鼠标或一触控萤屏等其中之一，该识别结果在该输入画面40显示时该输入单元5被触发可产生该输入讯号，该显示单元4可为一液晶显示器，该显示单元4可根据在该存储单元3所设的一应用程序32产生该输入画面40及该操作画面42，该语音识别数据库30设有多个样本语音数据300及识别结果302，各该样本语音数据300分别对应一个识别结果302，该语音识别单元2以该采集语音数据搜寻具有相同内容的一样本语音数据300，该语音识别单元2再根据该被搜寻到的样本语音数据300，将该被搜寻到的样本语音数据300所对应的一识别结果302的所有字元传送到该输入画面显40示出来，该语音采集单元1可为一麦克风(Microphone)，该存储体单元3可为一唯读存储体(ROM)或一快闪存储体(Flash)。
本发明提供一种利用语音识别实现字元输入的方法，请参阅图1和2所示，该方法是一手持式装置利用其所设的一语音采集单元1对该装置外部的一语音进行采集，并将该语音转换成一采集语音数据，然后，该手持式装置所设的一语音识别单元2接收该采集语音数据，该语音识别单元2并利用该手持式装置所设的一语音识别数据库3对该采集语音数据进行识别，用以产生出具有至少一个字元的一识别结果300，然后，该识别结果300被传送到该手持式装置所设的一显示单元4的一输入画面40显示出来，再根据该手持式装置所设的一输入单元5所产生的一输入讯号选取到对应该输入讯号的一字元，并将该字元输入到该显示单元4的一操作画面42上。
由于，该识别结果300内的字元可能只有一个，若该识别结果300内的字元仅有一个时，还要使用者来触发该输入单元5，实会造成使用上的不便，故，在本发明中，请参阅图3所示，当该识别结果300被传送到该输入画面40显示出来后，可依下列步骤进行处理，以令该识别结果的字元可以更便利的方式被输入到该操作画面42上(401)对该语音识别单元2所产生的一识别结果300进行判断是否仅具有一个字元，若是进行下列步骤，否则进行步骤(404)；(402)若该识别结果300仅具有一个字元，则自动产生选取该字元的一输入讯号；(403)再根据该自动产生的输入讯号，将该字元输入到该操作画面42上；(404)若对该识别结果300不仅具有一个字元，则将该识别结果300的所有字元传送到该输入画面40，并显示在该输入画面40；
(405)当根据该输入单元5所产生的一输入讯号选取到对应该输入讯号的一字元，并将该字元输入到该操作画面42上。
在本发明中，该语音识别数据库30设在该手持式装置所设的一存储单元3中，且该语音识别数据库30设有多个样本语音数据300及识别结果302，各该样本语音数据300分别对应一个识别结果302，使该手持式装置将可依下列步骤将任一识别结果300显示在该显示单元4上(501)首先，该语音识别单元2系搜寻以该语音识别数据库30中是否具有与该采集语音数据具有相同内容的一样本语音数据300，若是进行下列步骤，否则进行步骤(503)；(502)该语音识别单元2再根据该被搜寻到的样本语音数据300，将该被搜寻到的样本语音数据300所对应的一识别结果302的所有字元传送到该输入画面40显示出来；(503)该显示单元4输出无法辨识采集语音数据的一提示讯息。
为能更了解本案，以下举例说明本发明的一输入过程，该语音采集单元2接收到所收到的一采集语音数据为“kai(开)”，则该语音识别单元2在该语音识别数据库内搜寻到“kai”的样本语音数据300，且该“kai”之样本语音数据300所对应的识别结果302的所有字元为“1.开，2.揩，3.，4.，5.，6.K”，这些字元“1.开，2.揩，3.，4.，5.，6.K”被显示在该输入画面40上，而该输入单元5可为一键盘，使得该键盘对应的这些字元的一数字键(如数字键「1」)被按压后，该键盘会产生一输入讯号选取到对应该输入讯号的一字元“开”，并将该字元输入到该显示单元的一操作画面上。
藉由上述可知，该语音识别数据库30将相近似的发音的字元全部收集在同一识别结果302内，并将对应该识别结果302的所有字元显示在该输入画面40上，令使用者仅要选取相要输入的文字所对应的数字，即可完成输入，如此，该手持式装置将不需要高解析度的语音识别技术的大容量语音识别数据库，解决语音识别技术要设在在手持式装置的限制的问题，此外，亦使得该手持式装置在输入所需输入的次数及花费的时间将变的较少，实比其他传统的输入法更快速。
以上所述，仅为本发明最佳的一具体实施例，但本发明的构造特征并不局限于此，任何熟悉本技术领域者在本发明领域内，可轻易思及的变化或修饰，皆可涵盖在以下本案的专利范围。
权利要求
1.一种利用语音识别实现字元输入的手持式装置，包括一语音采集单元，该语音采集单元对该装置外部产生的语音进行采集，并产生一采集语音数据；一存储单元，设有一语音识别数据库一语音识别单元，分别连接到该语音采集单元及存储单元，该语音识别单元利用该语音识别数据库对该采集语音数据进行识别，用以产生出具有至少一个字元和一识别结果；一显示单元，与该语音识别单元连接，并可接收该识别结果，且可输出对应该识别结果的一输入画面；一输入单元，与该显示单元连接，并可产生一输入讯号，该装置可根据该输入讯号将被选择的一字元输入到该显示单元的一操作画面上。
2.如权利要求1所述的装置，其特征在于，该输入单元为一键盘、一鼠标或一触控屏幕其中之一。
3.如权利要求2所述的装置，其特征在于，该输入单元系与该显示单元在显示出该输入画面之状态下，才可被触发产生该输入讯号。
4.如权利要求3所述的装置，其特征在于，该显示单元为一液晶显示器。
5.如权利要求4所述的装置，其特征在于，该存储单元设有一应用程序，该显示单元根据该应用程序产生该输入画面及该操作画面。
6.如权利要求5所述的装置，其特征在于，该语音识别数据库包括多个识别结果；多个样本语音数据，各该样本语音数据分别对应一个识别结果；而该采集语音数据匹配相同内容的一样本语音数据的状态下，该语音识别单元可将该匹配的样本语音数据所对应的一识别结果的所有字元传送到该输入画面显示出来。
7.如权利要求6所述的装置，其特征在于，该语音采集单元为一麦克风。
8.如权利要求6所述的装置，其特征在于，该存储体单元可为一只读存储体。
9.如权利要求6所述的装置，其特征在于，该存储体单元可为一一快闪存储体。
10.一种利用语音识别实现字元输入的方法，是一手持式装置依下列步骤进行语音识别实现字元输入处理该手持式装置所设的一语音采集单元对该装置外部的一语音进行采集，并将该语音转换成一采集语音数据；然后，该手持式装置所设的一语音识别单元接收该采集语音数据；再由该语音识别单元根据该手持式装置所设的一语音识别数据库对该采集语音数据进行识别，用以产生出具有至少一个字元的一识别结果；然后，该识别结果被传送到该手持式装置所设的一显示单元的一输入画面显示出来；再根据该手持式装置所设的一输入单元所产生的一输入讯号选取到对应该输入讯号的一字元，并将该字元输入到该显示单元的一操作画面上。
11.如权利要求10所述的方法，其特征在于，当该识别结果被传送到该输入画面显示出来后，可依下列步骤进行处理，以令该识别结果的字元可以更便利的方式被输入到该操作画面上对该语音识别单元所产生的一识别结果进行判断是否仅具有一个字元；若该识别结果仅具有一个字元，则自动产生选取该字元的一输入讯号；再根据该自动产生的输入讯号，将该字元输入到该操作画面上。
12.如权利要求11所述的方法，其特征在于，当对该识别结果不仅具有一个字元，则将该识别结果的所有字元传送到该输入画面，并显示在该输入画面；当根据该手持式装置所设的一输入单元所产生的一输入讯号选取到对应该输入讯号的一字元，并将该字元输入到该显示单元的一操作画面上。
13.如权利要求12所述的方法，其特征在于，该语音识别数据库设在该手持式装置所设的一存储单元中，且该语音识别数据库设有多个样本语音数据及识别结果，各该样本语音数据分别对应一个识别结果，使该手持式装置将可依下列步骤将任一识别结果显示在该显示单元上该语音识别单元搜寻以该语音识别数据库中是否具有与该采集语音数据具有相同内容的一样本语音数据；若具有与该采集语音数据具有相同内容的一样本语音数据，该语音识别单元再根据该被搜寻到的样本语音数据，将该被搜寻到的样本语音数据所对应的一识别结果的所有字元传送到该输入画面显示出来。
14.如权利要求13所述的方法，其特征在于，若未具有与该采集语音数据具有相同内容的一样本语音数据，则该显示单元输出无法辨识采集语音数据的一提示讯息。
全文摘要
本发明是一种利用语音识别实现字元输入的手持式装置及方法，该方法系一手持式装置利用其所设的一语音采集单元对该装置外部的一语音进行采集，并将该语音转换成一语音数据，然后，该手持式装置所设的一语音识别单元接收该语音数据，并利用该手持式装置所设的一语音识别数据库对该采集语音数据进行识别，用以产生出具有至少一个字元的一识别结果，然后，该识别结果被传送到该手持式装置所设的一显示单元之一输入画面显示出来，再根据该手持式装置所设的一输入单元所产生的一输入讯号选取到对应该输入讯号的一字元，并将该字元输入到该显示单元的一操作画面上。
文档编号G10L15/00GK101030130SQ20061002428
公开日2007年9月5日申请日期2006年3月2日优先权日2006年3月2日
发明者赖振兴, 樊晓龙, 徐华鹏申请人:英华达(南京)科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赖振兴;樊晓龙;徐华鹏
技术所有人：英华达(南京)科技有限公司
我是此专利的发明人