用于通过语音识别输入字符的移动通信终端及方法

文档序号:7592083阅读:94来源:国知局
专利名称:用于通过语音识别输入字符的移动通信终端及方法
技术领域
本发明涉及移动通信终,以及更具体地说,涉及用于使用语音识别功能输入字符的移动通信终端和方法。
背景技术
通常,移动通信终端具有用于输入数字和English、Korean或其他字符的多个键。用户能通过按压多个键将字符输入到移动终端中,由此处理各种功能,诸如短消息业务(SMS)、备忘录、无线Internet访问和呼叫开始。例如,用户能通过使用多个键,输入消息以及发送和接收者的电话号码,在移动通信终端中使用SMS。用户能使用键输入备忘录消息。同时,用户能通过按压键,使用无线Internet业务来访问Web站点。
然而,对用户来说,使用多个键直接输入字符以便使用各种业务,诸如SMS、备忘录和无线Internet访问很麻烦且不方便。

发明内容
因此,做出了本发明以便解决在现有技术中出现的上述问题,以及本发明的一个目的是提供用于通过语音识别,容易输入字符的移动通信终端和方法,其消除了直接按压多个键的需要。在此所使用的术语“字符”被定义成包括数字和字母。
本发明的另一目的是提供用于识别语音和输入和发送对应于所识别的语音的消息的移动通信终端和方法。
本发明的另一目的是提供用于识别语音和输入对应于所识别的语音的接收方的电话号码的移动通信终端和方法。
本发明的另一目的是提供当使用无线Internet业务时,识别语音和输入对应于所识别的语音的Web站点地址,或当使用电话银行业务时,输入对应于所识别的语音的银行帐号的移动通信终端和方法。
为实现上述目的,提供一种能语音识别的移动通信终端,包括语音处理单元,用于调制语音信号以及将语音信号转换成语音数据;语音识别单元,用于基于语音数据识别语音,以及输出相应的语音信息;语音信息管理数据库,包括用于存储对应于语音信息的字符信息的表;控制单元,用于在字符输入模式中,根据通过语音识别输入字符的需求,在输入语音信号后,通过语音识别单元识别语音,检测对应于通过语音信息管理数据库所识别的语音信息的字符信息,以及如果检测到的话,识别出已经对应的字符信息;以及显示单元,用于在控制单元的控制下,显示输入字符信息的状态。
根据本发明的另一方面,提供一种用于在能语音识别的移动通信终端中输入字符的方法,所述方法包括步骤在字符输入模式中,确定是否输入通过语音识别输入字符的需求;当有通过语音识别输入字符的需求时,确定是否从外部输入语音信号;当从外部输入语音信号时,识别所输入的语音以及在存储对应于每个语音信息的字符信息的表中,检测对应于所识别的语音信息的字符信息;以及当检测到对应的字符信息时,识别出已经输入字符信息以及在显示单元上显示输入字符信息的状态。


从下述结合附图的详细描述,本发明的上述和其他目的、特征和优点将更显而易见,其中图1是根据本发明的移动通信终端的框图;图2表示根据本发明的第一实施例,存储对应于语音信息的字符信息的表;图3是根据本发明的第一实施例,通过语音识别输入字符的过程的流程图;图4表示根据本发明的第二实施例,存储对应于语音信号的几个条目的表;图5是根据本发明的第二实施例,通过语音识别输入消息的过程的流程图;图6表示根据本发明的第二实施例,当通过语音识别输入消息时,在显示单元上显示的画面的例子。
具体实施例方式
在下文中,将参考附图,描述本发明的优选实施例。在这些图中,将用相同的数字或字符表示相同的元件,尽管在不同图中描述。尽管在本发明的下述描述中,专门定义了某些元件,诸如电路设备,对本领域的技术人员来说这些元件的定义仅是增进本发明的理解以及在没有这些专用元件的情况下,也能实施本发明是显而易见的。同时,在本发明的下述描述中,将省略已知功能和结构的详细描述,以避免使本发明的主题变得不清楚。
图1是根据本发明的移动通信终端的框图。移动通信终端包括控制单元100、显示单元110、键输入单元120、存储器130、RF单元140、语音处理单元150、语音识别单元160、扬声器170、麦克风180、语音/字符数据转换单元190和语音信息管理数据库(DB)135。
控制单元100控制移动通信终端的整体操作。特别地,控制单元100控制移动通信终端的操作以便根据本发明,通过语音识别实现字符输入功能。具体地说,当在字符输入模式中需要字符输入时,控制单元100识别由用户输入的语音信号。随后,控制单元100识别出已经输入对应于所识别的语音的消息或字符信息,以及显示所输入的消息或字符信息。
存储器130可以包括用于存储操作程序的ROM以及电可擦可编程EEPROM和RAM。根据本发明,存储器130存储用于通过语音识别,实现字符输入功能的程序。同时,存储器130存储用于将语音数据转换成字符数据的转换表。
显示单元110可以包括显示设备,诸如液晶显示器(LCD)。在控制单元100的控制下,显示单元110显示移动通信终端的状态、程序运行状态、由语音识别等等输入的字符信息或消息。
键输入单元120具有多个字符键、用于实现各种功能的功能键以及语音识别键。当按压语音识别键时,将对应于通过语音识别输入字符的需求的键输入数据输出到控制单元100。
在控制单元100的控制下,RF单元140将各种数据通过天线发送到基站。同时,RF单元140将从基站接收的数据传送到控制单元100。
在控制单元100的控制下,语音处理单元150将通过RF单元接收的语音数据转换成可听声音以及通过扬声器170输出它。语音处理单元150还调制从麦克风180接收的语音信号,将信号转换成语音数据以及输出该数据。
在控制单元100的控制下,语音/字符数据转换单元190基于存储在存储器130中的转换表,将从语音处理单元150输出的语音数据转换成字符数据,以及输出该字符数据。
语音识别单元160检测从语音处理单元150输出的语音数据的语音特性以便识别该语音。同时,语音识别单元160将对应于所识别的语音的语音信息传送到控制单元100。
根据本发明的第一实施例,语音信息管理DB135包括存储对应于语音信息或数据的字符信息的表。根据本发明的第二实施例,语音信息管理DB包括存储对应于语音信息的几个条目的表。
在根据第一实施例的移动通信终端中,可以通过语音,依赖存储对应于每个语音信息的字符信息的表,在字符输入模式中输入字符。字符输入模式是用于输入字符,诸如文本消息、Web站点地址或银行帐号的模式,以便使用业务,诸如短消息业务(SMS)、多媒体消息传递业务(MMS)、无线Internet访问或电话银行业务。
图2表示根据本发明的第一实施例,存储对应于语音信息的字符信息的表。图2(a)表示存储对应于语音信息的Web站点地址的表。图2(b)表示存储对应于语音信息的银行帐号的表。图2(c)表示存储对应于语音信息的电话号码的表。
图3是根据本发明的第一实施例,通过语音识别,在移动通信终端中输入字符的过程的流程图。在下文中,将参考图1至3,更详细地解释根据本发明的第一实施例,输入字符的过程。
在步骤300,控制单元100确定是否需要输入对应于文本消息、Web站点地址、帐号等等的字符以便使用SMS、MMS、无线Internet业务或电话银行业务。用户能通过按压语音识别键来输入用于字符输入的需求。
如果确定不需要字符输入,控制单元100将进入步骤302以便执行所需功能。如果需要字符输入,控制单元100将进入步骤304。
在步骤304,控制单元100确定是否输入语音信号。当通过麦克风180将语音信号输入到语音处理单元150时,控制单元100进入步骤306。在步骤306,控制单元100控制语音处理单元150来调制和将所输入的语音信号转换成语音数据以及输出该语音数据。然后,控制单元100控制语音识别单元160来检测从语音处理单元150输出的语音数据的语音特性以及识别语音信息。
在步骤308,控制单元100检测对应于所识别的语音信息的字符信息。例如,控制单元100能搜索存储在如图2所示的语音信息管理DB135中的表中的字符信息。在检测存储对应于语音信息管理DB135中的所识别的语音信息的字符信息的表后,控制单元100进入步骤310,以便确定对应于所识别的语音的字符信息是否包括在该表中。
当存在对应于所识别的语音信息的字符信息时,控制单元100识别出已经输入该字符信息(步骤312)。例如,如果语音信息是“SamsungElectronics”,如图2(a)所示,控制单元100将识别出已经输入对应于词“Samsung Electronics”的web站点地址www.samsung.co.kr。如果语音信息是“Hana Bank”,如图2(b)所示,控制单元100将识别出已经输入对应于词“Hana Bank”的帐号“654321-87-012345”。如果语音信息是“my home”,如图2(c)所示,控制单元100将识别出已经输入我家的电话号码“02-123-4567”。
在识别出已经输入对应于所识别的语音信息的字符信息后,控制单元100进入步骤314以便在显示单元110上显示输入该字符信息的状态。
如果未检测到对应于所识别的语音信息的字符信息,控制单元100将进入步骤316以及将告知用户不存在相应的字符信息。此时,控制单元100将提供警告以便告知缺少该字符信息或引导用户通过按压键直接输入该字符信息。
根据第二实施例,当由用户输入通过语音识别输入的字符需求以便转发SMS或MMS消息时,移动通信终端显示对应于所输入的语音的条目。随后,当用户输入对应于将选择的条目的语音或键时,移动通信终端识别出已经将由语音或键输入选择的条目输入为消息。
图4表示根据本发明的第二实施例,存储相应于语音信息的条目的表。根据第二实施例,语音信息管理DB135包括用于存储对应于“Hong Gil Dong”的语音信息的条目,诸如电子邮件地址和主页地址的表,如图4所示。
图5是根据本发明的第二实施例,通过语音识别输入字符的过程的流程图。图6表示根据本发明的第二实施例,当通过语音识别输入消息时,在显示单元110上显示的画面的例子。
将参考图1和4至6,更详细地描述根据本发明的第二实施例,通过语音识别输入消息的过程。
参考图5,在步骤600,控制单元100确定在消息准备模式中,在准备SMS或MMS消息期间,用户是否通过语音识别输入用于字符输入的需要。当在消息准备模式中,输入用于SMS或MMS消息的字符时,用户能按压语音识别键作为通过语音识别输入字符的需求。
如果不需要用户输入字符,控制单元100将进入步骤630以便执行所需功能。如果根据字符输入需求,用户输入语音识别键,控制单元100将进入步骤602,在步骤602,控制单元100确定是否输入语音信号。当通过麦克风180,将语音信号输入到语音处理单元150时,控制单元100进入步骤604。在步骤604,控制单元100控制语音处理单元150以便调制所输入的语音信号以及将其转换成语音数据。当语音处理单元150输入该语音数据时,控制单元100控制语音识别单元160以便检测从语音处理单元150输出的语音数据的语音特性以及识别相应的语音信息。
在识别该语音信息后,控制单元100在步骤606搜索对应于所识别的语音信息的条目。例如,控制单元100搜索存储对应于所识别的语音信息的条目的表,如图4所示。随后,在步骤608,控制单元100确定是否检测对应于所识别的语音的条目。
当检测到对应于所识别的语音信息的条目,控制单元100在步骤610显示条目。如图6(a)所示,控制单元可以在显示单元110上以弹出菜单窗50的形式显示条目。例如,如果所识别的语音信息是“HongGil Dong”,将以弹出菜单窗50的形式,显示对应于语音信息,诸如Hong Gil Dong的电话号码、电子邮件地址和主页地址的条目,如图6(a)所示。
在显示对应于所识别的语音信息的条目后,当有用于选择条目的键或语音输入时,控制单元100在步骤612选择所显示的条目的一个,以及进入步骤614。例如,如果输入键或语音以便从以弹出菜单窗50显示的条目中选择条目“电话”。控制单元100将选择用于Hong GilDong的电话号码以及将进入步骤614。
在步骤614,控制单元100识别出已经输入用于所选择的条目的详细信息,以及在显示单元110上显示包括所选择的信息的文本消息。例如,如果选择条目“电话”,控制单元100将识别出已经输入电话号码02-123-4567以及将在显示单元110上显示包括电话号码02-123-4567的消息,如图6(b)所示。
如果在步骤608未检测到对应于所识别的语音信息的条目时,控制单元100将在步骤620告知缺少相应的条目以及将进入步骤622以便请求输入将输入为消息的语音信号。在步骤622,控制单元100可以在显示单元110上显示请求输入语音信号的消息。
随后,在步骤624,控制单元100确定是否有语音信号输入。如果已经输入语音信号,控制单元100将进入步骤626。在步骤626,控制单元100控制语音处理单元150以便调制和将该语音信号转换成语音数据以及输出该数据。同时,控制单元100控制该语音/字符数据转换单元190以便将语音数据转换成相应的字符数据。在下一步骤628,控制单元识别出所转换的字符数据已经被输入成文本消息的一部分,以及显示包括该字符数据的文本消息。
如上所述,当有通过语音识别输入字符的需求时,根据本发明的移动通信终端确定是否已经输入语音信号。当有语音信号输入时,移动通信终端检测相应于所输入的语音的字符数据,以及识别出已经输入字符数据。同时,当在SMS或MMS消息的准备期间,用户通过语音识别输入用于输入字符的需求时,移动通信终端显示对应于所输入的语音的条目。当有用于选择一个所显示的条目的键或语音输入时,移动通信终端识别出将所选择的条目输入为消息。
用户能通过能语音识别的移动通信终端,转发SMS或MMS消息,访问无线Internet业务或使用电话银行服务,而不需要直接输入字符,诸如文本消息、Web站点地址或银行帐号。
尽管参考其某些优选实施例,已经示出和描述了本发明,本领域的普通技术人员将理解到在不背离由附加权利要求限定的本发明的精神和范围的情况下,可以在形式和细节方面做出各种改变。
权利要求
1.一种能语音识别的移动通信终端,包括语音处理单元,用于调制语音信号以及将语音信号转换成语音数据;语音识别单元,用于基于语音数据识别语音,以及输出相应的语音信息;语音信息管理数据库,包括用于存储对应于语音信息的字符信息的表;控制单元,用于在字符输入模式中,根据通过语音识别输入字符的需求,在输入语音信号后,通过语音识别单元识别语音,检测对应于存储在语音信息管理数据库中的所识别的语音信息的字符信息,以及识别是否已经输入所检测的对应的字符信息;以及显示单元,用于在控制单元的控制下,显示输入字符信息。
2.如权利要求1所述的移动通信终端,其中,所述字符信息与环球网站点地址有关。
3.如权利要求1所述的移动通信终端,其中,所述字符信息与银行帐号有关。
4.如权利要求1所述的移动通信终端,其中,所述字符信息与电话号码有关。
5.如权利要求1所述的移动通信终端,进一步包括语音识别键,用于用户输入用于字符输入的需求。
6.一种用于在能语音识别的移动通信终端中输入字符的方法,所述方法包括步骤当在字符输入模式中时,确定是否输入语音信号;当输入语音信号时,识别所输入的语音信号以及输出相应的语音信息;在存储对应于语音信息的字符信息的表中,检测对应于所识别的语音信息的字符信息;以及当检测到对应的字符信息时,识别出已经输入字符信息以及在显示单元上显示所输入的字符信息。
7.如权利要求6所述的方法,其中,所述字符信息与环球网站点地址有关。
8.如权利要求6所述的方法,其中,所述字符信息与银行帐号有关。
9.如权利要求6所述的方法,其中,所述字符信息与电话号码有关。
10.一种用于在能语音识别的移动通信终端中输入字符的方法,所述方法包括步骤在字符输入模式中,确定是否由用户输入了通过语音识别输入字符的需求;当有通过语音识别输入字符的需求时,确定是否输入语音信号;当输入语音信号时,识别所输入的语音以及输出相应的语音信息;在存储对应于语音信息的字符信息的表中,检测对应于所识别的语音信息的字符信息;以及当检测到对应的字符信息时,识别出已经输入字符信息以及在显示单元上显示所输入的字符信息。
11.如权利要求10所述的方法,其中,所述字符信息与环球网站点地址有关。
12.如权利要求10所述的方法,其中,所述字符信息与银行帐号有关。
13.如权利要求10所述的方法,其中,所述字符信息与电话号码有关。
14.如权利要求10所述的方法,其中,用户能通过按压语音识别键,输入用于字符输入的需求。
15.一种能语音识别的移动通信终端,包括语音处理单元,用于调制语音信号以及将语音信号转换成语音数据;语音/字符数据转换单元,用于基于存储在存储器中的转换表,将语音数据转换成字符数据;语音识别单元,用于基于语音数据识别语音以及输出相应的语音信息;语音信息管理数据库,包括用于存储对应于语音信息的预定条目的表;控制单元,用于在消息准备模式中,根据通过语音识别输入字符的需求,在输入语音信号后,通过语音识别单元识别语音,检测对应于存储在语音信息管理数据库中的所识别的语音信息的条目,如果检测到的话,显示对应条目,识别出从所显示的条目选择条目的详细信息,显示包括所选择的详细信息的消息,以及,如果未检测到对应于所识别的语音信息的条目时,识别出已经将所输入的语音信号输入为消息的一部分,将语音信号转换成字符数据以及显示包括字符数据的消息。
16.一种用于在移动通信终端中输入字符的方法,该移动通信终端能语音识别,以及包括语音信息管理数据库,该语音信息管理数据库包括用于存储对应于语音信息的预定条目的表,所述方法包括当在消息准备模式中,由用户输入通过语音识别输入用于字符输入的需求时,由所输入的语音信号识别语音的第一步骤;确定是否检测到对应于所识别的语音信息的条目的第二步骤;如果检测到的话,显示对应条目的第三步骤;以及当选择一个显示条目时,识别出已经输入用于所选定的条目的详细信息,以及显示包括所选定的详细信息的消息的第四步骤。
17.如权利要求16所述的方法,进一步包括,当未检测到对应于所识别的语音信息的条目时,识别出已经将所输入的语音信号输出为消息的一部分,将语音信号转换成字符数据和显示包括字符信息的消息的第五步骤。
18.如权利要求16所述的方法,其中,如果检测到的话,所述第三步骤在弹出菜单窗中显示对应于所识别的语音信息的条目。
全文摘要
公开一种能语音识别的移动通信终端,包括语音处理单元、语音识别单元、语音信息管理数据库和控制单元,以及用于利用该移动通信终端的方法。由语音处理单元调制语音信号以及将语音信号转换成语音数据以便语音识别单元识别语音,以及输出相应的语音信息。语音信息管理数据库包括用于存储对应于语音信息的字符信息的表。控制单元在字符输入模式中,在通过语音识别输入字符的需求后,通过语音识别单元识别语音,检测对应于所识别的语音信息的字符信息,以及识别是否已经输入所检测的对应的字符信息,以及经显示单元显示所输入的字符信息。
文档编号H04M1/2745GK1578513SQ20041003858
公开日2005年2月9日 申请日期2004年5月8日 优先权日2003年7月7日
发明者崔惠林 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1