利用语音识别功能进行字符串编辑的移动通信终端设备的制作方法

文档序号：6417491阅读：175来源：国知局

专利名称：利用语音识别功能进行字符串编辑的移动通信终端设备的制作方法
技术领域：
本发明涉及移动通信终端设备，更具体地说，涉及具有利用语音识别功能进行字符串编辑的功能的移动通信终端设备。
在诸如便携式电话等传统的移动通信终端设备中，操作部分的按钮数目有限。进行诸如电子电话号码本和消息产生等字符串编辑功能时，必须从操作单元输入诸如汉字字符、片假名字符、平假名字符、字母数字字符等字符。另外，在字符串编辑中“编辑得更快和更简便”的要求变得更加迫切。
此外，提出了在计算机系统中利用语音识别功能读出字符串的方法。将来，预期准备存入移动通信终端设备和从中读出的字符串将随着移动通信终端设备的高效能而增加。
在上述情况下，在利用语音识别功能读出大量字符串作为候选者并从中选出一个的过程中，复杂的操作有可能变得必要。在这种情况下，以“更快而且更简便的过程”的形式出现的语音识别功能的特点将要减半。
结合以上描述，公开让公众审查的日本专利申请(A-平8-314494)公开了一种信息搜索设备。在该参考文献中，在步骤S110指定记录文件名和显示部分。在步骤S112从盘上读出ADPCM(自适应差分脉码调制)压缩声学数据并将其扩展，以便在以时间序列的形式显示频域数据。此时，若进行语音识别的字符意义不清楚，则在柱状图上指定声学数据重放的开始位置和结束位置，以便在步骤S113确认不清楚的部分。然后，在步骤S114重放并确认该声学数据，并进行确认部分中的字符修正和编辑。
另外，在公开让公众审查的日本专利申请(A-平10-49187)中公开了一种信息搜索装置。在这个参考文献中，语音信息搜索装置包括数据库和用于储存通过给数据的字符串加上表示该数据存于数据库中何处的索引而获得的索引字符串的索引部分。语音识别部分输出候选的字符串。过滤部分去除任何与索引字符串不一致的候选字符串。显示部分按照过滤部分的输出以评价值的升序显示第二识别块的候选字符串。字符串选择部分响应输入部分从候选字符串中选择预定的索引字符串。数据库搜索部分从数据库搜索与该索引字符串相关的数据。
此外，公开让公众审查的日本专利申请(A-平9-65001)中公开了一种通信终端设备。在这个参考文献中，通信终端设备包括消息登记部分3，其中把消息的语音和字符串作为一组来登记。语音识别部分4比较通过通信线路L输入的语音和登记在消息登记部分4上的语音的语音模式。当两者彼此一致时，从消息登记部分3读出与此语音对应的字符串，并打印出来。
此外，公开让公众审查的日本专利申请(A-平10-112747)公开了一种便携式电话机。在这个参考文献中，该便携式电话机被呼叫时，控制部分13接收一个源自基站2的电话号码，以便存入存储器，并开始一次通信。在通信过程中按下操作部分的地址键34，请求输入名字。输入名字时，该名字作为电话号码信息与该电话号码对应地存储在存储器中。
因此，本发明的一个目的是提供一种移动通信终端设备，其中可以利用语音识别功能使字符串的编辑进行得更快，更简便。
为了达到本发明的一个方面，移动通信终端设备包括显示部分、存储部分和控制部分。存储器储存语音的字符串。控制部分把第一语音的字符串作为候选字符串读出，并控制显示部分显示该候选字符串。然后，控制部分响应选择指令从候选字符串中选出一个，并响应编辑指令编辑与选出的候选字符串对应的字符串。
移动通信终端设备还可以包括输入部分，用来输入第一语音和第二语音。在这种情况下，控制部分对输入的语音进行语音识别，以识别第一语音和第二语音。另外，控制部分可以把已编辑的字符串与第二语音相关地存入存储器。作为另一方案，当存储器以文件夹为单元储存语音的字符串时，控制部分可以把已编辑的字符串与第二语音相关地存入特定的一个文件夹。控制部分可以确定特定的文件夹的属性与已编辑的字符串的属性是否匹配，并把已编辑的字符串与第二语音相关地存入该特定的文件夹。
此外，控制部分可以根据第一语音和当前字符输入方式搜索候选字符串。或者，控制部分可以根据第一语音、当前字符输入方式和每一个字符串中的字符数搜索候选字符串。在这些情况下，当前字符输入方式是汉字/平假名字符方式、片假名字符方式、字母字符方式、数字/符号字符方式中的任一种。
另外，当存储器以文件夹为单元储存语音的字符串时，控制部分可以根据第一语音、当前字符输入方式和每一个字符串的字符数中的至少一个搜索候选字符串。然后，控制部分可以控制显示部分显示与该搜索出的候选字符串相关的文件夹，响应文件夹选择指令从所显示的文件夹中选出一个，并控制显示部分以显示包含在所选出的文件夹中的搜索出的字符串。
为了达到本发明的另一个方面，一种编辑储存在移动通信终端设备中的字符串的方法包括把第一语音的字符串作为候选字符串读出；显示该候选字符串；响应选择指令从候选字符串中选出一个；以及响应编辑指令编辑与所选出的候选字符串对应的字符串。
所述读出步骤可以包括对语音进行语音识别，以便识别第一语音和第二语音。在这种情况下，已编辑字符串可以与第二语音相关地储存。而当语音的字符串以文件夹为单元储存时，可以把已编辑的字符串与第二语音相关地存入特定的一个文件夹中。此时，判断特定文件夹的属性与该已编辑字符串的属性是否匹配。
所述读出步骤可以包括根据第一语音、当前字符输入方式和每一个字符串中的字符数搜索候选字符串。在这种情况下，当前字符输入方式是汉字/平假名字符方式、片假名字符方式、字母字符方式、数字/符号字符方式中的任一种。
另外，所述读出步骤可以包括根据第一语音、当前字符输入方式和每一个字符串中的字符数中的至少一个搜索候选字符串；显示与搜索出的候选字符串相关的文件夹；以及响应文件夹选择指令从所显示的文件夹中选出一个，从而显示包含在所选出的文件夹中的搜索出的字符串。

图1是按照本发明第一实施例的移动通信终端设备的结构；图2是表示按照本发明第一实施例的移动通信终端设备中的字符串编辑功能的基本流程图；图3A和3B是在按照本发明第一实施例的移动通信终端设备中的字符串编辑的情况下语音识别功能中的候选限制过程的流程图；图4是表示按照本发明第二实施例的移动通信终端设备中文件夹指定过程的流程图；图5是表示按照本发明第二实施例的移动通信终端设备中根据文件夹指定过程来选择字符串的流程图。
在下文中，将参照附图详细地描述本发明的移动通信终端设备。
图1表示按照本发明第一实施例的移动通信终端设备的结构。参见图1，第一实施例的移动通信终端设备具有字符串编辑功能、储存已编辑字符串的功能和利用语音识别功能读出所储存的字符串的功能。
所述移动通信终端设备包括操作部分11、显示部分12、通知部分13、输入/输出部分15、传输/接收部分16、储存器17和控制部分14。操作部分11接收针对移动通信终端设备的操作，以便产生指令和数据。显示部分12在控制部分14的控制下显示该移动通信终端设备的状态和必要的数据。通知部分13在控制部分14的控制下把呼叫的到达和终端设备状态的改变通知用户。输入/输出部分15输入和输出语音。传输/接收部分16进行无线电通信的发送和接收操作。储存器17储存诸如字符串和终端设备的操作设置等数据。与语音识别字组相关地储存字符串。控制部分14控制整个终端设备的操作，并进行语音识别。
在字符串编辑方式下，用户通过对操作部分11的操作进行字符串的字符输入操作。字符串显示在显示部分12上并存入储存器17。语音识别时，响应对操作部分11的操作启动语音识别功能。首先以语音形式从输入/输出部分15输入语音识别字组，然后由控制部分15判定所输入的语音识别字组是否与对应于储存在储存器17中的字符串的语音识别字组中的任何一个一致。然后，在显示部分12上显示与所输入的语音识别字组一致的语音识别字组的字符串。
下面将参照图1和2描述按照本发明第一实施例的移动通信终端设备中的字符串编辑方法。
首先，参见图2，启动用于诸如电子电话号码本功能和消息产生功能(步骤S201)等功能的字符串编辑。
这样，操作方式便进入“字符输入方式选择”(步骤S202)。根据要输入的字符类别，字符输入方式有汉字/平假名字符方式、片假名字符方式、字母字符方式、数字/符号字符方式和半角字符方式。当启动字符串编辑时，设置内定的一种字符输入方式。用户操作操作部分11，响应从操作部分11发出的方式指定指令，从汉字字符方式、平假名字符方式、片假名字符方式、字母字符方式、数字/符号字符方式和半角字符方式中指定一种。使用内定的字符输入方式时，可以不必进行字符输入方式选择。此外，可以响应操作部分11中的按键操作改变字符输入方式。另外，依终端设备而定，可以在字符串编辑开始之前进行字符输入方式选择，然后，开始字符串编辑。
在字符串编辑方式下，响应对操作部分11的操作启动语音识别功能。以语音形式将语音识别字组从输入/输出部分15输入终端设备。此时，读出登记在储存器17中并与所输入的语音识别字组对应的一个字符串(步骤S204)。然后，在显示部分12上显示所读出的字符串。通过把另一个字符串读出和加到已显示的字符串中，并且增加和删除已显示的字符串，来编辑所显示的字符串(步骤S203)。编辑后的字符串可以存入储存器17。此后，必要时，可以利用语音识别功能再次读出已编辑的字符串。
参见图3A和3B，利用语音识别功能读出字符串(S204)。此时，把所有与从输入/输出部分15输入的语音字组一致的语音识别字组的字符串都临时作为候选者处理(S301)。但是，只有全部满足4个项目的字符串才作为候选者显示在显示部分12上(S310)。
(1)在字符输入方式中当语音识别功能启动时，满足下列条件中的一个(i)在汉字/平假名字符方式的情况下，在该字符串中包含任何汉字和平假名(S302)。
(ii)在片假名字符方式的情况下，字符串包含任何片假名字符，而不包含任何汉字或平假名字符(S303)，(iii)在字母字符方式的情况下，字符串包含任何字母字符，而不包含任何汉字、平假名和片假名字符(S304)，和(iv)在数字/符号字符方式的情况下，字符串只包含数字、#(英镑符)、*(星号)、p(pose)字符(S305)。
(2)当语音识别开始时设置了半角字符输入方式时，字符串只包含半角字符(S306，S307)。
(3)字符串中的字符数小于允许输入的字符数，亦即在字符串编辑中仍旧可以输入的字符数(S308)。
(4)字符串只包含字符串编辑中允许的字符，或者在候选字符串中不使用任何禁止输入的字符(S309)。
然后，在显示部分12(S310)上显示所显示的候选字符串，随后在显示的候选字符串中间选择一个字符串(S312)。字符串编辑继续进行。若不满足上述4个条件中的任何一个，则将该字符串从候选字符串中清除，而且不显示。
接着，当字符串编辑结束时(S205)，确定已编辑的字符串是否应该储存起来(S206)。应该储存时，响应来自操作部分11的储存指令把该字符串存入储存器17(S207)。不要储存时，放弃该字符串(S208)，并结束字符串的编辑(S211)。
设定是否要通过语音识别来读出已储存的字符串(S209)。需要读出所储存的字符串时，在进行了语音识别字组的登记之后(S210)，该字符串的编辑结束(S211)。不需要读出所存储的字符串时，不登记语音识别字组就结束该字符串的编辑(S211)。
即使在字符串的编辑结束之后，也可以把语音识别字组存入已存入储存器17的一个字符串中，而不为该语音识别进行登记。此外，可以取消向已为语音识别进行了登记的字符串的登记。
下面将要详细描述按照本发明第二实施例的移动通信终端设备。
字符串编辑结束(S205)，而且该字符串已经储存之后(S206)，进行语音识别字组的登记(S209，S401)。此时，指定一个文件夹(S402)。
可以根据与字符串的编辑功能有关的功能单元、诸如电子电话号码本和消息产生，把文件夹分类。而当把每一种功能分成细分的功能时，可以按照细分的功能单元把文件夹分类。或者，可以按字符类型单元，诸如汉字字符、平假名字符、片假名字符、字母字符、数字/符号字符，把文件夹分类。每一个文件夹可以包含多个带有语音识别字组的字符串。另外，给每一个文件夹分配属性。
在指定文件夹的情况下，判定所指定的文件夹的属性与已编辑的字符串的属性是否彼此一致(S403)。一致时，把已编辑的字符串存入储存器(S404)，然后结束该字符串的编辑(S405)。不一致时，重新指定新的文件夹(步骤S402)。
在字符串编辑时通过语音识别功能读出字符串的情况下，搜索与输入的语音一致的语音识别字组的字符串(S501)。搜索之后，在控制部分14的控制下，在显示部分12上显示包含搜索出来的字符串的文件夹的清单(S502)。随后，响应文件夹指定功能，在所显示的文件夹中指定一个(S503)。然后，只从指定的文件夹中读出字符串(S504)。此后，响应从操作部分11输入的字符串指定指令，在所显示的字符串中间指定一个(S505)，并利用读出的字符串进行字符串编辑。
这样，就有可能按照用户的使用方式，通过语音识别功能只读出必要的字符串，结果改进了字符串编辑的可操作性。
如上所述，可以利用本发明的字符串编辑中的语音识别功能简便而快速地读出字符串。进行字符串编辑，以便把通过语音识别功能读出的多个字符串结合起来。结果，便可达到改进字符串编辑的可操作性的效果。
这对于诸如移动通信终端设备等尺寸受限制而且在字符串编辑中需要复杂的操作的终端设备是非常有效的。
另外，有时可能要增大准备通过语音识别功能读出的字符串的字符数，而且把多个字符串分配给一个语音识别字组。在这种情况下，预先按照字符串编辑的状态，诸如字符输入方式、全角/半角的设置和剩下可以输入的字符数限制候选字符串。只把需要的字符串作为候选字符串加以显示，故有可能在不丧失语音识别功能的“快速而简便”的优点的情况下通过语音识别功能读出多个字符串。
权利要求
1.一种移动通信终端设备，其特征在于包括显示部分；储存器，用来储存语音的字符串；和控制部分，它读出第一语音的所述字符串作为候选字符串控制所述显示部分显示所述候选字符串响应选择指令从所述候选字符串中选出一个，并响应编辑指令编辑与所述选出的候选字符串对应的所述字符串。
2.按照权利要求1的移动通信终端设备，其特征在于还包括输入部分，用来输入第一语音和第二语音，其中所述控制部分对输入的语音进行语音识别，以识别所述第一语音和所述第二语音。
3.按照权利要求2的移动通信终端设备，其特征在所述控制部分把所述已编辑的字符串与所述第二语音相关地存入所述存储器。
4.按照权利要求2的移动通信终端设备，其特征在于所述存储器以文件夹为单元储存所述语音的字符串，以及所述控制部分把所述已编辑的字符串与所述第二语音相关地存入所述文件夹的特定的一个中。
5.按照权利要求2的移动通信终端设备，其特征在所述存储器以文件夹为单元储存所述语音的字符串，而且其中所述控制部分判定所述特定的文件夹的属性与所述已编辑的字符串的属性是否匹配，并把所述已编辑的字符串与所述第二语音相关地存入所述特定的文件夹中。
6.按照权利要求1至5中任何一个的移动通信终端设备，其特征在于所述控制部分根据所述第一语音和当前的字符输入方式搜索所述候选字符串。
7.按照权利要求1至5中任何一个的移动通信终端设备，其特征在于所述控制部分根据所述第一语音、当前的字符输入方式和每一个所述字符串中的字符数搜索所述候选字符串。
8.按照权利要求6的移动通信终端设备，其特征在于所述当前字符输入方式是汉字/平假名字符方式、片假名字符方式、字母字符方式或数字/符号字符方式。
9.按照权利要求1的移动通信终端设备，其特征在于所述存储器以文件夹为单元储存所述语音的字符串，以及所述控制部分根据所述第一语音、当前字符输入方式和每一个所述字符串的字符数中的至少一个搜索所述候选字符串，控制所述显示部分显示与所述搜索出的候选字符串相关的所述文件夹，响应文件夹选择指令从所述显示的文件夹中选出一个，以及控制所述显示部分以便显示包含在所述选出的文件夹中的所述搜索出的字符串。
10.一种在移动通信终端设备中编辑所存储的字符串的方法，其特征在于包括把第一语音的所述字符串作为候选字符串读出；显示所述候选字符串；响应选择指令从所述候选字符串中选出一个；以及响应编辑指令编辑与所述选出的字符串对应的所述字符串。
11.按照权利要求10的方法，其特征在于所述读出步骤包括对语音进行语音识别，以便识别所述第一语音和所述第二语音。
12.按照权利要求11的方法，其特征在于还包括与所述第二语音相关地储存所述已编辑字符串。
13.按照权利要求11的方法，其特征在于还包括与所述第二语音相关地把所述已编辑的字符串存入文件夹的特定的一个中，以文件夹为单元存储语音的所述字符串。
14.按照权利要求13的方法，其特征在于所述储存步骤包括判断特定文件夹的属性与所述已编辑字符串的属性是否匹配。
15.按照权利要求10的方法，其特征在于所述读出步骤包括根据所述第一语音、当前字符输入方式和每一个字符串中的字符数搜索所述候选字符串。
16.按照权利要求15的方法，其特征在于所述当前字符输入方式是汉字/平假名字符方式、片假名字符方式、字母字符方式或数字/符号字符方式中的任一种。
17.按照权利要求10的方法，其特征在于所述读出步骤包括根据所述第一语音、当前字符输入方式和每一个所述字符串中的字符数中的至少一个搜索所述候选字符串；显示与所述搜索出的候选字符串相关的所述文件夹；响应文件夹选择指令从所述显示的文件夹中选出一个；以及由此显示包含在所述选出的文件夹中的所述搜索出的字符串。
全文摘要
一种移动通信终端设备包括显示部分(12),储存部分(17)和控制部分(14)。储存器储存语音的字符串。控制部分把第一语音的字符串作为候选字符串读出,并控制显示部分显示候选字符串。然后,控制部分响应选择指令从候选字符串中选出一个,并响应编辑指令编辑与选出的候选字符串对应的字符串。
文档编号G06F17/22GK1257393SQ99126459
公开日2000年6月21日申请日期1999年12月17日优先权日1998年12月17日
发明者宇佐美真也申请人:日本电气株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宇佐美真也
技术所有人：日本电气株式会社
我是此专利的发明人

上一篇：图像读取装置、黑像素检索方法及白纸原稿检测方法
上一篇：共享浏览器的方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。