利用语音转文本辅助的多媒体和文本消息传送的制作方法

文档序号:2833514阅读:389来源:国知局
专利名称:利用语音转文本辅助的多媒体和文本消息传送的制作方法
背景技术
移动电话最常用的一个功能是消息传送,短消息服务(SMS)的文本消息传送或多媒体消息服务(MMS)消息传送。用户常常使用这种服务来代替向另一方拨打电话。此外,MMS提供将可闻和可视附件包含到消息中的功能。
消息传送之所以合乎需要,是因为它不向拨打电话那样可能会打搅对方。接收方可以在开会时小心地接收消息,而不致干扰与会的其它人。
通过移动电话使用SMS或MMS消息传送的最大缺点在于,由于移动电话小键盘尺寸相对较小,输入消息可能困难。再者,数字小键盘提供的文本输入方式并不方便。有可供移动电话使用的协助文本输入的小键盘附件,但它们太小而难以有效地加以管理。
因此需要一种简化SMS或MMS消息的创建并将其发送给另一方的系统或方法。
发明的公开移动电话制造商常常将“固定(canned)”消息包含在电话的存储器中。这些固定消息是经常重复使用的消息。用户只需浏览固定消息列表,便可选择一个来发送。浏览和选择固定消息的操作可能比从头编辑相同消息耗时少。用户还可以将他们自己创建的消息附加到固定消息列表中。
固定消息在提供消息起点方面很有用,但不能总是提供消息的具体细节。例如,一条固定消息可以是“于_在_见我”,其中第一个空白可以指时间(例如今天、今晚、明天),而第二个空白可以指地点(例如家、办公室、学校)。显然,单条固定消息无法涵盖所需消息的所有置换内容。为每个置换内容创建固定消息也是不现实的。最有效的解决方案是使用可加以编辑以适应用户即时需求的通用固定消息。
但是如上所述,编辑固定消息存在同样的移动电话数据输入的问题。一种解决方案是结合语音转文本处理来支持SMS和MMS消息的编辑。
本发明的一个实施例描述一种用于在移动电话上创建多媒体语音和文本消息的系统和方法,其中MMS消息的语音部分是文本部分的逐字再现。移动电话包括响应语音和文本输入进行消息传送的功能。消息编辑者访问移动电话的消息传送功能并口述消息。口述消息经记录并转换成文本消息。最后,文本部分和口述部分组合成MMS消息并使用移动电话的消息传送功能发送给接收者。
本发明的另一个实施例描述一种在移动电话上创建多媒体语音和文本消息的系统和方法,其中所述MMS消息的语音部分和文本部分是不同的。这允许消息编辑者对文本部分或语音部分进行个性化处理。所述消息编辑者访问移动电话的消息传送功能并口述消息。口述消息经记录并转换成文本消息。此时,消息编辑者记录上下文与所述文本消息相关的第二口述消息。接着将所述文本与所述第二口述消息组合成MMS消息并利用移动电话的消息传送功能发送给接收者。
本发明的再一个实施例描述一种用于在移动电话上创建MMS消息的系统和方法,它利用固定消息和语音转文本辅助来编辑所述固定消息。消息编辑者访问移动电话的消息传送功能并通过语音或文本方式输入部分消息。所述移动电话将输入与数据库比较,并显示接近匹配所述输入内容的文本消息的列表。这些文本消息包含至少一个空白字段,以填充具体信息来使该消息完整。所述消息编辑者选择所显示的文本消息之一。此消息随后显示在文本编辑功能中,以便可以使其完整。
编辑所选文本消息是通过语音转文本辅助功能来实现的。为所选文本消息中的第一个/下一个字段接收语音输入。该语音输入被转换成文本输入。将所述文本输入与数据库进行比较以尝试查找匹配项。
如果存在匹配项,则判断该匹配项是否对应于单词(短语)、图像或二者。如果匹配项是单词(短语),则在空白字段中填入该单词(短语)。如果匹配项是图像,则在空白字段中填入该图像。如果匹配项对应于单词(短语)和图像二者,则消息编辑者选择该单词(短语)或图像,并以选择的内容填充空白字段。执行检查,以查看所述固定消息中是否还有其它空白字段。如果还有其它空白字段,则控制返回到语音输入步骤,并重复该过程。否则,结束所述编辑过程。
如果没有匹配项,则移动电话显示数据库中最接近的匹配项,并询问消息编辑者是否要使用所述最接近的匹配项。
如果使用最接近的匹配项,则在空白字段中填入该最接近的匹配项。执行检查,以查看所述固定消息中是否还有其它空白字段。如果还有其它空白字段,则控制返回到语音输入步骤,并重复该过程。否则,结束所述编辑过程。
如果不使用上述最接近的匹配项,则移动电话提示消息编辑者将当前文本输入添加到数据库中。所述当前输入置于空白字段中。执行检查,查看所述固定消息中是否还有其它空白字段。如果还有其它空白字段,则控制返回到语音输入步骤,并重复该过程。否则,结束所述编辑过程。
附图简介

图1是描述根据固定消息创建并发送SMS或MMS消息的流程图。
图2是描述利用语音和/或预先的文本输入编辑固定消息的过程的流程图。
图3是描述使用语音转文本协助功能创建并发送SMS或MMS消息的流程图。
本发明的最佳实施方式图1是描述根据固定消息创建并发送SMS或MMS消息的流程图。用户(消息编辑者)访问移动电话的消息传送功能105。此操作通常通过导航编程到移动电话中的图形用户界面(GUI)菜单结构来完成。或者,移动电话可以编程为响应语音输入以激活消息传送功能。消息编辑者随后将消息110口述入移动电话的麦克风中,使移动电话屏幕显示最接近所述口述消息的固定消息的列表115。
为此,首先将口述消息转换成文本,并将其与固定文本消息的数据库比较。或者,可以将口述消息与与文本解释相关联的口述“固定”消息的数据库比较。对于任何一种方式,其结果均是接近匹配消息编辑者的口述消息的文本消息的显示列表。
用户随后从列出的固定消息中进行选择120。此消息随后单独显示在可以对其进行编辑的屏幕上125。一旦编辑操作完成,则会提示消息编辑者在该文本消息中添加语音标记或图像130。如果既未将语音标记添加到该消息中,也未将图像添加到该消息中,则将该消息作为SMS消息发送给接收者135(纯文本)。否则,将文本和语音和/或图像结合到MMS消息中,并利用移动电话的MMS功能发送给接收者140。
步骤110(将消息口述输入电话)和115(显示固定消息列表)需要语音转文本处理。该语音转文本处理通过移动电话中的数字信号处理器(DSP)来实现。DSP以可操作方式与移动电话的麦克风、显示屏以及可以是基于文本的、基于声音的或基于二者的固定消息数据库耦合。DSP可以通过将其处理操作限制于与声音或音素相对的单词或短语来加以简化。在包括电力消耗的处理要求方面,这是一个不很稳健的实现方案,但同时是一个大大减轻繁琐程度的系统。但是,也可以实现更复杂的提供更强语音转文本处理能力的DSP。
如上所述,创建并发送SMS或MMS消息的最有效率的折中方案是利用“固定”消息模板作为起点。这些消息需要以具体数据填充空白字段来完成。这些字段可以通过文本输入或语音输入来填充。语音输入使用前述语音转文本处理功能。
图2是描述利用语音和/或预示文本输入来编辑固定消息的图1步骤125处理流程图。因为文本和语音输入的处理过程非常相似,所以下文将根据具体需要参考语音或文本进行描述。此外,编辑固定消息的过程可以是处理文本和/或语音输入的混合操作。
一旦选择了固定消息模板(图1步骤120),则进入文本编辑器。这意味着由移动电话显示固定消息,以便可以对其进行编辑。文本编辑器移动光标到固定消息中的第一空白字段205,并等待语音或文本输入210。将该语音或预示文本输入与输入数据库比较215,220,希望发现匹配项。
如果输入是语音输入,则利用语音转文本处理将语音输入转换成文本,以便与基于文本的数据库比较。或者,可以将该语音输入与基于声音的数据库比较。该数据库中的每个声音(单词或短语)与该单词或短语的文本表示相关联,这样,在发现语音匹配时,可返回响应文本。该数据库还可以包含指向图像的指针。例如,单词“鸟”可以表示文本或可以表示鸟的图像。
如果在数据库中发现精确的匹配项,则判断该匹配项是否指单词(或短语)、图像或二者。如果单词和图像都对应于该数据输入,则提示消息编辑者选择230要将哪一项用于当前消息。当作出选择时,将选择的内容置于235固定消息字段中。执行检查240,以查看当前消息中是否还有其它空白字段。如果是这样,则将控制权返回到步骤205,以便消息编辑者可以提供固定消息下一空白字段的输入。如果当前消息中不再有空白字段,则执行检查以判断消息编辑者是否希望进一步对消息进行编辑245。如果是这样,则消息编辑者通过文本或语音输入来对该消息进行编辑250,然后才结束编辑过程255。如果不再需要进行额外的消息编辑,则结束编辑过程255。
如果执行步骤215,220之后未找到匹配项,则搜索数据库以查找数据库中最接近的匹配项260,并检查该最接近的匹配项是否在容许的限度内265。数据库显示所有容许的匹配项270,并要求消息编辑者选择最接近的匹配项之一275。如果选择了最接近的匹配项之一,则控制权转到步骤235,以所选内容填充空白字段。如果消息编辑者拒绝上述最接近的匹配项,则将输入添加到所述数据库中280。如果该输入是语音输入并且有声音数据库,则将其作为录音添加到声音数据库中,并创建文本关联。语音输入还转换成文本,并添加到文本数据库中。然后将新输入作为文本置于当前空白字段285中,并且控制权转给步骤240以如上所述进行处理。
如果执行步骤265之后没有在容许限度内的匹配项,则执行另一检查,以查看消息编辑者是否要将当前输入添加到所述数据库中290。如果是这样,控制权转给步骤280,在此步骤中提示消息编辑者将新输入添加到所述数据库中,处理如上所述继续。如果消息编辑者不满意当前输入,且他不希望将其输入到数据库中,则控制权返回到步骤210,并接收新的语音或文本输入。
数据库可以单独由用户控制来添加、删除或修改现有输入项。还可以创建指向图像或声音的指针作为数据库输入项。此外,如果消息接收者在移动电话电话簿中且碰巧该电话簿条目带图像标记,则可以在接收者进行语音输入时使该图像弹出。这将提供一种验证移动电话是否正确解释消息编辑者的语音输入项的手段。
如上所述,可以通过词汇表限制为与声音或音素相对照的单词或短语的子集来简化语音转文本功能。实际效果是降低实现语音转文本处理所需的MIP、存储器和功率要求。为此,可以将该语音转文本功能限制于固定消息编辑器应用。这将使数字信号处理器(DSP)搜索表(数据库)缩减到少量的固定短语。还减少了逻辑上符合这些短语的上下文的单词的数量。同样地,减少了关联的图像和声音的数量。这种减少相应使语音转文本算法所需的训练减少。算法训练可以在制造过程期间执行(即在移动电话到达最终用户之前)。该训练要识别由固定消息应用索引的表(数据库)项。这减少了执行该应用所需MIP的数量。此外,仅在固定消息应用处于激活状态时,才需要激活语音转文本算法。这避免了不使用时在后台运行消耗功率的程序。
本发明的另一个实施例是一种不使用“固定”消息模板的实施方案。图3是描述使用语音转文本辅助功能创建并发送SMS或MMS消息的流程图。在此实施例中,创建消息,并将语音标记或图像与该文本消息相结合以形成MMS消息。然后将得到的MMS消息传送给接收者。语音标记可以是文本消息的逐字表示,以便让接收者选择是阅读还是收听消息。或者,该语音标记可以是伴随文本消息的个性化消息。
将语音标记或图像添加到消息中的选项大大提高了消息传送实用性。例如,标准的文本消息可以附上告知接收者收听并给予回复的语音标记。个性化消息的实例是具有文本成分和语音成分的MMS消息,其中语音标记可以说“约翰,阅读此消息,然后打电话给我讨论”。或者,语音标记可以包含具有询问“约翰,你喜欢这首新歌吗?”的文本成分的内容(例如MP3片段)。同样地,图像可以在MMS消息中要求给予回应的文本成分一起发送,这样的文本成分如“约翰,你觉得这幅图如何?”。
此过程也可通过访问移动电话的消息传送功能来开始305。利用小键盘文本输入或语音转文本的语音输入来创建文本消息310。如果选择语音输入方法,则记录消息编辑者的语音并将其转换成文本。
如果消息编辑者只希望创建文本消息的逐字副本,则将文本消息和语音记录组合成MMS消息315。然后将该MMS消息传送给接收者320。
如果消息编辑者希望对文本消息进行个性化处理,则他口述并记录有关该文本消息的注释325。将该文本消息与个性化语音记录组合成MMS消息330并发送给接收者335。
本说明书公开了本发明的一些特定实施例。本领域的技术人员容易认识到,本发明可以应用于其它环境中。实际上,许多实施例和实施方案均是可行的。所附权利要求根本不用于将本发明范围局限于上述特定实施例。此外,“用于…的装置”的任何表述用于唤起对元素和权利要求作装置加功能的理解,而未明确使用表述“用于…的装置”的任何元素不应理解为装置加功能,即使该权利要求以其它方式包括了单词“装置”。
权利要求
1.一种在移动电话上创建消息的方法,所述移动电话包括响应语音和文本输入进行消息传送的功能,所述方法包括如下步骤访问所述消息传送功能(305);利用语音输入口述消息(310);将所述口述消息转换成文本消息(310);记录上下文与所述文本消息相关的第二口述消息(325);以及将所述文本消息与所述第二口述消息组合成MMS消息(330)。
2.一种在移动电话上创建消息的方法,所述移动电话包括响应语音和文本输入进行消息传送的功能,所述方法包括如下步骤访问所述消息传送功能(105);利用语音输入输入部分消息(110);显示接近匹配所述输入的文本消息的列表(115),其中所述文本消息包含至少一个空白字段;选择所述显示的文本消息之一(120);以及编辑所述选择的文本消息(125)。
3.如权利要求2的方法,其特征在于还包括可选地向所述编辑的文本消息添加语音标记(130)以及将所述语音标记与所述编辑的文本消息组合,以形成MMS消息(135)。
4.如权利要求2的方法,其特征在于还包括可选地向所述编辑的文本消息添加图像(130)以及将所述图像与所述编辑的文本消息组合,以形成MMS消息(135)。
5.如权利要求2的方法,其特征在于编辑所述选择的文本消息的步骤包括(a)显示所述选择的文本消息(205);(b)为所述选择的文本消息中的空白字段接收语音输入(210);(c)将所述语音输入转换成文本输入;(d)查找所述转换的语音输入与文本数据库之间的匹配项(215);如果存在匹配项(220),则(e)判断所述匹配项是否对应于单词、图像或二者(225);如果只对应于单词或只对应于图像,则(f)以所述单词或图像填充所述空白字段(235);如果对应于二者,则(g)选择所述单词或所述图像(230),并以所选内容填充所述空白字段;(h)检查是否还有其它空白字段(240);如果还有其它空白字段,则(i)返回到步骤(b),否则结束所述编辑过程(255);如果不存在匹配项,则(j)查找所述数据库中最接近的匹配项(260);(k)提示是否要使用该最接近的匹配项(275);如果使用最接近的匹配项,则(l)以所述最接近的匹配项填充所述空白字段(235);(m)检查是否还有其它空白字段(240)以及如果还有其它空白字段,则返回到步骤(b),否则结束所述编辑过程(255);如果不使用所述最接近的匹配项,则(o)提示将当前文本输入添加到数据库中(280);(p)以所述当前文本输入填充所述空白字段(285);(q)检查是否还有其它空白字段(240)以及如果还有其它空白字段,则返回到步骤(b),否则结束所述编辑过程(255)。
6.如权利要求5的方法,其特征在于还包括检查是否所述找到的最接近的匹配项是否对应于容许限度内的文本输入(265)。
7.如权利要求6的方法,其特征在于如果所述找到的最接近的匹配项不对应于容许限度内的所述文本输入,则提示将当前文本输入添加到所述数据库中(290)。
8.如权利要求5的方法,其特征在于还包括在所有空白字段都填充完时,进一步编辑所述消息(245、250)。
9.一种在移动电话上创建消息的系统,所述移动电话包括响应语音和文本输入进行消息传送的功能,所述系统包括用于访问所述消息传送功能的装置(105);用于利用语音输入输入部分消息的装置(110);用于显示接近匹配所述输入的文本消息的列表的装置,其中所述文本消息包含至少一个空白字段(115);用于选择所述显示的文本消息之一的装置(120);以及用于编辑所述选择的文本消息的装置(125)。
10.如权利要求9所述的系统,其特征在于还包括用于向所述编辑的文本消息添加语音标记(130)的装置以及用于将所述语音标记与所述编辑的文本消息组合,以形成MMS消息(135)的装置。
11.如权利要求9所述的系统,其特征在于还包括用于向所述编辑的文本消息添加图像(130)的装置以及用于将所述图像与所述编辑的文本消息组合,以形成MMS消息(135)的装置。
12.如权利要求9所述的系统,其特征在于用于编辑所述选择的文本消息的所述装置包括用于显示所选文本消息的装置(205);用于为所述选择的文本消息中的空白字段接收语音输入(210)的装置;用于将所述语音输入转换成文本输入的装置;用于查找所述转换的语音输入与文本数据库之间的匹配项(215)的装置;用于判断所述匹配项是否对应于所述数据库中的单词、图像或二者(225)的装置;用于从所述数据库中选择单词或图像(230)的装置;用于以单词或图像填充所述空白字段(235)的装置;用于查找所述数据库中与所述语音到文本转换输入最接近的匹配项(260)的装置;用于提示用户是否要使用该最接近的匹配项(275)的装置;用于以所述最接近的匹配项填充所述空白字段(235)的装置;用于将所述语音到文本转换输入添加到所述数据库中(280)的装置;用于以所述语音到文本转换输入填充所述空白字段(285)的装置;用于检查所选文本中是否还有其它空白字段(240)的装置;用于将控制返回给所述为所述选择的文本消息中的空白字段接收语音输入的装置;以及用于结束所述编辑过程(255)的装置。
13.如权利要求12所述的系统,其特征在于还包括用于检查所述找到的最接近的匹配项是否对应于容许限度内的文本输入(265)的装置。
14.如权利要求13所述的系统,其特征在于还包括用于在所述找到的最接近的匹配项不对应于容许限度内的所述文本输入时,提示将当前文本输入添加到所述数据库中(290)的装置。
15.如权利要求12所述的系统,其特征在于还包括用于在填充完所有空白字段时,进一步编辑所述消息(245、250)的装置。
全文摘要
一种用于在移动电话上创建多媒体语音和文本消息的系统和方法,其中MMS消息的语音部分是文本部分的逐字再现或文本部分的个性化描述。移动电话包括响应语音和文本输入进行消息传送的功能。消息编辑者访问移动电话的消息传送功能305并口述消息310。口述的消息经记录并转换成文本消息310。如果该消息是个性化的,则消息编辑者记录上下文与所述文本消息相关的第二口述消息325。现在,将所述文本部分与所述第二口述消息组合成MMS消息330并利用移动电话的消息传送功能发送给接收者335。还公开了一种用于在移动电话上创建MMS消息的系统和方法,它利用固定消息和语音至文本协助功能来编辑所述固定消息。消息编辑器访问移动电话的消息传送功能105并通过语音或文本输入消息部分110。移动电话将输入与数据库比较,并显示接近匹配所述输入的文本消息的列表115。所述消息编辑器选择显示的文本消息之一120。然后将该消息显示在文本编辑功能中125,以便可以完成对它的编辑。
文档编号G10L15/26GK1739309SQ200480002328
公开日2006年2月22日 申请日期2004年1月5日 优先权日2003年3月6日
发明者J·W·诺思库特 申请人:索尼爱立信移动通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1