用于在电信网上传输消息的方法和系统及相关发送器终端的制作方法

文档序号：6416987阅读：124来源：国知局

专利名称：用于在电信网上传输消息的方法和系统及相关发送器终端的制作方法
技术领域：
本发明涉及电信网上消息的传输。
背景技术：
例如按照UMTS标准(通用移动电信系统)或GSM/GPRS标准(全球移动通信系统和通用分组无线电业务的缩写)的新一代移动终端的引入使得能够传输和在终端上显示具有包括如文本、声音、图像、也可能还有运动图像等的不同要素的多媒体内容的消息。所述消息当前被表示为MMS，即，多媒体消息传送系统的缩写。
发送所述消息的能力引起不同类型的问题。
第一方面，必须保证所述消息可以通过使用如移动电话的设备相对容易地被构建，该设备由于减小的尺寸和处理能力，不能理想地适合于生成具有复杂内容的消息。
第二方面，希望具有发送和接收MMS消息的能力的终端能够与老的一代终端，诸如按照GSM标准运行的移动终端的并只能生成当前称为SMS-短消息业务的缩写-的那种文本消息的老一代终端共存和交互。有理由认为在所有当前流行的终端被替代之前的相当长的一段时间内两种技术肯定会共存。

发明内容
本发明的目的是支持具有发送如SMS消息那样的文本消息的能力的终端与能够接收MMS消息的终端之间的共存和交互。
按照本发明，所述目的是由于其特征为在以下的权利要求中具体地阐述的方法而达到的。本发明还包括相关的系统以及相应的发送器终端。
实际上，按照本发明的解决方案允许老一代终端--能够发送SMS文本消息的--导致具有要到MMS终端的多媒体内容的消息的生成。
在当前的优选实施例中，按照本发明的解决方案允许提供一种业务，它把纯文本消息自动变换成多媒体消息，从而变换成比起由纯文本构成的开始的消息”更丰富的”消息。
在当前的优选实施例中，按照本发明的解决方案提供了使用由同一个申请人制造的、并由注册商标JoeXpress标识的基于文本或自然音频来自动化一个三维人物的系统。
在这方面，查询文件EP-A-0 991 023、EP-A-0 993 197、和WO-A-01/75805是有用的。所讨论的系统能够把文本或记录的语音变换成讲出处理的句子的人物的运动。所述运动也包括没有与讲的话、面部表情和身体运动联系起来的运动。系统还能够操纵其它要素，诸如人物外貌的个性(例如，头发颜色、眼睛颜色、衣着方式等等)、人物所处的位置，观察点的移动，背景音乐。所有这些都在从所提供的有限数目的输入参数来构建视频剪辑时同时发生。
这样，按照本发明的解决方案例如允许根据被包含在起始SMS消息中的内容生成要到MMS终端的动画。在这种情形下，结果是包括诸如场景描述部分(以”同步的多媒体集成语言”或SMIL表示)和包含要被插入消息中的多媒体对象的部分的不同的部分的MMS消息，在这些部分之间自动生成动画。
第一代MMS终端受到对于消息内容的相当严格的约束限制具体地，不支持视频且消息的最大尺寸是30千字节。按照本发明的解决方案的优选实施例因此允许以生成的MMS语言引入具有小的尺寸的动画。具体地，视频被变换成按照GIF标准(用于图形交换格式的缩写)的图像，这个图像经受使用相当低的动画采样速率的动画，即，约1Hz。
而且，原始的文本被在序列的各个帧之间子划分。通过这样做，利用尺寸例如约为100×80像素(当前市场上的MMS终端的显示单元的尺寸)的动画，可以生成包含具有复杂的模型和场景的持续约15秒或在较简单的模型的情况下更长的动画的消息，这允许在动画的GIF图像内更高的压缩比。
如果消息的总的尺寸是有限的(例如，30千字节)而使得同时发送视频和音频是成问题的，则在观看动画的GIF图像期间有可能使得终端重现被插入在消息中的旋律，而不是语音消息这种类型的声音(“振铃声”)能够被包含在非常小数目的字节中。
在对于消息的尺寸存在不太严格的约束时，按照本发明的解决方案允许发送与由例如语音合成器生成的与动画有关的音频，而不是发送在帧里面的文本或甚至与其并行地发送。在这种形下，有可能甚至从自然音频自动生成MMS消息，在这种情形下，动画通过由语音识别器实行的处理的结果引导。能够实行上述功能的语音合成器和语音识别器当前在本领域是可得到的。
除了动画以外，MMS消息还可以有利地考虑旨在于包含对插入例如所谓的“标记”(logo)和/或广告标语有用的更多文本、旋律和图像的部分。

现在参照附图，完全作为非限制的例子来描述本发明，其中图1在功能体系结构级别上显示能够按照本发明运行的系统的结构，图2是显示按照本发明的用于发送消息的步骤的流程图，以及图3，其包括分别表示为3A和3B的两个部分，重现显示按照本发明的系统的安排的可能的形式的功能方框图的两个邻近的部分。
具体实施例方式
这里提供的说明参照现在至少是对于本发明的可能的使用来说最有吸引力的一个的应用情形，即，把在GSM移动终端中作为SMS消息生成的文本消息变换成将要在按照UMTS标准运行的网络上传输的MMS消息。
无论如何，按照本发明的解决方案也可以应用于不同地生成的、例如电子邮件消息的形式的文本消息，以及它可被使用来在诸如支持这样的传输的任何类型的网络上发送MMS消息，因此不限于UMTS网络。
在图1上，标号10统一表示具有MMS中继/服务器的功能的模块，以及为此包括具有中继功能的子模块，被表示为101；和具有服务器功能的子模块，被表示为102，通过被表示为103的接口被互相连接。自然地，子模块102和103也可以互相集成。
标注数字11代替地表示MMS业务的用户的数据库。这基本上是其中为可获得MMS业务的每个用户记录电话号码(或等同的指示)和有关所讨论的用户采用的终端类型的信息的数据库。
数据库11通过接口111被连接到模块10。
标注数字12和13表示在网络中被连接到模块10(这可以典型地发生在UMTS网络)以便能够接收MMS消息的两个用户。
被表示为12的用户是被直接包括在其中连结有模块10的网络中的用户。相关的连接因此是通过被表示为121的接口的直接类型。
而被表示为13的用户是被标称地连结到另一个移动网的用户。
在这种情形下，与模块10的连接不是直接的，而是借助于被表示为131a和131b的相应的接口通过基本上类似于接口10的附加模块10’达到的。
用户12和用户13的不同表示，是为了强调在其中多个电信网络以通用互联网共同运行的情形或漫游情形中也应用按照本发明的解决方案的可能性。
标注数字14表示通过各个接口141被连接到模块10，以便能够作为MMS消息的接收者运行的服务器，诸如电子邮件服务器。
最后，标注数字15表示通过各个接口151被连接到模块10的用于对MMS消息业务的提供进行记账的系统。
这里描述的系统体系结构和各种构成的单元相应于被认为在本领域中全都知道的解决方案。这些解决方案已能被使用于在电信网络内发送MMS消息(这样的新一代移动网络按照UMTS标准运行)。这个事实使得在这里提供对于所讨论的体系结构和单元的更详细的说明成为多余的。
按照本发明的解决方案的重要的特征是通过以下事实给出的、优选地通过各个接口161，将能够把诸如来自SMS消息管理中心17(通常称为缩写SMSC)的SMS消息的纯文本消息变换成具有多媒体内容的消息的模块或子系统16与模块10相联系。在模块10中进行可能的进一步处理后，所述消息可以由模块10以要到诸如图1所示的用户12，13和14那样的用户的MMS消息的形式进行广播。
具体地，模块10可被配置成允许确定的消息MMS传输到多个接收者或接收者列表。因此，虽然此后将几乎仅仅参考从SMS消息生成被发送到单个接收者的MMS消息，但按照本发明的解决方案容易适合于允许把所讨论的MMS消息广播到例如借助于http请求或借助于被发送到模块10的ftp请求规定的接收者列表。
如前所述，模块16的核心是由用于创建由文本或自然的语音产生动画的虚拟人物表示的多媒体内容的系统组成的。这样的系统的例子是上面提到的JoeXpress系统。
这样的系统使得用户能够选择虚拟人物，它的背景，任何个性，要产生的内容的格式。选择的参数被使用来用想要的情景和格式产生动画。
图2的流程图显示处理步骤，通过这些步骤，按照本发明的系统被在图1上显示为18的、起到”发送者”作用的用户访问。用户18具有终端，该终端能够把SMS消息发送到能够处理这种类型的消息的相应的中心，诸如在图1上显示为17的中心。
从被表示为200的起始步骤开始，标注数字202表示其中用户18在他/她的终端上编写SMS消息(其特征在此后会更好地说明)的步骤把它发送到与业务有关的电话号码，该电话号码在给所述SMS消息提供MMS特征后转发它。
所讨论的业务主要由被表示为16的模块实施，但某些功能可以由模块10执行，以及可能由模块17执行。
在图2上被表示为204的步骤中，业务管理功能--因此基本上是模块16--生成对发送相应于接收的SMS消息的MMS消息的请求。正如此后更好地解释的，除了消息本身以外，这样的请求还包含用户的识别号以及(可能地)有关接收终端的类型的信息。
在被表示为206的步骤中，模块16处理接收的请求，生成适合于接收终端的图形和处理能力特征的MMS消息。在被表示为208的步骤中，所述MMS消息被发送到相应的MMS中心(诸如模块10)，相应的MMS中心在以后的步骤208中，把消息转发到接收终端，诸如终端12，13或14。
步骤210表示其中把所述消息按照MMS的显示的典型的模式显示给接收终端的步骤。一旦通过读出MMS消息而完成传输，系统就移到被表示为212的结束步骤。
将要由用户在步骤202拨打的与业务有关的电话号码优选地是通常称为”大帐户”的那种专用电话号码。
由用户发送的字符序列，除了消息的文本以外，还包含在报头中的某些信息，诸如MMS消息的接收者的电话号码(图1上的用户12、13，14)、将重现消息的虚拟人物和它被插入到的背景。
最后两个信息项是任选的，所以可被忽略。在忽略的情形下，相应的信息由模块16自动选择，例如作为随机选择或作为预定的选择(缺省)。自然地，即使仅仅对于所述信息的一部分，这也是可应用的例如，如果只规定人物，则模块16自动选择背景。
被发送到业务的字符序列因此通常具有以下形式<recipient telephone number>[<virtual character(<background>)]<text message>
在步骤202，消息的报头可以人工地或借助于处在终端18中的脚本被编写，这允许借助于菜单选择虚拟人物和背景以及从地址簿中选择接收者。
如果消息被人工地拨号，则字符序列会包含错误。例如，用户会规定不存在的虚拟人物或背景的名称。在这种情形下，业务通过自动选择正确的而代替错误信息。
将会看到，所述脚本信息实际上相应于在用于发送SMS消息的某些移动电话终端中提供的功能，其有可能由同一业务管理系统远程地把相关的软件加载到各个终端18(具体地，加载到终端的用户身份模块或SIM)。
优选地基于以上已经几次提到的JoeXpress系统的用于把SMS文本格式变换成MMS多媒体格式的模块，优选地在被称为”文本动画”的模式中被使用。
在这种情形下，SMS消息的文本由语音合成器进行处理，语音合成器把文本变换成语音和提供定时的语音序列，然后该语音序列被使用于自动生成选择的虚拟人物的发声活动。
作为到SMS/MMS变换模块的输入提供的文本可包含对于最终得到的动画有影响的元信息，这些元信息把表情和手势加到虚拟人物上以及改变合成的语音。
所述元信息作为例如可以具有以下形式的字符的序列被插入到文本<tag><action_type>[<par1>][<par2>]...[<parn>]其中<tag>是对于区分元信息和要被合成的文本所必需的。
<action_type>规定要执行哪个动作。动作的例子是语音音质的改变、面部表情或身体运动的重现、观察点的改变等等。
<par1-n>是修正动作的参数，例如，面部表情的持续时间的改变。
较高级别上的另一个表示由所谓的”情绪标记”组成，即，由在文本通信中在互联网中通用的代表情绪状态的字符序列组成。情绪标记的例子是”；-)”、”-)”、”-o”，等等。
情绪标记由系统通过使用上述的表示法被变换成语义上等价的形式。对于情绪标记的支持由于它们被用户所熟悉的和能简单地插入到文本中而同时具有与低级别表示相同的灵活性的事实而被推动。
像JoeXpress系统那样的系统产生三维模型的动画，它们可以由系统转换成不同的格式，这些格式可以取决于三维信息是否被保持而被分类成两类。
属于第一类的有，例如，MPEG-4面部和身体动画参数序列、VRML动画(虚拟现实模型语言的缩写)、3D演播室最大动画等等。
属于第二类的有，视频编码格式，像MPEG-1、MPEG-2、MPEG-4视频、动画的GIF(虽然它在严格的意义上不是视频编码格式，但GIF-89a格式确实允许创建图像序列)。
动画的音频可以连同视频一起或分开地被编码，正如在VRML或动画GIF的情形下那样。
由于传输网络的终端的限制，多媒体内容受到约束，诸如消息的最大尺寸、空间分辨率、时间分辨率、和动画的编码的类型。
为此，除了消息的文本和发送者的识别号以外，必须考虑多媒体消息要被传送到的终端的类型。
终端类型实际上标识终端的类别(本质上，诸如存储容量、显示尺寸等的特征)和由于传输网络引起的任何其它约束。
将要在按照本发明的系统中产生的MMS消息因此被调节为在施加的约束内最有效地利用可用的资源。
这个要求可以以至少两个不同的方式被满足。
第一种方式规定在步骤204生成的创建MMS消息的请求除了消息的文本和发送者的识别号以外，还包含表示要被生成的消息必须属于的类别的信息，即MMS消息要到的终端的类型以及进而它的性能特征。将要综合SMS文本消息的视频内容然后按照接收终端类型被生成，即，被这样地生成以使得MMS消息(从通过综合所述视频内容与SMS消息而得到的多媒体消息中得出)直接与将要接收多媒体消息的MMS终端的特征兼容。
当这个解决方案被采用时，模块16能够根据接收者的识别号搜索被存储在数据库11中的终端类型信息。在模块16与数据库11之间的连接，按照图1所涉及的准则，可以是通过模块10的直接或间接类型。
得到相同的结果的第二种方式规定多媒体视频内容(将要被加到SMS消息)由模块16根据作为标准的准则被生成，从而与消息将要被发送到的终端的类型无关。
从由SMS文本消息与所述标准多媒体视频内容之间的综合得出的多媒体消息被模块16转发到模块10，该模块10从数据库11读出有关接收终端的信息后，将从多媒体消息得出的MMS消息”专门化”，使它适合于接收终端的特征。
采用一个还是另一个解决方案的选择主要是由应用考虑决定的。
第一个解决方案，至少在原理上，具有不需要生成在消息适合于接收终端的要求时将要被丢弃的信息的优点。然而，这个优点被保证模块16能够接收位于数据库11中的有关终端的类型的信息的需要抵消。
第二解决方案具有这样的优点它利用通常已经为当前的MMS应用提供的在模块10的级别上的数据库11的信息的可用性。在当前的MMS应用中，模块10已经能够达到按照接收终端的特征转发的MMS消息的专门化。然而，上述的优点至少部分地被以下事实减弱这个解决方案需要由模块16生成将要被丢弃的信息。
无论采用哪个解决方案，有可能从以下事实获得好处相同的动画可以在MMS消息中以基本上不同的方式表示。
例如，如上所述，可以利用每秒小数目的帧的动画GIF图像，在这种情形下，每个帧显示由人物在该时刻发音的消息的文本。这个特别紧凑的表示非常适用于其中消息尺寸约束特别严格或当接收终端不能显示视频时的情形。
替换地，可以通过压缩音频利用动画的GIF图像。在这种情形下，合成的语音，连同场情景音频一起，也被包括在消息中。当消息的尺寸足够大能包含运动图像和音频轨道时，这是对于不支持视频但能够处理音频的终端的有用的表示。
另外的替换例通过连同音频一起的视频剪辑表示。在这种情形下，得到的动画由于通过视频编码提供的比动画GIF图像更高的压缩比和动画中经常使用的更高数目的帧而在其运动方面更具有流动性。这种解决方案可以用于能够支持视频编码的终端。
应当强调，以上所述的把消息打包的方法仅仅是例子，它们完全不是按照本发明的解决方案提供的全部可能性。
现在参照图3A和3B描述图1上表示为16的模块的可能的体系结构安排。
方框或模块300旨在于接收实际上由终端18发送的SMS消息作为其输入，以及对其执行从报头提取信息的操作。
如前所述，文本的第一部分由报头表示，该报头包含接收终端(例如，参照图1，终端12、终端13、或终端14)的数目以及任选地包含发送者用户想要使用来生成视频内容的人物和背景的指示。这些数据通过分隔符字符从实际的消息中分隔出。消息可包含影响最终得到的动画的、低或高级别元信息(例如，所谓的情绪标记)。
作为这样的文本的例子，可以考虑以下的字符串“3356121180 Morpheus Country@H1！I’m at the beach-)butI’m getting bored without you，\kyawn.150.”在该例子中，所使用的分隔符是字符@。
与所讨论的消息有关的是发送者的识别号以及，可能地，表示接收终端模型的字符串。
标注数字302表示模块16的数据库，它在基于JoeXpress系统的优选实施方案中包含诸如可被使用来生成视频内容的字符表、与它们有关的语言、可得到的场景等等的信息。数据库302也包含人物和背景的三维模型。
方框300与数据库302共同运行，从消息中提取报头信息，诸如接收者的识别号，以及被使用来创建视频内容的人物和背景。
方框300然后与包含字符表、语音、可得到的背景的数据库302通信，以及如果这些信息在接收的SMS消息的报头中是被省略或是错误的，则方框300自动选择正确的任选项。
方框300在它的输出端处输出以下数据/信息--将要发送到其功能此后将更容易明白的附加方框302的不带有报头的消息文本(“H1！I’m at the beach-)but I’m getting boredwithout you，\kyawn.150.”)；--人物P--动画的主角--的名字(在这里示出的例子中，所述名字是”Morpheus”)，--与人物有关的语言L(例如英语)，--相应于其中放置虚拟人物P的场景的背景A(在这里考虑的例子中，背景是”乡村”背景)，以及--接收者D的识别号(在所示的例子中，由号码3356121180构成)。
从方框300接收消息M的文本开始，方框320把情绪标记变换成能够被信息系统使用的元信息，信息系统同时确定哪个文本将被插入到组成构成模块16的输出的MMS消息的动画的帧中。
所以，方框302的输出由具有低级别信息的文本TBS，即其中情绪标记用低级别元信息代替的文本(“H1！I’m at the beach\ksmile butI’m getting bored without you，\kyawn.150.”)，和其中所有低级别元信息被消除而只保持人物所说的加上情绪标记的文本TE(“H1！I’m atthe beach-)but I’m getting bored without you.”)组成。
由方框302生成的文本TBS被发送到方框304，方框304旨在于提取在文本中包含的动作表以及准备具有由语音合成器306使用的形式的文本，以便还得到与前述的动作有关的定时。
方框304把其中低级别元信息用语音合成器的”标签”代替(文本到语音)的文本TAG发送到合成器306。所述标签是由合成器标识为专门信息的字符序列，以及被使用来改变合成的语音或从合成器306得到与在合成的句子中的标签有关的时刻。所述时刻被使用来确定动作的时序。
方框304也连同任意参数一起生成基本上相应于被包含在文本中的动作表的信号TA作为附加输出。
参照上面几次提到的SMS消息，实际上包含有两个动作，即--微笑，和--打呵欠，150。
参数150修正“打呵欠”动作相对于标准持续时间的持续时间。
语音合成器306通过使用由方框300生成的信号L识别的选择的语言把从方框304接收的文本TAG变换成语音信号。
除了语音信号以外，方框306还产生定时的语音序列FT，被用作为构成讲话的运动的基础。应当想到，定时的语音序列是构成讲出的句子的音素的序列，并被与音素被讲出的时刻综合在一起。
代替地，被表示为V的信号是实际合成的语音信号。
用标注数字308和310表示的方框是监管用于视频内容的人物的讲话的动画和相应的面部和身体动画的机器。
方框308接收语音序列FT作为输入，把它变换成“面部表情标记(visemic)”序列，即，变换成在讲话时由面部产生的运动。为了得到现实的运动，动画机考虑相邻的音素的互相影响结果，所述共同清晰度现象。所产生的运动是三维的，以及相关的输出信号AP由以三维方式和与人物无关地描述讲话的运动的动画参数构成。这意味着，这样的参数可接连地应用于具有任何形状和复杂性的人物，人等。
用作为面部和身体动画机的方框310，根据相应于由被集成在虚拟相加节点312中的方框304生成的信号TA的动作表用由合成器306生成的关于动作的时序的信息运行。
方框310以与包含与人物无关的动画参数的形式的面部和身体运动的序列的附加数据库314合作的方式运行，该动画参数因此在这方面类似于由方框308输出的参数。在本例中，序列”微笑”和”打呵欠”是从数据库314取出的两个运动。
面部和身体310动画方框联合相应于人物必须执行的各种运动的各个动作，创建单个动画参数序列。各个运动根据与其有关的任何参数进行改变。运动也经受强度、持续时间、镜面反射特征等方面的自动变化，以增强多样性。最后，也加上由人物执行的、但没有明显地表示的某些运动，诸如眨眼。
方框310的输出由代表以三维方式与人物无关地描述讲话的运动的动画参数的信号AFC组成。所述参数因此可接连地应用于具有任何形状和复杂性的人物，人等，诸如动物。
被表示为316的接连的方框具有把讲话的运动(信号AP)与其它运动(信号AFC)混合，以得到现实的结果的任务。方框316的运行是基于考虑到正在进行对照的运动的优先级的逻辑，诸如讲出的爆破音素(诸如字母”p”)和打呵欠。最终得到的运动是三维的。
方框316的输出信号由代表与人物无关的动画的信号AIP组成。
信号AIP被馈送到方框318，方框318把独立的动画(信号AIP)变换成根据从方框300提取的信号P选择的人物的运动。最终得到的运动取决于模型的拓扑。正如以前看到的，与人物有关的模型被包含在数据库302中。
方框318的输出信号由识别所选择的人物的运动序列的信号ADP组成。
所讨论的信号ADP被馈送到方框320，方框320把具有来自方框300的背景信息A的信号ADP与关于直接从数据库302取出的人物和背景的附加信息合并。
所有这些是为了也将可以在场景中显示(信号A)并可以借助于文本中的元信息驱动的其余的动画，作为物体的运动或拍摄镜头的观察点的改变加到人物的动画中。
方框320的输出信号由最后的三维动画信号TRD组成，该三维动画信号TRD将要发送到任务为提供操作，即，任务为在屏幕上把由人物和背景组成的三维场景表示为像素矩阵的操作的方框322。以规则的时间间隔得到的所述像素矩阵的序列组成所述方框的输出。提供方框322的输出由被表示为FV的动画的视频帧序列组成。视频帧的采样速率是一个参数，在优选方式下它典型地被设置为25Hz。
信号FV被馈送到附加的方框324作为输入，附加的方框也将要接收具有由方框302生成的情绪标记TE的文本。
方框324在构成产生的视频动画的各个帧之间分发文本。所述操作是任选的以及在生成不带有音频的MMS消息时，即，其中SMS消息以文本和动画的形式被显示的MMS消息时被执行。
方框324的输出由人物和场景的所有运动的组组成。所述信号FVT，实际上相应于具有文本的视频帧序列，被馈送到视频编码方框326，该视频编码方框326将要除了信号FVT以外，还接收有关合成的语音的信号V以及有关接收终端的类型的信息TV作为它的输入。
图3A和3B上显示的实施例涉及其中所述信息在模块16的级别上可得到的解决方案。所述信息总地表示接收终端的牌子和模型名称(例如，Sony Ericsson T68i，Nokia 7650，等等)。
方框326在这种情形下通过以适合于从所讨论的接收终端观看的格式直接创建视频剪辑而进行。视频剪辑对于确定的终端类型的适配，例如影响帧的空间与时间分辨率，影响音频信道是否被插入等等。
这里参考的解决方案因此规定把SMS消息与这样生成的视频内容进行综合，以使得由模块16生成的、最终得到的多媒体消息具有适合于从所述终端观看的格式。
然而，如前所述，按照本发明的解决方案也可以在其中模块16(所以，在这里显示的实施例中的方框326)不实行这种”专门化”的动作的条件下被实施。
在这种情形下，将要补充进入的SMS文本消息的视频剪辑，或一般地说，视频内容，以标准格式被生成，即，不考虑接收终端的特征。
将要使得最后的MMS消息实际上是由接收终端可看见的相关的格式变换然后留给具有MMS中继/服务器功能的模块10(图1)。
在这里显示的实施例中(它事实上是例子)，来自方框326的输出信号然后由基本上类似于以压缩格式的视频剪辑的信号VC组成。
所述信号被发送到方框328，该方框将要用来从在它的输入端处承载的多媒体消息出发，构建相应于MMS标准的消息。
为了这样进行，除了由方框326输出的信号VC以外，方框328在它的输入端也接收相应于具有由方框302生成的情绪标记的文本的信号TE，有关来自方框300的接收者D的信号，以及关于发送者S的信息后一个信息是从图1的中心17按照已知的准则得出的，这里不需要详细说明。
为了生成将要被发送到模块10的MMS消息，方框328把以前计算的视频动画插入在MMS消息中。这优选地通过使用场景说明的SMIL语言和加入包括多个部分的单一形式的各个多媒体对象来进行。
方框328也把有关发送者、接收者和对象的信息插入消息报头中。该对象通过使用组成具有情绪标记的文本的第一人物被自动构成。
优选地，方框328也将要与由要被插入到MMS消息作为“标记”或广告、或作为能够被用作为用于场景的背景音乐或作为广告的叮当声的一系列图像组成的附加数据库330共同运行。
自然地，在不改变本发明的原理的情况下，本发明的实施方案和实施例的细节可以相对于这里纯粹作为例子描述和显示的内容充分地改变，而不会从而背离本发明的范围。这对于应用本发明以把除了由SMS生成的文本消息，例如，电子邮件消息的形式的文本消息，变换成MMS消息文本的可能性，以及对于应用本发明以在不同于UMTS网络上传输MMS消息的可能性来说，尤其如此，但并不具体限于此。
权利要求
1.用于在电信网上传输消息的方法，其特征在于，该方法包括以下步骤-从发送者终端(18)接收(17)文本消息，-综合(16)所述文本消息与视频内容，以生成多媒体消息，以及-把所述多媒体消息以MMS消息的形式发送(10)到至少一个接收终端(12，13，14)。
2.如权利要求1所述的方法，其特征在于，它包括接收(17)SMS消息的形式的所述文本消息的步骤。
3.如权利要求1或2所述的方法，其特征在于，它包括以下步骤-通过识别所述接收终端的特征而识别能够接收所述多媒体消息的接收终端(12，13，14)的类型，以及-使所述MMS消息适合(16，326；10)于所述接收终端(12，13，14)的特征。
4.如权利要求3所述的方法，其特征在于，它包括综合所述文本消息与生成的视频内容(326)，以使得所述多媒体消息适合于所述接收终端(12，13，14)的特征的步骤。
5.如权利要求3所述的方法，其特征在于，它包括以下步骤-用与接收终端(12，13，14)的特征无关地确定的视频内容补充所述文本消息，以及-使由此得到的多媒体消息适合(10)于所述接收终端(12，13，14)的特征。
6.如以前的权利要求的任一项所述的方法，其特征在于，它包括在由以下项目组成的组内选择所述视频内容的步骤-动画的图像，-背景图像，以及-具有可变的观察点的图像。
7.如以前的权利要求的任一项所述的方法，其特征在于，它包括从所述文本消息合成能够与所述多媒体消息内的所述视频内容相联系的语音信号(V)的步骤。
8.如权利要求7所述的方法，其特征在于，它包括生成所述动画图像(308，310)作为讲出相应于所述文本消息的合成的语音信号的人物的图像的步骤。
9.如权利要求8所述的方法，其特征在于，它包括借助于文本动画系统(308，310)生成所述人物的图像的步骤。
10.如以前的权利要求的任一项所述的方法，其特征在于，它包括综合(328)所述消息与背景音乐(330)的步骤。
11.如以前的权利要求的任一项所述的方法，其特征在于，它包括把动画的GIF图像包括在所述视频内容中的步骤。
12.如以前的权利要求6，8，9或11的任一项所述的方法，其特征在于，所述动画的图像是以Hz量级的动画采样速率得到的。
13.如以前的权利要求的任一项所述的方法，其特征在于，它包括鉴于所述文本消息的接收(17)，把用于标识在由以下项目组成的组内选择的所述视频内容的特征的至少一个字段与所述文本消息相联系的步骤-被使用来显示所述文本消息的虚拟人物(P)，以及-所述多媒体内容的背景(A)。
14.如以前的权利要求的任一项所述的方法，其特征在于，它包括在所述发送者终端(18)提供用于选择所述视频内容和所述接收终端(12，13，14)的脚本功能的步骤。
15.如以前的权利要求的任一项所述的方法，其特征在于，它包括在所述发送者终端(18)提供用于自动校正可能被包含在所述文本消息中的任何错误的功能的步骤。
16.如以前的权利要求的任一项所述的方法，其特征在于，它包括把用于选择地修正所述视频内容的特征的元信息与所述文本消息相联系的步骤。
17.如以前的权利要求的任一项所述的方法，其特征在于，它包括把用于选择地修正所述视频内容的特征的情绪标记形式的附加信息与所述文本消息相联系的步骤。
18.如以前的权利要求的任一项所述的方法，其特征在于，所述视频内容是从以下项目中选择的-按帧排序的动画的GIF图像，所述文本消息的各个部分与其相联系，-伴着压缩的音频的动画的GIF图像，以及-连同音频一起的视频剪辑。
19.用于在电信网上传输消息的系统，其特征在于，系统包括-接收模块(17)，用于从发送者终端(18)接收文本消息，-处理组(16)，具有视频信息的至少一个数据库(302，314，330)和用于综合所述文本消息与视频内容以生成多媒体消息的至少一个综合模块(326，328)，以及-发送模块(10)，用于把所述多媒体消息以MMS消息的形式发送到至少一个接收终端(12，13，14)。
20.如权利要求19所述的系统，其特征在于，所述接收模块(17)被配置成从所述发送者终端(18)接收以SMS消息的形式的文本消息。
21.如权利要求19或20所述的系统，其特征在于，它包括-检测模块(300；10)，用于通过识别所述接收终端的特征(TD)而检测要作为所述多媒体消息的接收者的接收终端(12，13，14)的类型，以及-用于使所述MMS消息适合于所述接收终端(12，13，14)的特征的模块(16，326；10)。
22.如权利要求21所述的系统，其特征在于，所述综合模块(326，328)被配置成用于综合所述文本消息与生成的视频内容(326)，以使得所述多媒体消息适合于所述接收终端(12，13，14)的特征。
23.如权利要求21所述的系统，其特征在于，所述集成模块(326，328)被配置成综合所述文本消息和与接收终端(12，13，14)的特征无关地确定的视频内容，以及系统具有与其相联系的用于MMS消息(10)的传输的模块(10)，所述MMS消息(10)被配置成使得所述多媒体消息经受使其适合(10)于所述接收终端(12，13，14)的特征的步骤(10)。
24.如以前的权利要求19到23的任一项所述的系统，其特征在于，它包括至少一个视频生成器模块(302，308，310)，用来生成在以下项目内选择的视频内容-动画的图像，-背景图像，以及-具有可变的观察点的图像。
25.如以前的权利要求19到24的任一项所述的系统，其特征在于，它包括语音合成器(306)，用来从所述文本消息合成能够与所述多媒体消息内的所述视频内容相联系(326)的语音信号(V)。
26.如权利要求25所述的系统，其特征在于，将至少一个运动生成模块(308，310)与所述视频生成模块(302，308，310)和所述语音合成器(306)相联系，以生成所述动画图像作为讲出相应于所述文本信号的合成的语音信号的人物的图像。
27.如权利要求26所述的系统，其特征在于，所述运动生成模块(308，310)是诸如JoeXpress系统那样的文本动画系统。
28.如以前的权利要求19到27的任一项所述的系统，其特征在于，它包括背景音乐的数据库(330)，与所述至少一个综合模块(326，328)共同运行，以综合所述MMS消息与背景音乐。
29.如以前的权利要求19到28的任一项所述的系统，其特征在于，所述综合模块(326，328)被配置成把动画的GIF图像包括在所述视频内容中。
30.如以前的权利要求24，26，27或29的任一项所述的系统，其特征在于，所述综合模块(326，328)被配置成把具有Hz量级的动画采样速率的动画的图像包括在所述视频内容中。
31.如以前的权利要求19到30的任一项所述的系统，其特征在于，所述接收模块(17)包括信息提取方框(300)，用于从所述发送者终端(18)接收的所述文本消息中提取标识在由以下项目内选择的所述视频内容的特征的至少一个字段-被使用来显示所述文本消息的虚拟人物(P)，以及-所述多媒体内容的背景(A)。
32.如以前的权利要求19到31的任一项所述的系统，其特征在于，具有所述至少一个视频信息的数据库(302，314，330)和用来综合所述文本消息与视频内容的所述至少一个综合模块(326，328)的所述处理组(16)被配置成生成在以下项目内选择的多媒体消息-按帧排序的动画的GIF图像，所述文本消息的各个部分与其相联系，-伴有压缩的音频的动画的GIF图像，以及-连同音频一起的视频剪辑。
33.用于如以前的权利要求19到32的任一项所述的系统的发送者终端，其特征在于，所述发送者终端(18)被提供有用于选择所述视频内容和所述接收终端(12，13，14)的脚本功能。
34.用于如以前的权利要求19到32的任一项所述的系统的发送者终端，其特征在于，所述发送者终端(18)被提供有用于自动校正可能被包含在所述文本消息中的任何错误的功能。
35.用于如以前的权利要求19到32的任一项所述的系统的发送者终端，其特征在于，所述发送者终端(18)被提供有用于把选择地修正所述视频内容的特征的元信息与所述文本消息相联系的功能。
36.用于如以前的权利要求19到32的任一项所述的系统的发送者终端，其特征在于，所述发送者终端(18)被提供有用于把选择地修正所述视频内容的特征的情绪标记形式的附加信息与所述文本消息相联系的功能。
全文摘要
本方法包括以下步骤从发送者终端(18)接收(17)文本消息，诸如SMS消息，综合(16)所述文本消息与视频内容，以生成多媒体消息，以及把所述多媒体消息以MMS消息的形式发送(10)到至少一个接收终端(12，13，14)。由此保证传统的移动终端(例如，GSM)与新一代移动终端(例如，UMTS)的可能的共存和互操作。
文档编号G06F13/00GK1685686SQ03822752
公开日2005年10月19日申请日期2003年8月4日优先权日2002年8月14日
发明者吉安尼·L.·古格利厄米, 吉安卢卡·弗兰希尼, 克劳迪奥·兰德, 卢卡·鲍索尼图申请人:意大利电信股份公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吉安尼.L..古格利厄米;吉安卢卡.弗兰希尼;克劳迪奥.兰德;卢卡.鲍索尼图
技术所有人：意大利电信股份公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。