多媒体内容的形态转换设备和方法

文档序号：7604948阅读：218来源：国知局

专利名称：多媒体内容的形态转换设备和方法
技术领域：
本发明大体上涉及一种用于自适应地转换多媒体内容的形态(modality)的设备和方法，更具体地，涉及一种系统并综合地访问形态转换的方法，所述形态转换是通用多媒体访问系统中内容自适应转换处理的重要部分。
背景技术：
在用于消费通用多媒体的系统中，内容的自适应转换是一种根据需要提供内容的最佳表述方法的重要处理，其中内容的自适应转换必须支持各种终端和各种网络访问。可以从两个角度考虑内容的自适应转换。一个是将内容从一种形态(例如视频)转换为另一种形态(例如图像)的形态转换。另一种是改变内容的比特率(或质量)而不转换内容的形态的内容代码转换。在许多情况下，经常将术语代码转换(transcoding)用作形态转换的含义。然而，在本发明中，如上所述，为了清楚，区分地使用这两个术语。形态不仅包括例如视频、图像、图形图像、音频和文本等模式，还包括例如MPEG、JPEG和GIF等编码格式。
假设将由多个内容项形成的多媒体文件发送到用户并在终端上消费。为了使文件适于所提供的资源限制(例如，总比特率或总数据量)，在确定引擎(图1的104)中，对于所有内容项，与形态转换的服务质量(QoS)相关的确定必须反映两个基本问题的答案，即，何时应当执行形态转换以及输出内容项的形态是什么。具体地，需要从用户的角度反映了用户偏好的、对这两个基本问题的答案。
如果没有这两个问题的答案，则不能应用适当的形态转换和适于改变内容的内容代码转换技术。迄今为止，还没有能够同时回答这两个问题的系统研究。如标题为“Adapting Multimedia InternetContents for Universal Access”的论文Rakesh Mohan，John R.Smith以及Chung-Sheng Li，“IEEE Trans.Multimedia”，卷1，No.1，第104-114页，1999年3月所述，首先由传统的资源分配问题来表示用于处理这种问题的确定引擎104的确定处理。
Ri和Vi分别是文件中内容项i的资源和内容值。在这种情况下，内容项的资源可以是数据量或比特率，内容值指定了通过内容发送的信息量。通常，Vi是不会相对于Ri减小的函数，并且取决于因人而异的主观估计。由以下等式表示内容值。
Vi＝fi(Ri，Pi，M) (1)在等式1中，将内容值Vi表示为资源Ri、形态支持能力M和用户偏好Pi的函数。在这种情况下，可以将针对内容项i的资源分配表示为以下等式2。
其中∧表示逻辑与。等式2表示用户偏好的条件需要在资源分配中必须首先反映用户尤其希望的形态。例如，当对于信息的视觉表述较弱的视力受损者消费多媒体时，在资源分配中，必须在视频、图像和文本形态之前反映音频形态。
所遇到的问题在于，应当找到满足资源限制Rc和等式2中给出的用户偏好的条件的集合{Ri}。本发明基本上从考虑到用户偏好的形态转换角度来进行该问题的解决。
在传统的访问方法中，内容值根据单分析函数(例如，对数函数)或由产生者或提供者指定的随机曲线，与资源相关。然而，由单分析函数表示的内容值模型不能展示存在于不同形态的内容值之间的相关性。具体地，在内容建模中不能反映用户偏好条件。
此外，在内容形态转换中考虑到用户偏好的传统访问方法不能具体地反映实际情况。例如，假设应当将服务器中的特定视频片段转换并发送到终端，并且终端支持除视频形态以外的所有图像、音频和文本形态。在发送的早期阶段，网络带宽足以将从视频转换而来的图像发送到终端。然而，如果带宽过窄以至于不能在时间已经经过时发送转换后的图像，则需要将视频转换为需要较窄带宽的音频形态。甚至还需要视频到文本的转换。通过以上示例，可以清楚地理解，需要具有转换顺序的形态转换，所述转换顺序取决于由本发明处理的网络带宽的可变特性。
作为另一个示例，假设网络能够发送所有视频、图像、音频和文本的形态。存在用户在使用内容的同时改变其终端的可能性。在用户使用个人数字助理(PDA)的情况下，PDA适于处理图像形态而不是视频形态，并且由于其特性，能够示出绝大多数图像，因此选择视频到图像的转换。然而，如果用户将终端从PDA改变为移动电话，需要视频到音频的形态转换。上述示例示出了在会话转移中，由于终端的不同能力出现的形态转换的必要性。
实际上，用户在短时间内预测临时网络的特性或检查新终端的处理能力是非常困难的。此外，只要出现重要改变就输入形态转换的选择可能对用户造成相当大的不便。对于形态转换，传统方法不能基于用户偏好的灵活和清楚表达来给出解决问题的方法。此外，资源分配方法中的传统研究只集中于内容代码转换，而没有说明何时以及如何确定形态转换，这是对于所有内容项的两个问题。此外，在研究中不能适当地处理用户对于形态转换的偏好。

发明内容
因此，本发明的目的是提供一种设备和方法，用于自动地转换多媒体形态，同时根据资源限制反映用户偏好。
本发明的另一个目的是执行内容值和资源之间关系的建模，并与所述建模相关地表示用户偏好。
本发明包括一种表示内容值和资源之间关系的内容值模型；一种清楚地表达用户偏好的方法，以便提供一种给予用户进行形态转换选择机会的灵活方法；以及一种在多个内容之间分配资源的资源分配方法。此外，本发明使用指定的转换顺序和有关重要性或权重的信息，以便利用用户偏好改变内容值模型。这种访问方法能够处理复杂文件的多个内容，并且不仅通过用户偏好，还通过终端或网络来适应可能出现的不同限制。
为了实现上述目的，本发明提供了一种用于自适应地转换多媒体内容的形态的设备，包括接收多媒体内容、多媒体内容的元数据、对于形态转换的用户偏好以及资源限制并且确定转换形态的时间和方法的引擎；以及根据由确定引擎确定的转换时间和方法来转换输入多媒体内容的形态的引擎。
确定引擎可以包括预测装置，用于利用输入多媒体内容和输入内容的元数据来预测重叠(overlapped)内容模型；修改装置，用于利用对于形态转换的用户偏好来修改重叠内容模型；以及确定装置，用于根据资源限制来确定转换多媒体内容的形态的时间和方法，以便允许按照与修改的重叠内容模型的最大内容值相对应的方式来表示多媒体内容。修改重叠内容模型的装置额外地修改重叠内容模型。确定引擎额外地根据资源限制来确定多媒体内容的比特率，所述设备还包括内容代码转换引擎，用于根据由确定引擎确定的比特率来转换输入多媒体内容的比特率，并以转换的比特率输出内容。
可以按照可扩展标记语言(XML)格式来描述对于形态转换的用户偏好。对于形态转换的用户偏好包括对于一般内容形态转换的用户偏好以及对于特定形态转换的用户偏好。
为了实现上述目的，本发明提供了一种自适应地转换多媒体内容的形态的方法，包括接收来自外部的多媒体内容和多媒体内容的元数据；接收对于形态转换的用户偏好；根据内容的元数据和对于形态转换的用户偏好，自适应地转换输入多媒体内容的形态；以及输出转换后的多媒体内容。可以在还考虑到资源限制的同时来执行形态的自适应转换。
形态的自适应转换可以包括利用输入多媒体内容和输入内容的元数据来预测重叠内容模型；利用对于形态转换的用户偏好来修改重叠内容模型；以及在资源限制下，转换多媒体内容的形态，以便允许按照与修改的重叠内容模型的最大内容值相对应的方式来表示多媒体内容。
为了实现上述目的，本发明提供了一种自适应地转换多媒体内容的形态的设备，包括接收来自外部的多媒体内容和多媒体内容的元数据的装置；接收由形态转换的顺序和权重表示的、对于形态转换的用户偏好的装置；根据内容的元数据和对于形态转换的用户偏好来自适应地转换输入多媒体内容的形态的装置；以及输出转换后的多媒体内容的装置。
为了有助于本发明的理解，需要澄清几个基本术语。多媒体文件是一种多媒体内容项的聚合，而内容项是发送例如新闻或足球比赛等完整信息的实体，可以利用例如视频、图像和文本等手段来表示所述完整信息。即，术语内容项不是指信息的物理载体，而是指信息本身。内容项可以具有多种不同质量和形态的内容版本。内容版本是内容项的物理个体，例如可以是表示足球比赛信息的连续图像、音频文件或文本段落。
下面说明访问处理。向内容项提供连接内容项的内容值和资源的特定内容值模型。在这种情况下，根据用户偏好和终端能力来修改内容值模型。之后，为了在多个内容项之间分配资源，使用了分配资源的方法。当将分配的资源映射到内容值模型时，能够得到适当内容的适当质量和形态。
内容值模型展示了作为由内容传输的信息量的内容值和资源之间的关系。本发明提出了一种被称作重叠内容模型的新内容模型，反映了用户偏好条件，以支持针对形态转换的QoS确定。

图1是根据本发明的自适应转换设备的配置图；图2是示出了图1的确定引擎的示例的配置图；图3是示出了本发明内容项的重叠内容值模型的图；图4是示出了本发明的内容项的最终内容值函数的概念的图；图5是示出了根据本发明的形态曲线的分析函数示例的图；图6是示出了根据本发明由形态能力修改的内容值模型示例的图；
图7是示出了根据本发明基于由用户确定的转换顺序的内容值模型示例的图；图8是示出了基于本发明权重的曲线之间的距离关系的图；以及图9是示出了本发明的处理内容的自适应转换的方法的流程图。
具体实施例方式
下面，将参考附图来详细说明本发明的实施例。在图中，相同的参考数字用于表示相同或相似的部件，或相同或相似的信号。
图1是根据本发明的自适应转换设备的配置图。如图所示，该设备包括三个主要部分，包括确定引擎104、内容形态转换引擎106和代码转换引擎108。
确定引擎104接收多媒体内容和多媒体内容的描述符(元数据)。此外，将对于形态转换的用户偏好的一些其他信息和资源限制(网络或终端)也输入到确定引擎104。为了使适合的内容当呈现给用户时具有最佳值或质量，确定引擎104分析内容描述符、用户偏好和限制，并进行对于形态转换和内容代码转换的最优确定。
内容形态转换引擎106和代码转换引擎108包括具体的描述符，以便根据确定引擎104的指令自适应地转换内容。如果需要自适应地转换内容而无需转换其形态，直接将内容与代码转换引擎108相连。如果需要转换内容的形态，将内容与形态转换引擎106相连，然后送往代码转换引擎108，以便适应需要的输出比特率。
能够离线或在线地连接内容形态转换引擎106和代码转换引擎108。在离线连接的情况下，在自适应转换之前，形态转换引擎106将内容转换为其他形态的内容，代码转换引擎108将形式(formality)内容转换为其他质量的版本(或其他比特率)。在自适应转换处理中，对于每一个输入内容，确定引擎104只选择特定形态或适当质量的版本，以便自适应地得到转换后的输出内容。在在线的情况下，确定引擎104应当学习用于输入内容的适当形态，此时，还学习代码转换格式和输入内容的级别。在这种情况下，形态转换引擎106和代码转换引擎108必须具有较高的计算效率来满足实时转换的需要。
在该系统中，需要以如XML等结构化形式来表示偏好信息，以便用户偏好的清楚表达和应用。表1是示出了本发明以XML形式给出的形态转换的用户偏好描述符。

图2是示出了根据本发明实施例的图1的确定引擎的配置图。如图所示，确定引擎104包括重叠内容模型预测单元202、重叠内容模型修改单元204和形态转换确定单元206。
重叠内容模型预测单元202通过网络接收来自外部的多媒体内容和用于多媒体内容的描述符(或元数据)，并利用多媒体内容和描述符来预测重叠内容模型。重叠内容模型修改单元204利用对于形态转换的用户偏好，修改在重叠内容模型预测单元202中产生的重叠内容模型。形态转换确定单元206根据资源限制来确定转换多媒体内容的形态的时间和方法，以便按照与修改的重叠内容模型的最大内容值相对应的形式来表示多媒体内容，并输出表示时间和方法的数据。此外，重叠内容模型修改单元204能够根据用户的终端类型来修改重叠内容模型。
图3示出了表示资源和用于内容项修改的内容值之间关系的重叠内容值模型。由内容提供者指定用于每一个形态的曲线，或由分析函数提供。形态曲线上的每一个点与形态的版本相对应。在该模型中，曲线的数目是内容项具有的形态的数目。
如图4所示，由重叠模型的上部轮廓来表示最终内容值函数，交叉点表示形态之间的边界。如果给定内容项的已分配资源，则能够容易地找到适当的形态和内容项的内容值。
内容值当然是主观值。内容值不仅取决于资源的量，还根据用户而变化。本发明首先考虑内容值和资源之间的相关趋势，此外，还考虑内容值对于用户的依赖性。下面，根据用户偏好和终端支持的形态来改变上部轮廓。
Vi＝max{VMij}，j＝1…K(3)在等式3中，Vi是内容项的内容值，VMij是用于内容项i的形态j的内容值曲线。在这种情况下，j＝1…K，K是用于内容项i的形态的数目，且必须满足VMij≥0。
当然，形态的曲线可以是随机的。然而，如果能够找到每一个形态中建模内容值的可接受分析函数，则该函数会更加有效。在标题为“Adapting Multimedia Internet Contents for UniversalAccess”的论文，Rakesh Mohan，John R.Smith以及Chung-ShengLi，“IEEE Trans.Multimedia”，卷1，No.1，第104-114页，1999年3月中，将自然对数函数(In)用于连接内容值和资源，而与内容的形态无关。
V＝a*ln(R) (4)在等式4中，V是内容值，R是资源，a是比例因子。然而，考虑资源增加到无限大的特定情况。实际中显而易见的是，用户的认知信息是有限的。然而，对数函数其本质上具有无限内容。
本发明提出了一种如等式5所示的简单分析函数，用于每一个形态的曲线。
对于Ri≥bij，VMij＝aij(Ri-bij)/(Ri-bij+cij) (5)图4示出了在等式5中的aij等于1、bij等于50以及cij等于100的情况下的分析函数。从图4中，可以理解，a是函数的上限，b是函数的起始点，c调整函数的倾斜度。在使用分析函数的情况下，通过调整参数a、b和c来建模其他内容。可以按照各种方式来扩展分析函数，以适应特定内容形式的复杂内容值模型。
处理重叠内容模型以外，本发明还提供了一种能够根据用户的观点来控制形态转换的各种形式的函数。本发明提供了一种清楚表达用户的各种形态转换偏好的具体方法。
对于用户偏好的清楚表达，考虑两种情况。一种是用户希望对于具有特定形态的一般内容进行自适应转换的情况，另一种是用户希望仅对特定内容进行形态转换的情况。因此，在本发明中，独立地考虑一般内容和特定内容。
在一般内容的形态转换情况下，用户没有内容细节的信息。因此，用户不能根据内容的细节来指定形态转换的不同类型，而只能执行统一的形态转换。属于一种特定形态的所有内容具有被转换为指定形态的相同可能性。例如，通常选择将图像形态转换为音频形态，但是听力受损的用户选择图像形态到文本形态的转换，而不是音频形态，这与内容的细节无关。
其次，在用于特定内容的形态转换情况下，用户已经具有内容的信息。因此，在这种情况下，用户能够针对具有相同形态的特定内容对象来执行不同类型的选择转换。例如，在用户已知以视频形态形成特定内容的情况下转换音乐会视频时，将音乐会视频转换为音频。可以将视频形态的其他剩余内容转换为图像或文本形态的内容。
将用户偏好的指定分为两个步骤，以便处理上述两种情况。首先，用户指定将形态转换为可转换形态的相关顺序。其次，对于形态转换的每一种类型，用户在数字上指定表示用户偏好的重要性或权重。注意以下事实重要性或权重不是指内容项的重要性或权重，而是内容项中形式转换的重要性或权重。
即，第一步骤在质量方面与用户偏好的清楚表达相对应，而第二步骤在数量方面与用户偏好的清楚表达相对应。当然，用户在第一步骤只指定了顺序，然后，能够在指定重要性的第二步骤隐含地使用默认值。如上所述指定的转换顺序使确定引擎104能够确定当需要执行形态转换时将其转换为何种形态。此外，用于指定转换的重要性信息使确定引擎104能够确定何时执行形态转换。即，重要性信息用于根据其比例调整每一个形态的内容值曲线。
例如，与相对于视频形态的形态转换顺序相关，可以将视频到视频的转换指定为第一，将视频到图像的转换指定为第二，将视频到音频的转换指定为第三，以及将视频到文本的转换指定为第四。与形态转换的权重相关，可以将视频的不转换指定为“1.5”，将视频到图像的转换指定为“1.0”，将视频到音频的转换指定为“1.0”，并且将视频到文本的转换指定为“1.0”。如示例所示，在视频的不转换的权重相对于其他较高的情况下，视频的不转换在较长时间内持续，因此下一轮次的视频到图像的转换出现相对较晚。
内容项的内容值模型是自适应转换处理中的重要附加输入值。内容值模型的改变引起自适应转换处理中输出改变的结果。
在自适应转换处理中，需要考虑终端支持的形态和用户偏好。这种限制用于改变内容值模型，并且能够根据限制来适当地改变输出。此外，需要资源分配算法与输入信息尽可能地保持独立。这种独立使自适应转换处理模块化。为了定义，说明根据终端特性和用户偏好的改变内容值模型的顺序。
首先，考虑终端的形态支持特性。在终端不支持特定形态的情况下，在终端中不处理其形态不被支持的内容。该内容的内容值是零。即，应当从自适应转换处理中去除其内容值不被支持的内容值。等式6包括上述内容。
Vi＝max{VMij}，其中j是支持的形态 (6)图6示出了不支持音频形态情况下的示例。去除了音频形态的曲线，结果，由文本和图像形态的曲线代替了音频曲线。
其次，在形态转换中，考虑对于转换顺序的用户偏好。实际上，在之前定义的内容值模型中，已经确定了转换顺序。但是在这种情况下，不是内容用户而是内容提供者来分配所定义的顺序。例如，如图4所示，作为原始形态的视频可能具有其中将视频转换为视频的顺序，即，视频的不转换是第一，视频到图像的转换是第二，视频到音频的转换是第三，且视频到文本的转换是第四。
用户能够根据由内容提供者提供的传统信息来改变转换顺序。在检查已有转换顺序的信息和基于用户偏好的新转换的信息之后，如果存在其在已有转换顺序中的次序在基于用户偏好的转换顺序中次序之前的形态转换，按照去除与所述形态转换相对应的曲线的方式来执行内容值模型的修改。
例如，图4中对于内容项的用户偏好具有视频的不转换是第一，视频到音频的转换是第二，视频到图像的转换是第三，且视频到文本的转换是第四的顺序。在这种情况下，与已有一般转换顺序相比，执行以下形态转换保持视频的不转换、去除视频到图像的转换、保持视频到音频的转换以及保持视频到文本的转换。结果，如图7所示，构造了一个新的内容值模型。
第三，考虑形态转换中的重要性信息。如图8所示，重要性信息用于调整形态的内容值曲线之间的距离(dij)。内容值曲线之间的距离调整影响了曲线的交叉点或边界的改变。如果增大形态的重要性，将其中执行转换的区域增加交叉点的变化量。在这种情况下，应当注意距离(dij)的总和是固定的，并且与内容项i的最大内容值一致。
如果Wij是用于内容项i的转换j的重要性信息，由等式7计算调整的距离。
d’ij＝wij*dij(7)新计算的距离(d’ij)的相对距离反映了用户的偏好。然而，需要重新调整距离，以便使距离的总和不变，并利用等式8来进行重新调整。
dijs=wijdijΣidijΣjwijdij---(8)]]>在等式8中，ds是最终调整的距离。即，结果是已知Σjdij=Σjdijs.]]>图9是示出了根据本发明的自适应转换多媒体内容的形态的方法的流程图。在步骤901，利用输入多媒体内容和内容的描述符来预测用于内容项的重叠内容值模型。在步骤906，参考终端支持的形态能力904，通过去除其形态不被支持的内容值的曲线来初步修改预测内容值模型902。然后，参考对于内容提供者的形态转换的用户偏好908，检查基于传统转换序列和用户偏好的转换顺序信息。作为检查结果，如果传统转换顺序在根据用户偏好提供的顺序之前，在步骤910，去除与该转换相对应的形态曲线，并根据基于用户偏好的转换重要性信息，调整剩余曲线的距离值，从而产生最终转换的内容值模型912。
可以认为上述处理是在自适应内容转换中利用终端特性信息和用户偏好的示例。此外，内容提供者能够找到至于特定应用的方法并应用该方法。
此外，在本发明中，在步骤916执行针对所有内容项的资源分配，同时给出重叠内容值模型和资源限制914。自适应转换文件向用户分配最优值。在步骤920，根据步骤918的分配内容项的资源，将资源映射到最终转换的文件。因此，在步骤922将内容转换为具有最优形态和质量的内容。
资源分配的问题已经讨论了数十年，能够通过两种基本方法来解决该问题。两种基本方法之一是拉格朗日法，另一种是动态编程法。在标题为“Adapting Multimedia Internet Contents for UniversalAccess”的论文，Rakesh Mohan，John R.Smith以及Chung-ShengLi，“IEEE Trans.Multimedia”，卷1，No.1，第104-114页，1999年3月中，将拉格朗日法用于找出分配适当资源量的内容版本。然而，由于该方法利用如自然对数函数等单凹形曲线来建模内容值，只能将该方法应用于凹形内容值模型。如果内容值模型具有凸形曲线，由凹形曲线来代替该模型。
在支持形态转换的内容自适应转换的应用中，需要将多种限制添加到动态编程法中。首先，当用户选择多个转换形态(例如，视频到音频的形态转换)时，动态编程法通常搜索资源的整个范围。即使在内容值是零的情况下，还执行资源搜索。在这种情况下，作为搜索的结果，能够提取其内容值是零的多个内容项。这表示已经删除了内容项，并且最终表示结果不同于用户所希望的结果。为了避免这种情况，限制搜索的范围，以便只有当内容值不是零时才进行搜索。
其次，动态编程的搜索结果可能不是唯一解决方案。其他解决方案能够将内容项的形态转换为不同的形态。例如，如果存在两项，在第一解决方案中，假设一个内容项具有视频形态，另一个内容项具有较低质量的图像形态。在第二解决方案中，假设所有这两个内容项都具有高质量的图像形态。在两个解决方案中，即使用户最初偏好视频，即，用户偏好第一解决方案，两种方法具有相同的内容值，因此不能确定选择哪一个。因此，在搜索之后，根据动态编程法，设置了必须检查用户偏好的限制。因此，选择适于用户偏好的、具有较高形态转换次序的内容项的解决方案作为最终解决方案。
工业应用性根据本发明，通过将用户的偏好应用于内容的形态转换处理，不仅根据终端和网络的特性，还根据用户的个人形态转换偏好特性来进行内容的最优形态转换，以便能够有效地实现通用多媒体访问。因此，偏好特定内容形态的用户能够根据用户的偏好，消费在一般资源分配中不能消费的内容形态。作为示例，通过允许视力或听力受损而不能消费特定形态的人具有形态选择的权利，能够有效地使用本发明。因此，由于本发明满足作为媒体国际标准的MPEG-7和MPEG-21的数字项自适应转换部分的原理，本发明能够提供与这种系统的可交换性。
权利要求
1.一种用于自适应地转换多媒体内容的形态的设备，包括接收多媒体内容、多媒体内容的元数据、对于形态转换的用户偏好以及资源限制并且确定转换形态的时间和方法的引擎；以及根据由确定引擎确定的转换时间和方法来转换输入多媒体内容的形态的引擎。
2.根据权利要求1所述的设备，其特征在于，所述确定引擎包括预测装置，用于利用输入多媒体内容和输入的内容元数据来预测重叠内容模型；修改装置，用于利用对于形态转换的用户偏好来修改重叠内容模型；以及确定装置，用于根据资源限制来确定转换多媒体内容的形态的时间和方法，以便允许按照与修改的重叠内容模型的最大内容值相对应的方式来表示多媒体内容。
3.根据权利要求1所述的设备，其特征在于，修改重叠内容模型的装置额外地修改重叠内容模型。
4.根据权利要求1所述的设备，其特征在于，确定引擎额外地根据资源限制来确定多媒体内容的比特率；以及所述设备还包括内容代码转换引擎，用于根据由确定引擎确定的比特率来转换输入多媒体内容的比特率，并以转换后的比特率输出内容。
5.根据权利要求1所述的设备，其特征在于，由形态转换的顺序和权重来表示对于形态转换的用户偏好。
6.根据权利要求1所述的设备，其特征在于，按照可扩展标记语言(XML)格式来描述对于形态转换的用户偏好。
7.根据权利要求1所述的设备，其特征在于，对于形态转换的用户偏好包括对于一般内容形态转换的用户偏好以及对于特定形态转换的用户偏好。
8.根据权利要求1所述的设备，其特征在于，对于形态转换的用户偏好包括对于视频形态转换的偏好、对于图像形态转换的偏好、对于音频形态转换的偏好以及对于文本形态转换的偏好。
9.一种自适应地转换多媒体内容的形态的方法，包括接收来自外部的多媒体内容和多媒体内容的元数据；接收对于形态转换的用户偏好；根据内容的元数据和对于形态转换的用户偏好，自适应地转换输入多媒体内容的形态；以及输出转换后的多媒体内容。
10.根据权利要求9所述的方法，其特征在于，由形态转换的顺序和权重来表示对于形态转换的用户偏好。
11.根据权利要求9所述的方法，其特征在于，按照XML格式来描述对于形态转换的用户偏好。
12.根据权利要求9所述的方法，其特征在于，对于形态转换的用户偏好包括对于一般内容形态转换的用户偏好以及对于特定形态转换的用户偏好。
13.根据权利要求9所述的方法，其特征在于，对于形态转换的用户偏好包括对于视频形态转换的偏好、对于图像形态转换的偏好、对于音频形态转换的偏好以及对于文本形态转换的偏好。
14.根据权利要求13所述的方法，其特征在于，对于视频形态转换的偏好包括对于视频到图像形态转换的偏好、对于视频到音频形态转换的偏好、对于视频到文本形态转换的偏好以及对于不转换的偏好。
15.根据权利要求13所述的方法，其特征在于，对于图像形态转换的偏好包括对于图像到音频形态转换的偏好、对于图像到文本形态转换的偏好以及对于不转换的偏好。
16.根据权利要求13所述的方法，其特征在于，对于音频形态转换的偏好包括对于音频到文本形态转换的偏好以及对于不转换的偏好。
17.根据权利要求13所述的方法，其特征在于，对于文本形态转换的偏好包括对于文本到音频形态转换的偏好以及对于不转换的偏好。
18.根据权利要求9所述的方法，其特征在于，还包括额外地接收资源限制，其中在额外地考虑资源限制的同时来执行形态的自适应转换。
19.根据权利要求18所述的方法，其特征在于，形态的自适应转换包括利用输入多媒体内容和输入的内容元数据来预测重叠内容模型；利用对于形态转换的用户偏好来修改重叠内容模型；以及在资源限制下，转换多媒体内容的形态，以便允许按照与修改的重叠内容模型的最大内容值相对应的方式来表示多媒体内容。
20.一种自适应地转换多媒体内容的形态的设备，包括接收来自外部的多媒体内容和多媒体内容的元数据的装置；接收由形态转换的顺序和权重表示的、对于形态转换的用户偏好的装置；根据内容的元数据和对于形态转换的用户偏好来自适应地转换输入多媒体内容的形态的装置；以及输出转换后的多媒体内容的装置。
全文摘要
本发明涉及一种系统并综合地访问形态转换的方法，所述形态转换是通用多媒体访问系统中内容自适应转换处理的重要部分。本发明提供了一种解决在形态转换时所遇到的、并且在自适应内容转换期间仍然是所遇到的难题之一的问题的有效方法。因此，本发明包括新提出的重叠内容建模，以确定形态转换；一种灵活并清楚地表达用户偏好并将其应用于形态转换的方法；以及一种根据用户偏好在复杂内容中分配资源的资源分配方法。结果，以上三种方法的整合提供了一种具体用于形态转换中所遇到的问题的综合解决方案，并且一般地，用于在内容自适应转换中所遇到的问题。
文档编号H04N7/173GK1748210SQ200480004100
公开日2006年3月15日申请日期2004年2月13日优先权日2003年2月13日
发明者鲁勇满, 郑庸柱, 洪镇祐, 南济镐, 金镇雄申请人:韩国电子通信研究院, 韩科技术株式会社, 韩国情报通信大学校产学协力团

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：鲁勇满;郑庸柱;洪镇祐;南济镐;金镇雄
技术所有人：韩国电子通信研究院;韩科技术株式会社;韩国情报通信大学校产学协力团
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。