多媒体流和社交网络线程之间的同步的制作方法_3

文档序号:9529478阅读:来源:国知局
IPTV节目上,标题、剧情介绍和/或演员表和作者和制片人可以通过将数据与多媒体内容复用来广播。
[0075]线程提取模块TEM从时间间隔中的用于社交网络线程的描述符的分析中产生社交关键字的列表。每个社交关键字与时间戳相关联。
[0076]多媒体提取模块MEM从与时间间隔相对应的多媒体流的片段的描述符的分析中产生多媒体关键字的列表。每个多媒体关键字与时间戳相关联。
[0077]语义分析模块SAM负责在社交关键字的列表和多媒体关键字的列表中执行语义分析。
[0078]对于每个时间间隔,针对多媒体关键字来计算和使用严格的相似性测量。只要满足下述约束,就可以使用文献的任何相似性度量:
[0079]1)使用例如关于社交关键字的语义分析,对于比较多组多媒体关键字的差异点相似性比率非常高,以及
[0080]2)多媒体关键字预先被过滤以仅选择多媒体关键字的列表中的不同的词。
[0081]例如,术语频率反向文档频率(TF-1DF)或词典可以被用于利用有意义的关键字强调,该有意义的关键字较不频繁发生。因此,严格的相似性测量过程提供了以高相关性概率的可能的同现。相似性的示例包括,例如余弦相似性、或诸如Sorensen-Dice系数的相似性。
[0082]语义分析模块SAM在对多媒体关键字的初始列表进行严格相似性测量之后产生过滤的多媒体关键字的过滤的列表。为此,语义分析模块SAM选择与社交关键字具有高相似性比率的不同的多媒体关键字。对于每个不同的多媒体关键字,“相似”关键字可以在社交线程中出现若干次,并且每个相似的社交关键字可以具有几个事件。
[0083]语义分析模块SAM选择在社交关键字的列表中存在的、并且与过滤的多媒体关键字相似的相似社交关键字。对于过滤的多媒体关键字的过滤的列表中的每个过滤的关键字,选择社交关键字的列表中的至少一个相似社交关键字。相似的社交关键字的其他事件可以出现在社交关键字的列表中;在这种情况下,这些事件也将被选中。假定,相似的社交关键字是具有相似的含义或在语义上接近的关键字。在结束时,每个过滤的多媒体关键字与一组相似的社交关键字相关联。
[0084]检查模块頂通过采用在社交关键字的列表中的相似社交关键字的时间戳和过滤的多媒体关键字的滤波的列表中的过滤的多媒体关键字的时间戳之间的时间差,来计算用于过滤的多媒体关键字的延迟值。延迟值是针对社交关键字的列表中的每个相似社交关键字计算的。
[0085]最后,检查t旲块IM提供关键字的最终列表,每个关键字被与一系列延迟相关联,每关键字的延迟的数目对应于社交关键字的列表中的相似社交关键字的数目。
[0086]检查模块頂识别时间间隔是否合格。如果找到大量(按经验定义)的相关关键字,则时间间隔是合格的。
[0087]为了识别关键字是否被认为是相关的,检查模块頂检查两个标准:
[0088]1/与关键字相关联的延迟的数目大于按经验定义的阈值;以及
[0089]2/延迟分布的熵(例如,方差)低。这意味着,所计算的延迟具有差不多相同的大小。
[0090]然后,检查模块頂可以计算关键字的全局延迟,例如作为与关键字相关联的所有延迟的平均、或作为与关键字相关联的给定数目延迟的平均。
[0091]如果时间间隔被认为是不相关的(即,不存在大量数目的相关关键字),则对于未来同步过程,相关结果和时间间隔被忽略。
[0092]检查模块頂通过与相关关键字相关的不同全局延迟来确定该合格的时间间隔的最终漂移。例如,最终漂移对应于与相关关键字相关的所有全局延迟的平均。
[0093]参考图3,根据本发明的一个实施例的用于控制在多媒体流和相关社交网络线程之间的同步的方法包括在通信系统内执行的步骤S1至S6。
[0094]在步骤S1中,同步设备SD的时间选择模块TSM选择与多媒体流片段相对应的时间间隔。在已经识别相关社交网络线程中的至少一个峰之后时间间隔被识别,该时间间隔在相关的社交网络线程中具有识别的至少一个峰,该时间间隔的结束对应于峰的顶部。
[0095]在步骤S2中,多媒体提取模块MEM确定与对应于时间间隔的多媒体流的一部分相关联的多媒体关键字的列表,每个多媒体关键字与时间戳相关联。
[0096]例如,分析对应于时间间隔的多媒体流的片段,以用于提取显著元素,诸如:用于嵌入式图像和视频的面部、对象和字符识别、用于音频轨道的音乐和声音识别。
[0097]在步骤S3中,线程提取模块TEM确定与对应于时间间隔的社交网络线程的一部分相关联的社交关键字的列表,每个社交关键字与时间戳相关联。
[0098]利用在所考虑的社交网络线程中出现的次数来列出经常出现的关键字。
[0099]在步骤S4中,语义分析模块SAM通过对列表中的关键字使用严格相似性测量来过滤多媒体关键字的列表。在对初始的多媒体关键字的列表进行严格相似性测量之后,语义分析模块SAM产生过滤的多媒体关键字的过滤的列表。
[0100]为此,语义分析模块SAM选择与社交关键字具有高相似性比率的不同的多媒体关键字。假定不同的多媒体关键字在一组多媒体关键字当中相对于其他多媒体关键字具有低出现数目。
[0101]相似性比率可以基于语义分析。
[0102]对于过滤的列表中的每个过滤的多媒体关键字,语义分析模块SAM选择相似于过滤的多媒体关键字的社交关键字的列表中的一组社交关键字。然后,每个过滤的多媒体关键字与一组相似的社交关键字相关联。
[0103]在步骤S5中,检查模块頂通过采用在过滤的多媒体关键字的时间戳和与过滤的多媒体关键字相关联的相似的社交关键字的时间戳之间的时间差,来计算用于过滤的多媒体关键字的延迟值。延迟值可以针对社交关键字的列表中的每个相似的社交关键字来计算。检查模块頂计算每个过滤的多媒体关键字的延迟值。
[0104]检查模块頂提供过滤的多媒体关键字的最终列表,每个过滤的多媒体关键字与延迟的列表相关联,每个过滤的多媒体关键字的延迟的数目对应于社交关键字的列表中的相似的社交关键字的数目。在最终列表中的每个过滤的多媒体关键字可以是多媒体关键字,因为每个多媒体关键字仅在多媒体关键字的过滤的列表中出现一次。
[0105]在步骤S6中,检查模块IM识别时间间隔是否合格。如果找到大量数目的不同的相关过滤多媒体关键字,即如果不同的相关过滤多媒体关键字的数目大于预定义的阈值,则时间间隔是合格的。
[0106]如果与过滤的多媒体关键字相关联的延迟的数目大于给定的阈值,并且如果延迟分布的熵低,则过滤的多媒体关键字被认为是相关的。
[0107]检查模块頂通过与过滤的多媒体关键字相关的延迟来计算过滤的多媒体关键字的全局延迟。
[0108]检查模块頂通过与相关的过滤的多媒体关键字相关的不同延迟,更具体地通过与相关的过滤的多媒体关键字相关的不同全局延迟,来确定用于合格的时间间隔的最终漂移。最终漂移表示在多媒体
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1