识别媒体内容中的报道的制作方法

文档序号:9713562阅读:426来源:国知局
识别媒体内容中的报道的制作方法
【专利说明】
【背景技术】
[0001]在今日总是互联的社会中,形式为现场直播、预录制或点播节目的媒体内容几乎是普遍存在的。例如,24 X 7新闻节目全天提供了连续的现场直播信息流,并且无数预录制媒体源在任何给定时刻例如经由互联网是可访问的。
[0002]可以使用大量不同技术、经由大量通信频道中的任意通信频道来广播、流传送、或另外输送媒体内容。例如,在互联网上流传送的视频媒体的输送通常包括将视频内容编码成一个或多个流传送视频格式,并且高效地向终端用户输送已编码的视频内容。
【附图说明】
[0003]图1是根据在此描述的实施方式的示例性报道识别环境的概念图。
[0004]图2是根据在此描述的实施方式的从媒体内容中识别报道的示例性方法的概念图。
[0005]图3是根据在此描述的实施方式的从媒体内容中识别报道的示例性方法的流程图。
[0006]图4是根据在此描述的实施方式的用于从媒体内容中识别报道的示例性计算机系统的框图。
【具体实施方式】
[0007]海量可应用媒体内容可容易地导致信息超负荷,尤其是如果媒体内容并未以允许用户容易地识别感兴趣的具体内容的方式而良好编组或另外结构化。作为结果,某些内容提供者、内容搜集者、或终端用户可以人工地加标签或者另外对媒体内容分类,例如通过将元数据与内容相关联。这种人工分类尽管相当精确,但可能是相对低效、昂贵和/或耗时的。
[0008]在此描述了用于识别媒体内容中的报道的技术,即便之前尚未如此分类报道。如在此所使用的,术语“报道”通常指媒体内容中与特定主题或一致性概念集相关的一部分。例如,在晚间新闻节目播出期间,一个报道可能描述最近犯罪审判的结果,而另一个报道可能讨论本地商务的成功,以及又一个报道可能涉及天气。根据在此描述的技术,媒体内容(例如新闻节目)被分离成概念性报道(例如包括法律报道、商务报道和天气报道的三种概念上不同的报道)。一旦已经使用所描述的技术识别了报道,可以执行额外的有用处理一例如以概括或分类报道,或者以使报道与媒体内容隔离(例如剪辑),以为了更方便的访问或传输。可以在已经识别了报道之后,对报道应用这些或其它合适的处理技术,以通常使得报道对于终端用户是更加可访问和/或可消费的。
[0009]图1是根据在此描述的实施方式的示例性报道识别环境100的概念图。如所示,环境100包括被配置为执行报道识别引擎112的计算系统110。报道识别引擎112可以通常操作为分析输入的媒体内容102,以及用于识别在媒体内容102中所包括的各个报道114a、114b和114c。如以下进一步详细描述的,报道识别引擎112可以通常通过将媒体内容102划分为片段,分析片段以确定与各个片段相关联的概念,比较不同片段之间的概念以确定不同片段的概念相似性,以及将概念上类似的片段合并为报道,来识别报道。
[0010]环境100的示例性拓扑结构可以代表各个报道识别环境。然而,应该理解的是,仅为了示意说明而示出了环境100的示例性拓扑结构,可以对配置作出各种修改。例如,环境100可以包括不同的或额外的部件,或者可以以不同于所示的方式而实施部件。同样地,尽管计算系统110通常被示为独立服务器,但应该理解的是,计算系统110实际上可以是任何合适类型的计算装置,诸如服务器、大型主机、膝上型计算机、台式计算机、工作站、或其它装置。计算系统110也可以代表计算装置的群组,诸如服务器农场、服务器集群、或者单独地或一起操作以执行在此描述的功能的计算装置的其它群组。
[0011]媒体内容102可以采用任何合适媒体类型的形式,并且可以从任何合适的媒体源提供。可以如在此所描述的进行处理的媒体类型的示例包括但不限于,音频信息(例如无线电广播、电话通话、音频流等),视频信息(例如电视广播、网络广播、视频流等),和/或多媒体信息(例如音频、视频、图形、和/或其它合适内容的组合)。媒体源的示例包括但不限于广播媒体源、流媒体源、在线媒体储存库、独立物理媒体(例如蓝光盘、DVD、小型盘等)等等。
[0012]计算系统110可以包括处理器122、存储器124、接口126、分段模块128、内容分析模块130以及片段合并模块132。应该理解的是,仅为了示意说明目的而示出所示部件,在一些情形中,参照计算系统110的特定模块或部件所描述的功能可以由例如计算系统110或其它合适的计算系统的一个或多个不同的或额外的模块或部件来执行。类似的,应该理解的是,功能的一部分或全部可以组合成比所示更少的模块或部件。
[0013]处理器122可以被配置为处理由计算系统110执行的指令。指令可以存储在非临时、有形的计算机可读存储介质上,诸如在存储器124中或者在分立的存储装置(未示出)上,或者在用于存储使可编程处理器执行在此描述的技术的指令的任何其它类型易失性或非易失性存储器上。可替代地或额外地,计算系统110可以包括专用硬件,诸如一个或多个集成电路、专用集成电路(ASIC)、专用处理器(ASSP)、现场可编程门阵列(FPGA)、或用于执行在此描述的技术的专用硬件的前述示例的任意组合。在一些实施方式中,如合适地,可以将多个处理器与多个存储器和/或多个类型的存储器一起使用。
[0014]接口126可以实施在硬件和/或软件中,并且可以例如被配置为从合适的媒体源(未示出)接收媒体内容102。在一些实施方式中,接口 126可以配置为从一个或多个媒体源定位和/或请求媒体内容102。例如,接口 126可以配置为循环地、定期地和/或随时地从不同的新闻频道或电台捕捉新闻提要,以及提供媒体内容102以供报道识别引擎112处理。接口126也可以被配置为输出供终端用户或其它合适的计算系统(诸如搜索引擎或其它合适的系统)所消费的已处理报道,例如报道114a、114b和/或114c。
[0015]在一些实施方式中,接口126也可以包括允许用户(例如系统管理员)直接地与计算系统110交互、例如人工地限定或修改与报道识别引擎112相关联的设置或选项的一个或多个用户接口。这些设置或选项可以存储在数据库(未示出)中,并且可以由报道识别引擎112使用,以调整与如在此描述的报道识别功能相关联的一个或多个处理参数。示例性的用户接口可以包括触摸屏装置、指示装置、键盘、语音输入接口、视觉输入接口等等。
[0016]分段模块128可以执行在一个或多个处理器(例如处理器122)上,并且可以基于媒体内容102中所包括的听觉指示器而将接收到的媒体内容102分段为多个媒体片段。例如,分段模块128可以分析媒体内容102的音频部分,来识别某些听觉标志(例如给定长度的静默,或特定类型的听觉信号,诸如音乐或特定音调),以识别媒体内容102中的逻辑断裂。在新闻节目的示例中,基于媒体内容102的音频部分中的静默或暂停的分段可以导致与句子和/或段落对齐的片段,因为发言者可能通常在句子和/或段落之间暂停简短片刻。类似的,新闻节目可以包括音乐叮当声、一系列音调、或者指示了在节目部分之间逻辑断裂的其它听觉信号。这些和/或其它合适的听觉指示器可以用于允许分段模块128对媒体内容102进行分段。
[0017]在一些实施方式中,分段模块128也可以或者可替代地使用视觉指示器来对接收到的媒体内容102进行分段。例如,分段模块128可以分析媒体内容128的视频部分,以识别也可以或者可替代地用于识别媒体内容102中的逻辑断裂的某些视觉标志(例如指示了连续视频帧之间显著差异的关键帧,黑色帧,或其它合适的视觉指示器)。当一起采用时,诸如静默的听觉指示器与诸如关键帧的视频指示器组合可以用于精确地且一致性地将媒体内容102分段为合适的媒体片段。
[0018]分段模块128也可以使用其它合适的指示器,以使得或者精细调整媒体内容102的片段为多个媒体片段。例如,媒体内容102的音频部分的语音至文本处理可以提供抄本,其可以例如与如上描述的听觉和/或视觉指示器结合一起用于确定对于片段合适的断裂(例如基于句号或抄本中其它标点符号)。类
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1