利用隐藏字幕信息来计量内容曝光的方法和装置的制作方法

文档序号：7677446阅读：97来源：国知局

专利名称：利用隐藏字幕信息来计量内容曝光的方法和装置的制作方法
技术领域：
本发明总体上涉及内容曝光(content exposures)的计量，更具体地说，涉及利用隐藏字幕信息来计量内容曝光的方法和装置。
背景技术：
可以通过收集、识别和/或提取嵌入到正在呈现的内容中的观众测量码来计量媒体内容的曝光。内容提供商(例如，电视和/或无线电广播公司)通常将这种观众测量码插入、嵌入和/或其他方式放置到内容中，以便于识别内容。可替代地或者附加地，可以通过收集表示内容的签名来测量内容的曝光。通过将在内容呈现期间收集的一个或更多个观众测量码和/或签名与已知观众测量码和/或签名的数据库进行比较，可以测量出特定内容段对于一个或更多个人、受众和/或家庭的曝光。

图1是利用隐藏字幕信息来计量内容曝光的示例系统的示意性例示。图2例示了实现图1的示例内容曝光计量的示例方式。图3是在给定时段期间最可能呈现和/或消费的电视频道的示例直方图4是观众测量码和线索数据的示例表。图5例示了实现图1的示例处理服务器的示例方式。图6是表示可以执行为实现图1的示例内容曝光计量器的示例处理的流程图。图7是表示可以执行为实现图1的示例处理服务器的示例处理的流程图。图8是可用于和/或编程为执行图6和/或图7的示例处理以实现图1 的示例内容曝光计量器和/或示例处理服务器的示例处理器平台的示意图。具体头^^方式图1例示了根据本发明的教导构造的、利用隐藏字幕(closed caption) 信息来计量内容曝光的示例系统。图1的示例系统计量a)在广播内容时正在呈现和/或消费的内容和/或b)在广播内容时没有呈现和/或消费的内容(例如，系统计量先前在广播时记录并且在稍后呈现(即，时间后移收看)的正在呈现和/或消费的内容)。为了计量内容曝光，图1的示例系统使用了隐藏字幕信息和/或内容识别符。如这里使用的，"内容识别符" 是与一段内容相关联、嵌入一段内容、从一段内容推断出和/或插入到一段内容中的可用于识别该段内容的任何类型的数据和/或信息。观众测量码(例如，内容提供商(例如，电视和/或无线电广播公司)嵌入到内容中以便于对内容进行识别的音频码、音频水印、视频水印、垂直消隐间隔(VBI: vertical blanking interval)码、图像水印和/或任何其他水印)、比特流中的公共或私有识别符、隐藏字幕信息、元数据、签名或任何其他类型的数据都可以用作内容识别符。观众在回放期间通常注意不到内容识别符，但是这种情况并不是绝对的。对于当前正在广播的内容，图1 的示例系统利用观众测量码和/或签名来识别正在呈现和/或消费的内容 (例如，音频、视频、图像和/或其他)。具体地说，可以将收集的观众测量码和/或签名与表示已知内容的观众测量码和/或签名的数据库进行比6较，以便于识别正在呈现的内容。类似地，对于之前记录的内容，示例系统也可以利用观众测量码和/或签名来识别呈现的媒体内容。由于根据之前记录的内容确定的观众测量码和/或签名可能相对于观众测量码和/或签名的基准数据库存在很大的时间偏移，因此将观众测量码和/或签名与数据库匹配以确定正在呈现和/或消费什么内容可能变得困难和/或耗时。因而，图1的示例系统在呈现和/或消费内容时，禾廿用隐藏字幕信息来识别最可能呈现的内容。如下所述，然后在将根据之前记录的内容确定的观众测量码和/或签名与观众测量码和/或签名的数据库匹配期间使用该可能的内容信息。具体地说，该可能的内容信息可以使得能够将提取的和/或确定的观众测量码和/或签名与观众测量码数据库的较小子集进行比较。还可以利用隐藏字幕信息和/或可能呈现和/或消费的内容信息来计量当前正在广播的内容。为了接收、播放、收看、记录和/或解码任何类型的内容，图l的示例系统包括诸如机顶盒(STB: settopbox)、数字视频记录器(DVR: digital video recorder)、录像机(VCR: video cassette recorder)、个人计算机(PC)、游戏控制台、电视、媒体播放器等的任何类型的媒体设备105。示例内容包括电视(TV)节目、电影、视频、商业节目、广告、音频、视频、游戏等。在图1的示例系统中，示例媒体设备105经由例如以下任何类型的源接收内容卫星接收器和/或天线110;经由任何类型的有线电视信号和/或地面广播接收的射频(RF)输入信号115;诸如因特网120的任何类型的数据通信网络；例如硬盘驱动器(HDD)、 VCR卡带、数字通用光盘(DVD)、致密盘(CD)、闪存设备等的任何类型的数据和/或媒体存储器125。在图1的示例系统中，内容(与其源无关)可以包括隐藏字幕信息和/或数据。可替代地或者附加地，可以与其自身的内容分开地提供和/或接收隐藏字幕信息和/或数据。媒体设备105和/或内容曝光计量器 150可以使这样的分开接收的隐藏字幕信息和/或数据与内容同步。为了提供和/或广播内容，图1的示例系统例如包括电视台、卫星广播公司、电影制片厂等的任何类型和/或数量的内容提供商130。在图1 所示的示例中，内容提供商130经由使用卫星发射器135和卫星和/或卫广播、有线电视广播、因特网120和/或媒体存储器125向示例媒体设备105传递和/或提供内容。为了计量内容的曝光和/或消费，图1的示例系统包括内容曝光计量器150。图1的示例内容曝光计量器150从示例媒体设备105接收音频数据155和/或视频数据160。示例内容曝光计量器150还接收任何类型的内容指南信息和/或数据165。可以经由因特网120、卫星输入、RF输入 115、媒体设备105和/或媒体存储器125将内容指南数据165广播和/或传递到内容曝光计量器150或由内容广播计量器150下载和/或以其他方式接收。在一些示例中，内容指南数据165例如是包含针对任何天数的和/或为内容曝光计量器150的地理位置(例如，邮递或邮政区号)定制的电视节目信息(例如，电视指南列表)的可扩展标记语言(XML)文件。图1的示例内容曝光计量器150例如可以是(a)PC; (b)可以通过示例媒体设备105实现、在示例媒体设备105中实现和/或以其他方式与示例媒体设备105相关联，禾口/或c)在PCT专利申请PCT/US2004/000818 中描述的XML数据收集服务器，以引证的方式将该申请的全部内容并入于此。以下关于图2对实现示例内容曝光计量器150的示例方式进行说明。并关于图6对执行为实现示例内容曝光计量器150的示例处理进行说明。如以下关于图2、图3和图6所述的，图1的示例内容曝光计量器 150使用内容指南数据165和/或从内容指南数据165得到的数据、以及例如从视频数据160得到的隐藏字幕信息来识别例如可能正在媒体设备 105和/或经由媒体设备105呈现(例如，收看)的一个或更多个电视节目和/或电影。如下所述，为了使得能够测量内容曝光，图1的示例内容曝光计量器150收集和/或生成可用于识别正呈现的内容的观众测量码和/ 或签名。在与内容广播的时间不同步地呈现和/或消费内容的情况下(例如，先前在广播时记录呈现和/或消费的内容并且当前正在媒体设备105 和/或经由媒体设备105回放)，示例内容曝光计量器150利用隐藏字幕信息和内容指南信息(例如，电子节目指南(EPG: electronic program guide) 信息)来识别一组潜在的候选内容中的哪个内容表示最可能呈现给调查对象/用户/家庭成员的内容。示例内容曝光计量器150还可以利用隐藏字幕信息来识别正在呈现和/或消费哪个当前广播的内容。当例如在媒体设备105和/或经由媒体设备105存储和/或记录内容时，还存储任何所包括的和/或关联的隐藏字幕信息和/或数据。例如，如果所接收到的内容包含嵌入的隐藏字幕信息，则根据正在记录的内容来保存隐藏字幕信息。当执行内容计量时，图1的示例内容曝光计量器150将内容呈现发生的时间划分为一组呈现时间间隔(例如，30秒)并且对各时间间隔确定最可能呈现和/或消费的内容。取决于期望的要执行的计量的间隔大小，时间间隔可以具有任何持续时间。另外，时间间隔的持续时间可以是固定的或可变的。对于各呈现时间间隔，图1的示例内容曝光计量器150为处理服务器175提供表示现在和/或过去最可能呈现的内容段的候选内容排序表。处理服务器175可以与内容曝光计量器150在位置上分离和/或可以与示例内容曝光计量器150位于同一位置。在图1的示例中，将候选内容排序表作为内容曝光线索(hint)列表170A提供给处理服务器175。在图1 的示例中，根据与各给定线索相关联的候选内容是在感兴趣的时间间隔期间呈现和/或消费的内容的概率来对线索170A进行排序，并且线索 170A例如可以包括三个或四个最可能的项目。处理服务器175可以从可能按地区分配的任何数量的内容曝光计量器150接收并处理内容曝光线索170A。如下面关于图2所述，示例内容曝光计量器150还从音频数据 155收集任何类型的观众测量码和/或签名(统一为观众测量数据170B)。将观众测量数据170B与内容曝光线索170A—起提供给处理服务器175。以下关于图4对由内容曝光计量器150用来向处理服务器175提供线索 170A和观众测量数据170B的示例表进行说明。可附加地或替代地，线索170A和观众测量数据170B可以被格式化为XML文件。音频测量数据170B可以包括和/或表示视频码、视频签名、图像码、图像签名等。为了简化说明，以下的公开涉及使用任何类型的码和/或签名作为观众测量数据170B。为了方便创建线索170A以识别与内容广播的时间不同步地呈现和/或消费的内容(例如，之前记录的内容)，示例内容曝光计量器150存储和/或保留内容指南数据165 (例如，EPG数据)和/或从在之前时段期间
(例如，过去的14天内)收集的内容指南数据165得到的数据。这样，如下所述，内容曝光计量器150可以使用当前收集的和/或之前收集的内容指南数据165和/或从当前收集的和/或之前收集的内容指南数据165得到的数据来识别在媒体设备105和/或经由媒体设备105呈现(例如，显示、收看和/或收听)的内容。在所示的示例中，由示例内容曝光计量器 150保留内容指南数据165和/或从内容指南数据165得到的数据的时段是示例处理服务器175被编程为计算和/或制表关于内容曝光的统计的时段。
在图1所示的示例中，将线索170A和观众测量数据(例如，码和/ 或签名)170B偶然地、周期性地、或实时地从内容曝光计量器150提供给处理服务器175。可以使用从示例内容曝光计量器150向示例处理服务器175下载和/或传送数据的任何类型的技术。例如，可以经由因特网120、公共交换电话网(PSTN) 180和/或专用网络来传送线索170A和观众测量数据170B。可附加地或替代地，示例内容曝光计量器150可以周期性地或非周期性地将线索170A和观众测量数据170B存储到任何类型的非易失性存储介质(例如，可记录致密盘(CD-R))上，将线索170A和观众测量数据170B传输(例如，拾取、邮寄等)到处理服务，并接着加载到示例处理服务器175上。
图1的示例处理服务器175利用从示例内容曝光计量器150接收到的线索170A和观众测量数据170B来确定在示例媒体设备105和/或经由示例媒体设备105呈现和/或消费哪个内容，以形成媒体设备105和/或一个或更多个媒体设备105的集合的内容曝光数据。例如，处理服务器175 利用线索170A来更有效地对由内容曝光计量器150收集的观众测量数据 (例如，码和/或签名)170B与在处理服务器175存储和/或可用的观众测量数据(例如，码和/或签名)的数据库进行比较。如上所述，在示例处理服务器175的观众测量数据的数据库理想地表示全部内容的大部分，从而增加了准确识别在示例媒体设备105呈现和/或消费的任何内容的可能性。然而，数据库越大，执行在数据库中存储的所有观众测量数据的搜索以识别匹配所需要的处理能力就越大。图1的示例处理服务器175
例如可以从内容提供商130接收观众测量数据和/或确定在处理服务器 175接收到的和/或由处理服务器175接收到的内容185的观众测量数据。另外，由数据库中存储的观众测量数据表示的内容可以包括已经广播和/ 或将要广播的内容和/或还没有广播但是用户经由DVD、 VCR或其他存储介质可用的内容。示例处理服务器175可以使用线索170A来限制必须比较的观众测量数据量，从而处理来自相当大数量的内容曝光计量器150 的内容曝光计量信息170B。以下关于图5对示例处理服务器175进行说明。并关于图7对可以执行为实现示例处理服务器175的示例处理进行
图1的示例处理服务器175组合了对与多个受众相关联的多个被计量的媒体设备105确定的内容曝光数据，以形成有意义的内容曝光统计。例如，所示示例的处理服务器175使用组合后的内容曝光数据来确定整体效果、影响范围和/或通过使用任何类型的统计方法处理收集的数据来对收看的内容进行观众人口统计。
图2例示了实现图1的示例内容曝光计量器150的示例方式。为了处理内容指南数据165，图2的示例内容曝光计量器150包括任何类型的索引引擎205。示例索引引擎205实施任何方法、算法和/或技术来处理包含多个记录的XML文件。对该XML文件进行处理使得创建识别对由 XML文件表示的多个记录进行区分的关键词的索引。考虑包含电视指南列表的示例XML文件，在该电视指南列表中，XML文件中的各记录代表单独的电视节目。XML文件中的各记录包含关于电视节目的数据，例如广播电视节目的频道号、与广播电视节目的频道相关联的名称、电视节目的节目名称、电视节目的内容描述以及要广播电视节目的时间。示例索引引擎205对XML数据编排索引以移除尽可能多的冗余信息，同时保留对区分列出的电视节目有用的关键词。例如，考虑具有名称和/或描述中包括"新闻"的多个电视节目的6-6: OIPM时隙。因为术语"新闻" 是"局部共用的"(例如，在相关时段中出现在第二节目中)，因此图2的示例索引引擎205在索引的关键词列表中不包括"新闻"。然而，如果那些相同的电视节目之一在其节目信息中包括较少局部共用的术语(例
如，特殊嘉宾的名称和/或特殊片段的描述)，则示例索引引擎205在索引的关键词列表中包括较少局部共用的数据(例如，特殊嘉宾的姓名和/或来自描述的一个或更多个词)。
为了存储可以由索引引擎205或任何其他关键词服务器形成的索引关键词，图2的示例内容曝光计量器150包括关键词数据库210。关键词数据库210中存储的关键词被索引到相关联的频道号、频道名称、节目名称、节目信息(例如，描述)和/或广播时间信息。示例关键词数据库210可以使用任何类型和/或数量的数据结构(例如，矩阵、阵列、变量、寄存器、数据表等)以存储索引关键词。在所示的示例中，关键词数据库210例如存储在任何类型的存储器和/或机器可访问的文件215中。图2的示例关键词数据库210包括当前时段(例如，当前星期)以及任何数量的之前的时段的索引关键词。关键词数据库210中包括的时段的数量和持续时间取决于处理服务器175计算和/或制表关于内容曝光的统计回溯多少时间。例如，处理服务器175可以被配置为仅考虑来自之前十四(14)天的内容。图2的示例索引引擎205周期性或非周期性地删除和/或以其他方式移除旧的关键词。
为了从视频数据160提取和/或解码隐藏字幕数据和/或信息，图2的示例内容曝光计量器150包括任何类型的隐藏字幕解码引擎220。图2的示例隐藏字幕解码引擎220例如利用任何类型的方法、算法、电路、设备和/或技术来解码21行国家电视系统委员会(NTSC: National TelevisionSystem Committee)电视信号或22行逐行倒相(PAL: Phase AlternationLine)电视信号以提取隐藏字幕文本222。在图1和图2的示例系统中，示例隐藏字幕解码引擎220随着在媒体设备105和/或经由媒体设备105回顾、显示、收看和/或回放内容而实时解码隐藏字幕文件222。可附加地或替代地，视频数据160可以存储在内容曝光计量器150中并由隐藏字幕解码引擎220非实时地处理。图2的示例隐藏字幕解码引擎220还提取和/或解码与隐藏字幕数据相关联的时间信息和/或与隐藏字幕数据和/或视频数据160中的信息一起嵌入的信息(即，隐藏字幕时间戳)。
为了确定在媒体设备和/或经由媒体设备最可能呈现和/或消费的内
容，图2的示例内容曝光计量器150包括隐藏字幕匹配器225。图2的示例隐藏字幕匹配器225利用任何类型的方法、算法、电路、设备和/或技术将隐藏字幕文本222的流与关键词数据库210中的索引关键词进行比较。当确定匹配时，记录与该匹配相对应的内容。在预定时间间隔期间 (例如，5分钟)，示例隐藏字幕匹配器225对识别到的匹配的总数和针对各特定内容(例如，电视节目)的匹配数量进行计数。在图2的示例中，在各时间间隔结束时，给定候选内容实际正在呈现和/或消费的概率是针对各候选内容的匹配数量除以匹配总数。具有最高概率的候选内容 (例如，电视节目)是当前最可能呈现和/或消费的内容。在图1和图2 的示例中，将具有最高概率的四段内容(即，最可能正在呈现和/或消费的内容)作为当前时间间隔的线索170A提供给处理服务器175。当然，也可以将任意数量的线索170A提供给处理服务器175。
图3例示了在具有T分钟的持续时间的各时间间隔315期间呈现和/ 或消费(例如，收看)的多个电视节目310的每个的概率305 (即，可能性)的示例直方图。如图所示，所示的各电视节目310具有一定高度的柱，该高度代表了在间隔315期间收看的该电视节目的可能性。在图3 的示例中，如柱320所示，在间隔315期间最可能收看的频道是在2006 年3月3日的6: 00-6: OIPM时段期间、在"FOX"电视频道上的晚间新闻。在图1到图3所示的示例中，基于隐藏字幕时间戳来确定时段，因此具有比节目开始时间、结束时间和/或节目持续时间更精细的间隔尺寸。该间隔尺寸取决于隐藏字幕时间戳的间隔尺寸和间隔315的长度。在间隔315结束时，将"FOX"、 "NBC"、 "ABC"和"CBS"作为线索提供给处理服务器175。当媒体设备105继续提供视频数据160时，图2 的隐藏字幕匹配器225继续识别和计数匹配，接着在各间隔325结束时，确定该间隔325的概率，并且向处理服务器175提供最可能的四个候选内容作为与当前正处理的时间间隔325相关联的线索170A。
可附加地或替代地，如果没有足够的关键词的集合，则图2的示例隐藏字幕匹配器225可能无法确切地识别正在呈现和/或消费的内容。例
如，示例隐藏字幕匹配器225可能仅能识别正在收看的电视台是ABC但是不能分辨正在呈现和域消费哪个电视节目。类似地，隐藏字幕匹配器 225可能能够识别正在呈现和/或消费晚间新闻，但是不能识别在哪个电视频道上。或者在给定时间间隔没有线索170A可用。
为了收集音频数据155的音频码，图2的示例内容曝光计量器150 包括任何类型的音频码引擎230。示例音频码引擎230利用任何类型的方法、算法、电路、设备和/或技术来搜索、定位、提取和/或解码由内容提供商(例如，电视和/或无线电广播公司)插入到音频数据155中的音频码，以便于对内容进行识别。这种音频码可以为检测内容的曝光目的而通用于产业中。然而，本领域技术人员将容易地认识到，不是所有的内容都插入了音频码和/或签名。
为了收集和/或生成音频数据155的音频签名，图2的示例内容曝光计量器150包括任何类型的音频签名引擎235。图2的示例音频签名引擎 235利用任何类型的方法、算法、电路、设备和/或技术来处理音频数据 155，以确定大体上和/或唯一识别音频数据155的对应部分的二进制指纹和/或签名。通过向音频数据155应用数据压縮来计算示例音频签名。
在图1和图2所示的示例中，示例隐藏字幕匹配器225将观众测量数据(例如，音频码和/或签名和/或各种签名)170B与线索信息170A — 起提供到处理服务器175。
尽管在图2中例示了示例内容曝光计量器150，但是图2中例示的元件、模块、逻辑、存储器和/或设备可以以任何方式组合、重新安排、消除和/或实现。例如，示例隐藏字幕匹配器225、示例索引引擎205禾口/ 或示例关键词数据库210可以与示例内容曝光计量器150分开实现(例如，通过示例处理服务器175和/或在示例处理服务器175中实现)。在这样的示例中，内容曝光计量器150将隐藏字幕信息222和观众测量数据 170B提供给处理服务器175，在处理服务器175生成线索信息170A。如下面关于图5更完整地描述的，处理服务器175使用生成的线索信息170A 和观众测量数据170B来识别由内容曝光计量器150计量的、在媒体设备105和/或经由媒体设备105呈现和/或消费的内容。此外，示例索引引擎 205、示例关键词数据库210、示例存储器和/或文件215、示例隐藏字幕匹配器225、示例隐藏字幕解码引擎220、示例音频码引擎230、示例音频签名235和/或更总体上的示例内容曝光计量器150可以由硬件、软件、固件和/或硬件、软件和/或固件的任何组合实现。例如，示例索引引擎205、示例关键词数据库210、示例存储器和/或文件215、示例隐藏字幕匹配器 225、示例隐藏字幕解码引擎220、示例音频码引擎230和/或示例音频签名引擎235可以经由通过诸如来自Intel 、 Sun 、 AMD⑧系列处理器禾口/ 或微控制器的任何类型的处理器执行的机器可访问指令实现。此外，内容曝光计量器可以包括额外的元件、模块、逻辑、存储器和/或设备和/ 或可以包括一个以上的任何例示元件、模块和/或设备(例如，视频码引擎或视频签名引擎)。
图4是具有分别与由内容曝光计量器150提供的其中一个线索170A
相对应的多个条目405的示例线索和调谐信息表。在图4的示例中，各多个条目405均包含时段间隔识别符410、指示内容何时呈现和/或消费的内容时间戳412、以及包括以下中的一个或更多个的线索信息(a)最高概率内容源(例如，电视频道)的列表415; (b)最高概率的内容段(例如，电视节目)的列表420; (c)最高概率广播时间的列表425。根据图 4的示例，各多个条目405还包括在该时段期间定位、提取、解码、识别和/或计算的任何观众测量数据430 (例如，音频码和/或音频签名)。特定时间戳条目412和特定广播时间425匹配的程度指示对应的内容是否实时呈现和/或消费和/或之前是否记录和/或获取过该对应的内容。尽管在图 4中例示了示例线索和调谐信息表，但是本领域普通技术人员将容易地认识到，内容曝光计量器150可以使用任何类型的文件、数据结构、表等来在向处理服务器175发送数据之前格式化数据。此外，在该表中可以包括更多或更少类型的信息。
图5例示了实现图1的示例处理服务器175的至少一部分的示例方式。为了确定由内容提供商130提供和/或从内容提供商130获得的音频数据185的音频码和/或签名，图5的示例处理服务器175包括任何类型的音频码引擎505。示例音频码引擎505利用任何类型的方法、算法、电路、设备和/或技术来搜索、定位、提取和/或解码和/或签名由内容提供商 (例如，电视和/或无线电广播公司)插入到音频数据185中的音频码和/ 或签名以便于对内容进行识别。这种音频码可以为检测内容的曝光目的而通用于产业中。然而，本领域普通技术人员将容易地认识到，并非所有内容都包含音频码。可附加地或替代地，内容提供商130可以仅提供想要获得其曝光和/或消费统计数据的内容的音频码。
为了确定音频数据185的音频签名，图5的示例处理服务器175包括任何类型的音频签名引擎510。图5的示例音频签名引擎510利用任何类型的方法、算法、电路、设备和/或技术来处理音频数据185以确定大体上和/或唯一识别音频数据185的对应部分的二进制指纹和/或签名。通过对音频数据185应用数据压縮来计算示例音频签名。
在图5的示例中，利用任何类型和/或数量的数据库和/或数据结构 (例如，矩阵、阵列、变量、寄存器、数据表等)来存储由示例音频码引擎505和/或示例音频签名引擎510定位、解码、提取、识别和/或计算的和/或从内容提供商130接收到的观众测量数据515 (例如，音频码和/ 或音频签名)，并且例如存储在任何类型的存储器和/或机器可访问的文件 520中。通过相关的频道号、频道名称、节目名称、节目信息(例如，描述)和/或广播时间信息对图5的示例观众测量数据库515编排索引。示例观众测量数据库515包括与当前正在广播的内容、过去广播的内容和/ 或将来将要广播的内容相对应的音频码和/或签名。可以基于期望的时段来选择数据库515中的数据量，将示例处理服务器175编程为在该期望的时段范围计算和/或制表关于内容曝光和/或消费的统计。例如，图5的示例处理服务器175可以被配置为仅考虑现在和/或过去广播和/或在之前的十四(14)天可用的内容。然而，如果期望安装存储媒体(例如，DVD)，则数据库515应当不限于基于时间。
为了识别在媒体设备105和/或经由媒体设备105呈现和/或消费的内容，图5的示例处理服务器175包括内容匹配器525。图5的示例内容匹配器525利用从内容曝光计量器150接收到的线索170A和观众测量数据170B来确定在示例媒体设备105和/或经由示例媒体设备105呈现和/或消费哪个内容，以形成媒体设备105的内容曝光数据530。具体地说，示例内容匹配器525利用提供的线索170A来识别在处理服务器175的观众测量数据库515中存储的码和/或签名的子集，以与从示例媒体设备105 收集的观众测量数据170B进行比较。观众测量数据170B和特定音频码和/或签名515之间的匹配指示与在处理服务器175中存储的特定音频码和/或签名相对应的内容是在媒体设备105和/或经由媒体设备105呈现和 /或消费的内容。
内容匹配器525可以利用线索170A很大程度上减少必须与由内容曝光计量器150收集的观众测量数据170B比较的、来自数据库515的观众测量数据的数量。结果，可以对内容曝光计量器150的、相当大数量的观众测量数据170B进行处理。以下关于图7对可执行为实现图5的示例内容匹配器525的示例处理进行说明。
在图5的示例中，利用任何类型和/或数量的数据结构(例如，矩阵、阵列、变量、寄存器、数据表等)来存储内容曝光数据530，并且将该数据例如存储在任何类型的存储器和/或机器可访问的文件535中。内容曝光数据530可以包括与多个受众相关联的多个其他受计量的媒体设备105 的内容曝光数据，以形成有意义的内容曝光统计。可以以统计方式对组合后的内容曝光数据530进行处理以例如确定呈现和/或消费的内容的总体效果、影响范围和/或观众人口统计。
尽管己经在图5中例示了示例处理服务器175，但是图5中例示的元件、模块、逻辑、存储器和/或设备可以以任何方式组合、重新安排、消除和/或实现。例如，图2的示例隐藏字幕匹配器225、示例索引引擎 205和/或示例关键词数据库210可以通过处理服务器175和/或在处理服务器175内实现。在这样的示例中，内容曝光计量器150将隐藏字幕信息222和观众测量数据170B提供给处理服务器175。基于接收到的隐藏字幕信息222，处理服务器175在其中生成线索信息170A。在一些示例中，处理服务器175从--些内容曝光计量器150接收隐藏字幕信息222 并且从其他内容曝光计量器150接收线索信息170A。此外，示例音频码引擎505、示例音频签名引擎510、存储器520、示例内容匹配器525、示例存储器535和/或更总体上的示例处理服务器175可由硬件、软件、固件和/或硬件、软件和/或固件的任何组合实现。例如，示例音频码引擎 505、示例音频签名引擎510、存储器520、示例内容匹配器525、示例存储器535可以经由通过诸如来自Intef、 Sun 、八1\40@系列处理器和/或微控制器的处理器的任何类型处理器175执行的机器可访问指令实现。此外，内容曝光计量器可以包括额外的元件、模块、逻辑、存储器和/或设备和/或可以包括一个以上的任何例示元件、模块和/或设备(例如，视频码引擎或视频签名引擎)。
图6和图7是表示分别可以被执行为实现图1的示例内容曝光计量器150和示例处理服务器175和/或更总体上说被执行为利用隐藏字幕信息来计量内容曝光的示例处理的流程图。可以由处理器、控制器和/或任何其他适当的处理设备执行图6和/或图7的示例处理。例如，可以以存储在诸如闪存、与处理器(例如，以下关于图8讨论的示例中央处理单元805)相关联的RAM的有形介质上的编码指令来实施图6和/或图7 的全部或部分流程图。或者可以利用专用集成电路(ASIC)、可编程逻辑设备(PLD)、现场可编程逻辑设备(FPLD)、分立逻辑、硬件、固件等来实现图6和/或图7的部分或全部示例处理。而且，图6和/或图7的部分或全部示例处理可以手动或作为任何前述技术的组合来实现(例如，固件和/或软件和硬件的组合)。而且，尽管参照图6和图7的流程图来对图6和图7的示例处理进行说明，但是本领域普通技术人员将容易地认识到，可以采用分别实现图1的示例内容曝光计量器150和/或示例处理服务器175、和/或更总体上说利用隐藏字幕信息和节目指南数据来计量内容曝光的许多其他方法。例如，可以改变各块的执行顺序，和/或可以改变、消除、细分或组合所述的某些块。另外，本领域普通技术人员将认识到，可以例如通过分幵的处理线程、处理器、设备、电路等按顺序执行和/或并行执行图6和/或图7的示例处理。
图6的示例处理以隐藏字幕匹配器(例如，图2的示例隐藏字幕匹配器225)从隐藏字幕解码引擎220获取和/或接收在下一时间间隔期间收集的隐藏字幕文本(即，词和/或多个词)的部分为开始(块605)。隐
藏字幕匹配器225接着将隐藏字幕文本与关键词数据库中的索引关键词进行比较(例如，图2的关键词数据库210)(块610)。如果识别到至少一个隐藏字幕词与至少一个索引关键词的匹配(块615)，则识别与匹配的关键词相对应的内容(例如，图3的示例内容320)，并且更新识别内容的直方图信息(块620)。如果没有识别到匹配(块615)，则跳过直方图的更新。
隐藏字幕匹配器225接着确定是否到达当前正在处理的时间间隔的末端(例如，图3的示例间隔315)(即，是否已经出现时间间隔315的边界(即，间隔边界))(块630)。如果还没有出现间隔边界(块630)，则控制返回到块605以得到下一隐藏字幕文本(块605)。如果已经出现间隔边界(块630)，则隐藏字幕匹配器225获得和/或接收从在刚刚结束的时间间隔期间呈现和/或消费的内容收集的任何音频码和/或签名(块 635)，并且获得和/或接收针对在刚刚结束的时间间隔期间呈现和/或消费的内容计算的音频签名(块640)。隐藏字幕匹配器225接着创建和/或将线索和观众测量数据条目(例如，图4的条目405)添加到表中和/或将线索和观众测量数据发送到处理服务器175。
图7的示例处理以内容匹配器(例如，图5的示例内容匹配器525) 在时间间隔315读取线索170A和观众测量数据170B为幵始(块705)。内容匹配器525识别最可能的内容、内容流和/或广播时间(块710)，并且确定最可能的内容、内容流和/或广播时间的音频码是否可用(块715)。可附加地或替代地，内容匹配器525可以在块710利用当选择最可能的内容、内容流和/或广播时间时的内容时间戳(例如，图4的示例时间戳 412)。例如，内容匹配器525可以首先选择与(例如，在广播内容时正在呈现的)实况内容的呈现相关联的候选内容。如果适用的音频码包括在观众测量数据170B中(块715)，则内容匹配器525将音频码和/或签名与对应于候选内容的音频码和/或签名515进行比较(块720)。如果存在匹配(块725)，则内容匹配器525结合内容曝光数据530中的时间戳 (例如，图4的示例时间戳412)对候选内容的呈现(即，识别候选内容为呈现禾D/或消费的内容)进行评分(credk)、积分(tally)和/或制表(块 730)。该时间戳指示内容曝光的时间。
如果在块715适用的音频码和/或签名不可用，或者如果在块725音频码和/或签名不匹配，则内容匹配器525确定是否最可能的候选内容的音频签名可用(块735)。如果音频签名不可用(块735)，则内容匹配器 525假定呈现和/或消费最可能的候选内容、源和域广播时间，并且将候选内容的曝光与时间戳(例如，图4的示例时间戳412) —起记录在内容曝光数据530中(块730)。时间戳指示内容曝光的时间。
如果音频签名可用(块735)，则内容匹配器525将该音频签名与对应于候选内容的音频签名515进行比较(块740)。如果音频签名匹配(块 745)，则内容匹配器525将该匹配(即，将候选内容识别为呈现和/或消费的内容)以及时间戳(例如，图4的示例时间戳412)记录到内容曝光数据530中(块730)。该时间戳指示内容曝光的时间。
如果音频签名不匹配(块745)，则内容匹配器525确定是否存在更多的线索(块750)。如果不存在更多的线索(块750)，则控制进入块755 以确定是否存在要处理的线索的额外时间间隔。可附加地或替代地，内容匹配器525将从媒体设备105收集的观众测量数据与在数据库中存储的所有观众测量数据515进行比较，以确定是否识别到匹配。
如果存在更多线索(块750)，则内容匹配器525识别下一最可能的候选内容(块760)。控制接着返回到块715。
在块755，如果另外间隔的另外线索170A和观众测量数据170B可用(块755)，则控制返回到块705以处理下一时间间隔。如果没有另外线索170A和观众测量数据170B可用(块755)，则控制从图7的示例机器可访问指令退出。
图8是可用于和/或编程为例如执行图6和/或图7的示例处理以分别实现图1的示例内容曝光计量器150和示例处理服务器175、和/或更总体上说利用隐藏字幕信息和节目指南数据来计量内容曝光的示例处理器平台800的示意图。例如，处理器平台800可由一个或更多个通用微处理器、微控制器等实现。图8的示例的处理器平台800包括通用可编程和/或专用处理器805。处理器805执行在处理器805的主存储器(例如，在随机存取存储器 (RAM) 815和/或只读存储器(ROM) 820中)中存在的编码指令810 和/或812。处理器805可以是任何类型的处理单元(例如，来自Inte产、 Sim 、和/或AM^系列处理器和/或微控制器中的任何的处理器和/或微控制器)。处理器805尤其可以执行图6和/或图7中的示例处理。
处理器805经由总线825与主存储器(包括RAM 815和ROM 820) 通信。RAM 815可以通过DRAM、 SDRAM禾B/或任何其他类型的RAM 设备实现。ROM 820可以通过闪存和/或任何其他期望类型的存储器设备实现。对存储器S15和存储器820的访问典型地由存储器控制器(未示出)以常规方式控制。RAM815例如可以用于存储图2的示例关键词数据库210和/或图5的示例观众测量数据库515和/或示例内容曝光数据 530。
处理器平台800还包括常规的接口电路835。接口电路835可以通过诸如外部存储器接口、串行端口、通用输入/输出等的任何类型的公知接口标准实现。
将--个或更多个输入设备835和一个或更多个输出设备840连接到接口电路835。输入设备835例如可以用于接收音频数据155、视频数据 160、内容指南数据165、音频数据185等。输出设备840例如可以用于将观众测量数据170B和/或线索170A从内容曝光计量器150发送到处理服务器175。
尽管这里已经对某些示例方法、装置和制品进行了说明，但是本专利的覆盖范围不限于此。相反，本专利包括在字面上或在等同教导下合理落入所附权利要求的范围内的所有方法、装置和制品。
权利要求
1. 一种方法，该方法包括以下步骤基于描述给定时段的节目的节目指南来形成各期间的关键词数据库；基于隐藏字幕文本和所述关键词数据库的比较来生成表示呈现一个或更多个相应媒体内容的可能性的一个或更多个值；收集观众测量数据；以及利用一个或更多个可能性值来识别一组基准数据，该组基准数据用于与所述观众测量数据进行比较以识别呈现的内容。
2. 如权利要求l所述的方法，其中利用所述可能性值还包括向收集服务器提供一个或更多个生成的可能性值和收集的观众测量数据以识别所述呈现的内容。
3. 如权利要求1所述的方法，其中生成表示可能性的一个或更多个值包括针对一个或更多个相应媒体内容对所述隐藏字幕文本和所述关键词数据库的一种或更多种匹配进行计数。
4. 如权利要求3所述的方法，该方法还包括对相应其中一个所述媒体内容计算一种或更多种匹配的和；以及将所述一种或更多种匹配的每一种除以所述和。
5. 如权利要求l所述的方法，其中所述节目指南信息包括可扩展标记语言(XML)数据结构。
6. 如权利要求1所述的方法，其中所述观众测量数据包括音频码、视频码、音频签名或视频签名中的至少一个。
7. 如权利要求6所述的方法，其中由广播公司插入所述音频码以识别第一特定内容。
8. 如权利要求1所述的方法，其中一个或更多个可能性值包括最可能的频道的列表、最可能的节目的列表或最可能的时间的列表中的至少一个。
9. 一种装置，该装置包括音频测量引擎，其收集观众测量数据；索引引擎，其基于节目指南来创建关键词数据库；以及隐藏字幕匹配器，其通过将隐藏字幕与所述关键词数据库比较来生成表示呈现一个或更多个对应节目的可能性的一个或更多个值，所述一个或更多个可能性值和所述观众测量数据可用于确定观众呈现统计。
10. 如权利要求9所述的装置，其中所述隐藏字幕匹配器将一个或更多个生成的可能性值和一个或更多个提取的观众测量数据提供到收集服务器来识别呈现的内容。
11. 如权利要求9所述的装置，该装置还包括用于提取隐藏字幕文本的隐藏字幕解码引擎。
12. 如权利要求9所述的装置，其中一个或更多个观众测量码和/或签名包括由广播公司插入以识别第一特定内容的一个或更多个音频码和/ 或签名。
13. 如权利要求9所述的装置，其中所述隐藏字幕匹配器通过针对一个或更多个相应媒体内容对所述隐藏字幕文本和所述关键词数据库的一种或更多种匹配进行计数来生成表示可能性的一个或更多个值。
14. 如权利要求9所述的装置，该装置还包括用于基于节目指南信息来生成关键词数据库的条目的索引引擎。
15. 如权利要求14所述的装置，其中所述索引引擎生成关键词数据库以移除冗余信息。
16. 如权利要求9所述的装置，其中一个或更多个可能性值包括最可能的频道的列表、最可能的节目的列表或最可能的时间的列表中的至少一个o
17. —种存储机器可读指令的制品，当该指令被执行时，其使得所述机器基于描述给定时段的节目的节目指南来形成各期间的关键词数据库；基于隐藏字幕文本和所述关键词数据库的比较来生成表示呈现一个或更多个相应内容的可能性的一个或更多个值；收集观众测量数据；以及利用一个或更多个可能性值来识别一组基准数据，该组基准数据用于与所述观众测量数据进行比较以识别呈现的内容。
18. 如权利要求17所述的制品，其中当机器可访问指令被执行时，使得所述机器通过向收集服务器提供一个或更多个生成的可能性值和一个或更多个收集的观众测量数据以识别所述呈现的内容来利用所述可能
19. 如权利要求17所述的制品，其中当机器可访问指令被执行时，使得所述机器通过针对一个或更多个相应媒体内容对所述隐藏字幕文本和所述关键词数据库的一种或更多种匹配进行计数来生成表示可能性的一个或更多个值。
20. 如权利要求17所述的制品，所述节目指南信息包括可扩展标记语言(XML)数据结构。
21. 如权利要求17所述的制品，其中所述观众测量数据包括音频码、视频码、音频签名或视频签名中的至少一个。
22. 如权利要求21所述的制品，其中由广播公司插入所述音频码以识别第一特定内容。
23. 如权利要求17所述的制品，其中一个或更多个可能性值包括最可能的频道的列表、最可能的节目的列表或最可能的时间的列表中的至少一个。
全文摘要
公开了一种利用隐藏字幕信息来计量内容曝光的方法和装置。该示例方法包括基于描述给定时段的节目的节目指南来形成各期间的关键词数据库，基于隐藏字幕文本和关键词数据库的比较来生成表示呈现一个或更多个相应媒体内容的可能性的一个或更多个值，收集观众测量数据；以及利用一个或更多个可能性值来识别一组基准数据，该组基准数据用于与所述观众测量数据比较以识别呈现的内容。
文档编号H04N5/91GK101536503SQ200780021863
公开日2009年9月16日申请日期2007年6月11日优先权日2006年6月15日
发明者阿伦·拉马斯瓦米申请人:尼尔森(美国)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：阿伦.拉马斯瓦米
技术所有人：尼尔森（美国）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。