利用隐藏字幕信息来计量内容曝光的方法和装置的制作方法

文档序号:7677446阅读:97来源:国知局
专利名称:利用隐藏字幕信息来计量内容曝光的方法和装置的制作方法
技术领域
本发明总体上涉及内容曝光(content exposures)的计量,更具体地 说,涉及利用隐藏字幕信息来计量内容曝光的方法和装置。
背景技术
可以通过收集、识别和/或提取嵌入到正在呈现的内容中的观众测量 码来计量媒体内容的曝光。内容提供商(例如,电视和/或无线电广播公 司)通常将这种观众测量码插入、嵌入和/或其他方式放置到内容中,以 便于识别内容。可替代地或者附加地,可以通过收集表示内容的签名来 测量内容的曝光。通过将在内容呈现期间收集的一个或更多个观众测量 码和/或签名与已知观众测量码和/或签名的数据库进行比较,可以测量出 特定内容段对于一个或更多个人、受众和/或家庭的曝光。


图1是利用隐藏字幕信息来计量内容曝光的示例系统的示意性例示。图2例示了实现图1的示例内容曝光计量的示例方式。图3是在给定时段期间最可能呈现和/或消费的电视频道的示例直方图4是观众测量码和线索数据的示例表。 图5例示了实现图1的示例处理服务器的示例方式。 图6是表示可以执行为实现图1的示例内容曝光计量器的示例处理 的流程图。图7是表示可以执行为实现图1的示例处理服务器的示例处理的流程图。图8是可用于和/或编程为执行图6和/或图7的示例处理以实现图1 的示例内容曝光计量器和/或示例处理服务器的示例处理器平台的示意 图。具体头^^方式图1例示了根据本发明的教导构造的、利用隐藏字幕(closed caption) 信息来计量内容曝光的示例系统。图1的示例系统计量a)在广播内容时 正在呈现和/或消费的内容和/或b)在广播内容时没有呈现和/或消费的内 容(例如,系统计量先前在广播时记录并且在稍后呈现(即,时间后移 收看)的正在呈现和/或消费的内容)。为了计量内容曝光,图1的示例系 统使用了隐藏字幕信息和/或内容识别符。如这里使用的,"内容识别符" 是与一段内容相关联、嵌入一段内容、从一段内容推断出和/或插入到一 段内容中的可用于识别该段内容的任何类型的数据和/或信息。观众测量 码(例如,内容提供商(例如,电视和/或无线电广播公司)嵌入到内容 中以便于对内容进行识别的音频码、音频水印、视频水印、垂直消隐间 隔(VBI: vertical blanking interval)码、图像水印和/或任何其他水印)、 比特流中的公共或私有识别符、隐藏字幕信息、元数据、签名或任何其 他类型的数据都可以用作内容识别符。观众在回放期间通常注意不到内 容识别符,但是这种情况并不是绝对的。对于当前正在广播的内容,图1 的示例系统利用观众测量码和/或签名来识别正在呈现和/或消费的内容 (例如,音频、视频、图像和/或其他)。具体地说,可以将收集的观众测 量码和/或签名与表示已知内容的观众测量码和/或签名的数据库进行比6较,以便于识别正在呈现的内容。类似地,对于之前记录的内容,示例 系统也可以利用观众测量码和/或签名来识别呈现的媒体内容。由于根据之前记录的内容确定的观众测量码和/或签名可能相对于 观众测量码和/或签名的基准数据库存在很大的时间偏移,因此将观众测 量码和/或签名与数据库匹配以确定正在呈现和/或消费什么内容可能变 得困难和/或耗时。因而,图1的示例系统在呈现和/或消费内容时,禾廿用 隐藏字幕信息来识别最可能呈现的内容。如下所述,然后在将根据之前 记录的内容确定的观众测量码和/或签名与观众测量码和/或签名的数据 库匹配期间使用该可能的内容信息。具体地说,该可能的内容信息可以 使得能够将提取的和/或确定的观众测量码和/或签名与观众测量码数据 库的较小子集进行比较。还可以利用隐藏字幕信息和/或可能呈现和/或消 费的内容信息来计量当前正在广播的内容。为了接收、播放、收看、记录和/或解码任何类型的内容,图l的示例系统包括诸如机顶盒(STB: settopbox)、数字视频记录器(DVR: digital video recorder)、录像机(VCR: video cassette recorder)、个人计算机(PC)、 游戏控制台、电视、媒体播放器等的任何类型的媒体设备105。示例内容 包括电视(TV)节目、电影、视频、商业节目、广告、音频、视频、游 戏等。在图1的示例系统中,示例媒体设备105经由例如以下任何类型的源接收内容卫星接收器和/或天线110;经由任何类型的有线电视信号和/或地面广播接收的射频(RF)输入信号115;诸如因特网120的任 何类型的数据通信网络;例如硬盘驱动器(HDD)、 VCR卡带、数字通 用光盘(DVD)、致密盘(CD)、闪存设备等的任何类型的数据和/或媒体 存储器125。在图1的示例系统中,内容(与其源无关)可以包括隐藏字 幕信息和/或数据。可替代地或者附加地,可以与其自身的内容分开地提 供和/或接收隐藏字幕信息和/或数据。媒体设备105和/或内容曝光计量器 150可以使这样的分开接收的隐藏字幕信息和/或数据与内容同步。为了提供和/或广播内容,图1的示例系统例如包括电视台、卫星广 播公司、电影制片厂等的任何类型和/或数量的内容提供商130。在图1 所示的示例中,内容提供商130经由使用卫星发射器135和卫星和/或卫广播、有线电视广播、因特网120和/或媒 体存储器125向示例媒体设备105传递和/或提供内容。为了计量内容的曝光和/或消费,图1的示例系统包括内容曝光计量 器150。图1的示例内容曝光计量器150从示例媒体设备105接收音频数 据155和/或视频数据160。示例内容曝光计量器150还接收任何类型的 内容指南信息和/或数据165。可以经由因特网120、卫星输入、RF输入 115、媒体设备105和/或媒体存储器125将内容指南数据165广播和/或 传递到内容曝光计量器150或由内容广播计量器150下载和/或以其他方 式接收。在一些示例中,内容指南数据165例如是包含针对任何天数的 和/或为内容曝光计量器150的地理位置(例如,邮递或邮政区号)定制 的电视节目信息(例如,电视指南列表)的可扩展标记语言(XML)文 件。图1的示例内容曝光计量器150例如可以是(a)PC; (b)可以通过示 例媒体设备105实现、在示例媒体设备105中实现和/或以其他方式与示 例媒体设备105相关联,禾口/或c)在PCT专利申请PCT/US2004/000818 中描述的XML数据收集服务器,以引证的方式将该申请的全部内容并入 于此。以下关于图2对实现示例内容曝光计量器150的示例方式进行说 明。并关于图6对执行为实现示例内容曝光计量器150的示例处理进行 说明。如以下关于图2、图3和图6所述的,图1的示例内容曝光计量器 150使用内容指南数据165和/或从内容指南数据165得到的数据、以及 例如从视频数据160得到的隐藏字幕信息来识别例如可能正在媒体设备 105和/或经由媒体设备105呈现(例如,收看)的一个或更多个电视节 目和/或电影。如下所述,为了使得能够测量内容曝光,图1的示例内容 曝光计量器150收集和/或生成可用于识别正呈现的内容的观众测量码和/ 或签名。在与内容广播的时间不同步地呈现和/或消费内容的情况下(例 如,先前在广播时记录呈现和/或消费的内容并且当前正在媒体设备105 和/或经由媒体设备105回放),示例内容曝光计量器150利用隐藏字幕信 息和内容指南信息(例如,电子节目指南(EPG: electronic program guide) 信息)来识别一组潜在的候选内容中的哪个内容表示最可能呈现给调查对象/用户/家庭成员的内容。示例内容曝光计量器150还可以利用隐藏字 幕信息来识别正在呈现和/或消费哪个当前广播的内容。当例如在媒体设备105和/或经由媒体设备105存储和/或记录内容时,还存储任何所包括 的和/或关联的隐藏字幕信息和/或数据。例如,如果所接收到的内容包含 嵌入的隐藏字幕信息,则根据正在记录的内容来保存隐藏字幕信息。当执行内容计量时,图1的示例内容曝光计量器150将内容呈现发 生的时间划分为一组呈现时间间隔(例如,30秒)并且对各时间间隔确 定最可能呈现和/或消费的内容。取决于期望的要执行的计量的间隔大小, 时间间隔可以具有任何持续时间。另外,时间间隔的持续时间可以是固 定的或可变的。对于各呈现时间间隔,图1的示例内容曝光计量器150为处理服务 器175提供表示现在和/或过去最可能呈现的内容段的候选内容排序表。 处理服务器175可以与内容曝光计量器150在位置上分离和/或可以与示 例内容曝光计量器150位于同一位置。在图1的示例中,将候选内容排 序表作为内容曝光线索(hint)列表170A提供给处理服务器175。在图1 的示例中,根据与各给定线索相关联的候选内容是在感兴趣的时间间隔 期间呈现和/或消费的内容的概率来对线索170A进行排序,并且线索 170A例如可以包括三个或四个最可能的项目。处理服务器175可以从可 能按地区分配的任何数量的内容曝光计量器150接收并处理内容曝光线 索170A。如下面关于图2所述,示例内容曝光计量器150还从音频数据 155收集任何类型的观众测量码和/或签名(统一为观众测量数据170B)。 将观众测量数据170B与内容曝光线索170A—起提供给处理服务器175。 以下关于图4对由内容曝光计量器150用来向处理服务器175提供线索 170A和观众测量数据170B的示例表进行说明。可附加地或替代地,线 索170A和观众测量数据170B可以被格式化为XML文件。音频测量数 据170B可以包括和/或表示视频码、视频签名、图像码、图像签名等。 为了简化说明,以下的公开涉及使用任何类型的码和/或签名作为观众测 量数据170B。为了方便创建线索170A以识别与内容广播的时间不同步地呈现和/或消费的内容(例如,之前记录的内容),示例内容曝光计量器150存储 和/或保留内容指南数据165 (例如,EPG数据)和/或从在之前时段期间
(例如,过去的14天内)收集的内容指南数据165得到的数据。这样, 如下所述,内容曝光计量器150可以使用当前收集的和/或之前收集的内 容指南数据165和/或从当前收集的和/或之前收集的内容指南数据165得 到的数据来识别在媒体设备105和/或经由媒体设备105呈现(例如,显 示、收看和/或收听)的内容。在所示的示例中,由示例内容曝光计量器 150保留内容指南数据165和/或从内容指南数据165得到的数据的时段 是示例处理服务器175被编程为计算和/或制表关于内容曝光的统计的时 段。
在图1所示的示例中,将线索170A和观众测量数据(例如,码和/ 或签名)170B偶然地、周期性地、或实时地从内容曝光计量器150提供 给处理服务器175。可以使用从示例内容曝光计量器150向示例处理服务 器175下载和/或传送数据的任何类型的技术。例如,可以经由因特网120、 公共交换电话网(PSTN) 180和/或专用网络来传送线索170A和观众测 量数据170B。可附加地或替代地,示例内容曝光计量器150可以周期性 地或非周期性地将线索170A和观众测量数据170B存储到任何类型的非 易失性存储介质(例如,可记录致密盘(CD-R))上,将线索170A和观 众测量数据170B传输(例如,拾取、邮寄等)到处理服务,并接着加载 到示例处理服务器175上。
图1的示例处理服务器175利用从示例内容曝光计量器150接收到 的线索170A和观众测量数据170B来确定在示例媒体设备105和/或经由 示例媒体设备105呈现和/或消费哪个内容,以形成媒体设备105和/或一 个或更多个媒体设备105的集合的内容曝光数据。例如,处理服务器175 利用线索170A来更有效地对由内容曝光计量器150收集的观众测量数据 (例如,码和/或签名)170B与在处理服务器175存储和/或可用的观众 测量数据(例如,码和/或签名)的数据库进行比较。如上所述,在示例 处理服务器175的观众测量数据的数据库理想地表示全部内容的大部分, 从而增加了准确识别在示例媒体设备105呈现和/或消费的任何内容的可能性。然而,数据库越大,执行在数据库中存储的所有观众测量数据的 搜索以识别匹配所需要的处理能力就越大。图1的示例处理服务器175
例如可以从内容提供商130接收观众测量数据和/或确定在处理服务器 175接收到的和/或由处理服务器175接收到的内容185的观众测量数据。 另外,由数据库中存储的观众测量数据表示的内容可以包括已经广播和/ 或将要广播的内容和/或还没有广播但是用户经由DVD、 VCR或其他存 储介质可用的内容。示例处理服务器175可以使用线索170A来限制必须 比较的观众测量数据量,从而处理来自相当大数量的内容曝光计量器150 的内容曝光计量信息170B。以下关于图5对示例处理服务器175进行说 明。并关于图7对可以执行为实现示例处理服务器175的示例处理进行
图1的示例处理服务器175组合了对与多个受众相关联的多个被计 量的媒体设备105确定的内容曝光数据,以形成有意义的内容曝光统计。 例如,所示示例的处理服务器175使用组合后的内容曝光数据来确定整 体效果、影响范围和/或通过使用任何类型的统计方法处理收集的数据来 对收看的内容进行观众人口统计。
图2例示了实现图1的示例内容曝光计量器150的示例方式。为了 处理内容指南数据165,图2的示例内容曝光计量器150包括任何类型的 索引引擎205。示例索引引擎205实施任何方法、算法和/或技术来处理 包含多个记录的XML文件。对该XML文件进行处理使得创建识别对由 XML文件表示的多个记录进行区分的关键词的索引。考虑包含电视指南 列表的示例XML文件,在该电视指南列表中,XML文件中的各记录代 表单独的电视节目。XML文件中的各记录包含关于电视节目的数据,例 如广播电视节目的频道号、与广播电视节目的频道相关联的名称、电视 节目的节目名称、电视节目的内容描述以及要广播电视节目的时间。示 例索引引擎205对XML数据编排索引以移除尽可能多的冗余信息,同时 保留对区分列出的电视节目有用的关键词。例如,考虑具有名称和/或描 述中包括"新闻"的多个电视节目的6-6: OIPM时隙。因为术语"新闻" 是"局部共用的"(例如,在相关时段中出现在第二节目中),因此图2的示例索引引擎205在索引的关键词列表中不包括"新闻"。然而,如果那些相同的电视节目之一在其节目信息中包括较少局部共用的术语(例
如,特殊嘉宾的名称和/或特殊片段的描述),则示例索引引擎205在索引的关键词列表中包括较少局部共用的数据(例如,特殊嘉宾的姓名和/或来自描述的一个或更多个词)。
为了存储可以由索引引擎205或任何其他关键词服务器形成的索引关键词,图2的示例内容曝光计量器150包括关键词数据库210。关键词数据库210中存储的关键词被索引到相关联的频道号、频道名称、节目名称、节目信息(例如,描述)和/或广播时间信息。示例关键词数据库210可以使用任何类型和/或数量的数据结构(例如,矩阵、阵列、变量、寄存器、数据表等)以存储索引关键词。在所示的示例中,关键词数据库210例如存储在任何类型的存储器和/或机器可访问的文件215中。图2的示例关键词数据库210包括当前时段(例如,当前星期)以及任何数量的之前的时段的索引关键词。关键词数据库210中包括的时段的数量和持续时间取决于处理服务器175计算和/或制表关于内容曝光的统计回溯多少时间。例如,处理服务器175可以被配置为仅考虑来自之前十四(14)天的内容。图2的示例索引引擎205周期性或非周期性地删除和/或以其他方式移除旧的关键词。
为了从视频数据160提取和/或解码隐藏字幕数据和/或信息,图2的示例内容曝光计量器150包括任何类型的隐藏字幕解码引擎220。图2的示例隐藏字幕解码引擎220例如利用任何类型的方法、算法、电路、设备和/或技术来解码21行国家电视系统委员会(NTSC: National TelevisionSystem Committee)电视信号或22行逐行倒相(PAL: Phase AlternationLine)电视信号以提取隐藏字幕文本222。在图1和图2的示例系统中,示例隐藏字幕解码引擎220随着在媒体设备105和/或经由媒体设备105回顾、显示、收看和/或回放内容而实时解码隐藏字幕文件222。可附加地或替代地,视频数据160可以存储在内容曝光计量器150中并由隐藏字幕解码引擎220非实时地处理。图2的示例隐藏字幕解码引擎220还提取和/或解码与隐藏字幕数据相关联的时间信息和/或与隐藏字幕数据和/或视频数据160中的信息一起嵌入的信息(即,隐藏字幕时间戳)。
为了确定在媒体设备和/或经由媒体设备最可能呈现和/或消费的内
容,图2的示例内容曝光计量器150包括隐藏字幕匹配器225。图2的示 例隐藏字幕匹配器225利用任何类型的方法、算法、电路、设备和/或技 术将隐藏字幕文本222的流与关键词数据库210中的索引关键词进行比 较。当确定匹配时,记录与该匹配相对应的内容。在预定时间间隔期间 (例如,5分钟),示例隐藏字幕匹配器225对识别到的匹配的总数和针 对各特定内容(例如,电视节目)的匹配数量进行计数。在图2的示例 中,在各时间间隔结束时,给定候选内容实际正在呈现和/或消费的概率 是针对各候选内容的匹配数量除以匹配总数。具有最高概率的候选内容 (例如,电视节目)是当前最可能呈现和/或消费的内容。在图1和图2 的示例中,将具有最高概率的四段内容(即,最可能正在呈现和/或消费 的内容)作为当前时间间隔的线索170A提供给处理服务器175。当然, 也可以将任意数量的线索170A提供给处理服务器175。
图3例示了在具有T分钟的持续时间的各时间间隔315期间呈现和/ 或消费(例如,收看)的多个电视节目310的每个的概率305 (即,可能 性)的示例直方图。如图所示,所示的各电视节目310具有一定高度的 柱,该高度代表了在间隔315期间收看的该电视节目的可能性。在图3 的示例中,如柱320所示,在间隔315期间最可能收看的频道是在2006 年3月3日的6: 00-6: OIPM时段期间、在"FOX"电视频道上的晚间 新闻。在图1到图3所示的示例中,基于隐藏字幕时间戳来确定时段, 因此具有比节目开始时间、结束时间和/或节目持续时间更精细的间隔尺 寸。该间隔尺寸取决于隐藏字幕时间戳的间隔尺寸和间隔315的长度。 在间隔315结束时,将"FOX"、 "NBC"、 "ABC"和"CBS"作为线索 提供给处理服务器175。当媒体设备105继续提供视频数据160时,图2 的隐藏字幕匹配器225继续识别和计数匹配,接着在各间隔325结束时, 确定该间隔325的概率,并且向处理服务器175提供最可能的四个候选 内容作为与当前正处理的时间间隔325相关联的线索170A。
可附加地或替代地,如果没有足够的关键词的集合,则图2的示例隐藏字幕匹配器225可能无法确切地识别正在呈现和/或消费的内容。例
如,示例隐藏字幕匹配器225可能仅能识别正在收看的电视台是ABC但 是不能分辨正在呈现和域消费哪个电视节目。类似地,隐藏字幕匹配器 225可能能够识别正在呈现和/或消费晚间新闻,但是不能识别在哪个电 视频道上。或者在给定时间间隔没有线索170A可用。
为了收集音频数据155的音频码,图2的示例内容曝光计量器150 包括任何类型的音频码引擎230。示例音频码引擎230利用任何类型的方 法、算法、电路、设备和/或技术来搜索、定位、提取和/或解码由内容提 供商(例如,电视和/或无线电广播公司)插入到音频数据155中的音频 码,以便于对内容进行识别。这种音频码可以为检测内容的曝光目的而 通用于产业中。然而,本领域技术人员将容易地认识到,不是所有的内 容都插入了音频码和/或签名。
为了收集和/或生成音频数据155的音频签名,图2的示例内容曝光 计量器150包括任何类型的音频签名引擎235。图2的示例音频签名引擎 235利用任何类型的方法、算法、电路、设备和/或技术来处理音频数据 155,以确定大体上和/或唯一识别音频数据155的对应部分的二进制指纹 和/或签名。通过向音频数据155应用数据压縮来计算示例音频签名。
在图1和图2所示的示例中,示例隐藏字幕匹配器225将观众测量 数据(例如,音频码和/或签名和/或各种签名)170B与线索信息170A — 起提供到处理服务器175。
尽管在图2中例示了示例内容曝光计量器150,但是图2中例示的 元件、模块、逻辑、存储器和/或设备可以以任何方式组合、重新安排、 消除和/或实现。例如,示例隐藏字幕匹配器225、示例索引引擎205禾口/ 或示例关键词数据库210可以与示例内容曝光计量器150分开实现(例 如,通过示例处理服务器175和/或在示例处理服务器175中实现)。在这 样的示例中,内容曝光计量器150将隐藏字幕信息222和观众测量数据 170B提供给处理服务器175,在处理服务器175生成线索信息170A。如 下面关于图5更完整地描述的,处理服务器175使用生成的线索信息170A 和观众测量数据170B来识别由内容曝光计量器150计量的、在媒体设备105和/或经由媒体设备105呈现和/或消费的内容。此外,示例索引引擎 205、示例关键词数据库210、示例存储器和/或文件215、示例隐藏字幕 匹配器225、示例隐藏字幕解码引擎220、示例音频码引擎230、示例音 频签名235和/或更总体上的示例内容曝光计量器150可以由硬件、软件、 固件和/或硬件、软件和/或固件的任何组合实现。例如,示例索引引擎205、 示例关键词数据库210、示例存储器和/或文件215、示例隐藏字幕匹配器 225、示例隐藏字幕解码引擎220、示例音频码引擎230和/或示例音频签 名引擎235可以经由通过诸如来自Intel 、 Sun 、 AMD⑧系列处理器禾口/ 或微控制器的任何类型的处理器执行的机器可访问指令实现。此外,内 容曝光计量器可以包括额外的元件、模块、逻辑、存储器和/或设备和/ 或可以包括一个以上的任何例示元件、模块和/或设备(例如,视频码引 擎或视频签名引擎)。
图4是具有分别与由内容曝光计量器150提供的其中一个线索170A
相对应的多个条目405的示例线索和调谐信息表。在图4的示例中,各 多个条目405均包含时段间隔识别符410、指示内容何时呈现和/或消费 的内容时间戳412、以及包括以下中的一个或更多个的线索信息(a)最 高概率内容源(例如,电视频道)的列表415; (b)最高概率的内容段(例 如,电视节目)的列表420; (c)最高概率广播时间的列表425。根据图 4的示例,各多个条目405还包括在该时段期间定位、提取、解码、识别 和/或计算的任何观众测量数据430 (例如,音频码和/或音频签名)。特定 时间戳条目412和特定广播时间425匹配的程度指示对应的内容是否实 时呈现和/或消费和/或之前是否记录和/或获取过该对应的内容。尽管在图 4中例示了示例线索和调谐信息表,但是本领域普通技术人员将容易地认 识到,内容曝光计量器150可以使用任何类型的文件、数据结构、表等 来在向处理服务器175发送数据之前格式化数据。此外,在该表中可以 包括更多或更少类型的信息。
图5例示了实现图1的示例处理服务器175的至少一部分的示例方 式。为了确定由内容提供商130提供和/或从内容提供商130获得的音频 数据185的音频码和/或签名,图5的示例处理服务器175包括任何类型的音频码引擎505。示例音频码引擎505利用任何类型的方法、算法、电 路、设备和/或技术来搜索、定位、提取和/或解码和/或签名由内容提供商 (例如,电视和/或无线电广播公司)插入到音频数据185中的音频码和/ 或签名以便于对内容进行识别。这种音频码可以为检测内容的曝光目的 而通用于产业中。然而,本领域普通技术人员将容易地认识到,并非所 有内容都包含音频码。可附加地或替代地,内容提供商130可以仅提供 想要获得其曝光和/或消费统计数据的内容的音频码。
为了确定音频数据185的音频签名,图5的示例处理服务器175包 括任何类型的音频签名引擎510。图5的示例音频签名引擎510利用任何 类型的方法、算法、电路、设备和/或技术来处理音频数据185以确定大 体上和/或唯一识别音频数据185的对应部分的二进制指纹和/或签名。通 过对音频数据185应用数据压縮来计算示例音频签名。
在图5的示例中,利用任何类型和/或数量的数据库和/或数据结构 (例如,矩阵、阵列、变量、寄存器、数据表等)来存储由示例音频码 引擎505和/或示例音频签名引擎510定位、解码、提取、识别和/或计算 的和/或从内容提供商130接收到的观众测量数据515 (例如,音频码和/ 或音频签名),并且例如存储在任何类型的存储器和/或机器可访问的文件 520中。通过相关的频道号、频道名称、节目名称、节目信息(例如,描 述)和/或广播时间信息对图5的示例观众测量数据库515编排索引。示 例观众测量数据库515包括与当前正在广播的内容、过去广播的内容和/ 或将来将要广播的内容相对应的音频码和/或签名。可以基于期望的时段 来选择数据库515中的数据量,将示例处理服务器175编程为在该期望 的时段范围计算和/或制表关于内容曝光和/或消费的统计。例如,图5的 示例处理服务器175可以被配置为仅考虑现在和/或过去广播和/或在之前 的十四(14)天可用的内容。然而,如果期望安装存储媒体(例如,DVD), 则数据库515应当不限于基于时间。
为了识别在媒体设备105和/或经由媒体设备105呈现和/或消费的内 容,图5的示例处理服务器175包括内容匹配器525。图5的示例内容匹 配器525利用从内容曝光计量器150接收到的线索170A和观众测量数据170B来确定在示例媒体设备105和/或经由示例媒体设备105呈现和/或 消费哪个内容,以形成媒体设备105的内容曝光数据530。具体地说,示 例内容匹配器525利用提供的线索170A来识别在处理服务器175的观众 测量数据库515中存储的码和/或签名的子集,以与从示例媒体设备105 收集的观众测量数据170B进行比较。观众测量数据170B和特定音频码 和/或签名515之间的匹配指示与在处理服务器175中存储的特定音频码 和/或签名相对应的内容是在媒体设备105和/或经由媒体设备105呈现和 /或消费的内容。
内容匹配器525可以利用线索170A很大程度上减少必须与由内容曝 光计量器150收集的观众测量数据170B比较的、来自数据库515的观众 测量数据的数量。结果,可以对内容曝光计量器150的、相当大数量的 观众测量数据170B进行处理。以下关于图7对可执行为实现图5的示例 内容匹配器525的示例处理进行说明。
在图5的示例中,利用任何类型和/或数量的数据结构(例如,矩阵、 阵列、变量、寄存器、数据表等)来存储内容曝光数据530,并且将该数 据例如存储在任何类型的存储器和/或机器可访问的文件535中。内容曝 光数据530可以包括与多个受众相关联的多个其他受计量的媒体设备105 的内容曝光数据,以形成有意义的内容曝光统计。可以以统计方式对组 合后的内容曝光数据530进行处理以例如确定呈现和/或消费的内容的总 体效果、影响范围和/或观众人口统计。
尽管己经在图5中例示了示例处理服务器175,但是图5中例示的 元件、模块、逻辑、存储器和/或设备可以以任何方式组合、重新安排、 消除和/或实现。例如,图2的示例隐藏字幕匹配器225、示例索引引擎 205和/或示例关键词数据库210可以通过处理服务器175和/或在处理服 务器175内实现。在这样的示例中,内容曝光计量器150将隐藏字幕信 息222和观众测量数据170B提供给处理服务器175。基于接收到的隐藏 字幕信息222,处理服务器175在其中生成线索信息170A。在一些示例 中,处理服务器175从--些内容曝光计量器150接收隐藏字幕信息222 并且从其他内容曝光计量器150接收线索信息170A。此外,示例音频码引擎505、示例音频签名引擎510、存储器520、示例内容匹配器525、 示例存储器535和/或更总体上的示例处理服务器175可由硬件、软件、 固件和/或硬件、软件和/或固件的任何组合实现。例如,示例音频码引擎 505、示例音频签名引擎510、存储器520、示例内容匹配器525、示例存 储器535可以经由通过诸如来自Intef、 Sun 、八1\40@系列处理器和/或微 控制器的处理器的任何类型处理器175执行的机器可访问指令实现。此 外,内容曝光计量器可以包括额外的元件、模块、逻辑、存储器和/或设 备和/或可以包括一个以上的任何例示元件、模块和/或设备(例如,视频 码引擎或视频签名引擎)。
图6和图7是表示分别可以被执行为实现图1的示例内容曝光计量 器150和示例处理服务器175和/或更总体上说被执行为利用隐藏字幕信 息来计量内容曝光的示例处理的流程图。可以由处理器、控制器和/或任 何其他适当的处理设备执行图6和/或图7的示例处理。例如,可以以存 储在诸如闪存、与处理器(例如,以下关于图8讨论的示例中央处理单 元805)相关联的RAM的有形介质上的编码指令来实施图6和/或图7 的全部或部分流程图。或者可以利用专用集成电路(ASIC)、可编程逻辑 设备(PLD)、现场可编程逻辑设备(FPLD)、分立逻辑、硬件、固件等 来实现图6和/或图7的部分或全部示例处理。而且,图6和/或图7的部 分或全部示例处理可以手动或作为任何前述技术的组合来实现(例如, 固件和/或软件和硬件的组合)。而且,尽管参照图6和图7的流程图来对 图6和图7的示例处理进行说明,但是本领域普通技术人员将容易地认 识到,可以采用分别实现图1的示例内容曝光计量器150和/或示例处理 服务器175、和/或更总体上说利用隐藏字幕信息和节目指南数据来计量 内容曝光的许多其他方法。例如,可以改变各块的执行顺序,和/或可以 改变、消除、细分或组合所述的某些块。另外,本领域普通技术人员将 认识到,可以例如通过分幵的处理线程、处理器、设备、电路等按顺序 执行和/或并行执行图6和/或图7的示例处理。
图6的示例处理以隐藏字幕匹配器(例如,图2的示例隐藏字幕匹 配器225)从隐藏字幕解码引擎220获取和/或接收在下一时间间隔期间收集的隐藏字幕文本(即,词和/或多个词)的部分为开始(块605)。隐
藏字幕匹配器225接着将隐藏字幕文本与关键词数据库中的索引关键词 进行比较(例如,图2的关键词数据库210)(块610)。如果识别到至少 一个隐藏字幕词与至少一个索引关键词的匹配(块615),则识别与匹配 的关键词相对应的内容(例如,图3的示例内容320),并且更新识别内 容的直方图信息(块620)。如果没有识别到匹配(块615),则跳过直方 图的更新。
隐藏字幕匹配器225接着确定是否到达当前正在处理的时间间隔的 末端(例如,图3的示例间隔315)(即,是否已经出现时间间隔315的 边界(即,间隔边界))(块630)。如果还没有出现间隔边界(块630), 则控制返回到块605以得到下一隐藏字幕文本(块605)。如果已经出现 间隔边界(块630),则隐藏字幕匹配器225获得和/或接收从在刚刚结束 的时间间隔期间呈现和/或消费的内容收集的任何音频码和/或签名(块 635),并且获得和/或接收针对在刚刚结束的时间间隔期间呈现和/或消费 的内容计算的音频签名(块640)。隐藏字幕匹配器225接着创建和/或将 线索和观众测量数据条目(例如,图4的条目405)添加到表中和/或将 线索和观众测量数据发送到处理服务器175。
图7的示例处理以内容匹配器(例如,图5的示例内容匹配器525) 在时间间隔315读取线索170A和观众测量数据170B为幵始(块705)。 内容匹配器525识别最可能的内容、内容流和/或广播时间(块710),并 且确定最可能的内容、内容流和/或广播时间的音频码是否可用(块715)。 可附加地或替代地,内容匹配器525可以在块710利用当选择最可能的 内容、内容流和/或广播时间时的内容时间戳(例如,图4的示例时间戳 412)。例如,内容匹配器525可以首先选择与(例如,在广播内容时正 在呈现的)实况内容的呈现相关联的候选内容。如果适用的音频码包括 在观众测量数据170B中(块715),则内容匹配器525将音频码和/或签 名与对应于候选内容的音频码和/或签名515进行比较(块720)。如果存 在匹配(块725),则内容匹配器525结合内容曝光数据530中的时间戳 (例如,图4的示例时间戳412)对候选内容的呈现(即,识别候选内容为呈现禾D/或消费的内容)进行评分(credk)、积分(tally)和/或制表(块 730)。该时间戳指示内容曝光的时间。
如果在块715适用的音频码和/或签名不可用,或者如果在块725音 频码和/或签名不匹配,则内容匹配器525确定是否最可能的候选内容的 音频签名可用(块735)。如果音频签名不可用(块735),则内容匹配器 525假定呈现和/或消费最可能的候选内容、源和域广播时间,并且将候 选内容的曝光与时间戳(例如,图4的示例时间戳412) —起记录在内容 曝光数据530中(块730)。时间戳指示内容曝光的时间。
如果音频签名可用(块735),则内容匹配器525将该音频签名与对 应于候选内容的音频签名515进行比较(块740)。如果音频签名匹配(块 745),则内容匹配器525将该匹配(即,将候选内容识别为呈现和/或消 费的内容)以及时间戳(例如,图4的示例时间戳412)记录到内容曝光 数据530中(块730)。该时间戳指示内容曝光的时间。
如果音频签名不匹配(块745),则内容匹配器525确定是否存在更 多的线索(块750)。如果不存在更多的线索(块750),则控制进入块755 以确定是否存在要处理的线索的额外时间间隔。可附加地或替代地,内 容匹配器525将从媒体设备105收集的观众测量数据与在数据库中存储 的所有观众测量数据515进行比较,以确定是否识别到匹配。
如果存在更多线索(块750),则内容匹配器525识别下一最可能的 候选内容(块760)。控制接着返回到块715。
在块755,如果另外间隔的另外线索170A和观众测量数据170B可 用(块755),则控制返回到块705以处理下一时间间隔。如果没有另外 线索170A和观众测量数据170B可用(块755),则控制从图7的示例机 器可访问指令退出。
图8是可用于和/或编程为例如执行图6和/或图7的示例处理以分别 实现图1的示例内容曝光计量器150和示例处理服务器175、和/或更总 体上说利用隐藏字幕信息和节目指南数据来计量内容曝光的示例处理器 平台800的示意图。例如,处理器平台800可由一个或更多个通用微处 理器、微控制器等实现。图8的示例的处理器平台800包括通用可编程和/或专用处理器805。 处理器805执行在处理器805的主存储器(例如,在随机存取存储器 (RAM) 815和/或只读存储器(ROM) 820中)中存在的编码指令810 和/或812。处理器805可以是任何类型的处理单元(例如,来自Inte产、 Sim 、和/或AM^系列处理器和/或微控制器中的任何的处理器和/或微 控制器)。处理器805尤其可以执行图6和/或图7中的示例处理。
处理器805经由总线825与主存储器(包括RAM 815和ROM 820) 通信。RAM 815可以通过DRAM、 SDRAM禾B/或任何其他类型的RAM 设备实现。ROM 820可以通过闪存和/或任何其他期望类型的存储器设备 实现。对存储器S15和存储器820的访问典型地由存储器控制器(未示 出)以常规方式控制。RAM815例如可以用于存储图2的示例关键词数 据库210和/或图5的示例观众测量数据库515和/或示例内容曝光数据 530。
处理器平台800还包括常规的接口电路835。接口电路835可以通 过诸如外部存储器接口、串行端口、通用输入/输出等的任何类型的公知 接口标准实现。
将--个或更多个输入设备835和一个或更多个输出设备840连接到 接口电路835。输入设备835例如可以用于接收音频数据155、视频数据 160、内容指南数据165、音频数据185等。输出设备840例如可以用于 将观众测量数据170B和/或线索170A从内容曝光计量器150发送到处理 服务器175。
尽管这里已经对某些示例方法、装置和制品进行了说明,但是本专 利的覆盖范围不限于此。相反,本专利包括在字面上或在等同教导下合 理落入所附权利要求的范围内的所有方法、装置和制品。
权利要求
1. 一种方法,该方法包括以下步骤基于描述给定时段的节目的节目指南来形成各期间的关键词数据库;基于隐藏字幕文本和所述关键词数据库的比较来生成表示呈现一个或更多个相应媒体内容的可能性的一个或更多个值;收集观众测量数据;以及利用一个或更多个可能性值来识别一组基准数据,该组基准数据用于与所述观众测量数据进行比较以识别呈现的内容。
2. 如权利要求l所述的方法,其中利用所述可能性值还包括向收集 服务器提供一个或更多个生成的可能性值和收集的观众测量数据以识别 所述呈现的内容。
3. 如权利要求1所述的方法,其中生成表示可能性的一个或更多个 值包括针对一个或更多个相应媒体内容对所述隐藏字幕文本和所述关键 词数据库的一种或更多种匹配进行计数。
4. 如权利要求3所述的方法,该方法还包括 对相应其中一个所述媒体内容计算一种或更多种匹配的和;以及 将所述一种或更多种匹配的每一种除以所述和。
5. 如权利要求l所述的方法,其中所述节目指南信息包括可扩展标 记语言(XML)数据结构。
6. 如权利要求1所述的方法,其中所述观众测量数据包括音频码、 视频码、音频签名或视频签名中的至少一个。
7. 如权利要求6所述的方法,其中由广播公司插入所述音频码以识 别第一特定内容。
8. 如权利要求1所述的方法,其中一个或更多个可能性值包括最可能的频道的列表、最可能的节目的列表或最可能的时间的列表中的至少一个。
9. 一种装置,该装置包括音频测量引擎,其收集观众测量数据;索引引擎,其基于节目指南来创建关键词数据库;以及 隐藏字幕匹配器,其通过将隐藏字幕与所述关键词数据库比较来生 成表示呈现一个或更多个对应节目的可能性的一个或更多个值,所述一 个或更多个可能性值和所述观众测量数据可用于确定观众呈现统计。
10. 如权利要求9所述的装置,其中所述隐藏字幕匹配器将一个或 更多个生成的可能性值和一个或更多个提取的观众测量数据提供到收集 服务器来识别呈现的内容。
11. 如权利要求9所述的装置,该装置还包括用于提取隐藏字幕文本 的隐藏字幕解码引擎。
12. 如权利要求9所述的装置,其中一个或更多个观众测量码和/或 签名包括由广播公司插入以识别第一特定内容的一个或更多个音频码和/ 或签名。
13. 如权利要求9所述的装置,其中所述隐藏字幕匹配器通过针对 一个或更多个相应媒体内容对所述隐藏字幕文本和所述关键词数据库的 一种或更多种匹配进行计数来生成表示可能性的一个或更多个值。
14. 如权利要求9所述的装置,该装置还包括用于基于节目指南信 息来生成关键词数据库的条目的索引引擎。
15. 如权利要求14所述的装置,其中所述索引引擎生成关键词数据 库以移除冗余信息。
16. 如权利要求9所述的装置,其中一个或更多个可能性值包括最 可能的频道的列表、最可能的节目的列表或最可能的时间的列表中的至少一个o
17. —种存储机器可读指令的制品,当该指令被执行时,其使得所述机器基于描述给定时段的节目的节目指南来形成各期间的关键词数据库;基于隐藏字幕文本和所述关键词数据库的比较来生成表示呈现一个 或更多个相应内容的可能性的一个或更多个值;收集观众测量数据;以及利用一个或更多个可能性值来识别一组基准数据,该组基准数据用 于与所述观众测量数据进行比较以识别呈现的内容。
18. 如权利要求17所述的制品,其中当机器可访问指令被执行时,使得所述机器通过向收集服务器提供一个或更多个生成的可能性值和一 个或更多个收集的观众测量数据以识别所述呈现的内容来利用所述可能
19. 如权利要求17所述的制品,其中当机器可访问指令被执行时, 使得所述机器通过针对一个或更多个相应媒体内容对所述隐藏字幕文本 和所述关键词数据库的一种或更多种匹配进行计数来生成表示可能性的 一个或更多个值。
20. 如权利要求17所述的制品,所述节目指南信息包括可扩展标记 语言(XML)数据结构。
21. 如权利要求17所述的制品,其中所述观众测量数据包括音频码、 视频码、音频签名或视频签名中的至少一个。
22. 如权利要求21所述的制品,其中由广播公司插入所述音频码以 识别第一特定内容。
23. 如权利要求17所述的制品,其中一个或更多个可能性值包括最 可能的频道的列表、最可能的节目的列表或最可能的时间的列表中的至 少一个。
全文摘要
公开了一种利用隐藏字幕信息来计量内容曝光的方法和装置。该示例方法包括基于描述给定时段的节目的节目指南来形成各期间的关键词数据库,基于隐藏字幕文本和关键词数据库的比较来生成表示呈现一个或更多个相应媒体内容的可能性的一个或更多个值,收集观众测量数据;以及利用一个或更多个可能性值来识别一组基准数据,该组基准数据用于与所述观众测量数据比较以识别呈现的内容。
文档编号H04N5/91GK101536503SQ200780021863
公开日2009年9月16日 申请日期2007年6月11日 优先权日2006年6月15日
发明者阿伦·拉马斯瓦米 申请人:尼尔森(美国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1