用于识别广播节目内容的系统与方法

文档序号:7989996阅读:180来源:国知局
用于识别广播节目内容的系统与方法
【专利摘要】一种广播节目内容识别系统,其包括适于自一广播源取样广播节目内容的至少一接收器;用于识别及储存取样广播节目内容的一内容识别引擎;及与该内容识别模块数据通信的一内容数据库;该内容数据库适于在接收一来自一客户端装置的一查询被揭露时返回与该广播节目内容有关的信息。该系统被配置成使得在内容识别引擎不能识别取样广播节目内容的情况下,内容识别引擎将未被识别的样本分割成至少第一及第二连续部分,且将第一部分附加至一先前识别的样本上。
【专利说明】用于识别广播节目内容的系统与方法
【技术领域】
[0001]本发明有关于用于识别广播节目内容的系统与方法。该系统及方法特别适于,但并不限于识别一通信装置使用者调谐到的广播节目内容,诸如音乐,将在这种上下文中加以描述。
【背景技术】
[0002]以下对本发明背景的讨论的意图仅为协助理解本发明。应了解的是,讨论并非确认或承认所提到的任一数据在任一管辖范围中在发明的 优先权日:前被公开、被知悉或为本领域技术人员的普通一般知识的一部分。
[0003]当前的音乐识别系统及方法通常包括使用音乐识别引擎。此类音乐识别引擎通常利用某种形式的音乐识别算法。一种已知的音乐识别算法通常获得一音频样本,比较该音频样本与其数据库中的项目,及返回已识别音频样本上可利用的某些信息。
[0004]当前的音乐识别系统主要仍是作为独立功能或作为多个使用者可存取的在线服务。为了提高其性能以处理来自多个使用者的同时请求,在线音乐识别系统一般被实施为负载平衡的一服务器场;也就是说,当有大量的同时请求时,音乐识别系统将使许多自身的实例复制在服务器场中来分担负载。然而,这样的实施假定高频宽网络连接。虽然在线识别引擎具有大量请求,因为它们享有大因特网频宽,故仍提供适当的响应时间。
[0005]然而,当现时的音乐识别系统实施在一移动服务场合下时,服务器场的模型可能无法正常工作。这是因为移动网络,通常为GSM网络,的频宽有限。在支持数以百万计的使用者的一移动服务中,识别引擎处理上的服务器负载可能变得过重,因此造成难以接受的使用者体验及/或实际上服务失误。此类阻塞及瓶颈也将对网络的非数据使用产生不利影响。不良服务质量强烈促成用户流失,在这个接近市场饱和及激烈竞争的时代,可能导致移动网络运营商退出市场。
[0006]除了上述以外,在移动服务中目前的现有技术系统需要使用者将这首歌的片段撷取成一音频剪辑,并将其发送至歌曲识别引擎。一音频剪辑,无论如何简短且不论使用何种压缩技术,尺寸都相当大。
[0007]本发明试图提供减少上文所提及的缺点的一内容识别系统及方法。

【发明内容】

[0008]此发明被开发以处理减少伴随音乐识别请求发生的额外支出的需求,从而避免相对较低频宽GSM网络中出现阻塞和瓶颈。
[0009]依据本发明的第一层面,提供一广播节目内容识别系统,该系统包括
[0010]至少一接收器,适于自一广播源取样广播节目内容;
[0011]一内容识别引擎,用于识别及储存取样广播节目内容;及
[0012]一内容数据库,与内容识别模块数据通信;该内容数据库适于在自一客户端装置接收一查询时返回与广播节目内容有关的信息。[0013]较佳地是,客户端装置是适于接收广播节目内容的一移动装置。
[0014]有利地是,查询是一 SMS查询或一 HTTP post查询。该查询包括广播节目内容的时间戳及与广播源相关联的一识别。
[0015]较佳地是,该客户端装置被配置成以一规则的时间间隔自动地将站ID及时间戳的被动信息发送至内容数据库。在此配置中,内容数据库进一步与适于处理接收到的被动信息以定制给客户端装置的广播节目内容的一应用内容管理器数据通信。
[0016]较佳地是,被动信息可经由SMS、MMS、IP、专有发信,或其它可用的无线连接,诸如W1-f1、蓝牙或近场通信(NFC)来发送。
[0017]较佳地是,该系统进一步包括与内容数据库数据通信的一简档数据库,其中来自内容数据库及简档数据库的信息被适应性调整、汇集并合并以得出特定于某一使用者的结论。
[0018]依据本发明的第二层面,提供一广播节目内容识别系统,该系统包括适于取样广播节目内容的至少一接收器及用于识别并储存取样广播节目内容的一内容识别引擎;其中在内容识别引擎不能识别取样广播节目内容的情况下,内容识别模块将未被识别的样本分割成至少第一及第二连续部分,且将第一部分或第二部分附加至一先前识别的样本。
[0019]较佳地是,该系统适于迭代分割及附加未被识别的样本,直到达到一终止条件或附加的第一或第二部分是可识别的为止。
[0020]较佳地是,该系统适于将未被识别的样本标记为一失败样本。
[0021]依据本发明的第三层面,提供识别广播节目内容的一方法,该方法包括以下步骤:
[0022]a.接收一广播节目内容样本;
[0023]b.确定接收样本是否是可识别的;
[0024]c.若确定是不可识别的,则将接收样本分割为第一及第二连续部分 '及
[0025]d.将第一部分附加至一先前可识别的样本。
[0026]较佳地是,该方法包括重复步骤(b)到(d),直到附加样本是可识别的为止的步骤。
【专利附图】

【附图说明】
[0027]本发明现在将参照附图,仅以举例方式被描述,其中:
[0028]图1是依据本发明的第一实施例的一内容识别系统的一示意图。
[0029]图2是依据本发明的第二实施例的一内容识别系统的一示意图。
[0030]图3是绘示依据本发明的实施例的取样算法的一流程图。
[0031]图4是落在内容持续时间之外的一样本的一图标,样本落在内容持续时间之外将导致由内容识别系统识别出的一失败。
[0032]图5绘示各种情境中的一不可识别样本的分割。
【具体实施方式】
[0033]依据本发明的第一实施例,有一广播节目内容识别系统10。内容识别系统10包括多个广播接收器14,每一广播接收器14适于自一或多个广播源12接收广播节目内容;一内容识别引擎16;及一内容数据库18。广播源12通常为广播站。出于说明目的,广播源12为调频(FM)频率广播站。每一广播站12以一不同的FM频宽来广播节目内容。在此实施例中,出于说明目的,来自每一广播源的广播内容是音乐,虽然容易了解的是,广播内容可以是包括音频广告等的其它音频内容。
[0034]每一接收器14与其对应的广播源12通信。应了解的是,每一接收器14可与广播源共处于同一区域或可地理上分散。每一接收器14适于自与广播音乐对应的广播源12连续地取样广播音乐。每一接收器14被配置成以一取样时间t来取样广播节目内容。
[0035]音乐识别引擎16包括一程序,该程序可以是本领域技术人员已知的一第三方软件应用程序(例如,SoundHound?)。音乐识别引擎16适于接收并处理来自每一接收器14的音乐样本。由音乐识别引擎16所执行的处理包括在一规则识别时间内剖析并识别样本。
[0036]内容数据库18不断地由内容识别引擎16增加内容数据。自识别引擎16发送至内容数据库18的数据可以是任一所期望的格式。例如,内容数据库18可具有其自身的译码器组,该译码器组经由一简单的数据库查找查询,例如,但并不限于SQL查询将来自识别引擎16的编码译码,并将其转译成恰当的信息,诸如歌名、类型、艺术家等。内容数据库18适于自至少一客户端装置20接收查询,每一查询包括时间戳及对应于客户端装置20调谐到的广播站12的站ID。内容数据库18依据接收时间来组织自识别引擎16接收的信息,且因此,能提供一接收自内容识别引擎16的内容的历史记录。使用者可获得的历史记录视数据库18的尺寸及容量而定。
[0037]客户端装置20通常是一移动装置。在此实施例中,移动装置20启用一 FM调谐器,使得移动装置20的使用者可调谐到一选择的广播站12。移动装置20适于与内容数据库18数据通信,且可使用数据查询机制,诸如,HTTP POST请求、方法调用、基于关键词的SMS查询等来查询内容数据库18。
[0038]现在将就系统10的操作来描述。
[0039]作为说明,移动装置20的使用者经由调整并入移动装置20的FM调谐器来调谐至多个广播站12中一特定的广播站12。使用者想要知道他/她调谐到的一广播音乐曲调的名称,因此他基于之前所提到的协议(经由HTTP POST,SMS查询等)来存取移动装置接口以向播放列表数据库18发送一查询。
[0040]内容数据库18基于二参数来执行一简单的查找:
[0041]a.查询的时间戳及
[0042]b.站 ID。
[0043]内容数据库18检查查询的时间戳来确定该时间戳是否落入一规则的已知取样间隔tk内,取样间隔tk是广播节目内容一定会被播放的时段。若该时间戳并未落入已知的取样间隔tk内,则内容数据库18向客户端装置20返回一检测失败错误,且可选择地促使客户端装置20的使用者重试。
[0044]典型地是,考虑到成功识别音乐样本所需的最小取样时间,取样间隔t的值由音乐识别算法来确定。任一较短的时间间隔将有效阻止识别引擎14识别音频样本。
[0045]然而,为了防止取样横跨两个不同的音乐样本,防止识别引擎识别样本,期望使取样间隔t尽可能地短。因此,为了防止取样重叠样本,取样间隔t应理想地保持低于或至多等于广播内容的播放长度。然而,实际上,每一广播内容将不会具有相同的播放长度,且因此,取样间隔t应保持短小,且至多等于最短广播内容的播放长度。即使如此,还是有可能重叠,因为每一广播节目内容的播放长度将改变。实施例中的方法是使取样间隔t与所利用的内容识别引擎16所需的最小取样间隔相配,及消除任何重叠样本。在样本发生重叠的情况下(被称为重叠情况/情境),内容识别引擎16内的一取样算法将执行必要的操作来消除重叠情况(随后加以描述)。
[0046]不论(多个)使用者是否发出请求,每一接收器14都连续取样由广播站12所广播的音乐。取样是根据图3中所示及以下所述的取样算法来执行:
[0047]程序从自广播源12采集一广播内容样本开始(步骤32 )。尽管取样是连续的,但是一样本是在一有限时期被采集被理解为采集一个样本的步骤。
[0048]算法检查样本是否已准备就绪(步骤34)。检查步骤包括验证一样本是否是可利用的。在预设情况下,该样本是一原始样本。检查步骤也可对一转码样本来执行(即,包括一可选择的转码步骤,将原始样本转换成一十六进制的明文,或任一唯一编码)。在此情况下,检查步骤验证转码样本的可利用性。一旦样本已准备就绪,其就被馈送至识别引擎16 (步骤36)。识别引擎16基于已知技术执行内容的识别,并检查识别是否成功(步骤38)。若内容识别被确定为是成功的,则信息被储存在内容数据库18中(步骤40)。该样本也被保留在一循环队列缓冲器中。该循环队列缓冲器可以是一先进先出队列系统,且是一种用于在不再需要内容时丢弃缓冲内容的装置。若内容识别并不成功,则一失败标记被做成(步骤42)。一失败的识别意味着样本落入重叠情况类别,且因此需要分割(步骤44),分割步骤被绘示于图5中。分割样本及第一部分接着被附加至前一样本,前一样本被保持在一储存缓冲区队列中(步骤46)。顺序连接的样本接着被馈送至内容识别引擎(参照步骤36)。程序重复,直到样本被识别并储存为止(步骤40)。若识别失败,则较早分割样本的第一部分的一半将被分割且接着附加至缓冲区队列中之前一样本。
[0049]步骤44在下文中进一步描述且被绘示于图5中。
[0050]图5绘示一特定广播站12所播放的节目内容A及B,及在节目内容A及B连续播放时取出的样本1、2、3及4。容易了解的是,样本1、2及4是明确的,即内容A可使用样本I及2来确定,而内容B可使用样本4来确定。然而,因为部分样本3是在内容A被播送时被取出的,且另一部分的样本3是在内容B被播送时被取出的,样本3造成一重叠问题。
[0051]因此,根据步骤38,样本3的识别将失败,因为音乐识别算法将不能确定样本3是否应与内容A或内容B相关联。在检测失败样本3时,取样算法继续标记失败样本(步骤42)并将样本3分割成样本S3L (第一部分)及样本S3R。在将样本S3L附加至样本2时,内容识别引擎将能有效地识别样本2+S3L。然而,基于步骤38,样本S3R仍将失败,且因此仍然是一重叠问题。失败样本S3R接着触发样本RL及样本RR的另一分割。将指出的是,将RR附加至样本4将导致有效识别内容B。然而,将RL附加至样本2或样本4均将导致识别程序失败。应了解的是,虽然图示及说明已描述一「左附加」情境,系统同样支持「右附加」(即,例如,将样本S3R附加至样本3)。
[0052]如图5中所示者,在重叠样本,样本3被分割时,确定性间隔增大。在没有分割步骤44下,确定性间隔,亦即,内容识别引擎16能明确识别播送的节目内容A、被称作第一确定性间隔的周期因为样本3处于一重叠情况而缩短。因此,在第一确定性间隔之后且落入样本3内的一使用者查询将返回一错误。[0053]然而,应用分割程序/步骤44,确定性间隔增大。第一部分样本S3L被增加至第一确定性间隔,造成较长的第二确定性间隔。因此,落入第二确定性间隔内的同一使用者查询将导致节目内容A的明确识别。对于所示的同一查询点,在第二确定性间隔下的结果将更好。
[0054]在成功识别时,样本及其信息被储存,且识别引擎16更新已知间隔tk,使其包括取样时间t加附加部分所花费的时间。对于每一储存样本,系统检查是否属于步骤42的一失败标记已被完成(步骤48)。若一失败标记被检测到,则这意味着最近处理的样本是一分害I]且顺序连接的/附加的样本(对照于一规则长度的样本),因此,此时将转移到下一规则长度的样本(步骤32)。当没有失败标记时,系统检查是否有另一分割要处理(步骤50)。若没有其它样本要处理,则取样算法进行到下一样本(步骤32)。
[0055]所述分割程序(步骤44)及附加程序是迭代的,但是有一终止条件。此条件可由商务规则来支配,诸如,将迭代数目规则到某一数目n,或直到l/2t是最小取样时间tmin的持续时间为止。tmin是得到一有用样本所需的最小取样时间间隔;取样时间小于tmin的任一样本将是不可识别的。η可以被最初设定成2。
[0056]依据本发明的第二实施例,有一内容识别系统10,其中相同的数字指相同的部分。
[0057]内容识别系统10包括各被配置成自一广播源12接收广播节目内容的多个广播接收器14、一内容识别引擎16及一内容数据库18。广播源12通常是广播站。出于说明目的,广播源12是FM频率广播站。每一广播站以一不同的FM频宽来广播节目内容。在此实施例中,出于说明目的,来自每一广播源的广播内容是音乐,然而,容易了解的是,它们可以是包括广告等的其它音频内容。
[0058]除了第一实施例之外,还有一移动网络运营商或应用内容管理器900及一简档数据库950。
[0059]不同于第一实施例中所描述的一常规查询,一客户端装置20定期地发送关于站ID及时间戳的被动信息给内容数据库18,无需使用者主动请求信息。这例如可经由客户端装置设定来完成,且将不再进一步详细描述。因此,所发送的被动信息将能反映客户端装置20的使用者是否已切换成另一站12 (基于站ID的切换)。被动信息可透过GSM网络经由客户端装置20使用的SMS、MMS, IP、专有发信机制等来发送,或如果客户端装置20有此装备,透过其它可利用的无线连接,诸如W1-f1、蓝牙、近场通信(NFC)等来发送。
[0060]内容数据库18与简档数据库950数据通信。来自内容数据库18及简档数据库950的信息可被进一步适应调整、汇集并合并(数据挖掘)以得出某一使用者特定结论,例如,显示什么特定内容使客户端装置20的使用者切换频道及什么特定内容鼓励他们继续收播,使用者收听偏好,惟其它信息也可被追踪,诸如,收听的歌曲、停留在一特定频道的长度、当使用者改变频道时播送的内容等。简档数据库950将此信息馈送至移动网络运营商或应用内容管理器900。内容管理器900因此能通过建议的营销方式及针对目标的广告来定制供移动装置20使用的内容,诸如,例如,用户所偏爱的可供销售的同一类型的光学媒体内容,或此类型中所确认艺术家的一即将举行的音乐会等。
[0061]来自内容数据库18及简档数据库950的信息可进一步以各种不同方式来使用。关于使用者行为的信息可被汇集并合并,以显示什么特定广播节目内容使客户端装置20的使用者转到另一频道,及什么特定广播节目内容鼓励他们继续收播。关于在任一特定时间调谐到广播站12的收听者数目的信息将是可利用的,在广播一特定节目内容的最佳时机/时期产生可利用的信息给应用内容管理器900。该信息于是可由内容提供者及广播站12利用于决定将更吸引收听者的有关节目编排。除此之外,此实施例还将与评价广播站12有关。应了解的是,传统上,信息收集及评价使用从人工随机调查到利用随机对家庭与个人配置的装置自动化数据收集的手段来执行。利用此实施例,具有内建调谐器的所有移动装置20可附随有一整合的报告系统,其允许实时确定在任何时间有多少客户端装置20(且因此,终端使用者)在收听一特定的广播频道12。当前实施例允许广告客户依据目标听众得到使用哪一广播频道12的更佳建议。
[0062]上文所提到的整合报告系统在后台被实施,且类似于由客户端装置20所发送的被动信息。当客户端20的一使用者调谐至一特定频道时,被动信息可以是一简单的通知,且此类通知在一数据库报表中被对照,这可能是另一种服务,其为免费取用、基于订阅、按次计费者或其它可随后确定的商业模式。
[0063]该实施例可进一步用于对一定义领域内最常播放的音乐制作排行榜。无需任何终端使用者参与,组合组件14、16及18可用于监视且对任一特定时段受欢迎的音乐、歌曲或专辑制作排行榜。收听者密度也可基于移动装置20的位置及数目来确定。此外,位置信息可由移动网络运营者900经由简档数据库950来提供。利用该信息,可做成地理剖绘以提供更相关的内容及节目编排。
[0064]在本发明的其它实施例中,接收器14及音乐识别引擎16可由混合广播站来取代。
[0065]与内容识别系统10相关联的一优势是能追踪历史数据。在这方面,当一使用者查询「最近播放的歌曲是什么?」时,内容数据库18撷取信息并提供歌曲信息。
[0066]除此之外,只要装置具有sms功能,所述实施例与相对较前代的使用者装置向下兼容。在此情况下,使用者仍可发送一简单的文本请求(包括站id),且系统10将回复,例如关于电台正在播放歌曲的名称的一文本讯息。
[0067]变化形式
[0068]-简档数据库950及由组合组件14、16及18所产生的基于位置的服务可由任一相关功能的同等物来取代,诸如来自同一使用者的先前交易或事件的记录,或可自可利用记录挖掘出的任何模式。
[0069]-由接收器14连续取样可被执行24/7。
[0070]应理解的是,上述实施例仅通过此发明的范例来提供,诸如下文详述者,且相关领域技术人员显而易见的是,对其进一步修改及改良被视为落入所述的本发明的广泛范围及幅度内。此外,尽管本发明的个别实施例可能已被描述,本发明还意图涵盖所讨论实施例的组合。
【权利要求】
1.一种广播节目内容识别系统,其包括: 至少一个接收器,适于自一广播源取样广播节目内容; 一内容识别引擎,用于识别及储存所取样的广播节目内容;以及一内容数据库,与该内容识别模块数据通信;该内容数据库适于在自一客户端装置接收一查询时返回与该广播节目内容有关的信息。
2.如权利要求1所述的系统,其中该客户端装置是适于接收该广播节目内容的一移动>j-U ρ?α装直。
3.如权利要求1所述的系统,其中该查询是一SMS查询或一 HTTPpost查询。
4.如权利要求1所述的系统,其中该查询包括该广播节目内容的时间戳及与该广播源相关联的一识别。
5.如权利要求4所述的系统,其中该客户端装置被配置成以规则的时间间隔自动地将关于站ID及时间戳的被动信息发送至该内容数据库。
6.如权利要求5所述的系统,其中该内容数据库进一步与一应用内容管理器数据通信,该应用内容管理器适于处理接收到的被动信息以定制该客户端装置的广播节目内容。
7.如权利要求5所述的系统,其中该被动信息可经由SMS、MMS、IP、专有发信,或其它可用的无线连接,诸如W1-f1、蓝牙或近场通信(NFC)来发送。
8.如权利要求1所述的系统,该系统进一步包括与该内容数据库数据通信的一简档数据库,其中来自该内容数据库及简档数据库的信息被适应性调整、汇集并合并,以得出某一使用者特定的结论。`
9.一种广播节目内容识别系统,其包括: 适于取样广播节目内容的至少一接收器,及用于识别及储存所取样的广播节目内容的一内容识别引擎; 其中在该内容识别引擎不能识别该所取样的广播节目内容的情况下,该内容识别引擎将未被识别的样本分割成至少第一及第二连续部分,且将该第一部分或第二部分附加至一先前识别的样本。
10.如权利要求9所述的系统,其中该系统适于将该未被识别的样本标记为一失败样本。
11.如权利要求9所述的系统,其中该系统适于迭代分割及附加该未被识别的样本,直到达到一终止条件或附加的第一或第二部分是可识别的为止。
12.—种识别广播的节目内容的方法,其包括以下步骤: a、接收一广播的节目内容的样本; b、确定所接收的样本是否是可识别的; C、若该样本被确定为是不可识别的,则将该所接收的样本分割为一第一及一第二连续部分;及 d、将该第一部分或第二部分附加至一先前可识别的样本。
13.—种如权利要求12所述的方法,其中包括重复步骤(b)至(d)直到所附加的样本是可识别的为止的步骤。
【文档编号】H04H60/58GK103718482SQ201280022188
【公开日】2014年4月9日 申请日期:2012年4月30日 优先权日:2011年5月10日
【发明者】A·D·伊巴斯克, E·R·G·杰森, W·E·S·于, M·O·小迪亚兹 申请人:斯玛特哈伯私人有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1