乐曲认识方法与系统、商业广告认识方法与系统的制作方法

文档序号:6465565阅读:133来源:国知局
专利名称:乐曲认识方法与系统、商业广告认识方法与系统的制作方法
技术领域
本发明涉及乐曲认识方法与系统以及存放乐曲认识程序的存储介 质,尤其是涉及实时地对TV (电视)及FM (调频广播)等广播的图像或
语音信息中所广播的乐曲加以认识与储存的乐曲认识方法与系统、以及 存放乐曲认识程序的存储介质。
另外,本发明还涉及CM (Commercial,商业广告)认识方法与系统、 以及存放CM认程序的存储介质,尤其是涉及实时地对电视及FM等广播 的CM加以认识与储存的CM认识方法与系统、以及存放CM认识程序的存 储介质。
背景技术
以往,并不存在对实时广播的图像信息及音乐信息等内容物 (contents)中使用的乐曲名加以实时认识而储存于存储装置的系统。
又,对实时广播的CM加以实时认识、储存的装置也不存在。而仅以 给定长度分割出的CM信息来比较认识CM数据的系统则更不存在。
如上所述,在以往系统中,不存在对被播放乐曲进行监视的技术, 不能将乐曲名同播放时刻信息一道储存到存储装置里。当对某乐曲名附 加时刻信息时只有靠人工处理,不能实时地附加所广播乐曲名、该乐曲 被广播的时刻信息。
又,关于CM也一样,不存在对被播放图像或语音信息中被广播的 CM实时认识储存的装置,除了靠人工处理别无它法,使得在实时性、扩 大规模上受到限制。

发明内容
针对上述情况,本发明目的就在于提供一种可以对电视及FM等播 放的图像或语音信息中所广播乐曲的乐曲名实时认识与储存的播出单 生成技术。
又,本发明目的还在于提供一种不仅可以对无线播放的还可以对 通过因特网等通信网络譬如以倾泻下载方式传送的广播数据、在既无 标志信息也无透明信息的情况下也可以实时地对目标乐曲数据加以比 较认识的播出单生成技术。
又本发明目的还在于提供一种可以对电视及TM等播放的图像或 语音信息中被广播的CM实时认识与储存的CM认识技术。 为实现上述目的,本发明可行如下技术方案。 本发明为一种播出单生成方法,从所接收数据生成内容物的播出
单,其中,包括如下步骤
预先抽出内容物特征而保存于内容物特征文件中,将该内容物关 联信息保存于内容物信息数据库;
抽出上述所接收数据的特征而保存于数据特征文件中; 通过对照上述内容物特征文件数据和上述数据特征文件数据来检 索内容物;
若上述内容物特征文件数据和上述数据特征文件数据一致,则将 对应于该数据的数据作为检索结果文件保存;
从上述检索结果文件与上述内容物信息数据库生成该内容物的播 出单。
根据本发明,可以根据被播放的广播数据等自动生成时间序列播 出单。上述的所谓数据特征文件譬如是广播特征文件。
在上述技术方案中,还可包括如是步骤当于上述检索步骤上述 数据特征文件中某数据不含在上述内容物特征文件中时,将该数据登
记于上述内容物特征文件中。
根据本发明,可以自动向内容特征文件登记数据。 在上述技术方案中,还可包括如下步骤
使上述内容物特征文件中不含有的数据所对应的内容物可为人所
视听;
将该内容物关联信息登记于上述内容物信息数据库。 根据本发明,可以自动地将业已登记的内容物特征文件的数据所 关联信息进行登记,可以利用该登记信息自动地生成时间序列播出单。
在上述技术方案中,还可包括如下步骤 当于上述检索步骤上述数据特征文件中某数据不含在上述内容物
特征文件中时,使该数据所对应的内容物可为人所视听;
将该内容物同该内容物关联信息 一道追加于上述播出单。 根据本发明,可以补充时间序列播出单,可以生成更高精度的播出单。
为实现上述目的,本发明还可行如下技术方案。 本发明为一种乐曲认识方法,从所接收数据认识乐曲,其中,包
括如下步骤
预先抽出乐曲内容物特征而保存于内容物特征文件中; 抽出上述所接收数据的特征而保存于广播特征文件中; 通过对照上述内容物特征文件和上述广播特征文件的数据来检索 乐曲;
若乐曲名被判明,则将该乐曲名作为检索结果文件保存; 从上述检索结果文件生成乐曲的时间序列播出单。 根据本发明,可以自动生成乐曲有关时间序列播出单。 在上述技术方案中,还可包括如下步骤 判定一下上述所接收数据是否为乐曲;若为乐曲,则将表明其数据是乐曲的事项以及该数据接收时刻保 存于乐曲抽出文件中;
当于上述乐曲检索步骤中上述广播特征文件中某数据的乐曲名没
被判明时,将该数据保存于乐曲名未抽出文件中;
从上述广播特征文件和上述乐曲抽出文件以及上述乐曲名未抽出
文件生成乐曲未检出文件。
根据本发明,对于尽管是乐曲但却没有记载于时间序列播出单者
也可以掌握。
在上述技术方案中,还可包括如下步骤
使上述乐曲未检出文件中记录的乐曲可为人所闻听;
将同该乐曲未检出文件中业已记录的乐曲有关的乐曲名及时刻追
加于上述播出单中。
根据本发明,可以补充时间序列播出单,可以生成更高精度的播出单。
在上述技术方案中,可以利用上述检索结果文件和具有被同乐曲 名赋与关联的信息的内容物信息数据库,生成上述时间序列播出单。
上述时间序列播出单可包括时刻、该时刻广播的乐曲名、以及该 乐曲名关联的信息。
根据本发明,可以自动生成具有乐曲名及该乐曲名关联的种种信 息的时间序列播出单。
在上述技术方案中,可在多地域接收广播数据,将在各地域接收 的数据发送至中心系统,在该中心装置以上述乐曲认识方法生成上述 时间序列播出单。
根据本发明,可以生成同各地广播台所广播内容有关的时间序列 播出单。
又,本发明还可以是一种乐曲认识方法,从所接收数据认识乐曲,
其中,包括如下步骤
预先抽出乐曲内容物特征而保存于内容物特征文件中;
在多地域接收广播数据;
在各地域,抽出上述所接收数据的特征而作为广播特征文件数据
发送至中心系统;
在该中心系统,通过对照上述内容物特征文件和上述广播特征文
件的数据来检索乐曲;
若乐曲名被判明,则将该乐曲名作为检索结果文件保存;
从上述检索结果文件生成乐曲的时间序列播出单。
根据发明,由于可以在各地生成广播特征文件而传送至中心,所
以可降低对中心的传送量。
在上述技术方案中,还可具备下列特征
上述内容物信息数据库及上述乐曲名关联的信息包含CM有关信
息,
上述内容物信息数据库中CM有关信息预先以CM认识方法登记于 上述内容物信息数据库中;
该CM认识方法包括如下步骤
从所接收数据检出CM数据;
抽出上述CM数据特征而保存于广播特征文件中;
对照上述广播特征文件和预先存放有CM内容物特征的主CM内容 物特征文件的数据;
当广播特征文件中数据不存在于主CM内容物特征文件中时,将该 数据作为新CM登记于含在上述内容物信息数据库中的主CM内容物特 征文《牛中。
根据本发明,可以生成含有CM信息的时间序列播出单。 为实现上述目的,本发明还可行如下技术方案。
本发明为一种CM认识方法,从所接收数据认识CM,保存所认识 CM数据,其特征在于,包括如下步骤
从所接收数据检出CM数据;
抽出上述CM数据特征而保存于广播特征文件中;
对照上述广播特征文件和预先存放有CM内容物特征的主CM内容 物特征文件的数据;
当上述广播特征文件中数据不存在于主CM内容物特征文件中时, 将该数据作为新CM登记于主CM内容物特征文件中。
这样,可以使得由人工进行的CM监测作业实现自动化,可以提供 能够用于生成时间序列播出单的CM数据。
在上述技术方案中,上述从所接收数据检出CM数据的步骤可包括 检出CM数据开始点及结束点的步骤。
可在抽出上述CM数据特征之际,对一定长度部分一自被检出的 上述CM数据的上述开始点与上述结束点之中心向该开始点与该结束点 侧均等地延长而切割的部分一一加以特征化。
根据本发明,可以吸收CM数据输入误差。
在上述技术方案中,还可包括如下步骤
根据上述数据对照结果显示不存在于主CM内容物特征文件中的 CM数据;
将该CM数据关联信息登记于含主CM内容物特征文件的CM管理数 据库群的各数据库中。
根据本发明,可以对业已自动地登记于主CM内容物特征文件的CM 数据关联信息进行登记,利用该信息可以生成具有CM相关信息的时间 序列猙出单。
另外,本发明其它目的、特征、功能以及优点可通过以下结合附 图对细节的描述得以清楚理解。


图l是本发明原理示意图。 图2是本发明原理结构图。 图3是本发明乐曲认识系统框图。
图4是本发明乐曲认识系统概要动作时序流程图。
图5是本发明CM认识系统框图。
图6是本发明CM认识系统概要动作流程图(其一)。
图7是本发明CM认识系统概要动作流程图(其二)。
图8是本发明第1具体例的乐曲认识系统框图。
图9是本发明第1具体例的乐曲认识系统动作流程图。
图10是本发明第1实施例的应用例示意图。
图11是制作时间序列播出单时所用的各个文件其及关系的示意图。
图12是时间序列播出单属性信息的示意图。
图13是时间序列播出单属性信息的示意图。
图14是本发明第2具体例的CM认识系统框图。
图15是用于CM特征数据的剪辑方法的示意图。
图16是本发明第3具体例的系统结构图。
图17是图16所示系统概要动作流程图。
图18是本发明第3具体例的系统的详细动作流程图。
图19是乐曲数据储存方法示意图。
图20是CM数据储存方法示意图。
图21是从乐曲,CM未抽出文件生成内容物特征文件的处理的示意
具体实施例方式
第一实施方案
图1及图2示出了本实施例原理。
如图1所示,根据本实施例,预先抽出内容物(contents)特征而 保存于内容物特征文件(步骤1);抽出所接收数据特征而保存于广播. 特征文件(步骤2);通过对照内容物特征文件与广播特征文件的数据 来检索乐曲(步骤3);若乐曲被判明则将该乐曲有关信息作为检索结 果文件加以保存(步骤4);根据检索结果文件生成乐曲的时间序列播 出单(步骤5)。
又,如图2所示,本实施方案的乐曲认识系统原理结构包括内 容物生成单元300——预先生成内容物,且抽出乐曲内容物特征而保存 于内容物特征文件320;和特征抽出单元105——抽出所接收数据特征 而保存于广播特征文件140;和乐曲检索单元120—通过对照内容物 特征文件320与广播特征文件140的数据来检索乐曲,且将检索结果 保存于检索结果文件.150;以及播出单生成单元200—从检索结果文 件150生成时间序列的乐曲的时间序列播出单。
图3示出了本发明乐曲认识系统概要。该图所示系统包括播放 捕捉检索装置IOO、乐曲确认登记装置200、内容物生成装置300。这 些装置都由PC(个人计算机)等构成。须指出的是,以一台具备所有这 些装置的功能的PC也可以实现本系统,只不过考虑到PC处理负荷、 性能价格比以及当前硬件规格等情况而分成3个装置。
播放捕捉检索装置100包括播放捕捉部110、检索部120、乐曲 抽出文件130、广播特征文件HO、检索结果文件150、乐曲名未抽出 文件160、乐曲未检出文件170、以及时刻数据提供部180。
播放捕捉部110就电视台、电台广播连续地监测广播数据,判定 一下所监测广播数据是乐曲还是非乐曲;若是乐曲,则将表明监测时
间内所广播的是乐曲的事项记录于乐曲抽出文件130,而且从该乐曲
中实时地以7. 5秒间隔抽出广播数据特征而保存于广播特征文件140。 又,以7.5秒间隔将该乐曲作为数码数据保存于图中省略的文件中。 在此,播放捕捉部110是根据来自时刻数据提供部180的时刻信息进 行上述处理的。另夕卜,对被捕捉信息记录吋赋与时间标识。
这里,之所以用7.5秒间隔,是由于一般在想知道CM中所插播乐 曲吋CM播放时间目前最短是15秒,通过取其一半时间作检索时间可 以切实地进行乐曲数据检索。
须指出的是,关于播放捕捉部110进行的是乐曲还是非乐曲的判 定,可以利用预先判定是乐曲还是非乐曲(不是乐曲,而是讲话等)的 已有技术(譬如"乐览"(乐曲非乐曲检出技术)特愿平8-340293,特愿
平10-68158等)。播放捕捉部110利用该技术把表明判定出是乐曲的
事项登记于乐曲抽出文件130。
检索部120将保存有内容物生成装置300所生成内容物特征的文
件读取于内存,进一步还读取广播特征文件140,进行两个文件的对照 (matching),将对照结果存放于检索结果文件150。将没有对照上的数
据存放于乐曲名未抽出文件160。
关于上述对照检索,可以釆用日本专利第3065314号"高速信号检
索方法与装置及其存储介质"等记载的学习活动(learning active)检
索方法。根据该方法,求内容物特征文件数据与广播特征文件数据的
类似值,通过比较所求类似值与阈值来进行检索。欲知其详细请参见
上述日本专利第3065314号。
乐曲抽出文件130由表明是乐曲的信息被赋与时间标识的数据构
成,播放捕捉检索部100所生成的广播特征文件是TAZ文件(二进制文
件)。须指出的是,TAZ文件是学习活动检索中可以进行髙速比较处理
的文件。
还有,对于广播内容,将之保存于图中省略的WAV文件等之中。
在广播特征文件140,保存播放捕捉部IIO自动捕捉的被播放的广
播数据而且抽出特征后的广播数据的特征数据。
在乐曲未检出文件nO,保存从乐曲抽出文件130、乐曲名未抽出 文件160以及广播特征文件140抽出的虽为乐曲但却没有对照出来的 数据。
在检索结果文件150,保存检索部120对内容物生成装置300所生 成的内容物特征文件(后述)和广播特征文件140的对照结果。g卩,对 照结果为一致的数据所对应的信息(乐曲名等)将保存于检索结果文件, 而将广播特征文件140当中的在内容物特征文件不存在的数据保存于 乐曲名未抽出文件(后述)。
乐曲确认登记装置200包括乐曲确认部210以及登记部220,其输 出时间序列播出单230。
乐曲确认部210利用检索结果文件150以及内容物信息数据库330 来抽出业已被认识的乐曲所对应的时刻、乐曲名、作曲者、节目(CM) 名、委托客户、商品、演员、以及CD信息等,将这些提供给登记部220。
登记部220按时间顺序将乐曲确认部210所抽出的内容登记于时 间序列播出单230。
又,在乐曲确认登记装置2CX),通过操作者对存放在乐曲未检出文 件的广播内容进行确认来认识乐曲,将对应数据追加于时间序列播出 单。另外,可以通过操作者根据乐曲未检出文件时刻信息闻听由播放 捕捉部110以MV文件等方式捕捉的乐曲来确认广播内容。
内容物生成装置300包括内容物生成部310、内容物特征文件320、 以及内容物信息数据库330。
内容物生成部310从记录有乐曲的介质获取内容物,把乐曲名以 及可以通用于内容物特征文件320的属性数据保存于内容物信息数据
库330,进一步还抽出乐曲特征同乐曲名一起保存于内容物特征文件 320。
内容物特征文件320是内容物生成部310所生成的文件,其中保 存乐曲名及该乐曲特征信息。
内容物生成部310将乐曲的所有属性数据都存放于内容物信息数 据库330。
下面描述上述乐曲认识系统的动作。
图4示出了本发明乐曲认识系统动作概要。
步骤IOI :在内容物生成装置300,把来自乐曲内容物存储介质等 的乐曲以及该乐曲的属性数据登记于内容物信息数据库330。属性数据 譬如是乐曲名、作曲者、节目名、委托客户、商品名、演员名等信息。
步骤102 :在内容物生成装置300,抽出乐曲特征而保存于内容物 特征文件320。
到此为止的处理是下述处理的前处理。
步骤103 :在播放捕捉检索装置100捕捉被播放图像或语音等。在 此,"被播放图像或语音等"包括通过因特网广播的图像或语音等。
步骤104:播放捕捉检索装置ioo利用任意一种就捕捉内容检测
是乐曲还是非乐曲的技术来检测广播数据是乐曲还是非乐曲。
步骤105 :在步骤103所捕捉的是乐曲的场合,将表明该时间广播 的是乐曲的事项记录于乐曲抽出文件130。所谓记录表明是乐曲的事项
譬如是指在该时间建立代表乐曲的标志。
步骤106 :在上述步骤104、 105的同时,还实时地以7. 5秒间隔 抽出乐曲特征而保存于广播特征文件140。又,乐曲的广播数据也保存 于图中省略的文件中。
步骤107 :接着在播放捕捉检索装置100,启动检索应用程序以进 行乐曲检索,而且还把于上述步骤102由内容物生成装置300生成的
内容物特征文件320的内容读入内存。
步骤108 :播放捕捉检索装置100的检索部120还读入广播特征文 件140,进行两个文件的对照。这时,设釆用上述学习活动检索技术。
步骤109 :将上述对照结果保存于检索结果文件150。对于没对照 上的特征数据,将存放于乐曲名未抽出文件160。
步骤110 :接着在乐曲确认登记装置200,从内容物生成装置300 读取内容物信息数据库330的各内容。
步骤ill :乐曲确认登记装置200还进一步从播放捕捉检索装置
100读取检索结果文件150。
步骤112 :据此,乐曲确认登记装置200从检索结果文件150中数 据和内容物信息数据库330中数据抽出乐曲名、作曲者、所捕捉节目、 委托客户、商品、演员等信息,进行将这些数据按时间顺序排列的处 理,生成时间序列播出单而当作时间序列播出单数据库230保存起来。
步骤113 :还通过操作者视听乐曲来确认同记录于乐曲来检出播 出单的特征数据对应的乐曲名,以补充时间序列播出单。
第二实施方案
下面,作为本发明第2实施方案来说明认识保存电视以及FM/AM 所播放的图像或语音信息当中CM(商业广告)的CM认识系统。须指出的 是,通过参照该CM认识系统所生成的CM数据,可以从第一实施方案 中被认识的乐曲生成包含CM数据数据的播出单。
图5是本发明CM认识系统概要示意图。
该图所示CM认识系统包括播放捕捉检索装置400、 CM确认更新部 500以及CM管理数据库群600。
播放捕捉检索装置400包括捕捉部410、检索部420、 FM/AM CM 文件430、广播特征文件440、 CM数据文件450、 TV.CM数据文件460 以及时刻数据提供部470。
捕捉部410就电视台、电台广播连续地监测广播数据,通过判定
CM结束与开始来判定所监测广播数据是否为CM;若是CM,则将所监测 CM数据存放于TV CM数据文件460或存放于FM/AM CM文件430。捕 捉部410还根据时刻数据提供部470所提供的时刻信息对CM数据赋与 时间标识。
进一步,捕捉部410还从所捕捉数据生成CM的特征数据而存放于 广播特征文件440。后面将要提到,在生成广播特征文件440时,为了 吸收由CM开始与结束点划分出的数据的切断点误差,还将数据再加工 成一定长度(8.0秒)数据——自CM数据中心向两侧均等地延长而切断 的数据。于是,利用学习活动检索技术所揭示的技术对该再加工后数 据实行特征数据化而以TAZ格式存放。TAZ文件是在检索部420的学习 活动检索上可以实行高速比较处理的文件。
检索部420,将广播特征文件440和CM管理数据库群600中的保 存有CM特征的文件读入内存,进行两个文件的对照,将对照结果存放 于CM数据文件450。须指出的是,假设检索部420采用学习活动检索 (日本专利3065314号等)。这时,对于对照结果显示没有检索到CM者, 将其CM数据以播放时间为名称保存于CM数据文件450。
捕捉部410所捕捉的FM/AM播放CM数据被当作WAV格式(只有语 音的格式)文件保存在FM/AM CM文件43Q。
广播特征文件440中保存从410所捕捉的CM数据抽出的CM特征 数据。广播特征文件440是TAZ文件(二进制文件)。
捕捉部410所捕捉的电视播放CM数据被当作AVI格式文件保存在 TV CM数据文件460。
CM确认更新部500读取保存着CM名没有被判明的CM数据的CM 数据文件450。由于CM数据文件450的CM为新CM的可能性大,所以 操作者譬如利用Windows Media Player 7等软件进行新登记CM确认,
抽出作广告者(委托客户)、商品名、乐曲名以及演员名等,存放于CM
管理数据库群600的文件中。
CM管理数据库群600包括CM主文件610、商品主文件620、演员 主文件630、乐曲名主文件640、作广告者主文件650、以及主CM内容 物特征文件660。在CM确认更新部500抽出商品主文件620、演员主 文件630、乐曲名主文件640、作广告者主文件650、以及主CM内容物 特征文件660中的数据。这些主文件是按存放在CM主文件610中CM 数据属性生成的主文件。
下面描述根据上述结构的动作。
图6及图7是本发明CM认识系统概要动作流程图。
步骤301 :在播放捕捉检索装置400的捕捉部410,捕捉被播放的 广播数据。
步骤302 :检索部410从所捕捉广播数据检测出CM数据,按前述 方法从CM数据抽出广播特征。
步骤303 :将所抽出广播特征存放于广播特征文件440,进入步骤
307。
步骤304、 305 :在上述处理同时,将电视CM存放于TV CM数据 文件460。
步骤306 :若被抽出的CM是业已FM/AM播放过的CM时,还将该 CM存放于FM/AM CM文件430。
步骤307 :在步骤303之后,检索部420将广播特征文件440和 CM管理数据库群600的CM内容物特征文件660读取于内存,比较两个 文件而行学习活动检索。
步骤308 :当通过检索判明CM时转到步骤307,进行下个广播特 征文件440数据与CM内容物特征文件660的检索。而当没有判明CM 时则转到步骤309。
步骤309 :没有判明CM时将播放时间作为名称登记于CM数据文件
450。
步骤310 :在CM确认更新部500,操作者利用现有软件等进行业 已登记于CM数据文件450的CM的确认。
步骤311 :由操作者进行CM主文件610维护,进一步,还从CM 主文件610开始进行各属性主文件的维护。
这样,就可以将新CM登记到数据库里。
第三实施例
也可以象第一实施方案所示的从所认识乐曲生成时间序列播出单 那样,从第二实施方案中所认识的CM生成时间序列播出单。
又,也可以象第二实施方案的CM例那样来更新有关乐曲的内容物 特征文件、内容物信息数据库。
进一步,也可以一边象第一实施方案那样生成时间序列播出单一 边象第二实施方案那样来更新有关CM或乐曲的内容物特征文件、内容 物信息数据库。其具体例后述。
下面,根据附图描述对应于上述各实施方案的具体例。
对应于第一实施方案的具体例(第1具体例)
图8是本发明第1具体例的乐曲认识系统框图。
关于该图所示各装置,同图3所示结构一样者标注同一标号,并 省略说明。
图9是本发明第1具体例的乐曲认识系统动作流程图。
下面根据图8及图9描述本发明乐曲认识系统。
如图8所示,在本乐曲认识系统中连接有播放捕捉检索装置 100—由实时地捕捉广播内容的PC110和检索广播特征文件M0的 PC120连接而成;和内容物生成装置300—具有对保持乐曲内容物特 征的内容物特征文件320及内容物信息数据库330加以管理的PC310;
以及乐曲确认登记装置200 —将时间序列播出单登记于数据库。
图9所示处理系列A中,PCil0捕捉播放内容(步骤201),从所捕 捉数据以7.5秒间隔输出广播特征文件140(步骤202);接着,PC120 利用从内容物生成装置300获取并预先在内存打开的内容物特征文件 320的内容与广播特征文件140,以学习活动检索方式检索乐曲(步骤 203),将检索结果输出至检索结果文件150(步骤205)。又,此时,若 经检索没有判明乐曲,则将特征数据存放于乐曲名未抽出文件(步骤 207)。
上述处理一完成,就会在乐曲确认登记装置200从检索结果文件 150的检索结果和内容物信息数据库生成时间序列播出单而保存于数 据库230。
在图9所示处理系列B中,播放捕捉检索装置100的PC110判定 一下广播数据是否为乐曲(步骤301);若是乐曲则将向乐曲抽出文件 130输出表明是乐曲的事项以及时间标识(步骤302)。又乐曲本身也 赋与时间标识而保存于图中省略的WAV文件等中。
这样,通过合并乐曲名未抽出文件160 (处理系列A的)和乐曲抽出 文件130(处理系列B的)就可以输出按时间分的乐曲未检出文件 nO(步骤208、 209),可以通过操作者向检索结果文件150反馈。据此 就可以补充时间序列播出单。
须指出的是,作为操作者的操作是一边在进行检索的PC120上 确认乐曲未检出文件的内容一边在检索结果文件150中补充所需数据 项目。
还须指出的是,设上述内容物特征文件320、检索结果文件150 采用TAZ文件(用于学习活动检索的二进制文件)。
在播出单生成方面要结合检索结果文件和包含CM主文件等的内容 物信息数据库。关于其具体例,描述应用例于下。
须指出的是,在图8所示例子中,PC110对于全国各地广播内容可 以通过从相应区域进行数据接收而作捕捉,进而进行广播特征文件生
成等。也可以在全国各地配置PC110,各PC110捕捉当地广播内容而生 成广播特征文件,然后将该广播特征文件发送给配置在中心的PCi20。
下面描述本发明应用例。
图IO是上述本发明具体例的应用例示意图。
该图中,内容物管理中心对应于图8所示内容物生成装置300。又, 设数据中心对应于图8的播放捕捉检索装置100。
首先,在内容物管理中心,从唱盘公司得到试听CD等,从CD销 售商店等购入DVD、新版CD等,根据这些存储介质将内容物连同内容 物属性存放于内容物信息数据库330,而且还抽出内容物特征而存放 于内容物特征文件320(在图10的例子中为乐曲数据库)。
接着,数据中心利用频道选择器获取譬如通过配置在全国各地的 天线得到的(电视(VHS)或FM等广播内容、或者通过抛物面天线得到的 卫星广播内容。在数据中心,以7.5秒间隔对所获取广播数据进行数 码化处理,同时抽出数据特征而存放于广播特征文件140,而且还判别 一下是乐曲还是讲话等非乐曲,继而将判别结果存放于乐曲抽出文件 130。
在数据中心的检索用PC,以检索引擎(学习活动检索技术)从内容 物管理中心预先获取的内容物特征文件以及广播特征文件检索乐曲而 存放于检索结果文件150。
据此,在数据中心内的用做乐曲确认登记装置200的PC中,利用 检索结果文件、内容物信息数据库330生成时间序列播出单。在图IO 的例子中,是按时刻(赋与检索结果文件的时间标识)顺序将乐曲名、 作曲者、节目(CM)、委托客户、商品、演员、以及CD信息等作为时间 序列播出单而登记于供网点(Web Site)用的数据库。又,对于不能检
索出的乐曲,由操作者进行乐曲追加。
图11示出了制作吋间序列播出单时所用的各个文件其及关系。 如该图所示,从广播特征文件和内容物特征文件生成检索结果文
件和乐曲名未抽出文件。进而从检索结果文件和内容物信息数据库生
成时间序列播出单。
另一方面,通过从乐曲抽出文件和乐曲名未抽出文件等生成乐曲
未检出文件、并由操作者确认该文件记录的乐曲所对应的乐曲名等,可
以补充时间序列播出单。又,对于乐曲名等得到确认的乐曲,可以视
需要进行特征化处理,据此将之追加于内容物特征文件中。这样,当
捕捉相当于TAZ4的乐曲时就可以认识该乐曲。
下面参考图12、 13描述利用内容物信息数据库生成图10所示时 间序列播出单的方法。
图12示意的是就播出单确定时刻9点时的各项目的示意图。如该 图所示,内容物信息数据库包括始自TAZ数据而串联起来的各数据库 (主数据库)。因此,只要从TAZ数据判明乐曲名,就可以通过自音源 主文件开始逐一査找各主文件而获取时刻9点的各信息。另外,从广 播台名和时刻还可以得知节目名。就这样,可以生成含有各种关联信 息的时间序列播出单。
图13所示的是时刻11点46分时的情形,同上述一样,可以根据 TAZ数据并利用各主文件来获取对应于该时刻的各种信息。
下面说明本发明乐曲认识系统模拟结果。该模拟以含有7首乐曲 的实际FM广播录音(约35分)作广播取样;以CD乐曲193首作数据库 取样,其中有6首含在上述广播取样中。
模拟条件设为以7.5秒间隔将广播取样同所有193首乐曲对照 (193首-20小时);PC服务器的规格——用1个CPU (Pentium Xeon 933MHZ)、 2GB内存、Linux gcc 291。 在上述条件下实施本发明方法模拟的结果显示所有应检出的6
首都被正确地检出;时间误差大致在7.5内;就速度而言,约45秒完 成了35分(2100秒)长检索,即实际时间下速度的50倍(-2100/45),就 是说若实际时间都占用的话则可处理大约9000首。
又,虽然上述实施例中是就图8、图9描述的,但是也可以把图9 所示动作设计成程序,将之存放于同数据中心及内容物管理中心所用 计算机连接的硬盘、软盘以及CD-ROM等可移动存储介质中,当实施本 发明之际将其安装于数据中心及内容物管理中心所用计算机。据此可 以容易地实现本发明。
对应于第二实施方案的具体例(第2具体例)
在此描述的是从被广播的广播数据实时地检出CM而加以认识保存 之例。通过将这样保存的CM数据用作上述主文件,可以生成含CM关 联信息的时间序列播出单。
图M是本发明第2实施例的CM认识系统框图。
关于该图所示构成要素,同图5所示结构一样者标注同一标号,并 省略说明。
本实施例的CM认识系统包括播放捕捉检索装置400——由捕捉 广播内容的捕捉PC410和比较广播特征文件440与CM内容物特征文件 660的学习活动检索PC420;和CM确认更新部500—参照学习活动检 索PC420输出的CM数据450进行CM确认及更新处理;以及CM管理数 据库群600—管理CM的各主文件。
在此说明一下图14中的文件格式。
广播特征文件440是存放实时抽出的TV CM及FM/AM CM两者特 征的TAZ格式文件。
TV CM数据文件460是存放TV CM的AVI格式文件,其被同广播 特征文件440内容成对地管理。
FM/AM CM文件430是存放FM/AM CM的WAV格式文件,其被同广 播特征文件440内容成对地管理。
CM数据文件450是存放应新登记的CM的文件,当为TV CM时数 据譬如以AVI格式存放,而当为FM/AM CM时数据譬如以WAV格式存 放。
CM管理数据库群600的主CM内容物特征文件660以TAZ格式存放。
下面参照上述过的图6、 7描述以上结构下之动作。
捕捉部410捕捉播放内容(步骤301)。然后,捕捉PC410靠CM检 测模块获取CM的开始和结束点。该CM检测内部模块可见于特愿平 6-312976"图像切断点检测方法及装置"(谷村 外村)等。
接着,为了吸收由CM检测模块所切出数据的切断点误差,还如图 15所示,将切出数据再加工成一定长度(8.0秒)数据一自CM数据中 心向两侧均等地延长而切断的数据,将其作为广播特征抽出(步骤302) 而存放于广播特征文件440 (步骤303)。
捕捉PC410,当靠CM检测模块切断的播放数据为TV数据时将之以 AVI格式存放,播放数据为FM/AM数据时将之以WAV格式存放(步骤 304、 305以及306)。
接着,学习活动检索PC420将广播特征文件440以及CM管理数据 库群600的主CM内容物特征文件660读入内存,进行学习活动检索(步 骤307)。在此,若CM在CM内容物特征文件660没有登记则将之登记 于CM数据文件450 (步骤309),而且若在CM内容物特征文件660没有 登记时还将该CM无条件地登记于主CM内容物特征文件660。
接着,在CM确认更新部500进行业已登记于CM数据文件450的 CM之确认(步骤310)。 Qi确认处理利用现有软件进行。又,通过靠操 作者追加各种最终附加信息来将该CM登记于CM主文件610。进一步, 还根掘业已登记于CM主文件610的CM的属性,以对应数据更新商品
主文件620、演员主文件630、乐曲名主文件640、作广告者主文件650、 以及主CM内容物特征文件660 (步骤311)。
又,虽然上述实施例中是就图6、图7所示流程描述的,但是也可 以把图6所示动作设计成程序,将之存放于同播放捕捉检索装置所用 计算机连接的硬盘、软盘以及CD-ROM等可移动存储介质中,当实施本 发明之际将其安装于播放捕捉检索装置所用计算机(捕捉PC、学习活动 检索PC)。据此可以容易地实现本发明。
在上述实施例中,虽然所示出的对TV、 FM/AM等广播台播放的广 播数据进行捕捉而加以认识保存的处理,但是并非仅限于此例,对于 通过因特网等通信网络传送的数据也可以应用和上述一样的处理。
须指出的是,在上述实施例中示出的对乐曲以7.5秒、对CM以8 秒间隔进行特征化的例子不过只是一例而已,并非限定于此。
对应于第三实施方案的具体例(第3具体例)
在此描述的是通过捕捉乐曲、CM而如第一实施例那样生成播出单、 同时如第二实施例那样登记内容物生成部中数据之例。
图16示出了本发明第3具体例的系统结构。
如该图所示,本第3具体例的乐曲CM认识系统包括播放捕捉检 索装置700—捕捉广播内容、进行乐曲及CM检索;和内容物生成装 置800—生成内容信息数据库;以及CM确认登记装置900—从检索 结果文件及内容信息数据库生成时间序列播出单,而且将被新确认乐 曲或CM的属性信息登记于内容物生成装置800。
播放捕捉检索装置700包括播放捕捉部710、检索部720、乐曲CM 抽出文件730、广播特征文件740、检索结果文件750、乐曲"CM未抽 出文4牛760、乐曲 CM未检出文件770、以及内容物特征文件生成部 780。内容生成装置包括内容物生成部810、内容物特征文件820、以 及内容物信息数据库830。
图17是图16所示系统概要动作流程图。参照图17描述动作概要。
首先在内容物生成装置800抽出乐曲、CM的特征而作为内容特征 文件保存(步骤401)。在播放捕捉检索装置700,播放捕捉部710捕捉 含有乐曲、CM的广播内容物作为AVI文件、WAV文件等保存,同时还 抽出内容物特征而保存于广播特征文件740(步骤402)。接着,利用内 容物特征文件820与广播特征文件740检索乐曲、CM (步骤403)。于是, 当乐曲或CM被判明时,将乐曲或CM有关信息保存于检索结果文件(步 骤404),生成时间序列播出单(步骤405)。而当乐曲或CM没有判明时, 将没被判明乐曲或CM的特征数据等保存于乐曲 CM未抽出文件(步骤 406),生成对应于该乐曲、CM的内容物特征文件,自动登记于内容物 生成装置800的内容物特征文件820(步骤407)。
下面以图18所示播放捕捉检索装置700的处理流程图进一步详述 以上处理。
如图8所示,本实施例中播放捕捉检索装置700的处理可以分为 进行乐曲、CM检索的处理系列1;和进行乐曲检索、乐曲判别、保存 的处理系列2;以及进行CM检出、保存的处理系列3。
在处理系列2,同第一实施例一样,判定广播内容是否为乐曲,生 成乐曲抽出文件,而且还将乐曲数据作为WAV文件等保存起来(步骤 501—503)。乐曲数据保存方法见图9。这样,每隔7.5秒即将被判定 为乐曲的部分保存起来。
在处理系列3,同第二实施例一样,通过检测广播切断点生成CM 抽出文件,而且还将CM数据作为AVI文件等保存起来(步骤511 — 513)。其处理情形见图20。这样,就将切断点间的CM部分保存了起来。
多页指出的是,CM抽出文件是象乐曲方面的乐曲抽出文件那样的文 件,记录有表明是CM的事项和其时间。
在处理系列l,就乐曲而言同第一实施例一样,就CM而言则同第二实施例一样,进行特征抽出、乐曲或CM检索(步骤521、 522)。
在判明了乐曲或CM名的场合,生成检索结果文件750(步骤523)。 而在没有判明乐曲或CM名的场合,则将数据存放于CM未抽出文件(步 骤524),利用该数据自动生成内容物特征文件(步骤525),假登记于 内容特征文件520。
图21示出了从乐曲 CM未抽出文件生成内容物特征文件的处理。 若此,从对应于乐曲"CM未抽出文件中数据的乐曲、CM的数据文件(AVI 或WAV)生成内容物特征文件。
又,象第一实施例那样,从乐曲"CM未抽出文件与乐曲CM抽出文 件等生成乐曲"CM未检出文件(步骤526),由操作者确认乐曲、CM,以 被确认乐曲、CM来进行时间序列播出单补充(步骤527)。进一步,还 利用确认结果进行内容物生成装置中各数据库更新(将TAZ文件与乐曲 名、作曲者等关联起来),据此将假登记内容物特征文件转为正式登记
(步骤528)。
通过进行这样的处理,可以一边进行时间序列播出单生成一边进 行以时间序列播出单为基础的内容物特征文件的数据追加、以及乐曲 或CM关联信息的登记。
如上所述,根据实时认识乐曲的本发明,以7.5秒间隔对播放的 广播数据(CM所用乐曲等)加以数码化、特征化,同预先准备的乐曲的 内容特征文件进行对照,能以被广播的时刻信息连同乐曲名作为时间 序列播出单保存于存储装置上。据此,可以获取乐曲名、作曲者、节 目(CM)、委托客户、商品、演员、以及CD信息等的按时刻分的播出单, 可以获取有意义的信息结果。这些可以被销售对象活用于市场信息等。
乡页指出的是,之所以用7.5秒间隔进行数码化特征化,是由于目 前一般CM广播时间最短是15秒,为切实地进行检索而取其一半时间。 故,视内容物种类而将数码化间隔时间变更为其它值也有效,并非一 定是7.5秒。
又根据本发明,对于已往由人工进行的CM监测作业可以实时地 自动认识,即便没有标志信息或透明信息等也照样可以实时登记TV以 及FM/AM播放的CM数据。进而,还可以将此CM数据用于生成时间序 列播出单。
又,根据本发明,在生成时间序列播出单过程中,由于对于乐曲 名没被判明的数据可以自动登记于内容物生成装置,所以可以充实内 容物生成装置中数据库数据,可以生成更髙精度的时间序列播出单。
本发明并非仅限于上述实施例,在不脱离本发明范围情况下可以 进行种种变形应用。
权利要求
1、一种CM认识方法,从所接收数据认识CM,保存所认识CM数据,其特征在于,包括如下步骤从所接收数据检出CM数据;抽出上述CM数据特征而保存于广播特征文件中;对照上述广播特征文件和预先存放有CM内容物特征的主CM内容物特征文件的数据;以及当上述广播特征文件中数据不存在于主CM内容物特征文件中时,将该数据作为新CM登记于主CM内容物特征文件中,上述从所接收数据检出CM数据的步骤包括检出CM数据开始点及结束点的步骤,在抽出上述CM数据特征之际,对一定长度部分加以特征化,所述一定长度部分是自被检出的上述CM数据的上述开始点与上述结束点之中心向该开始点与该结束点侧均等地延长而切割的部分。
2、 一种CM认识系统,用于从所接收数据认识CM、并保存所认识CM数据,其特征在于,包括如下各单元从所接收数据检出CM数据的单元;抽出上述CM数据特征而保存于广播特征文件中的单元;对照上述广播特征文件和预先存放有CM内容物特征的主CM内容物特 征文件的数据的单元;以及当上述广播特征文件中数据不存在于主CM内容物特征文件中时将该 数据作为新CM登记于主CM内容物特征文件中的单元,上述从所接收数据检出CM数据的单元包括检出CM数据开始点及结束 点的单元,在抽出上述CM数据特征之际,对一定长度部分加以特征化,所述一 定长度部分是自被检出的上述CM数据的上述开始点与上述结束点之中心 向该开始点与该结束点侧均等地延长而切割的部分。
全文摘要
提供了一种从接收数据生成广播内容物播出单的播出单生成方法。方法包括如下步骤预先抽出广播内容物特征保存于内容物特征文件,将广播内容物关联信息保存于内容物信息数据库;抽出接收数据特征而保存于广播特征文件;通过对照内容物特征文件和广播特征文件数据来检索给定种类广播内容物;若给定种类广播内容物名被判明则将对应于给定种类广播内容物的数据作为检索结果文件保存;从检索结果文件与内容物信息数据库生成给定种类广播内容物播出单。
文档编号G06F17/30GK101354716SQ200810131090
公开日2009年1月28日 申请日期2001年10月22日 优先权日2000年10月23日
发明者伊能美和子, 小林竜浩 申请人:Ntt通信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1