“内容”边界检测装置、监控方法、“内容”位置检测方法、程序及存储介质的制作方法

文档序号:6357180阅读:305来源:国知局
专利名称:“内容”边界检测装置、监控方法、“内容”位置检测方法、程序及存储介质的制作方法
技术领域
本发明涉及为进行广播监控对广播的视频及音频中的“内容”的边界位置进行检测的方法。
背景技术
在视频及音乐等的“内容”的广播散布中,为进行市场调查及征收“内容”使用费而对广播实行监控、对“内容”的广播时刻及广播时间的长度进行调查。
在这种广播监控中,通过对广播的“内容”以某种方法附加该“内容”的识别信息,从广播中将此识别信息检测出就可确定该“内容”广播的时刻及时间。
作为在“内容”上附加识别信息的现有的方法,比如,存在在“内容”的最初及最后的位置单纯附加特别波形的信号的方法及同样在“内容”的最初及最后的位置附加由副载波承载的规定信息的方法。在后面这种由副载波传输信息的方法中,在音频(声音和音乐)“内容”的场合,通过使该副载波的大小按照广播内容的声音的包络线而改变就可以使人耳难以听到。
此外,对于视频“内容”,还存在在视频记录中不使用的单线大小的区域中插入规定的编码信息的方法。
但是,近年来,以不影响“内容”品质的方式将特别的信息嵌入的电子水印技术日益普及。于是,提出了利用这一电子水印技术将广播监控用的识别信息(以下称其为监控信息)嵌入到“内容”。在此场合,对作为广播的全部内容的广播数据进行电子水印检测处理,并根据监控信息的检测结果通过确定规定的“内容”何时广播(在广播中的时间上的位置)而进行广播监控。
利用这一电子水印技术在“内容”上附加监控信息的方法,与上述在副载波及“内容”上的特定区域附加信息的方法比较,有以下的优点。
就是说,由于可以在整个“内容”中嵌入信息,不大会由于“内容”的加工和破坏(劣化)而失掉信息。
另外,由于是在“内容”本身附加监控信息,由第三者加工很困难,所以对抗伪造或篡改的安全性很高。
通常,在“内容”中嵌入水印是为了防止该“内容”被伪造或篡改。因此,在“内容”中一个信息(电子水印)反复多次嵌入。于是,在采用电子水印作为用来检测“内容”广播的时刻及时间的监控信息时,必须根据此电子水印来识别“内容”的边界位置(开始地点及结束地点)。
在监控的“内容”是视频“内容”的场合,可以以帧为单位,将有关该“内容”的信息(ID信息)全部嵌入到一帧之中。因而,检测每一帧的ID信息,就可以将检测出的与紧前面的帧不同的ID信息的帧识别为该“内容”的边界。
可是,在音频“内容”的场合,与视频“内容”不同,根据电子水印识别“内容”的边界不容易。其理由是因为不存在像视频“内容”的帧那样明确的时间分割之故。另外,由于在时间位置(时间轴上特定的位置)上不存在像视频“内容”的帧那样的宽度,在一个时间位置不能将ID信息全部嵌入,所以为了嵌入ID信息,“内容”必须较具有一定的时间宽度。
就是说,为了从嵌入到音频“内容”中的电子水印的ID信息识别该“内容”的边界,对于一维连续的位流(比特流),就必须确定一个“内容”的检测是从何处起到何处止和下一个“内容”的检测是从何处开始的。
此外,在广播的“内容”中,由于噪声、高音损失、为了广播进行的编辑处理、音频压缩等的影响,电子水印会损坏,检测出的位的内容也可能包含很多错误。为了修正这些错误引起的误判,必须从一定程度的长度的音频部分检出电子水印,确定ID信息。
可是,根据这一方法,由于要检测电子水印的音频具有一定的时间宽度,所以很难精密地确定嵌入的电子水印的内容在何处切换。
如上所述,如果在音频“内容”的场合,利用在“内容”中嵌入的电子水印来识别广播的“内容”的边界用作监控信息,则很难同时满足识别音频“内容”的边界位置的识别结果的可靠性和精度。
因此,本发明的目的就是要通过组合多种方法作为根据从“内容”检测出的电子水印识别的“内容”的边界的方法,使得在“内容”边界位置识别中同时满足高可靠性和高精度。

发明内容
为达到上述目的,本发明可以提供一种“内容”边界检测装置,其特征在于具有如下的构成。就是说,此“内容”边界检测装置的构成包括检测在具有时间要素的“内容”中嵌入的电子水印的电子水印检测部件;相应于利用此电子水印检测部件检测出的电子水印的状态,检测此“内容”的边界位置的边界位置检测部件;此边界位置检测部件的构成包括根据在利用电子水印检测部件检测出的电子水印中记述的信息,确定此“内容”的边界位置的第一边界确定单元;根据作为此电子水印嵌入的位(比特)的嵌入模式,确定此“内容”的边界位置的第二边界确定单元;将利用此第一、第二边界确定单元的处理结果进行组合而检测出“内容”的边界位置。
如果采用此第一、第二边界确定单元,首先利用第一边界确定单元确定具有一定程度时间宽度而可靠性高的边界位置,之后以第一边界确定单元所确定的确定范围作为对象,利用第二边界确定单元确定精度高的边界位置,则可以进行兼具高可靠性及高精度的边界位置的检测。
此处,此边界检测部件的构成可以具备根据在此电子水印检测中使用的同步信号的出现模式确定此“内容”的边界位置的第三边界确定单元,并且再将利用此第三边界确定单元的处理结果与利用第一、第二边界确定单元的处理结果进行组合而检测出此“内容”的边界位置。
对于利用上述第一、第二边界确定单元判断为“内容”的边界位置的位置,再通过确定基于同步信号的边界位置,可以以更高精度检测出边界位置。
另外,本发明的“内容”边界检测装置的构成可以包括作为第二边界确定单元,不是基于上述位的嵌入模式的方法,而是采取根据位的检测强度确定“内容”的边界位置的方法的单元。
因为这种基于此检测强度的方法,不适用于“内容”切换的场合,而是适用于“内容”开始或结束的场合的边界位置的确定,所以可以与基于位嵌入模式的方法并用并根据“内容”的边界的种类分别使用。
另外,本发明可以提供一种“内容”边界检测装置,其特征在于具有如下的构成。此“内容”边界检测装置的构成包括检测在具有时间要素的“内容”中嵌入的电子水印的电子水印检测部件;相应于利用此电子水印检测部件检测出的电子水印的状态,检测此“内容”的边界位置的边界位置检测部件;此边界位置检测部件的特征在于以在此“内容”中作为电子水印嵌入的规定的位串作为对象,根据此位串中的一定的长度的部分位串预测规定位的检出结果,根据此位的实际检出结果是否与预测一致确定此“内容”的边界位置。
此处,此边界检测部件,在将构成M序列的位串作为电子水印反复嵌入到“内容”中的场合,根据规定的M序列,预测构成此M序列的位串的下面检出的位的检出结果,相应于此预测结果,可以确定此“内容”的边界位置。
由这一“内容”边界检测装置使用的方法,可以只用在将边界位置检测用的专用位嵌入到“内容”中的场合,如果满足这样的条件,通过并用上述几个方法,可以进行可靠性及精度更高的边界位置的检测。
另外,本发明的特征在于其构成包括在确定在包含种种的“内容”的广播数据中规定的“内容”占据的时间的监控方法中,对此广播数据执行电子水印检测处理,检测出嵌入到此“内容”中的电子水印的步骤;相应于检测出的电子水印的状态,检测此广播数据的此“内容”的边界位置的步骤;根据检测出的此“内容”的边界位置,确定在此广播数据中此“内容”占据的时间的步骤;而检测此“内容”的边界位置的步骤的构成包括藉助基于在检测出的电子水印中记述的信息的第一方法,确定嵌入此电子水印的“内容”的边界位置的步骤;以及以利用此第一方法确定的边界位置为对象,藉助基于作为电子水印嵌入的位的有关信息的第二方法,以比第一方法更高的精度确定此“内容”的边界位置的步骤。
此处,藉助第二方法确定“内容”的边界位置的步骤的构成包括以作为电子水印嵌入到此“内容”中的规定的位串作为对象,根据此位串中的一定长度的部分位串预测规定的位的检出结果的步骤;以及根据此位的实际检测结果与预测是否一致确定此“内容”的边界位置的步骤。
此外,在此监控方法中,检测此“内容”的边界位置的步骤的构成可以包括以利用第二方法确定的边界位置作为对象,藉助基于在上述电子水印检测中使用的同步信号的出现模式的第三方法,以比利用第二方法更高的精度确定此“内容”的边界位置的步骤。
另外,本发明,也可以作为检测包含规定的音频“内容”的音频数据的该音频“内容”的时间位置的“内容”位置检测方法而提供。此“内容”位置检测方法的特征在于其构成包括对音频数据执行电子水印的检测处理,将嵌入到音频“内容”中的电子水印检测出的步骤;藉助基于在检测出的电子水印中记述的信息的第一方法确定将此电子水印嵌入的音频“内容”的边界位置的步骤;以及以此第一方法确定的边界位置作为对象,藉助基于作为电子水印嵌入的位的检测强度的第二方法,以比第一方法更高的精度确定此音频“内容”的边界位置的步骤。
另外,本发明,可以将与上述“内容”位置检测方法及监控方法的各步骤相对应的处理作为由计算机执行的程序予以提供。此外,此程序,可以存储于磁盘及光盘、半导体存储器、其他存储介质中进行发布,或是存储于与网络相连接的程序传送装置的存储装置中经该网络进行发布而提供。


图1为应用本实施方式的广播监控系统的概略说明图。
图2为本实施方式的“内容”边界识别装置的构成说明图。
图3为示出在本实施方式的检测方法[1]中在挪动检测范围的同时反复重复检测电子水印的情况。
图4为示出在本实施方式的检测方法[1]中从有电子水印的状态向无电子水印的状态变化的场合的边界位置的说明图。
图5为示出在本实施方式的检测方法[1]中从无电子水印的状态向有电子水印的状态变化的场合的边界位置的说明图。
图6为示出在本实施方式的检测方法[1]中电子水印的ID信息变化的场合的边界位置的说明图。
图7为示出在检测方法[1]中位错误的个数超过可纠正错误的上限个数(Nc)、ID信息检测失败的几率的示图。
图8为示出在检测方法[1]中在检测范围横跨边界的条件下可纠正错误的几率的示图。
图9为示出在检测方法[2]中在音频“内容”中嵌入的ID信息产生的检测位的周期性的示图。
图10为示出在检测方法[2]中在与音频“内容”的边界无关的情况下错误检测出不一致的几率的示图。
图11为示出在检测方法[2]中在规定的N位中错误检测出不一致的地点至少为一个的几率的示图。
图12为示出在检测方法[2]中可在越过边界M位的地点初次检测出不一致的几率的示图。
图13为示出在检测方法[2]中可在越过边界后的某一位的地点初次检测出不一致的期望值的示图。
图14为示出在检测方法[3]中在音频数据中在嵌入电子水印的地点和未嵌入电子水印的地点的位检测强度的差异的示图。
图15为示出在检测方法[3]中在有无电子水印的判断中使用的位的个数为32个时的电子水印有无判断的几率的示图。
图16为示出在检测方法[3]中在有无电子水印的判断中使用的位的个数为32个时的误判率、误采用率及丢失率的示图。
图17为示出在检测方法[3]中在有无电子水印的判断中使用的位的个数为16个时的电子水印有无判断的几率的示图。
图18为示出在检测方法[3]中在有无电子水印的判断中使用的位的个数为16个时的电子水印有无判断的几率的示图。
图19为示出在检测方法[3]中在有无电子水印的判断中使用的位的个数为8个时的电子水印有无判断的几率的示图。
图20为示出在检测方法[3]中在有无电子水印的判断中使用的位的个数为8个时的电子水印有无判断的几率的示图。
图21为示出在检测方法[3]中在有无电子水印的判断中使用的位的个数为4个时的电子水印有无判断的几率的示图。
图22为示出在检测方法[3]中在有无电子水印的判断中使用的位的个数为4个时的电子水印有无判断的几率的示图。
图23为说明在检测方法[4]中在音频“内容”中嵌入的电子水印的同步位置的示图。
图24为说明在检测方法[4]中在音频“内容”切换时的电子水印的同步位置的出现方式的示图。
图25为说明在检测方法[4]中在音频“内容”结束时的电子水印的同步位置的出现方式的示图。
图26为说明在检测方法[5]中在音频“内容”中作为电子水印嵌入的边界检测用位的构成的示图。
图27为示出在检测方法[5]中实际上在与音频“内容”的边界无关的情况下错误检测出不一致的几率的示图。
图28为示出在检测方法[5]中在规定的N位范围中错误检测出不一致的地点至少为一个的几率的示图。
图29为示出在检测方法[5]中可在越过边界M位的地点初次检测出不一致的几率的示图。
图30为示出在检测方法[5]中电子水印的位检测强度的平均丢失率的示图。
图31为示出在检测方法[5]中作为边界检测位的M序列维的丢失率的示图。
图32为说明本实施方式中确定边界检测部件的音频“内容”的边界位置的处理的流程图。
具体实施例方式
下面根据附图所示的本发明的实施方式对本发明予以详细说明。
图1为应用本实施方式的广播监控系统的概略说明图。另外,本实施方式的“内容”的边界的识别方法,除了音频“内容”以外,也可以应用于视频和音频组合的“内容”的音频部分及视频“内容”本身,但在以下的说明中是针对以音频“内容”为对象的场合进行叙述的。
如图1所示,应用本实施方式的系统,其构成包括广播音频“内容”的广播台100和接收该广播执行广播监控的监控中心200。
广播台100,在广播节目表等之中,从“内容”数据库110取得所要求的音频“内容”进行广播。此“内容”数据库110,可以是广播台100的自己的数据库,也可以利用外单位的数据库。在音频“内容”中采用电子水印技术嵌入有关该音频“内容”的信息(ID信息)。作为监控信息,除了采用ID信息之外,也可以嵌入广播监控专用的信息。另外,在广播台100中,也还可以将有关该广播台100的信息嵌入作为电子水印。将ID信息嵌入到音频“内容”中的电子水印的方法,只要是能够满足下面两个条件,任何方法都可以(i)可以嵌入多个位。
(ii)通过将不同的位在时间上顺序嵌入而将(i)的多个位嵌入。另外,广播方式,无论是地上波广播、卫星广播等利用电波的广播,还是利用广播缆线的有线广播、利用因特网等的信息网络的广播等,什么方式都可以。
监控中心200,接收广播台100的广播,调查其广播的音频“内容”、何时广播和广播多长时间。此调查结果,用来作为市场调查及征收“内容”使用费的资料。
另外,监控中心200,为进行这一调查,使用嵌入到音频“内容”中的电子水印的ID信息。就是说,利用从接收广播得到的音频数据(包括音频“内容”和音频“内容”以外的音频)检测出的ID信息识别有无音频“内容”及其边界,根据该识别结果确定广播该音频“内容”的时刻及时间。
此处,所谓的在本实施方式中使用的音频“内容”的边界,是根据检测出的电子水印的状态进行区别的音频“内容”的定界符,在电子水印发生下面任何一种变化时都将该位置判断为音频“内容”的边界。
(i)从嵌入有某种电子水印的状态变化为无电子水印嵌入的状态。
(ii)从无电子水印嵌入的状态变化为嵌入有某种电子水印的状态。
(iii)电子水印嵌入的信息的内容变化。
图2为设置于监控中心200,从接收到的音频“内容”检测嵌入到该音频“内容”中的电子水印,根据该检测结果识别音频“内容”的边界的“内容”边界识别装置的构成说明图。
参照图2,本实施方式的“内容”边界识别装置10的构成包括检测嵌入到音频“内容”中的电子水印的电子水印检测部件11和根据电子水印检测部件11的检测结果检测“内容”的边界的边界检测部件12。
“内容”边界识别装置10,可以由个人计算机及工作站以及其他的计算机装置实现。另外,图2所示的电子水印检测部件11及边界检测部件12,是由程序控制的CPU执行的软件块。控制CPU的该程序,可以存储于磁盘及光盘等存储介质中进行发布,或由程序传送装置经网络发布而提供。
在上述构成中,电子水印检测部件11,从所接收到的音频“内容”中检测电子水印,求出各个位的检测值。此时,根据需要进行位置同步。此外,在对所得到的检测值进行纠错等之后,利用此检测值取得嵌入电子水印的音频数据的ID信息。
边界检测部件12,根据在电子水印检测部件11中检测出的电子水印的ID信息、检测出该ID信息的时间位置、各个位的检测值、同步位置,确定接收的音频数据的音频“内容”的边界位置。
下面对利用边界检测部件12的音频“内容”的边界位置的检测方法予以详细说明。
在本实施方式中,为了同时满足音频“内容”的边界位置识别中的可靠性和精度,组合使用多个检测方法确定音频“内容”的边界位置。于是,首先对可以在本实施方式中使用的各个检测方法予以说明,其次对组合这些检测方法确定边界位置的步骤予以说明。
在本实施方式中,采用以下5种方法作为音频“内容”的边界位置的检测方法。(1)在挪动检测时间带的同时多次检测ID信息,根据检测结果识别边界位置的方法。(2)使用嵌入到音频“内容”中的ID信息的一致性识别边界位置的方法。(3)根据电子水印的检测强度识别边界位置的方法。(4)根据ID信息的同步位置的连续性识别边界位置的方法。(5)使用专用位识别边界位置的方法。
另外,在以下的说明中,将音频“内容”的边界位置识别的可靠性分为“误采用率”和“丢失率”两个出错率(误码率)定义如下。
“误采用率”将完全不是边界的地点判断为边界的几率。误采用率高时就到处全是边界。
“丢失率”未将应该判断为边界的候补判断为边界的几率。丢失率高时设定不出边界。
在误采用率和丢失率之间建立一个折衷关系。就是说,如果将用来识别为边界的阈值设定的高,则误采用率下降丢失率上升,反之,如果阈值设定的低,则误采用率上升而丢失率下降。
另外,识别音频“内容”的边界的精度,表示以规定的方法判断边界位置时的误差的大小。就是说,在将边界的某一位值只确定在具有一定的时间宽度的范围之中的方法中,就是确定边界位置在该范围内也会出现误差(在该范围中何处是正确的边界位置不清楚),而识别精度降低。
下面对各个检测方法予以说明。
(1)在挪动检测时间带的同时多次检测ID信息,根据检测结果识别边界位置的方法检测方法[1]。
由于电子水印对音频“内容”的嵌入具有一定程度的时间长度,在其检测中也要从具有一定的时间长度的范围中检测。在检测方法[1]中,是在将用于此检测的范围的一定长度重叠挪动的同时反复检测电子水印。于是,比较从各个检测范围检测出的电子水印的ID信息,就可以判断在哪一时点ID信息发生变化。另外,为了是在电子水印检测中不使反复嵌入到音频“内容”中的ID信息不会被漏读,各检测范围重叠的距离必须至少等于电子水印的一个周期。
图3为示出在挪动检测范围的同时反复重复检测电子水印的情况的示图。
在图3中,对检测范围1、检测范围2、检测范围3顺序检测电子水印。其中示出在检测范围1、2中,检测出ID信息“A”的电子水印,在检测范围3中未检测出电子水印(在图中以“×”表示)。
图4至图6为分别示出利用检测方法[1]识别上述3种边界每一种的音频“内容”的边界的情况的示图,图4为从有电子水印的状态向无电子水印的状态变化的场合的边界位置的说明图,图5为示出从无电子水印的状态向有电子水印的状态变化的场合的边界位置的说明图,而图6为示出电子水印的ID信息变化的场合的边界位置的说明图。
在图4中,标记为A的各检测范围是检测出ID信息“A”的电子水印的检测范围,标记为“×”的各检测范围是未检测出电子水印的检测范围。另外,ID信息“A”是嵌入到音频“内容”A内的ID信息。
如图4所示,对音频“内容”的电子水印的检测结果从有电子水印的状态向无电子水印的状态变化的场合,一直到最后检测出ID信息“A”的电子水印的检测范围,确实存在具有ID信息“A”的音频“内容”A。所以,可知该音频“内容”A结束的边界位置,在最后检测出ID信息“A”的电子水印的检测范围的终端位置和最初未检测出电子水印的检测范围的终端位置之间,即两个检测范围的终端侧的错动宽度的某一处。但是,在此范围内不能确定正确的边界位置。
在图5中也与图4一样,标记为A的各检测范围是检测出ID信息“A”的电子水印的检测范围,标记为“×”的各检测范围是未检测出电子水印的检测范围。另外,ID信息“A”是嵌入到音频“内容”A内的ID信息。
如图5所示,对音频“内容”的电子水印的检测结果从无电子水印的状态向有电子水印的状态变化的场合,在最初检测出ID信息“A”的电子水印的检测范围装置中,已经存在具有ID信息“A”的音频“内容”A。所以,可知该音频“内容”A开始的边界位置,在最初检测出ID信息“A”的电子水印的检测范围的开始位置和未检测出电子水印的最后的检测范围的开始位置之间,即两个检测范围的开始侧的错动宽度的某一处。但是,在此范围内不能确定正确的边界位置。
在图6中,标记为A的各检测范围是检测出ID信息“A”的电子水印的检测范围,标记为“B”的各检测范围是检测出ID信息“B”的电子水印的检测范围,标记为“×”的各检测范围是未检测出表示确定的ID信息的电子水印的检测范围。另外,ID信息“A”是嵌入到音频“内容”A内的ID信息,ID信息“B”是嵌入到音频“内容”B内的ID信息。
如图6所示,在对音频“内容”的电子水印的检测结果中ID信息是变化的场合,在横跨音频“内容”A和音频“内容”B的检测范围中,任何一个ID信息都检测不出(在此检测范围中,在检测强度等方面可以得到某种信息作为电子水印嵌入的迹象)。然而,与图4、图5一样,一直到最后检测出ID信息“A”的电子水印的检测范围,确实存在具有ID信息“A”的音频“内容”A,在最初检测出ID信息“B”的电子水印的检测范围装置中,已经存在具有ID信息“B”的音频“内容”B。因而,可知从音频“内容”A切换到音频“内容”B的边界位置,在最后检测出ID信息“A”的电子水印的检测范围的终端位置和最初检测出ID信息“B”的电子水印的检测范围的开始位置之间的某一处。但是,在此范围内不能确定正确的边界位置。
如上所述,此检测方法[1],对上述的三种边界都可以检测出边界位置。
于是,作为电子水印反复嵌入到音频“内容”中的ID信息,只要未因为破坏而失掉,在本方法的检测范围的任何一个都一定可以检测出来。另外,如果多少有一些破坏的话,可以利用电子水印检测部件11的通常的纠错技术进行修正。所以,采用这一方法的音频“内容”的边界位置的识别的可靠性非常高。
另一方面,利用本方法确定的音频“内容”的边界位置的识别总是具有一定的时间宽度。并且,也可以将一方的检测范围的终点及始点,或作为边界位置识别的范围的中间点等假设为音频“内容”的边界,在此场合,必然伴随有误差产生。所以,音频“内容”的边界识别的精度低。
但是,在电子水印检测部件11的纠错能力高的场合,即使是越过音频“内容”的边界,也不能获得正确的ID信息时,有时也可以判断藉助纠错修正ID信息,可以检测出电子水印。此时,利用本方法进行的音频“内容”的边界的识别精度更低。此外,在此场合,为避免此种纠错引起的弊害,如果增加检测范围的错动宽度,如图4、5所示,因为以低于此范围的精度不能识别音频“内容”的边界,识别精度将更降低。
下面对检测方法[1]的音频“内容”的边界识别的可靠性及精度予以更详细的说明。
将在电子水印的ID信息中包含的位数设定为N。假设电子水印的各个位的检测强度平均为μ,分散为1。于是期望的出错率Pb可以以下面的公式1表示。
Pb(μ)=∫-∞012πexp(-(x-μ)22)dx]]>此时,作为位数的N个中的位误差率为k个几率Pa1可用下面的公式2求得。
Pa1(μ,N,x)=kN(Pb(μ))k(1-Pb(μ))N-k]]>如果发生位错误的个数未超过可纠错的上限个数(Nc),就可以对位错误进行修正而输出正确的ID信息。此几率Pa2可由下面的公式3求得。
Pa2(μ,N,Nc)=Σk=0NcPa1(μ,N,x)]]>另一方面,如果发生位错误的个数超过可纠错的上限个数(Nc),则ID信息的检测失败的几率Pa3可由下面的公式4求得。
Pa3(μ,N,Nc)=1-Pa2(μ,N, Nc)图7为在Nc=9、N=128的场合对μ画出的误采用率Pa3的曲线图。
如果在检测出正确的ID信息的间隙检测ID信息失败的话,在本来不是音频“内容”的边界的地点会误采用为边界。所以,这一几率表示误采用率。
下面考虑检测范围跨越音频“内容”的边界的场合。设检测范围的最后尾的M位跨越边界,是另外的信息的位。因为不了解作为另外的信息嵌入的是什么信息,可以假设在某一位置嵌入同一位的可能性与嵌入不同位的可能性相等为1/2。于是,在跨越边界的M个位之中,与边界前的ID信息的同一位置的位偶然一致的位的数目为m的可能性Pa4可以以下面的公式5表示。
Pa4(M,m)=mM(12)M]]>其中,与ID信息不一致的(M-m)个的位嵌入以取得的检测强度越大,则越会成为纠错或检错失败的原因。此处,与ID信息不一致的一个位成为检错失败的原因的几率是因为在不引起位错误时成为检错失败的原因之故(1-Pb)。因此,在M位跨越边界的条件下,成为纠错、检错失败的原因的位的个数为k的几率可由下面的方式求出。
首先,对检错失败有贡献的位有以下三种。
1.在跨越边界的M个位之中,m个位偶然一致。在这些一致的位之中数个由于破坏而反转,成为检错失败的原因。假设这种位的个数为n个。关于这一个数的限制为0≤n≤m≤M≤N在与ID信息一致的m个位之中,n个位反转的几率为Pa1(μ,m,n)。
2.在跨越边界的M个位之中,如果检测出与ID信息不一致的(M-m)个的位,则成为检错失败的原因。设在这些位之中有数个由于破坏而反转,不成为检错失败的原因,而不如此的成为检错失败的原因的位的个数为P。关于这一个数的限制为0≤p≤M-m≤M≤N因为在与ID信息不一致的(M-m)个位之中,p个位不反转的几率,与在(M-m)个之中,(M-m-p)个反转的几率相等,为Pa1(μ,M-m,M-m-p)。
3.边界以前的N-M个位是一致的,原本不会成为检错失败的原因。然而,其中的数个可能破坏而反转,成为检错失败的原因。假设成为这种检错失败的原因的位的个数为q个。关于这一个数的限制为0≤q≤N-M≤N所以,在此N-M个位之中,q个位反转的几率为Pa1(μ,N-M,q)。
于是,由于成为检错失败的原因的位的个数合计为k,k=n+p+q成立。
由上述可知,在有M位跨越边界的条件下,成为检错失败的原因的位的个数为k的几率为Pa5可由下面的公式6求得。
Pa5(N,M,k)]]>=Σm=0N(Pa4(M,m)Σn+p+q=kPa1(μ,m,n)Pa1(μ,M-m),M-m-p)Pa1(μ,N-M,q)]]>利用这一公式,在有M位跨越边界的条件下也可以检错的几率Pa6可由下面的公式7求得。
Pa6(N,M,Nc)=Σk=0NcPa5(N,M,k)]]>图8为在Nc=9的场合,对跨越边界的位的个数,画出的可纠错几率Pa6的曲线图。
如果M的值增加,最终表示ID信息的N位全部由下面的音频“内容”的ID信息构成。在此场合,因为检测出的ID信息本身改变,不会出现漏过边界的情况。
在利用电子水印的音频“内容”的边界识别中最优选的状态是(a)在检测范围不跨越边界时总是可以成功进行纠错而得到正确的ID信息,(b)在检测范围跨越边界时总是可以进行检错而得不到ID信息的状态。为实现(a)的要件,优选的是纠错能力强,但究竟纠错能力是有限制的,完全实现是不可能的。另一方面,为实现(b)的要件,纠错能力反而成为障碍。这是因为由于在检测范围稍微跨越边界的程度之下可纠错,所以尽管跨越边界也可以判断ID信息存在。
所以,如上所述,在检测方法[1]中,对识别音频“内容”的边界的精度不能有太高的期望,优选的是保持在识别音频“内容”的边界的大致的位置。
(2)使用嵌入到音频“内容”的ID信息的一致性识别边界位置的方法检测方法[2]。
通常,在电子水印中,是将同一ID信息(位串)反复嵌入到音频“内容”中。在检测方法[2]中,根据此位串的嵌入模式,通过比较相距一个周期的位,检查ID信息的连续性(一致性),判断在什么时点ID信息发生改变。
图9为示出在音频“内容”中嵌入的ID信息产生的检测位的周期性的示图。
在图9中,从音频“内容”中反复检测出ID信息“B”的电子水印。由于各ID信息“B”的内容是相同的,检测出的位串具有周期性(在一个周期中一个ID信息)。
如图9所示,在对音频“内容”反复嵌入同一的ID信息的场合,周期地检测出同一位串。所以,如果音频“内容”继续而ID信息不变化,则新检测出的位与前一个周期的ID信息“B”相对应的位串的同一位置的位是相同的。根据检测出的周期性,换言之,新检测出的位与前一个周期检测出的位是相同的。因此可知,如果检测出的位与前一个周期检测出的位不同,就意味着作为电子水印嵌入到音频“内容”中的ID信息是变化的,该位是音频“内容”的边界。
然而,实际上,尽管音频“内容”继续,但由于电子水印发生破坏,不能忽视检测位的变化的可能性。因此,对位检测强度设定阈值,利用以超过该阈值的检测强度检测出的位识别位的一致不一致,进行上述的判断。
另一方面,如果进行这种处理,在音频“内容”结束而在音频“内容”中不存在电子水印的场合,由于电子水印的检测强度一样会降低,会变成为无检测位的状态。因此,不能识别位的一致不一致,就不能进行上述的判断。所以,检测方法[2],不适用于检测音频“内容”结束的场合及开始的场合的边界(上述的(i)(ii)的边界),而适用于音频“内容”切换、电子水印的ID信息变化的场合的边界(上述的(iii)的边界)的检测。
另外,即使是音频“内容”切换电子水印的ID信息变化的场合,也可以有数个位偶然一致的场合。在此场合,在检测方法[2]中,不能正确确定音频“内容”切换的边界位置。就是说,从实际的边界前进数个位,才可将出现与一个周期前不同的位的地点初次判断为边界,精度相应地降低。
下面对检测方法[2]的音频“内容”的边界识别的可靠性及精度予以更详细的说明。
尽管不是音频“内容”的边界,由于前一个周期和这一周期之一的位破坏而错误检测出不一致的几率Pb1可由下面的公式8求得。
Pb1(0)=2Pb(μ)(1-Pb1(μ))特别是,如果在设定阈值而检测强度低于阈值时不进行位的一致不一致的识别,错误检测出不一致的几率Pb1可由下面的公式9求得。
Pb1(TB)=2Pb(μ+TB)(1-Pb1(μ+TB))图10为在公式9中,在TB=1.0的场合,相对μ的变化错误检测出不一致的几率Pb1的曲线图。
另外,在N位中至少在一个地点错误地检测出不一致的几率Pb2可由下面的公式10求得。
Pb2(TB,N)=1-Pb(TB)N图11为在公式10中,在TB=1.0的场合,相对μ的变化错误检测出不一致的几率Pb2的曲线图。
考虑到这些几率,在ID信息长的场合,错误地检测出不一致的可能性不能忽视。
另一方面,在跨越音频“内容”边界之后检测出的位不一致的几率Pb3可由下面的公式11求得。
Pb3(TB)=12((1-Pb(μ-TB))2+Pb(μ-TB)2)+12Pb1(TB)]]>
在上面的公式11中,第一项表示在原来嵌入的位与一周期前的对应位不同,并且前一个周期和现今的周期的检测都无位错误的场合及在两方的周期中都引起位错误的场合。第二项表示原来嵌入的位与一周期前的对应位一致,而在前一个周期和现今的周期的任何一个中由于位破坏检测出不一致的场合。
在跨越边界M位的地点才可初次检测出不一致的几率Pb4可计算如下。就是说,在M-1位中间检测不出与前一个周期的对应位的不一致,而在第M位可检测出与对应位的不一致的几率可由下面的公式12求得。
Pb4(M)=(1-Pb3(TB))(M-1)Pb3(TB)图12为在公式12中,在TB=1.0的场合,可在越过边界的位的个数的该地点初次检测出不一致的几率Pb4的曲线图。另外,图13为示出在TB=1.0的场合,相对μ,可在跨越边界后,在某位的地点初次检测出不一致的期望值的曲线图。
丢失率Pb5,是在跨越音频“内容”的实际边界的一个周期大小的位串上一次都未检测出与对应位的不一致而不能识别边界的场合的几率,可由下面的公式13求得。
Pb5=1-ΣM=1NPb4M]]>此值极小,在μm=1.0的场合也仅为约6.8×10-9。
但是,这些预测,是在嵌入到音频“内容”中的位一致,并且不一致的几率为1/2的前提下算出的,在实际的个别场合并不一定总是成立的。比如,在跨越音频“内容”的实际边界一周期大小的位串中,在除去最后的一位,其他全部的位与前一周期的对应位偶然一致的场合,音频“内容”的边界位置的识别的可靠性就显著降低。
(3)根据电子水印的检测强度识别边界位置的方法检测方法[3]。
通常,在电子水印中,如果参照嵌入到音频“内容”中的各个位的检测强度,在嵌入ID信息的部分中和未嵌入ID信息的部分中,其分布是不同的。所以,在检测方法[3]中,通过检查位的检测强度,可以判断音频“内容”在音频数据的哪一时点开始和在哪一时点结束。
图14为示出在音频数据中在嵌入电子水印的地点和未嵌入电子水印的地点的位检测强度的差异的示图。
在图14中,对于从音频数据中检测出的位,根据适当的数目的位(在图中以○和×表示各个范围)的检测强度顺序判断是否嵌入电子水印。
如图14所示,因为在具有ID信息“A”的音频“内容”的部分中,嵌入电子水印(ID信息“A”),检测强度变强(分散变大)。与此相对,因为在不是音频“内容”的部分中,未嵌入电子水印,检测强度变弱(分散变小)。
很多电子水印经过归一化(规格化),以使未嵌入的音频“内容”的检测强度遵守标准正态分布。所以,通过选择适当个数的位,检测其检测强度是否遵守标准正态分布(比如,将分散与阈值比较),就可以判断是否是嵌入电子水印的部分。在图14中,以○表示的部分是判断为嵌入电子水印的位的检测强度的部分,以×表示的部分是判断为未嵌入电子水印的位的检测强度的部分。
检测方法[3],通过确定用于检测有无电子水印的位的检测强度的数目,可以选择音频“内容”的边界识别的可靠性和精度之间的平衡。如果采用多个位的检测强度来检测电子水印的有无,则可靠性提高而精度降低。
这一点,与检测方法[1]相似。在本方法中,由于采用称为位检测强度的微信息,与检测方法[1]相比较,音频“内容”的边界识别的精度更高。但是,为了判断检测强度的分布,一定程度的数目的位(10~30位左右)的检测强度是必需的,所以精度也下降相应的程度。
另外,检测方法[3],是根据位的检测强度判断有无电子水印的方法,与利用电子水印嵌入的信息的内容无关。所以,本方法,适用于音频“内容”结束的场合及开始的场合的边界(上述的(i)(ii)的边界)的检测,而不能应用于音频“内容”切换、电子水印的ID信息变换的场合的边界(上述的(iii)的边界)的检测。
下面对检测方法[3]的音频“内容”的边界识别的可靠性及精度予以更详细的说明。
首先,在ND个位中检测强度超过阈值TDM的位至少为NM个的场合,判断在该区域中嵌入电子水印。在检测值的平均值为μ的区域中,判断嵌入电子水印的几率Pd1可由下面的公式14求得。
Pd1(μ,TDM)]]>=Σx=NMNDxND(1-Pb(μ-TDM)+(Pb(μ+TDM))x(Pb(μ-TDM)-Pb(μ+TDM))(Nb-x)]]>此公式用来计算在检测值为正或负的任何方向上超过阈值的位的个数至少为NM个至多为ND个的几率。
另外,在ND位中小于阈值TDU的位至少为NU个的场合,在判断在该区域中无电子水印嵌入。在检测值的平均值为μ的区域中,判断未嵌入电子水印的几率Pd2可由下面的公式15求得。

Pd2(μ,TDU)]]>=Σx=NUNDxND(Pb(μ-TDU)+(Pb(μ+TDU))x(1-Pb(μ-TDU)-Pb(μ+TDU))(ND-x)]]>其中,在判断电子水印嵌入的区域与判断电子水印未嵌入的区域是连续的区域的场合,将该边界识别为音频“内容”的边界。在此场合,实际上,尽管未跨越音频“内容”的边界,判断为边界的几率Pd3可由下面的公式16求得。
Pd3(μ,TDM,TDU)=Pd1(μ,TDM)Pd2(μ,TDU)另外,在将N位的ID信息全部分割为每个为ND位根据有无电子水印判断边界的场合,在规定的至少一个的区域中,误判是边界的误采用率Pd4可由下面的公式17求得。
Pd4(μ,TDM,TDU,N)=(1-(1-Pd1(μ,TDM)Pd2(μ,TDU))NND]]>此外,尽管跨越音频“内容”的边界,检测出此边界损坏的丢失率Pd5可由下面的公式18求得。
Pd5(μ,TDM,TDU)=1-Pd1(μ,TDM)Pd2(0,TDU)检测方法[3]的音频“内容”的边界识别的可靠性及精度,强烈依赖于在判断有无电子水印时使用的位的个数ND。
在ND的值为32、26、8、4的场合的上述几率Pd1、Pd2及可以判断有无嵌入的几率、几率Pd3、误采用率Pd4及丢失率Pd5如图15至图22所示。
图15为示出在ND=32、TDM=2.0、NM=7、TDU=1.0、NU=20的场合,对于μ,判断有电子水印嵌入的几率Pd1、判断无电子水印嵌入的几率Pd2的任何一种的判断的几率的曲线图。另外,图16为示出在ND=32、TDM=2.0、NM=7、TDU=1.0、NU=15、N=128的场合,对于μ,误判断边界的几率Pd3、判断在ID信息中的至少一个地点有边界的误采用率Pd4、检测出音频“内容”实际的边界损坏的丢失率Pd5的曲线图。
图17为示出在ND=16、TDM=2.0、NM=4、TDU=1.0、NU=6的场合,对于μ,判断有电子水印嵌入的几率Pd1、判断无电子水印嵌入的几率Pd2的任何一种的判断的几率的曲线图。另外,图18为示出在ND=16、TDM=2.0、NM=4、TDU=1.0、NU=6、N=128的场合,对于μ,误判断边界的几率Pd3、判断在ID信息中的至少一个地点有边界的误采用率Pd4、检测出音频“内容”实际的边界损坏的丢失率Pd5的曲线图。
图19为示出在ND=8、TDM=2.2、NM=2、TDU=1.5、NU=4的场合,对于μ,判断有电子水印嵌入的几率Pd1、判断无电子水印嵌入的几率Pd2的任何一种的判断的几率的曲线图。另外,图20为示出在ND=8、TDM=2.2、NM=2、TDU=1.5、NU=4、N=128的场合,对于μ,误判断边界的几率Pd3、判断在ID信息中的至少一个地点有边界的误采用率Pd4、检测出音频“内容”实际的边界损坏的丢失率Pd5的曲线图。
图21为示出在ND=4、TDM=2.0、NM=1、TDU=1.5、NU=2的场合,对于μ,判断有电子水印嵌入的几率Pd1、判断无电子水印嵌入的几率Pd2的任何一种的判断的几率的曲线图。另外,图22为示出在ND=48、TDM=2.0、NM=1、TDU=1.5、NU=2、N=128的场合,对于μ,误判断边界的几率Pd3、判断在ID信息中的至少一个地点有边界的误采用率Pd4、检测出音频“内容”实际的边界损坏的丢失率Pd5的曲线图。
各图的阈值,可适当选择以使在μ十分大的场合,Pd1的值接近1,Pd2的值接近0,在μ在0附近的场合,Pd1的值接近0,Pd2的值接近1。如比较各图,可看到,如果在判断中使用的位的个数ND短,几率Pd1和几率Pd2平缓变化,只要μ稍微破坏(劣化),判断为不存在电子水印的可能性变大。换言之,可知如果提高音频“内容”的边界的识别精度,作为代偿,误采用率变大。
在未嵌入电子水印的区域中,误判是音频“内容”的边界的几率是Pd3(0,TDM,TDU),在跨越边界只M个位的地点判断初始检测出边界的几率Pd6可由下面的公式19求得。
Pd6(TDM,TDU)=Pd3(0,TDM,TDU)(1-Pd3(0,TDM,TDU))(M-1)因为此值很小,判断在未嵌入电子水印的位置存在音频“内容”的边界的情况很少见。
(4)根据ID信息的同步位置的连续性识别边界位置的方法检测方法[4]。
在很多电子水印技术中,在将“内容”在时间上分割为一定的长度(此处称其为帧)之后,对分割的各个帧实施信息的嵌入。在检测嵌入的信息之际,在进行用来检测帧的前头的同步处理之后,对该帧进行检测处理。在检测方法[4]中,根据此电子水印的同步位置的出现,判断音频“内容”的边界位置。
图23为说明在音频“内容”中嵌入的电子水印的同步位置的示图。
在图23中,ID信息的电子水印,嵌入到每一帧之中。另外,各帧的前头为同步位置,检测出同步信号。由此,取得检测ID信息之际的同步。
通常,由于在音频“内容”中反复嵌入同一信息,如图23所示,在一个音频“内容”中,同步位置以一定间隔出现(排成线形)。
图24为说明在音频“内容”切换时的电子水印的同步位置的出现方式的示图。
在音频“内容”切换时,在切换前后的各个音频“内容”中,如图23所示,同步位置以等间隔出现,在音频“内容”切换的边界位置中,如图24所示,同步位置的间隔变乱。
图25为说明在音频“内容”结束时的电子水印的同步位置的出现方式的示图。
在音频“内容”结束时,在结束前的音频“内容”中,如图23所示,同步位置是以等间隔出现的,而在音频“内容”结束后,因为电子水印不存在,同步位置也不存在。所以,如果进行取得同步的处理,如图25所示,同步位置以不规则的间隔出现。
另外,图中未示出,在音频”内容”开始的场合,与图25相反,以不规则的间隔出现的同步位置,从音频“内容”开始的时点起整齐地以等间隔出现。
如上所述,在音频“内容”切换的位置及音频“内容”开始位置及结束位置,用来检测电子水印的同步位置的出现方式分别发生变化。因此,可以将帧的同步位置的出现方式的变化的位置判断为音频“内容”的边界。所以,此检测方法[4],对于全部上述三种边界都可以检测边界位置。
本方法,如上所述,是将帧的同步位置的出现方式的变化的位置判断为音频“内容”的边界。所以,由于音频“内容”的边界可以以帧为单位进行,音频“内容”的边界的识别精度极高。
另一方面,在将作为电子水印嵌入到音频“内容”的位损坏时,由于在音频“内容”中同步位置的出现间隔也变为不规则,会判断为音频“内容”的边界。所以,音频“内容”的边界识别的可靠性低。
下面对检测方法[4]的音频“内容”的边界识别的可靠性及精度予以更详细的讨论。
在电子水印的检测处理中进行同步时,根据到前一次为止的同步位置,预测下一次以后的Ns次的同步位置。同步信号,在未嵌入电子水印的场合,或是即使是嵌入电子水印,但在同步的位置以外,遵从标准正态分布。在这种条件下,通过检测下面的Ns次的同步位置的检测结果是否遵从标准正态分布,就可以判断有无边界。
在同步信号中嵌入的有正值和负值,在不能预测嵌入的是哪一个的场合,可以采用与在检测方法[3]中使用的判断是否嵌入电子水印的方法同样的方法。在音频“内容”中存在电子水印并且同步位置不错位的场合,误判音频“内容”有边界的几率Pe1可由下面的公式20求得。
Pe1(μ,TEM)]]>=Σx=NUNDxNs(Pb(μ-TEM)-(Pb(μ+TEM))x(1-Pb(μ-TEM)+Pb(μ+TEM))(Ns-x)]]>另外,在判断嵌入到同步信号中的一定是正的值的场合,通过将Ns个的同步信号检测值的合计值与阈值进行比较,可以检测同步信号是否遵从标准正态分布。
另外,在检测方法[4]中,在音频“内容”受到破坏而检测电子水印之际的同步位置不规则出现的场合,音频“内容”中的很多位置处会出现边界误检。所以,优选的方法不是只使用本方法来识别边界位置,而使将其与其他的方法组合使用,以便提高识别边界位置的精度。
(5)使用专用位识别边界位置的方法检测方法[5]。
检测方法[1]~[4]是利用为了在音频“内容”上附加ID信息等已经嵌入的电子水印检测边界位置,而检测方法[5]是将为检测边界设定的专用位(以下称其为边界检测位)嵌入到音频“内容”中。于是,通过对检测出的边界检测位进行分析,就可以确定音频“内容”的边界。
图26为说明在音频“内容”中作为电子水印嵌入的边界检测用位的构成的示图。
在图26中,已经检测出的边界检测位以100110顺序排列。于是,示出的是新检测出边界检测位1的状态。
边界检测位,根据一定的规则嵌入到音频“内容”中,对于ID信息的位,是每一定位数配一个边界检测位。因此,在音频“内容”中嵌入的电子水印的总位数增加。
另外,为了使用边界检测位来检测音频“内容”的边界,下面研究边界检测位串的一致性。就是说,只要边界检测位的检测结果遵守一定的规则,换言之,只要下一个检测的边界检测位的检测结果是可以预测的,音频“内容”就继续。于是,如果边界检测位的检测结果不遵守该规则,就是说,下一个检测的边界检测位的检测结果是不能预测的,该不能预测的边界检测位的位置就是音频“内容”的边界位置。
另外,作为边界检测位嵌入到音频“内容”中的信息的内容,必须设定为偶然保持一致性的几率很低,即或是存在音频“内容”的边界。于是,优选的方法是可以以尽量少的位数判断有无一致性。
比如,假设将N次的M序列嵌入作为边界检测位。因为N次的M序列的长度为(2N-1),所以以此为周期将M序列反复嵌入。所以,在跨越音频“内容”的边界的同时,边界检测位的内容的一致性偶然保持的几率为1/(2N-1)。N次的M序列,利用N个位,决定下面的一位。因此,从最后检测出的N个边界检测位预测下面的一位,实际上检测出的下面的边界检测位与预测结果不等时,就认为是失掉一致性,可以判断此位置为音频“内容”的边界位置。使用M序列的优点是周期(2N-1)长,并且为判断一致性所必需的位的历史N个很少。
与在检测方法[2]中叙述的一样,为了防止在破坏的部分上的误检测,优选的方法是在本方法中也设定阈值。无论是用来预测下一个边界检测位的N个边界检测位,还是该次的边界检测位,所有的检测强度都要尽可能可靠地大,并且只要是在一致性未失掉的场合,就应该判断是音频“内容”的边界。
如上所述,检测方法[5],可以以一个位单位识别音频“内容”的边界,识别的精度非常高。
另一方面,因为考虑到音频“内容”的破坏引起的误检及跨越音频“内容”的边界的同时偶然保持边界检测位的一致性的场合,识别的可靠性稍微降低。
如果可以将多个位并列嵌入作为边界检测位,可靠性和精度可以提高。但是,在此场合,应该嵌入作为电子水印的位的个数还要增加。
另外,为了防止嵌入到音频“内容”中的位的个数的增加,也考虑在为嵌入ID信息所使用的位的个数的范围内嵌入边界检测位,在此场合,ID信息的信息量减少。另外,也考虑嵌入在用作ID信息的同时也作为边界检测位使用的位串,但是这种位串的设定不容易。
下面对检测方法[5]的音频“内容”的边界识别的可靠性及精度予以更详细的讨论。
设使用的M序列的阶为D。在最后检测出的D位和新检测出的一位的边界检测位的检测强度全部都超过阈值TC的场合检查一致性。就是说,检查基于M序列的预测和检测出的边界检测位一致不一致。
在此场合,实际上尽管不是音频“内容”的边界,误检不一致的几率Pc1可由下面的公式21求得。
Pc1(Tc)=Pb(μ+Tc)(1-Pb(μ-Tc))D图27为在TC=1.0、D=5的场合,对于μ的变化,误检不一致的几率Pc1的曲线图。
另外,在N位的范围中在至少一个地点误检不一致的几率Pc2可由下面的公式22求得。
Pc2(Tc,N)=1-(1-Pc1(Tc))N
图28为在TC=1.0、D=5的场合,对于μ的变化,在N位中在至少一个地点误检不一致的几率Pc2的曲线图。从图28可知,在ID信息长的场合,误检不一致不能说没有,但与检测方法[2]相比较,误采用率低很多。
另一方面,在跨越音频“内容”的边界一位的地点检测出的位是不一致的几率Pc3可由下面的公式23求得。
Pc3(Tc,1)=(1-Pb(μ-Tc))D{12Pb(μ+Tc)+12(1-Pb(μ-Tc))}]]>此式,尽管跨越音频“内容”的边界,是基于假设偶然地嵌入与同一音频“内容”内同样的边界检测位的几率是1/2的这一假定。于是,由于原本保持一致性的位受到破坏而变为不一致的几率和原本未保持一致性的位按照原样检测出来变为不一致的几率相加而成为此式。
另外,在跨越音频“内容”的边界M位的地点检测出的位与预测是不一致的几率Pc3可由下面的公式24求得。
Pc3(Tc,M)=12(1-Pb(μ-Tc))(D-M-1)(1-Pb(μ-Tc)+Pb(μ+Tc))M]]>在不同的音频“内容”连续的场合,如果完全跨越音频“内容”的边界,为了检测下面的音频“内容”的电子水印,该部分的M序列再一次保持一致性。所以,根据由M序列产生的预测和实际检测出的边界检测位的不一致,不能识别音频“内容”的边界。在完全跨越音频“内容”的边界的位置不嵌入电子水印的场合,由M序列产生的预测和实际的边界检测位的不一致的检测的可能性几率Pc3可由下面的公式25求得。
Pc3(Tc,x)=12(1-Pb(0-Tc)+Pb(0+Tc))(D+1)]]>在跨越音频“内容”的边界M位的地点最初可以检测出不一致的几率Pc4可由下面的公式26求得。
Pc4(M)=Pc3(Tc,M)Πx=1M-1{1-Pc3(Tc,x)}]]>图29为在TC=1.0、D=5的场合,对于跨越边界的位的个数,在其位置最初检测出不一致的几率Pc4的曲线图。检测出的不一致的精度最多为D位。在此范围内找不到边界时,利用本方法,因为边界检测失败,丢失率高。
图30为在TC=1.0、D=5的场合,对于μ找不到边界的几率的曲线图。并且,图31为在TC=1.0的场合,对于D找不到边界的几率的曲线图。
对于边界检测位的检测值高的音频“内容”,通过增加D可以减小丢失率(但是,在此场合,失掉检测精度)。不过,在由于音频“内容”的破坏使得边界检测位的检测值小的场合,如果增加D,因为全部位达到阈值的可能性变低,丢失率会更加增大。
以上,对五种音频“内容”的边界检测方法进行了说明。如上所述,各检测方法[1]、[2]、[3]、[4]、[5],各自的音频“内容”的边界的识别的可靠性和精度不同。于是,在本实施方式中,通过将这些检测方法组合使用,可以以高可靠性及高精度实现音频“内容”的边界的识别。
下面,以其具体方法为例进行说明。
图32为说明图2所示的边界检测部件12的音频“内容”的边界位置的处理的流程图。在此动作例中,在上述的音频“内容”的边界检测方法中,将检测方法[1]、[2]、[3]、[4]组合使用。
另外,在利用边界检测部件12进行处理之前,利用电子水印检测部件11从作为处理对象的音频数据进行电子水印的检测。
参照图32,边界检测部件12,从电子水印检测部件11接收检测出的ID信息和表示检测出该ID信息的时间信息(步骤3201),首先,利用检测方法[1]识别音频“内容”的边界位置(步骤3202)。
如上所述,检测方法[1],因为使用检测出的ID信息本身,可靠性高,但由于作为音频“内容”的边界位置确定的位置具有一定的时间宽度,精度低。于是,边界检测部件12,对利用检测方法[1]确定的边界位置再利用其他的方法进一步完善。
就是说,边界检测部件12,根据检测方法[1]的检测结果,判断检测出的音频“内容”的边界,是音频“内容”结束的场合及开始的场合的边界(上述的(i)(ii)的边界),还是音频“内容”切换、电子水印的ID信息变化的场合的边界(上述的(iii)的边界)(步骤3203)。
在利用检测方法[1]检测出的音频“内容”的边界是(iii)的边界场合,边界检测部件12,然后利用适用于此种边界检测的检测方法[2]识别音频“内容”的边界位置(步骤3204)。
另外,在利用检测方法[1]检测出的音频“内容”的边界是(i)(ii)的边界的场合,边界检测部件12,然后利用适用于此种边界检测的检测方法[3]识别音频“内容”的边界位置(步骤3205)。
由于检测方法[2]、[3]采用检测出的电子水印的位数据及检测强度,这些方法受到音频“内容”的破坏的影响,比检测方法[1]的可靠性差。但是,由于在检测方法[1]中在判断为音频“内容”的边界的范围内使用检测方法[2]、[3],可以得到高可靠性。
如上所述,检测方法[2],理论上可以由记述作为电子水印嵌入的ID信息的位单位确定音频“内容”的边界,但实际上有时在边界前后的ID信息中有几个位偶然一致,判断为边界的位置实际的边界晚数个位。
另外,因为检测方法[3],根据电子水印的检测位的检测强度的分布判断音频“内容”的有无,与检测方法[1]的场合相比,时间宽度小得多,但是必须有合适数目的位的个数以便得到检测强度的分布。
于是,边界检测部件12,以利用检测方法[2]、[3]取得的边界位置为对象,利用检测方法[4]确定音频“内容”的边界位置(步骤3206)。
如上所述,检测方法[4],根据用于电子水印的嵌入及检测同步位置判断音频“内容”的边界位置。因此,可以以同步信号出现的间隔这样的非常高的精度确定音频“内容”的边界。
另外,检测方法[4]本身,由于受到音频“内容”的破坏的影响,可靠性低,但通过在利用检测方法[1]、[2]、[3]判断为音频“内容”的边界的范围内使用检测方法[4],也可以确保高可靠性。
以上,对组合使用检测方法[1]、[2]、[3]、[4]的音频“内容”的边界检测方法进行了说明。这些检测方法,只要在音频“内容”中嵌入某个电子水印,就可以应用。所以,利用在ID信息的嵌入中使用的电子水印可以识别音频“内容”的边界位置。
另外,上述的处理动作仅仅是示例而已。比如,在进行边界位置探索之际,通过以动态方式设定适当的阈值,可以使用检测方法[2]代替检测方法[3]。另外,相应于音频“内容”及嵌入的ID信息的内容等,在以检测方法[2]、[3]得到的精度足够的场合,也可以省略利用检测方法[4]对边界位置的确定。
另外,对于音频“内容”,如果嵌入边界位置检测用的专用位,也可以再利用检测方法[5]计测音频“内容”的边界位置。按照检测方法[5],如果音频“内容”未被破坏等等,则因为可以以一个位单位确定边界位置,可以代替检测方法[2]、[3]或与这些方法一并使用。在合并使用检测方法[2]、[3]和检测方法[5]的场合,虽然不能期待精度提高那末高,但通过增加检测方法可以提高检测结果的可靠性。
在上述实施方式中,对音频“内容”切换到其他音频“内容”的位置、音频“内容”的开始位置、结束位置这样的边界位置的识别是通过对嵌入到音频“内容”中的电子水印的检测结果的处理而识别的。根据以上述方式得到的边界位置及在“内容”边界识别装置10中在电子水印检测之际得到的时间信息,可以确定音频数据的规定的音频“内容”的时间位置。所以,如果在对广播的广播监控中采用,就可以在广播数据中确定音频“内容”占据的时间,可以调查该音频“内容”何时广播和广播多少时间。
但是,在广播等的音频数据中有时不明确现实的音频“内容”的边界位置。比如,规定的音频“内容”淡出结束,同时另外的音频“内容”淡入开始的场合就是。
在此场合,由于淡入、淡出而存在两个音频“内容”重叠的部分,在本实施方式的任何一种检测方法中也不能确定明确的边界(在此场合,比如,在检测方法[1]、[2]等之中,将开始检测出下面的音频“内容”的电子水印的位置和前面的音频“内容”的电子水印不再检测出的位置识别为音频“内容”的边界位置)。
在这种场合,预先确定哪一个时点为音频“内容”的边界,根据该规则确定音频“内容”的边界。比如,可以将检测出前面的音频“内容”的ID信息的最后的位置和检测出下面的音频“内容”的ID信息的最初位置的中间点(即两个音频“内容”重叠范围内的中间地点)作为音频“内容”的边界。
另外,在将多个音频“内容”合成广播的场合,正如在上述的利用淡入、淡出切换音频“内容”的场合也叙述过的,由于检测出两种电子水印,在本实施方式的检测方法中,不能确定关于一个音频“内容”的边界位置。所以,本实施方式,是以在广播的音频数据中同时只包含音频“内容”的场合的边界位置为对象。
另外,在本实施方式中,说明的是检测音频“内容”的边界位置的场合,但对于动画的视频“内容”及视频和音频组合的“内容”的音频部分等包含时间要素的其他“内容”,采用嵌入“内容”的ID信息的电子水印,可以将本实施方式的各检测方法按照原样应用。
如上所述,根据本发明,根据从“内容”检测出的电子水印,通过将多个方法组合作为识别“内容”的边界的方法,在“内容”的边界位置的识别中,可同时满足高可靠性和高精度。
权利要求
1.一种“内容”边界检测装置,其特征在于包括检测在具有时间要素的“内容”中嵌入的电子水印的电子水印检测部件;相应于利用上述电子水印检测部件检测出的上述电子水印的状态,检测上述“内容”的边界位置的边界检测部件;上述边界检测部件包括根据在利用上述电子水印检测部件检测出的上述电子水印中记述的信息,确定上述“内容”的边界位置的第一边界确定单元;根据作为上述电子水印嵌入的位的嵌入模式,确定上述“内容”的边界位置的第二边界确定单元;将上述第一、第二边界确定单元的处理结果进行组合而检测出上述“内容”的边界位置。
2.如权利要求1所述的“内容”边界检测装置,其特征在于上述边界检测部件包括根据在上述电子水印检测中使用的同步信号的出现模式确定上述“内容”的边界位置的第三边界确定单元;并且进而将上述第三边界确定单元的处理结果与上述第一、第二边界确定单元的处理结果进行组合而检测出上述“内容”的边界位置。
3.一种“内容”边界检测装置,其特征在于包括检测在具有时间要素的“内容”中嵌入的电子水印的电子水印检测部件;相应于利用上述电子水印检测部件检测出的上述电子水印的状态,检测上述“内容”的边界位置的边界检测部件;上述边界检测部件包括根据在利用上述电子水印检测部件检测出的上述电子水印中记述的信息,确定上述“内容”的边界位置的第一边界确定单元;根据作为上述电子水印嵌入的位的检测强度,确定上述“内容”的边界位置的第二边界确定单元;将上述第一、第二边界确定单元的处理结果进行组合而检测出上述“内容”的边界位置。
4.如权利要求3所述的“内容”边界检测装置,其特征在于上述边界检测部件包括根据在上述电子水印检测中使用的同步信号的出现模式确定上述“内容”的边界位置的第三边界确定单元;并且进而将上述第三边界确定单元的处理结果与上述第一、第二边界确定单元的处理结果进行组合而检测出上述“内容”的边界位置。
5.一种“内容”边界检测装置,其特征在于包括检测在具有时间要素的“内容”中嵌入的电子水印的电子水印检测部件;相应于利用上述电子水印检测部件检测出的上述电子水印的状态,检测上述“内容”的边界位置的边界检测部件;上述边界检测部件,以作为上述电子水印在上述“内容”中嵌入的规定的位串作为对象,根据该位串中的一定的长度的部分位串预测规定位的检出结果,根据该位的实际检出结果是否与预测一致确定上述“内容”的边界位置。
6.如权利要求5所述的“内容”边界检测装置,其特征在于在将构成M序列的位串作为上述电子水印反复嵌入到上述“内容”中的场合,上述边界检测部件根据规定的M序列,预测构成该M序列的位串的下面检出的位的检出结果,相应于该预测结果,确定上述“内容”的边界位置。
7.一种监控方法,用于确定在包含种种的“内容”的广播数据中规定的“内容”占据的时间,其特征在于包括对上述广播数据执行电子水印检测处理,检测出嵌入到上述“内容”中的电子水印的步骤;相应于检测出的上述电子水印的状态,检测上述广播数据的上述“内容”的边界位置的步骤;根据检测出的上述“内容”的边界位置,确定在上述广播数据中上述“内容”占据的时间的步骤;检测上述“内容”的边界位置的步骤包括藉助基于在检测出的上述电子水印中记述的信息的第一方法,确定嵌入该电子水印的“内容”的边界位置的步骤;以及以利用上述第一方法确定的上述边界位置为对象,藉助基于作为上述电子水印嵌入的位的有关信息的第二方法,以比上述第一方法更高的精度确定上述“内容”的边界位置的步骤。
8.如权利要求7所述的监控方法,其特征在于检测上述“内容”的边界位置的步骤包括以利用上述第二方法确定的上述边界位置作为对象,藉助基于在上述电子水印检测中使用的同步信号的出现模式的第三方法,以比利用上述第二方法更高的精度确定上述“内容”的边界位置的步骤。
9.如权利要求7所述的监控方法,其特征在于利用上述第二方法确定上述“内容”的边界位置的步骤包括以作为上述电子水印嵌入到上述“内容”中的规定的位串作为对象,根据该位串中的一定长度的部分位串预测规定的位的检出结果的步骤;以及根据上述位的实际检测结果与预测是否一致确定上述“内容”的边界位置的步骤。
10.一种监控方法,用于确定在包含种种的“内容”的广播数据中规定的“内容”占据的时间,其特征在于包括对上述广播数据执行电子水印检测处理,检测出嵌入到上述“内容”中的电子水印的步骤;根据检测出的作为电子水印嵌入的位的嵌入模式,检测上述广播数据的上述“内容”的边界位置的步骤;根据检测出的上述“内容”的边界位置,确定在上述广播数据中上述“内容”占据的时间的步骤。
11.一种监控方法,用于确定在包含种种的“内容”的广播数据中规定的“内容”占据的时间,其特征在于包括对上述广播数据执行电子水印检测处理,检测出嵌入到上述“内容”中的电子水印的步骤;根据检测出的作为电子水印嵌入的位的检测强度,检测上述广播数据的上述“内容”的边界位置的步骤;根据检测出的上述“内容”的边界位置,确定在上述广播数据中上述“内容”占据的时间的步骤。
12.一种“内容”位置检测方法,检测在包含规定的音频“内容”的音频数据中该音频“内容”的时间位置,其特征在于包括对上述音频数据执行电子水印的检测处理,将嵌入到上述音频“内容”中的电子水印检测出的步骤;藉助基于在检测出的上述电子水印中记述的信息的第一方法确定嵌入该电子水印的上述音频“内容”的边界位置的步骤;以及以上述第一方法确定的上述边界位置作为对象,藉助基于作为上述电子水印嵌入的位的检测强度的第二方法,以比上述第一方法更高的精度确定上述音频“内容”的边界位置的步骤。
13.如权利要求12所述的“内容”位置检测方法,其特征在于还包括以利用上述第二方法确定的上述边界位置作为对象,藉助基于在上述电子水印检测中使用的同步信号的出现模式的第三方法,以比利用上述第二方法更高的精度确定上述音频“内容”的边界位置的步骤。
14.如权利要求12所述的“内容”位置检测方法,其特征在于利用上述第二方法确定上述音频“内容”的边界位置的步骤包括以作为上述电子水印嵌入到上述音频“内容”中的规定的位串作为对象,根据该位串中的一定长度的部分位串预测规定的位的检出结果的步骤;以及根据上述位的实际检测结果与预测是否一致确定上述音频“内容”的边界位置的步骤。
15.一种程序,其特征在于在控制计算机、检测在包含规定的音频“内容”的音频数据中该音频“内容”的时间位置的程序中,使上述计算机执行对上述音频数据执行电子水印的检测处理,对嵌入到上述音频“内容”的电子水印进行检测的处理;藉助基于在检测出的上述电子水印中记述的信息的第一方法,确定嵌入该电子水印的上述音频“内容”的边界位置的处理;以利用上述第一方法确定的上述边界位置为对象,藉助基于作为上述电子水印嵌入的位的检测强度的第二方法,以比上述第一方法更高的精度确定上述音频“内容”的处理。
16.如权利要求15所述的程序,其特征在于上述计算机还执行以利用上述第二方法确定的上述边界位置作为对象,藉助基于在上述电子水印检测中使用的同步信号的出现模式的第三方法,以比利用上述第二方法更高的精度确定上述“内容”的边界位置的处理。
17.一种程序,其特征在于在控制计算机、检测在包含规定的音频“内容”的音频数据中该音频“内容”的时间位置的程序中,使上述计算机执行以作为电子水印嵌入到上述音频“内容”中的规定的位串作为对象,根据该位串中的一定长度的部分位串预测规定的位的检出结果的处理;以及根据上述位的实际检测结果与预测是否一致确定上述音频“内容”的边界位置的处理。
18.一种存储介质,其特征在于是一种将控制计算机、检测在包含规定的音频“内容”的音频数据中该音频“内容”的时间位置的程序存储于其上的存储介质,上述程序使上述计算机执行对上述音频数据执行电子水印的检测处理,将嵌入到上述音频“内容”中的电子水印检测出的处理;藉助基于在检测出的上述电子水印中记述的信息的第一方法,确定将该电子水印嵌入的上述音频“内容”的边界位置的处理;以及以上述第一方法确定的上述边界位置作为对象,藉助基于作为上述电子水印嵌入的位的检测强度的第二方法,以比上述第一方法更高的精度确定上述音频“内容”的边界位置的处理。
全文摘要
本发明可提供一种“内容”边界检测装置其特征在于根据从“内容”检测出的电子水印,通过将多个方法组合作为识别“内容”的边界的方法,在“内容”的边界位置的识别中,可同时满足高可靠性和高精度。其构成包括检测在具有时间要素的“内容”中嵌入的电子水印的电子水印检测部件11;相应于利用此电子水印检测部件11检测出的电子水印的状态,检测此“内容”的边界位置的边界位置检测部件12;此边界位置检测部件12的构成包括根据在利用电子水印检测部件11检测出的电子水印中记述的信息,确定此“内容”的边界位置的第一边界确定单元;根据嵌入在此电子水印中的位的嵌入模式,确定此“内容”的边界位置的第二边界确定单元;将利用此第一、第二边界确定单元的处理结果进行组合而检测出“内容”的边界位置。
文档编号G06T1/00GK1509466SQ0280991
公开日2004年6月30日 申请日期2002年5月14日 优先权日2001年5月17日
发明者立花隆辉, 小林诚士, 士 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1