用以检测媒体数据流中精彩片段的装置以及相关方法

文档序号：7966263阅读：134来源：国知局

专利名称：用以检测媒体数据流中精彩片段的装置以及相关方法
技术领域：
本发明涉及一种用来检测媒体数据流中精彩片段的装置以及相关方法，特别涉及一种装置，其利用视频特征决定视频精彩片段，再利用音频特征决定音频精彩片段，然后同时根据视频和音频精彩片段决定整体的精彩片段。
背景技术：
现有利用特殊程序自动化撷取精彩片段的技术是依赖视频内容或者音频内容，例如，体育精彩片段是由场景的颜色检测而得，然而，对于一般的电影影片而言，便需要一种可同时考虑音频内容和视频内容的方法，以更准确地获得电影精彩片段。
为检测视频内容以获得精彩片段，现有技术会将一画面分割成数个颜色区块，并将这些颜色区块和一参考画面相比较以辨识出场景，由于精彩片段通常出现于一些特殊的场景中，因此用来获得精彩片段所需处理的候选画面的数量便可减少。另外，对于经由检测音频内容以获得精彩片段而言，既然会评量音频数据的音量峰值，假如数个峰值在短时间出现，则一彼此部分重迭的区段会被撷取出来作为精彩片段，如此一来，上述现有方法的检测精彩片段的准确度便不佳。
再者，目前尚未有可同时利用音频和视频内容来检测电影精彩片段的架构，所以，一种可以同时考虑音频和视频内容以在一般电影影片中自动检测精彩片段的装置将会大幅提升影音节目的品质。

发明内容
根据本发明的申请专利范围，本发明揭露一种用以检测媒体数据流的精彩片段的装置。此装置包含视频处理模块、音频处理模块、镜头变换检测器以及后处理器。此视频处理模块用来决定视频阀值，而音频处理模块用来决定音频阀值，而镜头变换检测器电连接于视频处理模块和音频处理模块，用以决定镜头变换以告知视频处理模块和音频处理模块。后处理器电连接于视频处理模块和音频处理模块，用来根据视频参数和视频阀值决定出视频精彩片段，然后根据音频参数和音频阀值决定出音频精彩片段，最后根据视频精彩片段和音频精彩片段决定出媒体数据流的精彩片段。
根据本发明的申请专利范围，其另揭露一种检测媒体数据流的精彩片段的方法。此方法包含决定一视频阀值、决定至少一音频阀值、检测一镜头转换以将媒体数据流区分为数个镜头，以及根据视频参数和视频阀值确定视频精彩片段，然后根据音频参数和音频阀值确定音频精彩片段，最后根据视频精彩片段和音频精彩片段决定媒体数据流的精彩片段。

图1为本发明第一实施例的检测精彩片段的装置的示意图。
图2为图1所示的第一实施例检测精彩片段的方法流程图。
图3为本发明第二实施例的检测精彩片段的装置的示意图。
图4为图3所示的第二实施例检测精彩片段的方法流程图。
图5为本发明第三实施例的检测精彩片段的装置的示意图。
图6为图5所示的第三实施例检测精彩片段的方法流程图。
附图符号说明100、300、500 装置110、310、510 移动向量运算器115、315、515 色阶分布运算器120、125、325、525 视频阀值决定单元135、335、535 音量运算器140、340、540 过零率运算器150、350、550 音频阀值决定单元155、355、555 镜头变换检测器160、360、560 后处理器320、345、520、545 镜头数据处理单元具体实施方式
请参阅图1，图1是本发明第一实施例的检测精彩片段(highlight)的装置100的示意图。装置100包含一移动向量运算器(motion-vectorcalculator)110、一色阶分布运算器(histogram calculator)115、多个镜头数据处理单元(shot data processing unit)120、145、一视频阀值决定单元125、一音量运算器135、一过零率运算器(zero-crossing ratecalculator)140、一音频阀值决定单元150、一镜头变换检测器(shot changedetector)155以及一后处理器(post processor)160。因为移动向量运算器110、色阶分布运算器115、镜头数据处理单元120以及视频阀值决定单元125是共同来处理一媒体数据流(media stream)SM以产生一视频阀值TV，用以决定视频精彩片段，而这些功能方块便结合起来形成一视频处理模块105。同样地，音量运算器135、过零率运算器140、镜头数据处理单元145以及音频阀值决定单元150共同来处理一媒体数据流SM以产生一音频阀值TA，用以决定音频精彩片段，而这些功能区块结合起来便形成一音频处理模块130。
如图1所示，媒体数据流SM分别传送到镜头变换检测器155、视频处理模块105、音频处理模块130以及后处理器160中。视频处理模块105会根据媒体数据流SM决定视频阀值TV，并传送视频阀值TV到后处理器160中，在此同时，音频处理模块130根据媒体数据流SM决定音频阀值TA，并传送音频阀值TA到后处理器160中，接着，后处理器160便根据媒体数据流SM的视频参数(video parameter)和视频阀值TV决定视频精彩片段，以及另根据媒体数据流SM的音频参数(audio parameter)和音频阀值TV来决定音频精彩片段，之后，在根据视频精彩片段和音频精彩片段来决定出媒体数据流SM中的精彩片段H。在视频处理模块105中，色阶分布运算器115是接收媒体数据流SM并计算出两邻近画面(frame)的色阶分布差值(histogram difference)，而移动向量运算器110则计算出一个画面中移动向量的总和。镜头变换检测器155将媒体数据流SM划分成数段镜头(shot)，并传送至镜头数据处理单元120、145中，若一镜头的时间很短则表示其仅包含极少数的画面，所以镜头数据处理单元120个别地处理每个具有画面个数小于一画面参考值的镜头，例如，镜头数据处理单元120计算出这些镜头的过零率，并将此过零率和全部媒体数据流SM的平均过零率相较以决定其精彩片段。镜头数据处理单元120更利用每一剩余镜头的色阶分布差值来计算出一色阶分布平均值，并且又利用各个剩余镜头的画面所对应的移动向量的总和来计算出一移动向量平均值。色阶分布平均值和移动向量平均值皆传送至视频阀值决定单元125，因此视频阀值决定单元125会再次计算出所有剩余镜头的色阶分布平均值的平均值来作为色阶分布参考值，并将每个剩余镜头的色阶分布平均值和色阶分布参考值相比较，其中，当镜头的色阶分布平均值大于色阶分布参考值时，就不适用于决定视频阀值。
最后，视频阀值决定单元125仅平均具有色阶分布平均值不大于色阶分布参考值的镜头所对应的移动向量平均值，以产生一最终移动向量平均值，而此最终移动向量平均值乘以一加权系数(weighting factor)，例如0.8，作为视频阀值。在此请注意，一并考虑色阶分布差值和媒体数据流SM的移动向量，可增加检测精彩片段的准确性，但是也可以只考虑移动向量以节省成本。
在音频处理模块130中，音量运算器135接收媒体数据流SM，并测量媒体数据流SM中每个画面的音量(volume energy)，而过零率运算器140则检测每一画面的过零率，其中音量和过零率两者皆传送至镜头数据处理单元145。镜头变换检测器155会将镜头长度(shot length)告知镜头数据处理单元145，而镜头数据处理单元145便舍弃画面个数小于画面参考值的镜头，并且计算出剩余镜头的音量的音量平均值，并将计算出剩余镜头的过零率的过零率平均值。
音频阀值决定单元150和视频阀值决定单元125的运作方式不同。音频阀值决定单元150藉由平均媒体数据流的所有音量平均值计算出一第一音频阀值，且平均媒体数据流的所有过零率平均值计算出一第二音频阀值，而两个不同的音频阀值便可以根据不同的需求来决定出音频精彩片段。后处理器160接收到视频阀值TV，并将视频阀值TV和媒体数据流SM的目前画面(currentframe)有关的移动向量的总和相比较，如果总和大于视频阀值TV，后处理器160便选择目前画面当作一视频精彩片段，假如总和不大于视频阀值，则后处理器160不会选择目前画面来作为一视频精彩片段。相同地，后处理器160接收到音频阀值TA，并将音频阀值TA和媒体数据流SM的目前画面有关的音量或者过零率相比较，举例来说，假如音量大于音频阀值TA，则后处理器160会选择目前画面当作一音频精彩片段；假如音量未大于音频阀值TA，后处理器160就不会选择目前画面来作为一音频精彩片段。后处理器160最后会利用上述视频精彩片段和音频精彩片段来决定出精彩片段H。
请特别注意，后处理器160是在一时间域(time domain)中决定精彩片段，所以，后处理器160便能够根据视频阀值和音频阀值决定出精彩片段镜头(highlight shot)，并结合位于精彩片段镜头之前或者之后的多个镜头，以便构成一完整的精彩片段，使得使用者能看到更顺畅的精彩片段画面而不至于被过多中断所干扰。
请参考图2，图2是图1所示的第一实施例检测精彩片段的方法流程图。
此方法的相关步骤如下步骤205开始；步骤210检测镜头变换以将媒体数据流区分成多个镜头，然后执行步骤215和步骤260；步骤215此镜头的画面个数是否小于10？假如是，执行步骤221；假如不是，则依序执行步骤225和步骤230；步骤221计算镜头的过零率；步骤222决定高频率的精彩片段，接着跳至步骤290；步骤225平均所有媒体数据流的色阶分布差值以得到一色阶分布参考值，接着执行步骤235；步骤230平均镜头的色阶分布差值以求得一色阶分布平均值；步骤235色阶分布平均值是否大于色阶分布参考值？假如是，执行步骤236，假如不是，则执行步骤245；步骤236计算镜头的移动向量，接着执行步骤255；步骤245计算镜头的移动向量以得到一移动向量平均值，以及再将移动向量平均值乘以0.8来得到一视频阀值；步骤255根据视频阀值和媒体数据流的目前画面相关的移动向量的总和来决定视频精彩片段，接着执行步骤285；步骤260计算出画面的音量和过零率；步骤270平均音量和过零率得到一音频阀值，接着执行步骤222和步骤280；步骤280根据媒体数据流的目前画面的音频阀值和音频参数(如音量和过零率)来决定音频精彩片段；步骤285根据视频精彩片段和音频精彩片段来决定出精彩片段；步骤286结合在精彩片段镜头之前或者之后的多个镜头以构成一完整的精彩片段；步骤290结束。
请参阅图3，图3是本发明第二实施例的检测精彩片段的装置300的示意图。装置300包含一移动向量运算器310、一色阶分布运算器315、多个镜头数据处理单元320、345、一视频阀值决定单元325、一音量运算器335、一过零率运算器340、一音频阀值决定单元350、一镜头变换检测器355以及一后处理器360。将第二实施例和图1的第一实施例作比较可发现，两者的功能方块是相同的，但是连接方式却不同，在第二实施例中，装置300先处理媒体数据流SM的视频部分，以输出一视频阀值TV传送进入后处理器360，然后由后处理器360根据媒体数据流SM中每个画面的移动向量的总和以及视频阀值TV来决定出视频精彩片段HV，接下来，装置300利用第一实施例中所述的检测音频精彩的方法来处理对应视频精彩片段HV的镜头以得到音频阀值TA，最后，后处理器360便根据音频参数(例如音量与过零率)和音频阀值TA，由视频精彩片段镜头中决定出音频精彩片段以作为最终的精彩片段H。因为装置300优先处理视频部分，所以处理音频部分的数据量会大量减少，因此，处理速度便会相对地提高。另外，在一些特殊的电影影片中，例如动作片，由于视频内容比音频内容更具特色，所以一开始先由视频内容来决定，接着再由音频内容进一步选取出来的精彩画面便会更加正确且品质更佳。
请参考图4，图4是图3所示的第二实施例检测精彩片段的方法流程图。不同于图2中的流程，在此实施例中会优先处理视频部分，然后才处理音频部分并决定出最终的精彩片段，但在图2中，视频部分和音频部分却是在同一时间被考虑并决定出最终的精彩片段。图4中的相关步骤如下步骤405开始；步骤410检测镜头变换以将媒体数据流区分成数个镜头；步骤415此镜头的画面个数是否小于10？假如是，执行步骤421；假如不是，则依序执行步骤425和步骤430；步骤421计算镜头的过零率；步骤422决定高频率的精彩片段，接着跳至步骤490；步骤425平均所有媒体数据流的色阶分布差值以得到一色阶分布参考值，接着执行步骤435；步骤430平均镜头的色阶分布差值求得一色阶分布平均值；步骤435色阶分布平均值是否大于色阶分布参考值？假如是，执行步骤436，假如不是，则执行进入步骤445；
步骤436计算镜头的移动向量，接着执行步骤455；步骤445计算镜头的移动向量以得到一移动向量平均值，并再将移动向量平均值乘以0.8以得到一视频阀值；步骤455根据视频阀值和媒体数据流的现在画面相关的移动向量的总和来决定出视频精彩片段；步骤460计算出视频精彩片段镜头的音量和过零率；步骤470平均音量和过零率以得到音频阀值，接着执行步骤422和步骤485；步骤485根据音频阀值和音频参数从视频精彩片段镜头中决定音频精彩片段；步骤486结合在精彩片段镜头之前或者之后的多个镜头以构成完整的精彩片段；步骤490结束。
另外，不一定只能优先处理视频部分，也可以优先处理音频部分。请参考图5，图5是本发明第三实施例的检测精彩片段的装置500的示意图。装置500包含一移动向量运算器510、一色阶分布运算器515、多个镜头数据处理单元520、545、一视频阀值决定单元525、一音量运算器535、一过零率运算器540、一音频阀值决定单元550、一镜头变换检测器555以及一后处理器560。第三实施例中的功能方块和第一、二实施例相同，但是连接方式却不同。在第二实施例中，装置500先处理媒体数据流SM的音频部分，以输出一音频阀值TA传送进入后处理器560，然后，后处理器560便根据媒体数据流SM中的音频参数(例如音量和过零率)和音频阀值TA决定出视频精彩片段HA，接下来，装置500利用第一实施例所述的检测音频精彩片段的方法来处理音频精彩片段HA所对应的镜头以得到视频阀值TA，最后，后处理器560根据音频精彩片段镜头的移动向量的总和与视频阀值TV，由音频精彩片段镜头中决定出视频精彩片段以作为最终的精彩片段H。因为装置500优先处理音频部分，所以处理视频部分的数据量会大量减少，因此，处理速度也如同在第二实施例中的描述一样地会大幅提高。另外，在一些特殊的电影影片中，例如剧情片，由于音频内容比视频内容更具特色，所以一开始先由音频内容来决定，接着再由视频内容进一步选取出来的精彩画面便会更加正确且品质更佳。
请参考图6，图6是图5所示的第三实施例检测精彩片段的方法流程图。图6中的步骤执行顺序会先进行音频部分，然后进行视频部分，最后决定出最终精彩片段。图6中的相关步骤如下步骤605开始；步骤610检测镜头变换以将媒体数据流区分成数个镜头，然后执行步骤660；步骤615此镜头的画面个数是否小于10？假如是，执行步骤621；假如不是，则依序执行步骤625和步骤630；步骤621计算镜头的过零率；步骤622决定高频率的精彩片段，接着跳至步骤690；步骤625平均所有音频精彩片段镜头的色阶分布差值以得到一色阶分布参考值，接着执行步骤635；步骤630平均音频精彩片段镜头的色阶分布差值以求得一色阶分布平均值；步骤635色阶分布平均值是否大于色阶分布参考值？假如是，执行步骤636，假如不是，则执行步骤645；步骤636计算镜头的移动向量，接着执行步骤655；步骤645计算镜头的移动向量以得到一移动向量平均值，并再将移动向量平均值乘以0.8以得到一视频阀值；步骤655根据视频阀值和音频精彩片段镜头相关的移动向量的总和决定出最终精彩片段，接着跳至步骤690；步骤660计算出画面的音量和过零率；步骤670平均音量和过零率以得到音频阀值，接着执行步骤622和步骤680；步骤680根据媒体数据流的目前画面的音频阀值和音频参数(例如音量和过零率)决定出音频精彩片段，接着跳至步骤615；步骤686结合在精彩片段镜头之前或者之后的多个镜头以构成完整的精彩片段；步骤690结束。
本发明提供一种装置和方法以根据视频参数和音频参数来检测精彩片段，其处理流程可依照实际情况来加以设定，例如，在动作片中，可优先处理视频部分，然后才处理音频部分；而在剧情片中，则可优先处理音频部分，然后才处理视频部分。请特别注意，即使没有设定特定的处理顺序，本发明依旧可以实施。
以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。
权利要求
1.一种用以检测一媒体数据流的精彩片段的装置，该装置包含一视频处理模块，用来决定一视频阀值；一音频处理模块，用来决定至少一音频阀值；一镜头变换检测器，电连接于该视频处理模块和该音频处理模块，用以决定一镜头变换来告知该视频处理模块和该音频处理模块；以及一后处理器，电连接于该视频处理模块和该音频处理模块，用来根据多个视频参数和该视频阀值决定出多个视频精彩片段，根据多个音频参数和该音频阀值决定出多个音频精彩片段，然后根据该多个视频精彩片段和该多个音频精彩片段决定出该媒体数据流的精彩片段。
2.如权利要求1所述的装置，其中，该视频处理模块包含一移动向量运算器，用以计算该媒体数据流中一画面的一移动向量总和；一镜头数据处理单元，电连接于该镜头变换检测器和该移动向量运算器，用来根据每一镜头中多个画面的多个移动向量总和计算出一第一数值；以及一视频阀值决定单元，电连接于该镜头数据处理单元，用来根据该第一数值决定该视频阀值。
3.如权利要求2所述的装置，其中，该镜头数据处理单元会平均对应该多个画面的该多个移动向量总和以产生一移动向量平均值作为该第一数值。
4.如权利要求3所述的装置，其中，该视频阀值决定单元将该移动向量平均值乘以一加权系数以计算出该视频阀值。
5.如权利要求2所述的装置，其中，该镜头数据处理单元将具有一画面个数小于一画面参考值的该镜头的一过零率与一过零率平均值作比较以得到该媒体数据流的精彩片段。
6如权利要求2所述的装置，其中，该视频处理模块更包含一色阶分布运算器，用以计算出两个邻近画面的一色阶分布差值；其中，该镜头数据处理单元更根据该镜头的多个色阶分布差值来计算出一第二数值；以及该视频阀值决定单元更根据该媒体数据流的多个色阶分布差值计算出一色阶分布参考值，以及当该第二数值小于该色阶分布参考值时，该视频阀值决定单元就只根据该第一数值决定出该视频阀值。
7.如权利要求6所述的装置，其中，该镜头数据处理单元平均该镜头的该多个色阶分布差值以产生一色阶分布平均值以作为该第二数值，以及该视频阀值决定单元平均该媒体数据流的该多个色阶分布差值平均来得到该色阶分布参考值。
8.如权利要求1所述的装置，其中，该音频处理模块包含一音量运算器，用以检测该媒体数据流中每个画面的音量；一镜头数据处理单元，电连接于该镜头转换检测器和该音量运算器，用来根据一镜头中画面的音量决定出一数值；以及一音频阀值决定单元，电连接于该镜头数据处理单元，用来根据该数值决定出该音频阀值。
9.如权利要求8所述的装置，其中，该镜头数据处理单元平均该镜头中每个画面的音量以得到一音量平均值来作为该数值。
10.如权利要求9所述的装置，其中，该音频阀值决定单元平均该媒体数据流中多个音量平均值以得到该音频阀值。
11.如权利要求1所述的装置，其中，该音频处理模块包含一过零率运算器，用以检测一画面的一过零率；一镜头数据处理单元，电连接于该镜头变换检测器和该过零率运算器，用来根据一镜头中画面所计算出的过零率来决定出一第一数值；以及一音频阀值决定单元，电连接于该镜头数据处理单元，用来根据该第一数值决定出该音频阀值。
12.如权利要求11所述的装置，其中，该镜头数据处理单元平均该镜头中画面的过零率以产生一过零率平均值作为该第一数值。
13.如权利要求12所述的装置，其中，该音频阀值决定单元平均该媒体数据流中多个过零率以决定出该音频阀值。
14.如权利要求11所述的装置，更包含一音量运算器，用以检测一画面的音量；其中，该镜头数据处理单元更根据该镜头中画面的音量计算出一第二数值；以及该音频阀值决定单元根据该第一、二数值决定出该音频阀值。
15.如权利要求1所述的装置，其中，每一视频参数是一移动向量总和，该后处理器比较对应于一目前画面的移动向量总和以及该视频阀值，假如目前画面的移动向量总和大于该视频阀值，则该后处理器以该目前画面作为一视频精彩片段，以及假如该目前画面的移动向量总和不大于该视频阀值，则该后处理器不会以该目前画面作为一视频精彩片段。
16.如权利要求1所述的装置，其中，该多个音频参数中一音频参数是音量，该后处理器比较一目前画面的音量和该音频阀值，假如该目前画面的音量比该音频阀值大，则该后处理器以该目前画面作为一音频精彩片段，以及假如该目前画面的音量不大于该音频阀值，该后处理器不会以该目前画面作为一音频精彩片段。
17.如权利要求1所述的装置，其中，该多个音频参数中一音频参数是过零率，该后处理器比较一目前画面的过零率和该音频阀值，假如该目前画面的过零率较该音频阀值大，则该后处理器将以该目前画面作为一音频精彩片段，以及假如该目前画面的过零率未大于该音频阀值，则该后处理器不会以该目前画面作为一音频精彩片段。
18.如权利要求1所述的装置，其中，该后处理器优先决定该多个视频精彩片段，之后才决定该多个音频精彩片段，并且根据该多个音频精彩片段处理该多个视频精彩片段以决定该媒体数据流的精彩片段。
19.如权利要求1所述的装置，其中，该后处理器优先决定该多个音频精彩片段，之后才决定该多个视频精彩片段，并且根据该多个视频精彩片段处理该多个音频精彩片段以决定该媒体数据流的精彩片段。
20.如权利要求1所述的装置，其中，该后处理器在同一时间决定该多个视频精彩片段与该多个音频精彩片段，以决定该媒体数据流的精彩片段
21.如权利要求1所述的装置，其中，该多个音频参数和该多个视频参数是针对不同预设环境来分别加以设定。
22.如权利要求1所述的装置，其中，该后处理器另结合位在该媒体数据流的精彩片段之前或者之后的多个镜头以建立一完整的精彩片段。
23.一种检测一媒体数据流的精彩片段的方法，该方法包含决定一视频阀值；决定至少一音频阀值；检测一镜头转换以将该媒体数据流区分为数个镜头；以及根据多个视频参数和该视频阀值来决定出多个视频精彩片段，根据多个音频参数和该音频阀值来决定出多个音频精彩片段，然后根据该多个视频精彩片段和该多个音频精彩片段来决定该媒体数据流的精彩片段。
24.如权利要求23所述的方法，其中，决定一视频阀值的步骤包含有计算出该媒体数据流中一画面的一移动向量总和；根据每一镜头中多个画面的多个移动向量总和计算出一第一数值；以及根据该第一数值计算出该视频阀值。
25.如权利要求24所述的方法，其中，该第一数值是一移动向量平均值，其利用平均该多个画面的该多个移动向量总和而得。
26.如权利要求25所述的方法，其中，该视频阀值是经由该移动向量平均值乘以一加权系数而得。
27.如权利要求24所述的方法，更包含将具有一画面个数小于一画面参考值的该镜头的一过零率与一过零率平均值相比较以获得该媒体数据流的精彩片段。
28.如权利要求24所述的方法，更包含计算两个相邻画面的一色阶分布差值；根据该镜头的多个色阶分布差值得到一第二数值；以及根据该媒体数据流的多个色阶分布差值计算出一色阶分布参考值，当该第二数值小于该色阶分布参考值时，仅根据该第一数值决定该视频阀值。
29.如权利要求28所述的方法，其中，该第二数值是一色阶分布平均值，其经由平均该镜头的该多个色阶分布差值所得，以及该色阶分布参考值是经由平均该媒体数据流中多个色阶分布差值所得。
30.如权利要求23所述的方法，其中，决定至少一音频阀值的步骤包含检测该媒体数据流中每个画面的音量；根据一镜头中画面的音量计算出一数值；以及根据该数值决定出该音频阀值。
31.如权利要求30所述的方法，其中，该数值是藉由平均该镜头中每个画面的音量而计算出。
32.如权利要求31所述的方法，其中，该音频阀值是藉由平均该媒体数据流中多个音量平均值而得。
33.如权利要求23所述的方法，其中，决定至少一音频阀值的步骤包含检测一画面的一过零率；根据一镜头中画面所计算出的过零率来决定出一第一数值；以及根据该第一数值决定出该音频阀值。
34.如权利要求33所述的方法，其中，该第一数值是藉由平均该镜头中画面的过零率而得。
35.如权利要求34所述的方法，其中，该音频阀值是藉由平均该媒体数据流中多个过零率而得。
36.如权利要求33所述的方法，更包含检测一画面的音量；根据该镜头中画面的音量计算出一第二数值；以及根据该第一、二数值决定出该音频阀值。
37.如权利要求23所述的方法，其中，每一视频参数是一移动向量总和，以及该方法另包含有比较对应于一目前画面的移动向量总和和该视频阀值，假如该目前画面的移动向量总和大于该视频阀值，则以该目前画面作为一视频精彩片段，假如该目前画面的移动向量总和不大于该视频阀值，则不以该目前画面作为一视频精彩片段。
38.如权利要求23所述的方法，其中，该多个音频参数中一音频参数是音量，该方法更包含比较一目前画面的音量和该音频阀值，假如该目前画面的音量大于该音频阀值，则以该目前画面作为一音频精彩片段，假如该目前画面的音量不大于该音频阀值，则不以该目前画面作为一音频精彩片段。
39.如权利要求23所述的方法，其中，该多个音频参数中一音频参数是过零率，该方法更包含比较一目前画面的过零率和该音频阀值，假如该目前画面的过零率大于该音频阀值，则以该目前画面作为一音频精彩片段，假如该目前画面的过零率不大于该音频阀值，则不以该目前画面作为一音频精彩片段。
40.如权利要求23所述的方法，其中，决定该媒体数据流的精彩片段的步骤是优先决定该多个视频精彩片段，然后决定该多个音频精彩片段，最后再根据该多个音频精彩片段来处理该多个视频精彩片段以决定该媒体数据流的精彩片段。
41.如权利要求23所述的方法，其中，决定该媒体数据流的精彩片段的步骤是优先决定该多个音频精彩片段，然后决定该多个视频精彩片段，最后再根据该多个视频精彩片段来处理该多个音频精彩片段以决定该媒体数据流的精彩片段。
42.如权利要求23所述的方法，其中，该媒体数据流的精彩片段是同时参考该多个视频精彩片段和该多个音频精彩片段而得。
43.如权利要求23所述的方法，其中，该多个音频参数和该多个视频参数是针对不同预设环境来分别加以设定。
44.如权利要求23所述的方法，其中，决定该媒体数据流的精彩片段的步骤另包含结合位在该媒体数据流的精彩片段之前或者之后的多个镜头以建立一完整的精彩片段。
全文摘要
一种用以检测媒体数据流的精彩片段的装置。此装置包含视频处理模块、音频处理模块、镜头变换检测器以及后处理器。此视频处理模块是用来决定视频阀值，而音频处理模块用来决定至少一音频阀值。镜头变换检测器电连接于视频处理模块与音频处理模块，用来决定镜头变换以告知视频处理模块与音频处理模块。后处理器电连接于视频处理模块与音频处理模块，用来根据视频参数和视频阀值决定视频精彩片段并根据音频参数和音频阀值决定出音频精彩片段，最后依据视频精彩片段与音频精彩片段来决定媒体数据流的精彩片段。
文档编号H04N9/802GK101018347SQ20061011075
公开日2007年8月15日申请日期2006年8月11日优先权日2006年2月9日
发明者叶家宏, 刘荣文, 郭致宏, 施宣辉申请人:智辉研发股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶家宏;刘荣文;郭致宏;施宣辉
技术所有人：智辉研发股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。