从数字电视广播中提取连续剧的集序数的方法和装置的制作方法

文档序号:7591073阅读:181来源:国知局
专利名称:从数字电视广播中提取连续剧的集序数的方法和装置的制作方法
技术领域
本发明涉及一种提取通过电视频道发送的电视节目的服务信息的方法和系统,特别是涉及提取数字视频广播中,通过电子节目指南向用户广播的包含播放的电视系列节目的播放集序数,从而提醒用户避免错过收看喜爱的电视序列节目的方法和系统。
背景技术
电视连续剧是最受欢迎的电视节目之一,人们在观看活动中通常希望获知有关电视序列节目,例如电视连续剧的集序数信息(即,所播放的连续剧的第几集)。通常,观众希望通过观看第一集来决定以后是不是还观看该连续剧,或者希望知道下一集会由哪个频道播放。但电视频道数的不断增加以及生活节奏的不断加快,加重了人们通过传统方式获取电视节目信息的时间负担。
通常,为了得到电视节目的节目表,需要查阅报纸或杂志的电视节目栏。随着数字视频广播(DVB)的发展,广播电台可以发送包含视频信号、音频信号以及各种其它附加信息的数据。电视接收机接收这些附加信息,并响应用户的要求使用这些信息,从而使节目单的自动或半自动浏览、预告、提醒及推荐等手段得以实现。
例如,电子节目指南(Electronic Program Guide-EPG)实现于数字机顶盒上,它为用户提供了一种容易使用、界面友好、可以快速访问想要收看的电视节目的方式。而同样应用于终端的电视节目过滤或推荐系统,根据用户观看电视节目的历史,可以对新的节目进行评分,通过向用户提供可能感兴趣的电视节目从而减少用户浏览节目单的时间。然而,已有的这些手段并没有解决连续剧的首集提醒和集序数提取问题,同时也应该看到,现有的数字视频广播业务信息(DVB-SI)等数字电视服务规范并没有把连续剧的集序数标注信息作为独立的元数据类型纳入其框架。

发明内容
本发明的目的是提供旨在利用数字电视节目的服务信息,自动发现电视序列节目,例如,连续剧的首集并向用户作出提醒,同时给出连续剧的集序数以方便用户浏览的方法和装置,以使用户看到电视节目首集提醒后不至于错过喜爱的电视剧。本发明包括对服务信息的解码,连续剧的集序数表示模型,电视节目的集序数计算等方面。
为了实现本发明的目的,根据本发明的一个方面,提供一种从数字视频广播中提取电视节目信息的方法,包括步骤接收播放的电视节目标题和类型信息;根据预先存储的节目标题语法表分析所述节目标题,并生成与所述节目标题对应的标题字符串;和根据预先存储的所述节目标题语法表和解释所述节目标题语法表的语义解释函数表从所述生成的标题字符串中提取电视节目信息。
根据本发明的另一个方面,提供一种从数字视频广播中提取电视节目的集序数信息的方法,包括步骤接收播放的电视节目标题和类型信息;根据预先存储的节目标题语法表分析由类型信息指示为电视序列节目的节目标题,并生成与所述节目标题对应的标题字符串;和根据预先存储的所述节目标题语法表和解释所述节目标题语法表的语义解释函数表从所述生成的标题字符串中提取所述电视序列节目的集序数信息。
根据本发明的再一个方面,提供一种提取电视节目的集序数的装置,包括服务信息解码装置,用于对数字电视广播提供的码流进行解码,从中检出包括电视节目的集序数信息的服务信息;集序数模型装置,用于存储电视节目的集序数的表达模型;集序数提取装置,根据所述服务信息解码单元提供的解码服务信息,利用集序数模型单元中存储的集序数的表达模型对解码的服务信息进行匹配和识别计算,以得到电视节目的集序数信息;和控制装置,用于控制各个装置的操作并存储用于控制各个单元的操作所需的程序。
根据本发明的再一个方面,提供一种从数字视频广播中提取电视节目的集序数的方法,包括步骤接收服务信息的数据码流;对接收的服务信息码解码,从中提取服务信息,使用存储的集序数表达模型对解码的服务信息进行匹配和识别计算,以便从服务信息中分离出集序数信息;当分离出的集序数信息是首集时,向用户提醒电视节目的首集播放信息;和当分离出的集序数不是首集时,通过浏览界面向用户提供电视节目的相应的集序数信息。
另外,本发明还提供了存储执行所述用于从数字视频广播中提取电视节目的集序数的方法的程序的记录介质。


通过下面结合附图对用于解释,而不是限制本发明的优选实施例进行详细描述,将使本发明的上述及其它目的、特征和优点更加清楚,其中图1是根据本发明实施例的提取电视节目集序数的装置的配置方框图;图2是根据本发明实施例的提取电视节目集序数的流程图;图3是根据本发明实施例由语法分析器输出的电视节目的标题的语法树的示意图;图4是根据本发明实施例的自顶向下的语法分析器的配置示意图;和图5是根据本发明另一个实施例的自底向上的语法分析器的配置示意图;图6是根据本发明实施例的语义解释器的配置示意图;和图7是根据本发明提取电视节目的集序数的流程图。
具体实施例方式
下面结合附图描述本发明的提取电视节目集序数的装置,以及向用户提供电视节目集序数的构建模型。
图1是根据本发明实施例的提取电视节目集序数的装置的配置方框图。如图1所示,该装置包括中央控制单元11,服务信息解码单元12,集序数模型单元13,集序数提取单元14,输入请求单元15,首集提醒界面单元16,和集序数浏览界面单元17。
控制单元11是提取电视节目集序数的装置的总控制单元,用于控制各个单元之间的数据发送,以及将工作分配给各个单元。控制单元11存储用于控制各个单元的操作所需的程序。作为例子,控制单元11可以由中央处理单元(CPU)来实现。服务信息解码单元12对数字电视广播提供的码流进行解码,从中检出包括集序数信息的服务信息。集序数模型单元13是存储有关集序数表达式的模型化表示单元。集序数表达模型由系统开发人员在离线情况下构建,也可以在版本更新时由厂家负责更新。集序数提取单元14在控制单元11的控制下,根据由服务信息解码单元12解码的服务信息,利用集序数模型单元13中存储的模式对解码的服务信息进行匹配或识别计算,计算得到电视节目的集序数信息。输入请求单元15接受用户输入的首集提醒的请求,或诸如对集序数查询,使用之类的其它的请求,通过控制单元11向相应的单元发出控制指令。另外,作为例子,输入请求单元也可以接受来自遥控器输入。首集提醒界面单元16根据从输入请求单元15中获得的用户请求,利用集序数提取单元计算得到的集序数,通过显示一个界面,将目前已知的连续剧的首集播放信息显示给用户。集序数浏览界面单元17根据从输入请求单元15中获得的用户请求,利用集序数提取单元计算得到集序数,在本单元中进行显示,同时可以进行按集序数排序、查找等操作。
本发明的提取电视节目集序数的装置可以集成在本地机顶盒中,也可以作为分离单元设置在机顶盒中。集序数表示模型是可选的,或可更新的,例如,可以通过诸如电视电缆,微波,卫星线路之类的传输线路在线下载新的模型进行更新,或由广播节目供应商等直接提供,而无需用户的额外操作。
图2示出了本发明利用数字电视中服务信息规范提供电视节目信息的流程。
通过诸如电视电缆,微波,卫星线路之类的传输线路接收服务信息的数据码流。在机顶盒中,对接收的服务信息码解码,从中提取服务信息,并利用集序数模型单元13中存储的集序数表达模型对解码的服务信息进行匹配和识别计算,以便从服务信息中分离出集序数信息。此后,判断集序数信息是首集还是其它集的集序数。如果分离出的集序数是首集,则通过首集推荐提醒界面向用户提醒有关电视节目的首集播放信息。如果分离出的集序数不是首集信息,则通过浏览界面向用户提供电视节目的集序数信息。
下面说明服务信息的构成与利用。
在数字视频广播中,所有视频、音频、文字、图片等信息经数字化处理后都变成了数据,并按照MPEG-2的标准打包,形成固定长度(188个字节)的传送包。然后对这些数据包进行复用,形成传送码流(TS)。通常一个频道对应一个TS流,一个频道的TS流由多个节目及业务组成。在数字电视的传送流(TS)中插入的业务信息(SI)携带了电子节目指南(EPG)所需的全部数据。业务信息包括用来描述传送系统、传送内容和广播数据流时间表等数据,它帮助综合接收解码器(IRD)自动调谐,给用户提供附加信息,使IRD能自动设置可供选择的业务。只要播出前端按有关标准将业务信息插入,接收端的解码器就可以从TS中取出业务信息,构成不同功能的EPG。在TS流中如果没有引导信息,数字电视的终端设备将无法找到需要的码流,所以在MPEG-2中,专门定义了节目说明信息(PSI),其作用是自动设置和引导接收机进行解码。PSI信息在复用时通过复用器插入到TS流中,并用特定的PID(包标识符)进行标识。
MPEG-2标准中定义的节目业务信息PSI是对单一码流的描述。PSI由节目关联表(PAT)、条件接收表(CAT)、节目映射表(PMT)和网络信息表(NIT)组成。每个表被分成若干段映射(变换)到传送流中传输。PSI信息在复用时通过复用器插入到TS流中,并用特定的PID(包标识符)进行标识。PSI指定了如何从一个携带多个节目的传送流中正确找到特定的节目,当接收机要接收某一个指定节目时,它首先从节目关联表(PAT)中取得这个节目的节目映射表的PID值,然后从TS中找出与此PID值相对应的节目映射表,从这个节目映射表中获得构成这个节目的基本码流的PID值,根据这个PID值滤出相应的视频、音频和数据等基本码流,解码后复原为原始信号,删除所包含的其余PID的传送包。
DVB及相关的DVB-SI是当前最为流行的数字视频广播的规范,同时也是欧洲和中国即将采取的数字视频广播规范,因此本发明即以DVB-SI标准为基础进行设计。应该理解,本发明的应用不限于此,可以基于本发明的构思,根据具体的应用规范进行改进而不脱离本发明的精神和范围。
在DVB-SI规范中并没有把集序数作为独立的元数据类型纳入其标准的情况下,即使可以规定某个扩展或保留字段用以表达该信息,也没有理由期待各个不同的频道提供商会使用相同的扩展或保留字段。因此必须建立在通用规范的基础上来提取集序数信息才是可靠的。
业务信息(SI)中定义了9个表1)业务群关联表(BAT);2)业务描述表(SDT);2)事件信息表(EIT);4)运行状态表(RST);5)时间和日期表(TDT);6)时间偏移表(TOT);7)填充表(ST);8)选择信息表(SIT);9)间断信息表(DIT)。
考察DVB-SI规范,可以发现其中可利用的信息主要包括节目的标题和类型,其中标题用事件信息表(Event Information Table-EIT)中short_event_descriptor描述符的event_name_char字段描述,而一二级类型用EIT表中content_descriptor描述符的content_nibble_level_1及content_nibble-level_2字段描述。
虽然short_event_descriptor描述符的text_char或extended_event_descriptor描述符的item_char字段可容纳更多、表达能力更强大的文本描述信息,但在这些字段进行集序数提取运算将会很复杂,所以本发明不利用所有这些更复杂的描述符。
电视集序数的模式中国目前的各个电视台都有各自的电视节目预告表,或者刊登在电视报上,或者在其网页上发表。考察现有的节目预告单可以推知集序数的表达模式。下文将以权威的中央电视台的国际网站上发表的电视节目单为例,说明集序数模型的归纳方法。
模式样例在中央电视台的国际网站上收集的2个月、12个电视频道的节目预告单中,考察电视剧类节目的标题,有典型意义的带有集序数的标题总结在表1中。
表1.典型节目单中集序数的典型表述方式

对表1中集序数的表达方式的分析可以看出,表中的标题样例具有如下的特点1).一般会以一个栏目名称起头;2).在栏目名称后一般用冒号“”作为分隔符;3).在冒号分隔符后面,可能会有栏目的序号,例如,表1中第7、8条的“2000-156”,这些序号往往含有数字和破折号“—”;4).电视剧名在上述项目后出现,有时以书名号“《》”为标记;5).集序数一般情况下置于标题的最后,往往用括号“()”加以包含,或者以“第x集”的形式出现;多个集序数有时以列表的形式出现,例如,表1中第9条的“(5.6.7)”,有时以区间的形式出现,例如,第10条中的“15-17”;集序数可以用阿拉伯数字表示,也可以用汉字表示;6).标题的最后有时可能有另外的信息,比如该电视节目的产出国家名,例如,表1中第2条的“(韩)”等;7).某些更为复杂的标题可以容纳多级别的集序数信息,如表1中第13条的“命案十三宗(2)外遇(2)”。
如果用普通的程序设计方法来解决表1中所示典型样例的集序数检出问题也是可以实现的,但是程序的复杂性和出错的可能性比较大,模式修改后程序的重开发量也会很大。本发明提出使用形式语言的分析方法(或自然语言理解)来解决集序数的提取问题,系统开发者仅需编写语法(grammar)和语义(semantic)函数,相应的语法分析(parsing)则用通用的语法分析器(parser)程序来处理。
电视节目信息的正则语法表示类似于可以用上下文无关语法来近似描述一种自动语言,通过使用更为简单的正则语法(regular grammar,type-3 grammar),可以精确描述节目标题的表达形式。
下面是根据表1中典型样例而归纳出的节目标题的正则语法。可以明确看出,所有样例均可由此语法生成,而由此语法生成的标题也符合这些样例或人们可以理解的其它标题描述实例。
对于语法中的符号,如果它不出现在任意一条规则的右部,则称其为非终结符;反之,称其为终结符。下面给出电视节目信息的语法表示及其含义。
标点符号及其它表示节目标题中出现的标点符号及其它符号及文字

对于所得到的热敏电阻,以与实施例1同样的方法,得到了温度一电阻曲线。初期室温电阻为2.0×10-3Ω(1.4×10-2Ω·cm)。然而,即使改变温度,也见不到有大的电阻变化,也得不到充分的PTC特性,这些结果示于表1(比较例2)除了向混合物中添加导电性粒子使其为60质量%之外,其余与比较例1同样,得到了有机质正特性热敏电阻。
对于所得到的热敏电阻,以与实施例1同样的方法,得到了温度一电阻曲线,在150℃附近电阻急剧增加,电阻变化率在8个数量级(108)以上。初期室温电阻为1.0×10-2Ω(1.3×10-1Ω·cm)。然后,加热冷却后的室温电阻值为2.0×10-2Ω(2.6×10-1Ω·cm)。另外,以6V-10A(开10秒、关350秒=1个循环)的断续负荷试验进行10个循环后的室温电阻值为0.15Ω(1.06Ω·cm)这些结果示于表1中。
表1

表1中,在初期室温电阻值、加热冷却后的室温电阻值和断续负荷试验后的室温电阻值各栏中示出的数值是以Ω·cm为单位表示时的数值。
如表1所示,确认了实施例1和2的有机质正特性热敏电阻同时具有足够低的室温电阻值和足够大的电阻变化率。加热冷却后的室温电阻值恢复性、和断续负荷试验后的室温电阻恢复性也都良好,可靠<p>栏目段表示节目标题所表示的栏目

集序数段表示节目标题所表示电视系列节目的集序数

注释及其它表示节目标题所表示电视节目的注释和其它信息

名称段表示电视节目的名称

本集描述段表示对电视节目内容的简要描述

内容段,由多个本集描述段构成表示一次播放的电视节目内容的描述

节目标题表示所播出的电视节目的标题title→content_sec|column_sec content_sec
语法分析器下面说明通过分析上面的语法表达式得到节目内容及电视节目的集序数的语法分析器。
要判断一个标题是否能通过上文所述的标题语法,或者确定标题中由哪些成分(constituent)由哪种方式组成,需要使用语法分析器来实现。语法分析器的输出结果就是该标题的语法树(syntactic tree)。有两种通用的上下文无关语法(Context Free Grammar-CFG)分析器,一种是自顶向下的(top-down)分析器,另一种是自底向上的(bottom-up)分析器。
这些通用算法的细节将在后面描述。但不同的语法分析器给出的语法树是一样的。在此,只以图3给出的例子进行说明。图3中是上面表1中的第1条样例“黄金热播男才女貌(4)”经过语法分析器对语法表达式中的内容逐项分析之后输出的语法树,其中节点是成分,旁边的标记为其对应的语法符号;成分之间的连接表示父子关系,处于相对上方的为父成分,相对下方的为子成分。
自顶向下语法分析器简单地说,自顶向下算法的思路是,从语法的起始符S出发(注意,本发明中上面的语法表达的语法起始符是title)。枚举语法中的规则,对当前状态中的非终结符进行改写或推导,直至所有非终结符均已被重写成终结符,且终结符串与输入句子的词类全部匹配成功为止。
自顶向下语法分析器的中间结果可以用状态((推导树(deductiontree))((推导表)deduction list)当前位置(current position))来表示,其中推导树(deduction tree)是对应的未完成的语法树,其中待匹配节点的符号自左至右组成deduction list列表,而current position是当前的输入句子的位置。deduction tree树的特点是,一个节点存在子节点,当且仅当该节点的所有左兄弟所领子树的叶节点都是语法中的终结符。
算法需要维护一个可能状态列表(possibilities list),它的第一个元素是当前状态(current state),其余元素为备份状态(backup state)。算法从初始的可能状态列表((S)(S)1)出发,其中的(S)树表示只有一个S根节点的树,(S)deduction list中的S符号有一个指针与(S)树中的S节点相连,并且该初始可能状态列表不含有备份状态。分析器对语法表示中的内容的分析步骤如下1).如果可能状态列表为空,则算法失败退出;否则选取其中第一个状态C作为当前状态,并将其从可能状态列表中删去。
2).如果C的deduction list是空符号串,并且分析位置是句末位置,则算法成功退出,此时C的deduction tree就是完整的语法树,将其输出。将可能状态列表清除,退出程序。
3).否则根据以下三种情况分别处理,3a).如果C中deduction list的第一个符号是终结符,并且下一个输入符号等于该终结符,则将该终结符在deduction list中删去,该终结符含有的指向deduction tree待匹配节点的指针同时删除,将currentposition加1,将得到的新状态加入到可能状态列表中去;3b).如果C中deduction list的第一个符号是终结符,但下一个输入符号不等于该终结符,则不做任何处理;3c).如果C中deduction list的第一个符号是非终结符,则枚举语法中所有左部是该非终结符规则,对该终结符进行重写,并将所有这些新状态加入可能状态列表中去。具体生成新状态的做法是,用该条规则的右部符号串在deduction list中代替该符号,置于deduction list中所有符号之前。利用deduction list中该符号的指针,找到在deduction tree中对应的待匹配节点,在该节点下生成以该规则的右部符号为符号的相同数目的子节点节点,按顺序建立deduction list中新符号与deduction tree中新节点之间的指针联系,最后将该符号及其对应的指针删除。
4).返回步骤1)。
可以看出,步骤1)总是选择第1个状态作为当前状态,但在步骤3)把新状态加入到可能状态列表中时。有两种选择,一种是加到可能状态列表的前端(视备份状态列表为先进后出栈),另一种是加到可能状态列表的后端(视备份状态列表为先进先出队列),这就形成深度优先搜索和广度优先搜索两种策略,这两种方法在本发明中都可选用。
图4示出了自顶向下的分析器40。分析器40包括语法表存储装置41,输入符号串缓存装置42,分析器控制器43和可能状态列表存储装置44。其中语法表存储装置41以一维数组的形式存放语法中的所有r条规则。作为替换,语法规则也可存储在图1所述的集序数模型单元13中。输入符号串缓存装置42以一维数组的形式存放输入句子中的所有s个符号,可能状态列表存储装置44存放分析器运行时维护的可能状态列表(数目不定)。自顶向下分析器控制器则43是算法控制部件,它根据三个存储装置的内容执行上述算法,并在算法需要的时刻对上述三个存储装置进行查询、获取、删除及更新等操作,最后将分析出的语法树进行输出。
下面说明自底向上语法分析器。自底向上算法的思路是,从输入句子的符号串出发,对相邻符号串进行归结,生成对应规则的左部符号,直至最终生成语法法起始符号S(前述语法表示中的语法起始符是title)。
线图表分析器(Chart Parser)是最典型的自底向上语法分析器,它包含以下四个主要的数据结构1).活动弧-active arc,指当前已经扩展了一部分但仍没有得到最后归结的规则实例。它的表示方法与规则类似,但需在右部符号间插入一个圆点,指示下一步的匹配位置。比如NP→ART。ADJN这条活动弧,它指示下一个待扩展的符号是ADJ这个终结符。
2).成分-constituent,指当前已经最后归结的规则实例,或者是输入符号串实例。
3).议程表-agenda,新归结得到的成分存放在agenda中,直到它们均已被处理(被扩展)为止。正像自顶向下的分析算法一样,图表分析器也有两种搜索策略,即深度优先和广度优先,当议程表为先进后出栈(FILO)时,为深度优先搜索,当议程表为先进先出队列(FIFO)时,则为广度优先搜索。
4).线图表-chart,它是存放当前所有已经分析得到的中间结果的数据结构,通过这个机制,可以避免已有的成分被多次地归结,实现共享。
下面描述自底向上语法分析器的算法过程1).如果已没有输入符号(句子已处理完),则在线图表中寻找符号为S的成分,如果存在,则将其所领子树输出,如果没有,则说明分析失败,输出空结果。将所有活动弧和成分删除,退出程序。
2).根据当前输入符号生成相应的成分,将其置入议程表。
3).如果议程表为空,则转第1)步。
4).从议程表中选出一个(一般取第一个)成分C,设该分成的位置是(p1,p2),将其从议程表中删去,并加入到线图表中去。
5).对于语法表中任意一条形如X→CX1X2…Xn的规则,添加一条新活动弧X→。CX1X2…Xn,将其位置设为(p1,p2),其子节点列表为空。
6).对于已存在的任意一条形如X→X1X2…。C…Xn并且位置在(p0,p1)的活动弧,添加一条新活动弧X→X1X2…C。…Xn,将其位置设为(p0,p2),将原有活动弧的子节点和C添加成为该新活动弧的子节点。
7).对于已存在的任意一条形如X→X1X2…Xn。C并且位置在(p0,p1)的活动弧,归结一个新成分,将其位置设为(p0,p2),将原有活动弧的子节点和C添加成为该新成分的子节点;将该新成分置于议程表中去(深度优先和广度优先做法不同,前文已述)。
8).如果议程表为空,则转第1步;否则转第4步,重复上面的步骤。
图5示出了自底向上的线图表语法分析器50。如图6所示,线图表语法分析器50包括语法表存储装置51,输入符号串缓存装置52,分析器控制器53,活动弧存储装置54,议程表存储装置55,和线图表存储装置56。
语法表存储装置51以一维数组的形式存放语法中的所有r条规则。作为替换,语法规则也可以存储在图1所示的集序数模型单元13中。输入符号串缓存装置52以一维数组的形式存放输入句子中的所有s个符号。议程表存储装置55存储运行时某一时刻待扩展的成分(数目不定)。活动弧存储装置54存储运行时生成的所有活动弧(数目不定),线图表存储装置56则存放运行时生成的所有成分。自底向上线图表分析器控制器则是算法控制部件,它根据五个存储装置的内容执行上述算法,并在算法需要的时刻。描述算法对上述五个存储装置进行查询、获取、删除及更新等操作,最后将分析出的语法树进行输出。
经过前述处理后,得到分析出的语法树。语法树只给出标题的成分结构,相应的数据计算需要设置语义函数来完成。下面对本发明中运行语义解释函数以求得集序数值的方法流程进行描述。在语法树中寻找符号为ordinal_spec的节点,如果没找到,则算法失败,结果是无集序数。如果找到,则查找与该节点对应规则的语义解释函数,如果为空,则失败,结果是无集序数;如果该语义解释函数存在,则调用该语义解释函数,得到的函数返回值就是最后的集序数(单值、区间或列表),将其输出。
语义解释函数必须在每个需要的规则处都设置,该函数以各子成分的取值为条件,给出本成分的值。对于前面给出的语法表达的标题语法示例,可写出下面所示的语义解释函数。其中变量$0表示该函数的输出,也即该成分的取值,而$i(i>0)则是第i个子成分的取值。注意,有些规则的语义解释函数为空,则相应规则在下面不再列出。另外,需要指出,前面的语法表达中由于书写的原因,有些规则由于左部符号相同所以用‘|’合并起来写成一条,但在它们的语义函数时不能共用时在下面的语义解释函数中分开写出。
内容字符

}阿拉伯数字串

汉字表示的数字串



集序数段


图6示出了本发明中使用的语义函数解释器60。如图6所示,该语义函数解释器包括语法表存储装置61,语义函数存储装置62,语义函数解释器控制器63。语义函数解释器60接受输入的语法树和语法树中的待求节点,语义函数存储装置62存储与语法规则一一对应的语义解释函数。语义解释器控制器63是核心部件,它根据待计算的节点在语法表存储装置61中寻找到对应的规则,并在语义函数存储装置62中找到对应的语义函数,然后执行语义函数。由于语义解释函数一般是递归的,因此在某个语义解释函数的执行过程当中,需要递归地多次在语法树中找到对应子节点,在语法表存储装置61中找到该子节点对应的子规则,以及在语义函数存储装置62中查找到对应的子函数并执行。待求节点对应的语义函数返回值就是对应电视节目的集序数,由语义解释器控制器输出。
应用本发明提出的方法可以提取出电视节目信息包含的集序数信息。图7示出了得出集序数的处理流程图。其中节目的标题和类型直接根据服务信息解码器(图1中的参考标号11表示)得出;语法分析器可采用上面描述的自顶向下的语法分析器,或自底向上的语法分析器来配置与实现。可以直接根据语法树中是否有与集序数对应的节点(实施例中为ordinal_spec节点)判断是否有集序数成分。而标题语法表和语义解释函数表可从上面给出的语义函数中得到。
下面参考图7描述根据本发明提取电视节目的集序数的流程。在步骤S71,接受从服务信息解码单元(图1中的11)提供的节目标题和类型信息,判断节目类型是否是电视序列节目。如果不是电视系列节目,则没有集序数信息,并输出无集序数的指示。如果确定该电视节目的类型是电视序列节目,则在步骤S72将节目标题提供给语法分析器,语法分析器根据存储的标题语法表达式分析所提供的节目标题,输出相关的语法树。接下来,在步骤S73判断该语法树中是否包含集序数成分。如果判断结果为否定,则表明没有集序数信息,并输出无集序数的指示。如果判断结果表明存在着集序数信息,则将语法树提供给语义解释器,流程进行到步骤S74。语义解释器根据存储的标题语法表和语义解释函数表计算集序数,并输出集序数信息。此后,可通过图1所示的集序数浏览界面看到该电视系列节目的集序数。
本发明提供了一种在数字电视服务信息标准框架DVB-SI下,利用节目标题信息进行自动发现连续剧集序数信息的方法和装置。该方法的内容包括用正则语法来描述标题的构成结构,使用上下文无关语法分析器来分析标题的语法树,编写语义解释函数来计算相关成分对应的集序数。
需要指出的是,由于无法预测各个电视频道会以何种结构提供节目标题,因此理论上离线编写的标题语法并不能完全覆盖所有可能的句型(sentence pattern)。但标题容纳信息有其局限性,而且系统开发人员通过市场调查和详尽分析,也可以做到很高水平的覆盖度(比如95%),从而达到实用要求。其它关于自然语言理解系统的研究经验也证明了这一点。
另外,在机顶盒可以动态安装软件的前提下,也可以通过版本更新的方式向用户提供新语法的下载,以得到近乎100%的集序数提取性能根据本发明的提取电视节目的集序数的方法可以通过硬件来实现,也可以由处理器通过执行具有相应功能的程序通过实现。所述程序可记录在诸如软盘,硬盘,CD-ROM,DVD-ROM之类的计算机可读的记录介质上。
至此已结合优选实施例对本发明进行的详细描述。应该理解,本发明并不局限于此,而是仅由所附权利要求限定,本领域技术人员在不脱离本发明精神和范围的情况下可对本发明的实施例进行各种改变和改进。
权利要求
1.一种从数字视频广播中提取电视节目信息的方法,包括步骤接收播放的电视节目标题和类型信息;根据预先存储的节目标题语法表分析所述节目标题,并生成与所述节目标题对应的标题字符串;和根据预先存储的所述节目标题语法表和解释所述节目标题语法表的语义解释函数表从所述生成的标题字符串中提取电视节目信息。
2.一种从数字视频广播中提取电视节目的集序数信息的方法,包括步骤接收播放的电视节目标题和类型信息;根据预先存储的节目标题语法表分析由类型信息指示为电视序列节目的节目标题,并生成与所述节目标题对应的标题字符串;和根据预先存储的所述节目标题语法表和解释所述节目标题语法表的语义解释函数表从所述生成的标题字符串中提取所述电视序列节目的集序数信息。
3.根据权利要求2所述的方法,其中根据预先存储的节目标题语法表分析所述电视序列节目的所述节目标题的步骤进一步包括枚举所述语法表中的语法规则,对当前状态中的非终结符进行改写或推导,直至所有非终结符均已被重写成终结符,且终结符串与输入的节目标题的词类全部匹配的步骤。
4.根据权利要求2所述的方法,其中根据预先存储的节目标题语法表分析所述电视序列节目的所述节目标题的步骤进一步包括从输入的所述节目标题的字符串开始,对相邻字符串进行归结,生成对应于所述语法表中的语法规则的左部符号,直至最终生成语法起始符号。
5.根据权利要求2所述的方法,其中提取所述电视序列节目的集序数信息的步骤包括在所述标题字符串中寻找指示集序数信息的节点,查找与该节点对应的语法规则的语义解释函数,利用所述语义解释函数计算所述节点的集序数信息的函数值作为所述电视序列节目的集序数。
6.一种提取电视节目的集序数的装置,包括服务信息解码装置,用于对数字电视广播提供的码流进行解码,从中检出包括电视节目的集序数信息的服务信息;集序数模型装置,用于存储电视节目的集序数的表达模型;集序数提取装置,根据所述服务信息解码单元提供的解码服务信息,利用集序数模型单元中存储的集序数的表达模型对解码的服务信息进行匹配和识别计算,以得到电视节目的集序数信息;和控制装置,用于控制各个装置的操作并存储用于控制各个单元的操作所需的程序。
7.根据权利要求6所述的装置,还包括首集提醒界面装置,用于根据用户的请求,利用集序数提取单元计算得到的集序数,通过显示界面将电视节目的首集播放信息显示给用户。
8.根据权利要求6所述的装置,还包括集序数浏览界面装置,用于根据用户的请求,利用集序数提取装置计算得到的集序数,通过显示界面节目将电视节目的集序数显示给用户。
9.根据权利要求6所述的装置,其中所述集序数模型装置存储所述节目标题的语法表达式。
10.根据权利要求6所述的装置,其中所述集序数提取装置包括语法分析器,所述语法分析器包括语法表达式存储装置,用于存储所述节目标题的语法表达式;输入符号串缓存装置,用于以一维数组的形式存储输入的节目标题中的所有符号;可能状态列表存储装置,用于存储所述语法分析器运行时维护的可能状态列表;和自顶向下分析器控制器,用于根据上述存储装置存储的内容分析出对应的标题字符串并输出。
11.根据权利要求10所述的装置,其中所述语法分析器包括语法表达式存储装置,用于存储所述节目标题的语法表达式。
12.根据权利要求6所述的装置,其中所述集序数提取装置包括语法分析器,所述语法分析器包括输入符号串缓存装置,用于一维数组的形式存放输入的节目标题中的所有符号;议程表存储装置,用于存储运行时某一时刻待扩展的成分;活动弧存储装置,用于存储运行时生成的所有活动弧;线图表存储装置,用于存储运行时生成的所有成分;和分析器控制器,用于分子上述存储装置存储的内容分析出对应的标题字符串并输出。
13.根据权利要求12所述的装置,其中所述语法分析器包括语法表达式存储装置,用于存储所述节目标题的语法表达式。
14.根据权利要求10至13所述的装置,其中所述集序数提取装置包括语义函数解释装置,所述语义函数解释装置包括语义函数存储装置,用于存储与语法表达式一一对应的语义解释函数;语义解释器控制器,根据所述语法分析器输出的标题字符串,查找语法表达式存储装置存储的语法表达式,和语义函数存储装置中存储的对应的语义函数,然后计算所述语义函数,以获得对应的语义函数返回值作为对应的电视节目的集序数。
15.一种从数字视频广播中提取电视节目的集序数的方法,包括步骤接收服务信息的数据码流;对接收的服务信息码解码,从中提取服务信息,使用存储的集序数表达模型对解码的服务信息进行匹配和识别计算,以便从服务信息中分离出集序数信息;当分离出的集序数信息是首集时,向用户提醒电视节目的首集播放信息;和当分离出的集序数不是首集时,通过浏览界面向用户提供电视节目的相应的集序数信息。
16.一种存储用于执行从数字视频广播中提取电视节目信息的方法的程序的记录介质,所述方法包括步骤接收播放的电视节目标题和类型信息;根据预先存储的节目标题语法表分析所述节目标题,并生成与所述节目标题对应的标题字符串;和根据预先存储的所述节目标题语法表和解释所述节目标题语法表的语义解释函数表从所述生成的标题字符串中提取电视节目信息。
17.一种存储用于执行从数字视频广播中提取电视节目的集序数信息的方法的程序的记录介质,所述方法包括步骤接收播放的电视节目标题和类型信息;根据预先存储的节目标题语法表分析由类型信息指示为电视序列节目的节目标题,并生成与所述节目标题对应的标题字符串;和根据预先存储的所述节目标题语法表和解释所述节目标题语法表的语义解释函数表从所述生成的标题字符串中提取所述电视序列节目的集序数信息。
18.一种存储用于执行从数字视频广播中提取电视节目的集序数的方法的程序的记录介质,所述方法包括步骤接收服务信息的数据码流;对接收的服务信息码解码,从中提取服务信息,使用存储的集序数表达模型对解码的服务信息进行匹配和识别计算,以便从服务信息中分离出集序数信息;当分离出的集序数信息是首集时,向用户提醒电视节目的首集播放信息;和当分离出的集序数不是首集时,通过浏览界面向用户提供电视节目的相应的集序数信息。
全文摘要
本发明提供一种从数字视频广播中提取电视节目的集序数信息的方法,包括步骤接收播放的电视节目标题和类型信息;根据预先存储的节目标题语法表分析由类型信息指示为电视序列节目的节目标题,并生成与所述节目标题对应的标题字符串;和根据预先存储的所述节目标题语法表和解释所述节目标题语法表的语义解释函数表从所述生成的标题字符串中提取所述电视序列节目的集序数信息。本发明还提供提取电视节目的集序数的装置。
文档编号H04N5/445GK1678042SQ20041003192
公开日2005年10月5日 申请日期2004年3月31日 优先权日2004年3月31日
发明者郑文涛, 燕鹏举, 李斌 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1