实时媒体词典的制作方法

文档序号:7607704阅读:163来源:国知局
专利名称:实时媒体词典的制作方法
技术领域
本发明总体上涉及多媒体流(multi-media streams MMS),并且尤其涉及供多媒体流使用的实时媒体词典。
人们当观看多媒体内容(这里指的是多媒体流)时会遇到它们并不认识的字。典型情况下多媒体流包含音频和视频部分并且可以包括字幕(subtitle)和应用(OCAP,MHP,等)。多媒体流可以是所要观看的任何视频内容,诸如电影、电视节目、教育材料、工作材料等。
如果在观看多媒体内容期间遇到难字,那么观看者可以查词典或百科全书以便找到该词的意思或同义词,或者查翻译词典以便查找在另一种语言中的该词。如果正在其上观看多媒体流的装置(诸如计算机)支持词典,那么观看者必须停止播放所述多媒体流,打开词典应用,并且键入他/她所不理解的词(如果拼写是已知的话)。
美国专利号5,543,851提出包括其上存储有词典的存储器,可以查找在播放多媒体流时所显示的基于文本的字幕中的词。然而,观看者所不理解的任何词必须包含在所述存储器中,因此,不常用的词或在某些专业领域中的专用词不可能被存储在所述存储器中。美国专利号5,543,851的系统也只是仅仅适用于作为基于文本字幕的一部分而显示的词。因而,如果没有使用字幕,或者如果使用基于图像的字幕,那么观看者必须采取如上所述的手动查找词的方式。
因此本发明的目的是提供用于观看多媒体流的方法和设备,所述方法和设备克服了现有技术的缺点。
据此,提供了一种用于观看多媒体流的方法。所述方法包括把词典数据库添加到多媒体流中;并且允许所述多媒体流的观看者在观看所述多媒体流期间访问所述词典数据库。
所述词典数据库可以包括在多媒体流中所使用的一个或多个词的定义、翻译和同义词中的至少一个。
允许步骤可以包括指示词典访问。所述指示可以包括按压专用于启动对词典数据库访问的按钮。所述方法还可以包括显示在多媒体流中一个或多个所选择词的定义、翻译和同义词中的至少一个。可以根据在多媒体流中的数据、在所述多媒体流中所显示的字幕和在所述多媒体流中所再现的音频中的至少一个来挑选所选择的词。可以根据在指示之前所读出或所显示的词的预定数目来挑选所选择的词。还可以根据在指示之前的预定时段来挑选所选择的词。所述方法还可以包括挑选至少一个所选择词的定义、翻译和同义词之一,并且显示所挑选的定义、翻译或同义词。
所述方法还可以包括当访问词典数据库时暂停观看多媒体流。
还提供了一种用于观看多媒体流的方法,其中所述方法包括指示想要在观看所述多媒体流期间访问词典数据库的愿望;识别多媒体流中并非基于文本字幕的词;并且显示所述多媒体流中一个或多个所选择且识别词的定义、翻译和同义词中的至少一个。
所述词典数据库可以被包括在多媒体流中并且可以包括在所述多媒体流中所使用的一个或多个词的定义、翻译和同义词中的至少一个。
所述识别可以包括使用图像识别来识别基于图像字幕的词。所述识别还可以包括使用语音识别来识别音频词。
可以根据在指示之前所读出或所显示的词的预定数目来挑选所选择的词。还可以根据在指示之前的预定时段来挑选所选择的词。
所述方法还可以包括挑选至少一个所选择词的定义、翻译和同义词之一,并且显示所挑选的定义、翻译或同义词。
还提供了一种用于观看多媒体流的设备。所述设备包括用于输入多媒体流的输入装置,所述多媒体流其中包含有词典数据库;用于观看多媒体流视频部分的显示器;用于再现多媒体流音频部分的扬声器;用于指示想要在观看多媒体流期间访问词典数据库的愿望的装置;用于当指示并显示多媒体流中一个或多个所选择且识别词的定义、翻译和同义词中的至少一个时来访问词典数据库的控制器。
还提供了一种用于观看多媒体流的设备,其中所述设备包括用于输入多媒体流的输入装置;用于观看多媒体流视频部分的显示器;用于再现多媒体流音频部分的扬声器;用于指示想要在观看多媒体流期间访问词典数据库的愿望的装置;用于识别多媒体流中并非基于文本字幕的词的识别装置;和用于当指示并显示多媒体流中一个或多个所选择且识别词的定义、翻译和同义词中的至少一个时来访问词典数据库的控制器。
还提供了一种用于执行本发明方法的计算机程序产品以及其中存储所述计算机程序产品的程序存储装置。所述计算机程序产品可以被收录到计算机可读介质中或包含在多媒体流中。
结合下列说明、所附权利要求和附图,将能够更好地理解本发明的设备和方法的这些及其它特征、方面和优点,其中

图1图示了用于观看多媒体流的设备的实施例的示意图。
图2A和2B依照用于挑选要求其附加信息的词的实施例图示了图1的设备的显示。
图3A和3C依照用于挑选要求其附加信息的词的实施例图示了图1的设备的显示。
现在参照图1,图示了用于观看多媒体流的设备的实施例的示意图。所述设备总体上用附图标记100指代。仅以举例形式把设备100示为机顶盒,具有可操作与其连接的视频显示器102和扬声器104。所述设备可以是能够显示多媒体流或使多媒体流能够被显示的任何装置,诸如移动电话、个人数字助理、网络平板计算机、膝上计算机或台式计算机或电视监视器。尽管所示出的视频显示器102和扬声器104与设备100分离,不过它们任一个或者它们两者都可以与所述设备100整合在一起。
所述设备100具有用于输入多媒体流的输入装置106。所述多媒体流可以是任何视频或音频内容,可以借助在本领域中已知的任何装置输入,诸如在例如DV、DVD、CD、D-VCR之类的存储介质上,或直接由广播、卫星、电缆、蜂窝网络等发送到所述设备100。无论所述多媒体流是通过传输输入还是通过存储介质输入,所述多媒体流可以存储到设备100中的内部存储装置(未示出),所述内部存储装置典型情况下为在PVR上所形成的硬盘驱动器。然后从所述存储装置访问所述多媒体流。因而,所述输入装置可以是用于读取并播放存储介质的装置或用于接收并读取所传送的数据流的装置。所述设备还可以具有用于识别在多媒体流音频部分中的词的语音识别系统108和用于识别在多媒体流的基于图像字幕中的词的图像识别系统110。优选地是,设备100的组件,以及显示器102和扬声器104在处理器112(作为选择被称为“控制器”)的控制下。处理器112可以专用于控制上述的设备100的组件或者还可以控制所述设备100的其它功能。例如,在设备100是机顶盒的情况下,处理器还可以控制所述机顶盒的其它标准功能,诸如操作用于接收并显示电视广播或有线电视频道的调谐器。
设备100还具有指示装置,用于指示想要在观看多媒体流期间访问词典数据库的愿望。如下面将要论述的那样,优选地是,多媒体流其中包含有词典数据库。所述词典数据库可以具有对应于在多媒体流中所使用的词的信息,诸如在所述多媒体流中所使用的至少一些词的定义、翻译和/或同义词。指示装置可以是遥控装置114。遥控装置114可以连线到设备100或经由无线介质(诸如红外或RF)与设备100无线通信。在无线配置中,所述设备包括可操作来连接到处理器112以便与遥控装置114通信的天线116(接收器),这一点在本领域是公知的。如下所述,遥控装置114优选地是并不专用于设备100的功能,而是还可用于控制装置的其它功能。在设备100是机顶盒的情况下,遥控装置114还可以用来改变频道、控制音量并且控制其它标准功能。遥控装置114具有用于这种功能的多个按钮118以及方向按钮垫120,所述方向按钮垫120特别用于遍历在视频显示器102上所显示的用户界面上所显示的列表。优选地是,方向按钮垫120还具有用于在所显示的列表中输入高亮显示功能的“输入”按钮122。
现在将另外参考图2A、2B、3A、3B和3C来描述设备100的操作。如上所述,多媒体流优选地是包含词典数据库。所述词典数据库包括对应于在多媒体流中所使用的词的附加信息,诸如在所述多媒体流中所使用的一个或多个词的定义、翻译和/或同义词。其它类型的信息也可以包含在词典数据库中,诸如在多媒体流中一个或多个词的图画或视频示例。依照这种方式,每个特定的多媒体流可以包括在所述多媒体流中所选择的难词的词典数据库。因而,不必使在所述装置所存储的主词典数据库具有通用词条以及用于各个领域的技术和医学词条。完整的词典数据库可以包括在多媒体流中至少在节目/事件开始处。如果要求对所述流随机访问,那么可以重复地包括词典数据库。
然而,候选方法是只具有在所述流中确定数目的感兴趣词(例如,最后8个感兴趣的词)的非常小的词典数据库,所述词典数据库被不断地更新。当观看者指示想要访问词典数据库的愿望时,显示最后预定的词数。因而,可以避免需要语音/字幕识别。
当观看多媒体流时,允许观看者访问词典数据库,优选通过在遥控装置114上指示想要这样访问所述词典数据库的愿望。优选地是,所述观看者按压在遥控装置上(或作为选择,在设备100上)的专用按钮124以便开始对词典数据库的所想要的访问。专用按钮可以用词典符号“帮助”或问号来标记。当按下专用按钮124或采用其他方式指示想要访问词典数据库的愿望时,处理器112访问在多媒体流中的词典数据库并且在显示器102上显示在所述多媒体流中一个或多个所选择词的定义、翻译和/或同义词。
可以根据多媒体流中的数据、所述多媒体流中所显示的字幕和/或所述多媒体流中所再现的音频来挑选所选择的词。在多媒体流具有基于文本字幕(例如,闭合字幕、基于电文的字幕)的情况下,处理器可以直接识别并访问在词典数据库中的词。对于作为视频一部分或被作为DVB字幕(位图)广播的基于图像的字幕,图像识别系统110用来识别在多媒体流中的词。在没有字幕的情况下,语音识别系统108用来识别在多媒体流音频部分中的词。语音和图像识别系统在本领域中都是公知的,为了简洁起见,在这里省略对其详细论述。
一旦从多媒体流识别所述词,那么可以根据在指示之前所读出或所显示的预定数目的词来选择所述词。例如,处理器可以访问词典数据库并且显示在按下专用按钮124之前在扬声器上所再现的(或在字幕上所显示的)最后词或最后十个词。作为选择,还可以根据在指示之前的预定时段来挑选所选择的词。例如,处理器可以访问词典数据库并且显示在专用按钮124被按下之前的最后十秒期间在扬声器上所再现的词。优选地是,设备100可以被观看者编程来挑选用于选择要显示的词的默认方法以及所述词的预定数目或预定时段的长度。本发明的方法还可以滤出显而易见的词(诸如“我”、“这个”和“一个”)。在词典数据库处在多媒体流中的情况下,词典数据库可以排除这种显而易见的词,然而,当所述词典数据库存储在设备100中时这种过滤可能是重要的。
图2A和2B图示了由设备100在显示器102上所显示的图形用户界面的第一例子。当按下专用按钮124时,可以暂停多媒体流,例如电影,处理器112可以借助于语音和图像识别系统108、110来识别在所述多媒体流中的词,并且在所暂停的电影上显示第一窗口200。
作为选择,处理器112可以在播放多媒体流时识别在所述流中的词,并且可以依照词数的预定时段来高速缓存先前的词数。第一窗口包含依照预定准则所选择的词列表202,上面论述了词的例子。每个词还具有对应于关于每个词的信息类型的类别204。例如,在列表202中的每个词的定义为“D”,翻译为“T”,并且同义词为“S”。如果选择其它附加信息,诸如所述词的视频示例,那么可以使用附加窗口(未示出)来播放视频示例。可以把视频示例添加到类别作为“V”。于是观看者就可以使用方向按钮垫120来高亮显示他或她需要其更多信息的词。类似地,所述观看者可以使用方向按钮垫120来高亮显示对应于所述高亮显示词的类别之一。在观看者的选择被高亮显示之后,他或她可以按下输入按钮122来输入他的选择。当输入选择时,显示具有在列表202中所高亮显示词的定义、翻译或同义词的另一窗口206。在想要翻译的情况下,可以在窗口206之前显示临时窗口208,以便选择所要翻译的语言,如图2B所示。作为选择,可以使用处理器来设置默认语言,因而消除了对附加窗口208、310的需要。在显示所选择词的附加信息之后,然后观看者可以选择另一词(例如使用遥控装置114上的后退按钮)或隐藏/停止词典数据库应用。在已经暂停多媒体流的情况下,在隐藏或停止词典数据库应用时,当观看者指示时可以自动重新启动或手动重新启动所述多媒体流。
图3A-3C图示了由设备100在显示器102上所显示的图形界面的另一例子。当按下专用按钮124时,暂停多媒体流并且在所暂停的电影上显示第一窗口300。第一窗口包含依照预定准则所选择的词列表302,上面论述了词的例子。然而,在第二窗口306中显示了类别304,所述类别304对应于关于在第一窗口300中所选择词的信息类型。例如,在列表302中的每个词具有在第二窗口306中所显示的“定义”、“翻译”和“同义词”选择。观看者首先使用方向按钮垫120和输入按钮122来高亮显示他或她需要其更多信息的词。然后,就可以显示第二窗口306,并且观看者可以类似地再次使用方向按钮垫120和输入按钮122来高亮显示对应于所高亮显示词的类别304之一。当输入选择时,显示具有在列表302中所高亮显示的词的定义、翻译或同义词的另一窗口308(与在第一例子中的窗口206类似),如图3B中所示。在想要翻译的情况下,可以在窗口306之前显示临时窗口310(与在第一例子中的窗口208类似),以便选择所要翻译的语言,如图3C所示。
尽管所选择的词和相应的特性在窗口上被示出,然而那些本领域技术人员应当理解它们可以依照其它方式显示,诸如沿着显示器102顶部所显示的条或在沿着屏幕一边的下拉式菜单。此外,尽管当显示所选择的词时可以暂停多媒体内容,然而当显示所选择的词时也可以继续播放所述多媒体内容。此外,如果多媒体流继续播放,那么可以重新格式化所述多媒体流的显示,以致所述多媒体流可以在不妨碍所选择词的显示的情况下被观看。
本发明的方法特别适于由计算机软件程序执行,这种计算机软件程序优选包含对应于所述方法单个步骤的模块。当然这种软件可以被收录到计算机可读介质,诸如集成芯片或外围装置。计算机软件程序还可以是多媒体流(如MHP或OCAP应用)的一部分。因此,计算机软件程序可以使用在所述流中的音频、视频、内容和词典数据库的特定资料。
那些本领域技术人员应当理解本发明的方法和设备消除了现有技术方法的缺点。例如,与现有技术的方法对比,不要求观看者停止观看多媒体流并且开始另一应用。也不需要观看者手动键入他/她并不理解的词。因此,不需要全键盘,具有方向键和输入键(这在大部分家用电子产品上是通用的)的简单遥控装置足以。另外,本发明的方法和设备并不被限制为具有基于文本字幕的多媒体流,还可以供具有基于图像字幕或根本没有字幕的内容使用。此外,由于词典数据库可以包含在多媒体流中,所以它还可以专用于所述多媒体流的内容。
这特别可用于在具有自己词汇的教育、文献和课程中所使用的多媒体流。尽管所述方法和设备对这种类型的内容具有特别的效用,然而其作为如电影之类的常规内容的附加服务也具有一定效用。
虽然已经示出并描述了本发明的优选实施例,然而当然应当理解,在不脱离本发明精神的前提下,可以容易地进行各种形式上或细节上的修改和变化。因此本发明并不意在局限于所描述和图示的确切形式,而应当被构造为覆盖了落入附加权利要求范围内的所有修改。
权利要求
1.一种用于观看多媒体流的方法,所述方法包括把词典数据库添加到多媒体流中;并且允许所述多媒体流的观看者在观看所述多媒体流期间访问所述词典数据库。
2.如权利要求1所述的方法,其中所述词典数据库包括在多媒体流中所使用的一个或多个词的定义、翻译和同义词中的至少一个。
3.如权利要求1所述的方法,其中所述允许包括指示词典访问。
4.如权利要求3所述的方法,其中所述指示包括按压专用于启动对所述词典数据库进行访问的按钮(124)。
5.如权利要求3所述的方法,还包括显示在所述多媒体流中一个或多个所选择词的定义、翻译和同义词中的至少一个。
6.如权利要求5所述的方法,其中根据所述多媒体流中的数据、所述多媒体流中所显示的字幕和所述多媒体流中所再现的音频中的至少一个来挑选所选择的词。
7.如权利要求5所述的方法,其中根据在指示之前所读出或所显示的词的预定数目来挑选所选择的词。
8.如权利要求5所述的方法,其中根据在指示之前的预定时段来挑选所选择的词。
9.如权利要求5所述的方法,还包括挑选至少一个所选择词的定义、翻译和同义词之一,并且显示所挑选的定义、翻译或同义词。
10.如权利要求1所述的方法,还包括当访问所述词典数据库时暂停观看所述多媒体流。
11.一种用于观看多媒体流的方法,所述方法包括指示想要在观看所述多媒体流期间访问词典数据库的愿望;识别多媒体流中并非基于文本字幕的词;并且显示所述多媒体流中一个或多个所选择且识别词的定义、翻译和同义词中的至少一个。
12.如权利要求11所述的方法,其中所述词典数据库被包括在所述多媒体流中,并且包括所述多媒体流中所使用的一个或多个词的定义、翻译和同义词中的至少一个。
13.如权利要求11所述的方法,其中所述识别包括使用图像识别来识别基于图像字幕的词。
14.如权利要求11所述的方法,其中所述识别包括使用语音识别来识别音频词。
15.如权利要求1所述的方法,其中根据在指示之前所读出或所显示的词的预定数目来挑选所选择的词。
16.如权利要求11所述的方法,其中根据在指示之前的预定时段来挑选所选择的词。
17.如权利要求11所述的方法,还包括挑选至少一个所选择词的定义、翻译和同义词之一,并且显示所挑选的定义、翻译或同义词。
18.一种用于观看多媒体流的设备(100),所述设备包括用于输入多媒体流的输入装置(106),所述多媒体流其中包含有词典数据库;用于观看多媒体流视频部分的显示器(102);用于再现多媒体流音频部分的扬声器(104);用于指示想要在观看多媒体流期间访问词典数据库的愿望的装置(114,116);以及用于当指示并显示多媒体流中一个或多个所选择且识别词的定义、翻译和同义词中的至少一个时来访问词典数据库的控制器(112)。
19.如权利要求18所述的设备,还包括识别装置(108,110),用于识别多媒体流中并非基于文本字幕的词。
20.一种用于观看多媒体流的设备(100),所述设备包括用于输入多媒体流的输入装置(106);用于观看多媒体流视频部分的显示器(102);用于再现多媒体流音频部分的扬声器(104);用于指示想要在观看多媒体流期间访问词典数据库的愿望的装置(114,116);用于识别多媒体流中并非基于文本字幕的词的识别装置(108,110);和用于当指示并显示多媒体流中一个或多个所选择且识别词的定义、翻译和同义词中的至少一个时来访问词典数据库的控制器(112)。
21.如权利要求20所述的设备,其中所述词典数据库包含在多媒体流中。
22.一种用于观看多媒体流的计算机程序产品,所述计算机程序产品包括用于读取在多媒体流中的词典数据库的计算机可读程序代码装置;和用于允许多媒体流的观看者在观看所述多媒体流期间访问词典数据库的计算机可读程序代码装置。
23.如权利要求22所述的计算机程序产品,其中所述计算机程序产品被收录在计算机可读介质中。
24.如权利要求22所述的计算机程序产品,其中所述计算机程序产品包含在多媒体流中。
全文摘要
提供了一种用于观看多媒体流的方法。所述方法包括把词典数据库添加到多媒体流中;并且允许所述多媒体流的观看者在观看所述多媒体流期间访问所述词典数据库。还提供了一种用于观看多媒体流的方法,其中所述方法包括指示想要在观看多媒体流期间访问词典数据库的愿望;识别多媒体流中并非基于文本字幕的词;并且显示在多媒体流中一个或多个所选择且识别词的定义、翻译和同义词中的至少一个。
文档编号H04N5/445GK1843036SQ200480024409
公开日2006年10月4日 申请日期2004年8月23日 优先权日2003年8月25日
发明者A·P·P·维里森 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1