字幕文件处理方法及装置与流程

文档序号:12279900阅读:367来源:国知局
字幕文件处理方法及装置与流程

本申请涉及信息处理技术领域,尤其涉及一种字幕文件处理方法及装置。



背景技术:

为了满足用户的视频播放需求,在播放视频文件的同时,加载相应的字幕文件进行同步展示。通常,字幕文件分为硬字幕和软字幕,其中,硬字幕也称为内嵌字幕,把字幕文件和视频流压制在同一组数据里,无法分离,其缺点是修正难度大,一旦出错必须重新制作整个视频文件,限制了用户对字体风格个人喜好的修改。软字幕也称外挂字幕,把字幕文件单独保存,只需与视频文件名相同,在播放时自动调用。

目前,用户在搜索软字幕文件时,对用户输入的关键字进行简单的匹配,导致搜索到的某些字幕文件不准确,用户需要重复搜索才能找到合适的字幕文件,降低了用户终端的资源利用率。此外,搜索到的合适的字幕文件数量有限,无法提供不同格式、不同语种的字幕文件供用户选择,不能充分满足用户对字幕文件的不同需求,影响了用户的视频播放体验。



技术实现要素:

本发明提供了一种字幕文件处理方法及装置,能够提高字幕文件搜索的准确性以及中央处理器(CPU)的利用率。

本发明的技术方案是这样实现的:

本发明提供了一种字幕文件处理方法,应用于搜索服务器,包括:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找 到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给搜索客户端,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;及,当从搜索客户端接收到针对字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给搜索客户端。

本发明还提供了一种字幕文件处理方法,应用于搜索客户端,方法包括:接收针对一视频文件的字幕文件的搜索请求;将搜索请求发送给搜索服务器,以使搜索服务器基于搜索请求查找该视频文件对应的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;接收搜索服务器返回的字幕文件列表,从字幕文件列表中选择一字幕文件,向搜索服务器发送携带所选择的字幕文件的下载请求;及,从搜索服务器将所选择的字幕文件下载到本地。

本发明又提供了一种搜索服务器,包括:获取模块,用于从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;配置模块,用于针对每一视频文件,配置该视频文件的关键词;确定模块,用于针对该视频文件的每一资源包,通过将配置模块配置的该视频文件的关键词和获取模块获取的该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性;接收模块,用于从搜索客户端接收针对一视频文件的字幕文件的搜索请求,以及从搜索客户端接收针对字幕文件列表中一字幕文件的下载请求;查找模块,用于基于接收模块接收到的搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性;生成模块,用于根据查找模块确定的相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;及,发送模块,用于将生成模块生成的字幕文件列表发送给搜索客户端,以及将接收模块接收到的下载请求中的字幕文件发送给搜索客户端。

本发明提供了一种搜索客户端,包括接收模块、选择模块和发送模块,其中,接收模块用于接收针对一视频文件的字幕文件的搜索请求;发送模块用于将接收模块接收的搜索请求发送给搜索服务器,以使搜索服务器基于搜索请求查找该视频文件对应 的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;接收模块用于接收搜索服务器返回的字幕文件列表;选择模块用于从接收模块接收的字幕文件列表中选择一字幕文件;发送模块用于向搜索服务器发送携带选择模块确定的字幕文件的下载请求;接收模块用于从搜索服务器将所选择的字幕文件下载到本地。

根据本发明提供的方法,通过关键词与内容描述信息的匹配确定字幕文件的相关性,提高了搜索字幕文件的准确性,避免用户反复多次搜索,提高了电子设备中CPU的资源利用率,并且能够提供具备不同相关性的多个字幕文件供用户选择,充分满足了用户对字幕文件的不同需求,提高了用户的视频播放体验。

附图说明

图1为本发明实施例所涉及的实施环境示意图;

图2为依据本发明一实施例的搜索服务器处理字幕文件的方法的流程示意图;

图3为依据本发明一实施例的建立字幕文件库的示意图;

图4为依据本发明一实施例的生成字幕文件列表的界面示意图;

图5为依据本发明另一实施例的搜索服务器处理字幕文件的方法的流程示意图;

图6为依据本发明一实施例的搜索客户端处理字幕文件的方法的流程示意图;

图7为依据本发明另一实施例的搜索客户端处理字幕文件的方法的流程示意图;

图8为依据本发明一实施例的字幕文件处理方法的交互示意图;

图9为依据本发明一实施例的搜索服务器的结构示意图;

图10为依据本发明另一实施例的搜索服务器的结构示意图;

图11为依据本发明又一实施例的搜索服务器的结构示意图;

图12为依据本发明一实施例的搜索客户端的结构示意图;

图13为依据本发明另一实施例的搜索客户端的结构示意图;

图14为依据本发明又一实施例的搜索客户端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例所涉及的实施环境示意图。参见图1,字幕文件处理系统100包括一个或多个视频服务器110-1…110-n、搜索服务器120、搜索客户端130和媒体播放器140。在媒体播放器140上播放一视频文件时,同步展示字幕文件。

为了在媒体播放器140上展示和该视频文件对应的字幕文件,首先,搜索服务器120建立字幕文件库。针对每一视频文件,搜索一个或多个视频服务器110-1…110-n,获取各视频文件的资源包。其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件。针对每一视频文件,配置该视频文件的关键词;针对该视频文件的每一资源包,通过将自身配置的该视频文件的关键词和该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性。

搜索客户端130接收用户输入的针对一视频文件的字幕文件的搜索请求,将该搜索请求发送给搜索服务器120。搜索服务器120根据接收到的搜索请求,生成该视频文件的字幕文件列表,该字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件,并将该字幕文件列表发送给搜索客户端130。

搜索客户端130根据该字幕文件列表,选择一个字幕文件,然后向搜索服务器120发送针对所选择的字幕文件的下载请求。然后,搜索服务器120接收到下载请求后,将该字幕文件发送给搜索客户端130。

当媒体播放器140打开一视频文件,加载已下载到搜索客户端130的字幕文件;然后在播放该视频文件时,同步展示该字幕文件。

其中,搜索客户端130可以位于一电子设备的媒体播放器140内,实现该媒体播放器140的搜索功能。或者,搜索客户端130可以为独立的搜索浏览器,和媒体播放器140安装于同一电子设备上。该电子设备可以是单独的媒体播放设备,也可以是具有媒体播放功能的任一电子设备,包括但不限于台式计算机、智能手 机、掌上电脑、平板电脑、智能手机等。

本发明实施例中所述的字幕文件属于软字幕,即外挂字幕文件,在搜索服务器120上预先储存多个字幕文件并设定相关性值,当搜索客户端130接收到搜索请求时将该字幕文件下载到本地以同步播放。

图2为依据本发明一实施例的搜索服务器处理字幕文件的方法的流程示意图。参见图2,该方法应用于搜索服务器,包括:

步骤201,从视频服务器获取各视频文件的资源包。

其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件。其中,内容描述信息包括该视频文件的简介信息、推荐信息、用户评论信息中的任一项或任意几项;一个或多个字幕文件对应多个语言和/或多个文件格式,例如,语言为中文、英文、中英双字等,文件格式为.smi、.srt等,其中.smi是多媒体教本,可以使用RealPlayer、Media Player Classic打开;.srt是电影字幕文件,可以使用VobSub或者QQ影音打开,在展示时,将其与视频文件放置在同一目录下并且保证文件名相同,这样在观看视频文件时可以自动调用相应的字幕文件。

步骤202,针对每一视频文件,配置该视频文件的关键词,针对该视频文件的每一资源包,通过将自身配置的该视频文件的关键词和该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性。

其中,该视频文件的关键词可以为该视频的名称、视频中的角色、演员、导演等中的一个或多个。例如,视频文件为一电影,关键词包括电影名“超能陆战队”、角色“大白”;又如,视频文件为一电影,关键词包括电影名“阿凡达”、导演“詹姆斯·卡梅隆”;又如,视频文件为一电视剧,关键词包括电视剧名“越狱”,演员“米帅”。

在一实施例中,通过将该视频文件的各关键词和内容描述信息分别进行匹配,计算得到匹配度。其中,匹配度可以为各关键词在内容描述信息中出现的次数之和。然后,将匹配度作为该资源包中各字幕文件的相关性的数值。

具体而言,若关键词包括电影名“超能陆战队”和角色“大白”,内容描述信息为该视频文件的简介信息,即电影“超能陆战队”的剧情简介。那么,通过在该剧情简 介的文本内容中搜索关键词一“超能陆战队”以及关键词二“大白”,将出现这两个关键词的次数之和作为匹配度,将该匹配度标记为该资源包中各字幕文件的相关性的数值。当资源包中包括多个字幕文件时,这些字幕文件的相关性相同。

或者,预设多个相关性级别,通过将匹配度和一个或多个预设阈值进行比较,确定匹配度所属的相关性级别,并用该相关性级别来表征该资源包中各字幕文件的相关性。

具体而言,将字幕文件的相关性标记为“高”、“中”和“低”,将上述匹配度和第一预设阈值、第二预设阈值进行比较。若匹配度大于第一预设阈值,确定各字幕文件的相关性为高;若匹配度小于第一预设阈值且大于第二预设阈值,确定各字幕文件的相关性为中;若匹配度小于第二预设阈值,确定各字幕文件的相关性为低。

在另一实施例中,内容描述信息包括该视频文件的简介信息、推荐信息、用户评论信息中的任一项或任意几项。此时,为内容描述信息中各项内容描述信息设置优先级。例如,根据关键词和各项内容描述信息的关联程度的不同,将该视频文件的简介信息的优先级设置为“一级”,将推荐信息的优先级设置为“二级”,将用户评论信息的优先级设置为“三级”。

通过将关键词和各项内容描述信息分别进行匹配,计算得到关键词分别与各项内容描述信息之间的匹配度,其中,关键词与每项内容描述信息的匹配度为关键词在该项内容描述信息中出现的次数;针对每项内容描述信息,将关键词与该项内容描述信息之间的匹配度和该项内容描述信息的优先级对应的分值相乘,得到该项内容描述信息的相关性值,将每项内容描述信息的相关性值相加之和作为该内容描述信息的相关性值;将该内容描述信息的相关性值作为该资源包中各字幕文件的相关性的数值。

具体而言,若关键词为“大白”,内容描述信息包括电影“超能陆战队”的简介信息和推荐信息,在简介信息和推荐信息中分别搜索“大白”,将“大白”出现的次数作为关键词与每项内容描述信息的匹配度,例如在简介信息中出现55次,在推荐信息中出现20次;若优先级“一级”、“二级”和“三级”分别对应分值80%、50%和30%,简介信息对应“一级”,推荐信息对应“二级”,那么对应该内容描述信息的相关性值为55*80%+20*50%=54,将54这一数值标记为该资源包中各字幕文件的相关性的数值。即,根据每项内容描述信息的优先级对应的分值,对匹配度进行加权来得到针对 该资源包的各字幕文件的相关性。其中,上述优先级“一级”、“二级”和“三级”分别对应的分值仅为举例,具体数值可以根据内容描述信息所包含的信息项数、每项内容描述信息和关键词之间的关联程度自行设定,本发明不做具体设定。

或者,预设多个相关性级别,通过将该内容描述信息的相关性值和一个或多个预设阈值进行比较,确定该内容描述信息的相关性值所属的相关性级别,并用该相关性级别来表征该资源包中各字幕文件的相关性。

具体而言,将各字幕文件的相关性标记为“高”、“中”和“低”,预设第一预设阈值为50和第二预设阈值为25,与上述计算出的相关性值54进行比较。由于相关性值54大于第一预设阈值50,可以确定该资源包中各字幕文件的相关性为高。否则,若匹配度小于第一预设阈值且大于第二预设阈值,确定各字幕文件的相关性为中;若匹配度小于第二预设阈值,确定各字幕文件的相关性为低。

这样,搜索服务器针对获取到的各视频文件的资源包及相关性计算,可以建立一字幕文件库。图3为依据本发明一实施例的建立字幕文件库的示意图,其中,一个视频文件对应多个资源包,每个资源包标记有字幕文件的相关性。具体而言,每个视频文件对应一个索引和多个关键词(包括视频名称、角色、导演),每个资源包对应有索引、多个字幕文件(区分不同的语言、格式)、多项内容描述信息(分为简介信息、推荐信息、用户评论信息及各自对应的优先级级别)和计算得到的相关性(可以标记为具体的数值或者相关性级别“高”、“中”、“低”)。其中,每项内容描述信息若存在,则以“.txt”来标识。

步骤203,当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,基于搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性。

步骤204,根据相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给搜索客户端。

其中,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件。图4为依据本发明一实施例的生成字幕文件列表的界面示意图。其中,对应图3给出的字幕文件库里的信息,在字幕文件列表中给出了不同语言下根据相关性排序后的字幕文件,其中字幕文件以“资源包索引.文件格式”的形式给出。例如, 用户搜索“超能陆战队”的字幕文件,在“中”文字幕文件中列出了1.srt(对应相关性数值54)、3.srt(对应相关性数值38)和2.srt(对应相关性数值30);在“英”文字幕文件中列出了1.srt(对应相关性数值54)和3.smi(对应相关性数值38);在“中英”文字幕文件中列出了1.srt(对应相关性数值54)和3.smi(对应相关性数值38)。

步骤205,当从搜索客户端接收到针对字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给搜索客户端。

在图4示出的字幕文件列表中选择了一字幕文件后,携带于下载请求中,并发送给搜索服务器,然后搜索服务器将该字幕文件发送给搜索客户端以用于播放视频文件时同步展示。

在本发明实施例中,从视频服务器获取各视频文件的资源包,针对每一视频文件,配置该视频文件的关键词,针对该视频文件的每一资源包,通过将自身配置的该视频文件的关键词和该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性,当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性,根据相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给搜索客户端,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件,当从搜索客户端接收到针对字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给搜索客户端,使得搜索服务器能够通过关键词与内容描述信息的匹配提高搜索字幕文件的准确性,避免用户反复多次搜索,提高了电子设备中CPU的资源利用率,并且能够提供具备不同相关性的多个字幕文件供用户选择,充分满足了用户对字幕文件的不同需求,提高了用户的视频播放体验。

图5为依据本发明另一实施例的搜索服务器处理字幕文件的方法的流程示意图。参见图5,该方法应用于搜索服务器,包括:

步骤501,搜索一个或多个视频服务器,从各视频服务器获取和该视频文件相关的网页和各字幕文件的下载地址。

步骤502,针对每一视频服务器,从该视频服务器获取到的网页中抓取对应该 视频文件的内容描述信息;访问下载地址,并下载得到各字幕文件;生成该视频文件的一个资源包。

其中,该资源包包括抓取到的内容描述信息和下载到的各字幕文件,内容描述信息包括该视频文件的简介信息、推荐信息、用户评论信息中的任一项或任意几项,每项内容描述信息可以储存为.txt文件;一个或多个字幕文件对应多个语言(中文、英文、中英双字及其他)和/或多个文件格式(.smi、.srt及其他)。下载地址可以为全球资源定位器(URL)地址。

在具体应用时,可以使用爬虫软件进行爬取,例如使用搜索引擎从万维网下载网页,根据一定的网页分析算法和搜索策略抓取网页中的数据和URL,并建立索引,以便之后的查询和检索。

步骤503,针对每一视频文件,配置该视频文件的关键词,针对该视频文件的每一资源包,通过将自身配置的该视频文件的关键词和该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性。

在一实施例中,通过将该视频文件的各关键词和每项内容描述信息分别进行匹配,计算得到各关键词分别与各项内容描述信息之间的匹配度。其中,匹配度可以为各关键词在内容描述信息中出现的次数之和。然后,针对每项内容描述信息,将各关键词与该项内容描述信息之间的匹配度和该项内容描述信息的优先级对应的分值相乘,得到该项内容描述信息的相关性值,将每项内容描述信息的相关性值相加之和作为该内容描述信息的相关性值;将该内容描述信息的相关性值作为该资源包中各字幕文件的相关性的数值。

具体而言,若关键词包括为电影名“超能陆战队”和角色“大白”,内容描述信息包括电影“超能陆战队”的简介信息和推荐信息,在简介信息和推荐信息中分别搜索“超能陆战队”和“大白”,将“超能陆战队”和“大白”出现的次数之和作为各关键词与每项内容描述信息的匹配度,例如在简介信息中“超能陆战队”和“大白”一共出现70次,在推荐信息中一共出现28次;若优先级“一级”、“二级”和“三级”分别对应分值80%、50%和30%,简介信息对应“一级”,推荐信息对应“二级”,那么对应该内容描述信息的相关性值为70*80%+28*50%=70,将70这一数值标记为该资源包中各字幕文件的相关性的数值。

或者,预设多个相关性级别,通过将该内容描述信息的相关性值和一个或多个预设阈值进行比较,确定该内容描述信息的相关性值所属的相关性级别,并用该相关性级别来表征该资源包中各字幕文件的相关性。

具体而言,将各字幕文件的相关性标记为“高”、“中”和“低”,预设第一预设阈值为50和第二预设阈值为25,与计算得到的该内容描述信息的相关性值70进行比较。由于相关性值70大于第一预设阈值50,可以确定该资源包中各字幕文件的相关性为高。

步骤504,当从搜索客户端接收到针对一视频文件的字幕文件的搜索请求时,执行如下处理:基于搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性。

其中,搜索请求包括用户输入的针对该视频文件的搜索词,将搜索词分为多个词语;若多个词语中的任一词语与自身配置的该视频文件的任一关键词相同,则将该视频文件对应的一个或多个资源包作为查找到的各资源包。

步骤505,根据相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表并发送给搜索客户端,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件。

步骤506,当从搜索客户端接收到针对字幕文件列表中一字幕文件的下载请求时,将该字幕文件发送给搜索客户端。

图6为依据本发明一实施例的搜索客户端处理字幕文件的方法的流程示意图。如图6所示,该方法应用于搜索客户端,包括:

步骤601,接收针对一视频文件的字幕文件的搜索请求,并将搜索请求发送给搜索服务器。

这样,搜索服务器基于搜索请求查找该视频文件对应的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件。

步骤602,接收搜索服务器返回的字幕文件列表,从字幕文件列表中选择一字幕文件,向搜索服务器发送携带所选择的字幕文件的下载请求。

其中,字幕文件列表进一步列出各字幕文件各自对应的语言和/或文件格式,以使用户根据播放该视频文件时所需的语言和/或文件格式从字幕文件列表中确定所需的字幕文件,通过接收用户的操作,生成下载请求。

或者,搜索客户端根据预设规则自行选择一个或多个字幕文件,并携带于下载请求中。例如,预设规则为优选选择.srt格式的字幕文件,或者优选选择中英双字的字幕文件等。

步骤603,从搜索服务器将所选择的字幕文件下载到本地。

图7为依据本发明另一实施例的搜索客户端处理字幕文件的方法的流程示意图。在图6的基础之上,图7所示的方法中进一步包括:

步骤604,打开该视频文件,加载已下载到本地的字幕文件。

步骤605,播放该视频文件,并同步展示该字幕文件。

在本发明实施例中,搜索客户端将接收到的针对一视频文件的字幕文件的搜索请求发送给搜索服务器后,接收搜索服务器返回的字幕文件列表,其中,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件,使得搜索得到的字幕文件数量增加,并且根据相关性进行了排序,便于用户进一步选择所需的合适字幕文件,提高了搜索字幕文件的准确性和效率,满足了用户对字幕文件的不同需求。

图8为依据本发明一实施例的字幕文件处理方法的交互示意图,其中包括视频服务器、搜索服务器以及搜索客户端之间的交互步骤。具体如下:

步骤801,搜索服务器发送资源包搜索请求。

其中,该资源包搜索请求包括一视频文件的关键词。

步骤802,视频服务器向搜索服务器发送网页和各字幕文件的下载地址。

步骤803,针对每一视频服务器,搜索服务器从该视频服务器获取到的网页中抓取对应该视频文件的内容描述信息;访问下载地址,并下载得到各字幕文件;生成该视频文件的一个资源包。

其中,该资源包包括抓取到的内容描述信息和下载到的各字幕文件。

步骤804,针对每一视频文件,搜索服务器配置该视频文件的关键词,针对该视频文件的每一资源包,通过将自身配置的该视频文件的关键词和该资源包中的 内容描述信息进行匹配,确定该资源包中各字幕文件的相关性。

步骤805,搜索客户端向搜索服务器发送针对一视频文件的字幕文件的搜索请求。

步骤806,搜索服务器基于搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性,根据相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表。

其中,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件。

步骤807,搜索服务器将字幕文件列表发送给搜索客户端。

步骤808,搜索客户端从字幕文件列表中选择一字幕文件。

步骤809,搜索客户端向搜索服务器发送携带所选择的字幕文件的下载请求。

步骤810,搜索服务器将所选择的字幕文件发送给搜索客户端。

图9为依据本发明一实施例的搜索服务器900的结构示意图。搜索服务器900包括:

获取模块910,用于从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;

配置模块920,用于针对每一视频文件,配置该视频文件的关键词;

确定模块930,用于针对该视频文件的每一资源包,通过将配置模块920配置的该视频文件的关键词和获取模块910获取的该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性;

接收模块940,用于从搜索客户端接收针对一视频文件的字幕文件的搜索请求,以及从搜索客户端接收针对字幕文件列表中一字幕文件的下载请求;

查找模块950,用于基于接收模块940接收到的搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性;

生成模块960,用于根据查找模块950确定的相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;及,

发送模块970,用于将生成模块960生成的字幕文件列表发送给搜索客户端,以 及将接收模块940接收到的下载请求中的字幕文件发送给搜索客户端。

图10为依据本发明另一实施例的搜索服务器1000的结构示意图。其中,在一实施例中,获取模块910包括:

搜索单元911,用于针对每一视频文件,搜索一个或多个视频服务器,从各视频服务器获取和该视频文件相关的网页和各字幕文件的下载地址;

抓取单元912,用于针对每一视频服务器,从搜索单元911获取的网页中抓取对应该视频文件的内容描述信息;

访问单元913,用于访问搜索单元911获取的下载地址,并下载得到各字幕文件;

生成单元914,用于生成该视频文件的一个资源包,该资源包包括:抓取单元912抓取到的内容描述信息和访问单元913下载到的各字幕文件。

在一实施例中,确定模块930包括:

计算单元931,用于通过将该视频文件的各关键词和内容描述信息分别进行匹配,计算得到匹配度;

确定单元932,用于根据计算单元931得到的匹配度确定该资源包中各字幕文件的相关性。

在一实施例中,内容描述信息包括该视频文件的简介信息、推荐信息、用户评论信息中的任一项或任意几项;

相应地,确定模块930包括:

设置单元933,用于为内容描述信息中各项内容描述信息设置优先级;

计算单元931,用于通过将关键词和各项内容描述信息分别进行匹配,计算得到关键词分别与各项内容描述信息之间的匹配度;

确定单元932,用于根据计算单元931得到的关键词与各项内容描述信息之间的匹配度以及设置单元933设置的各项内容描述信息的优先级,确定该资源包中各字幕文件的相关性。

在一实施例中,搜索请求包括用户输入的针对该视频文件的搜索词;

相应地,查找模块950用于将搜索词分为多个词语;若多个词语中的任一词语与自身配置的该视频文件的任一关键词相同,则将该视频文件对应的一个或多个资源包作为查找到的各资源包。

图11为依据本发明又一实施例的搜索服务器1100的结构示意图。该媒体播放设备1100可包括:处理器1110、存储器1120、端口1130以及总线1140。处理器1110和存储器1120通过总线1140互联。处理器1110可通过端口1130接收和发送数据。其中,

处理器1110用于执行存储器1120存储的机器可读指令模块。

存储器1120存储有处理器1110可执行的机器可读指令模块。处理器1110可执行的指令模块包括:获取模块1121、配置模块1122、确定模块1123、接收模块1124、查找模块1125、生成模块1126和发送模块1127。

获取模块1121被处理器1110执行时可以为:从视频服务器获取各视频文件的资源包,其中,每一视频文件对应一个或多个资源包,每个资源包包括该视频文件的内容描述信息和一个或多个字幕文件;

配置模块1122被处理器1110执行时可以为:针对每一视频文件,配置该视频文件的关键词;

确定模块1123被处理器1110执行时可以为:针对该视频文件的每一资源包,通过将配置模块1122配置的该视频文件的关键词和获取模块1121获取的该资源包中的内容描述信息进行匹配,确定该资源包中各字幕文件的相关性;

接收模块1124被处理器1110执行时可以为:从搜索客户端接收针对一视频文件的字幕文件的搜索请求,以及从搜索客户端接收针对字幕文件列表中一字幕文件的下载请求;

查找模块1125被处理器1110执行时可以为:基于接收模块1124接收到的搜索请求查找该视频文件对应的各资源包,确定查找到的各资源包中各字幕文件的相关性;

生成模块1126被处理器1110执行时可以为:根据查找模块1125确定的相关性对查找到的各资源包中的各字幕文件进行排序,生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;及,

发送模块1127被处理器1110执行时可以为:将生成模块1126生成的字幕文件列表发送给搜索客户端,以及将接收模块1124接收到的下载请求中的字幕文件发送给搜索客户端。

由此可以看出,当存储在存储器1120中的指令模块被处理器1110执行时,可实 现前述各个实施例中获取模块、配置模块、确定模块、接收模块、查找模块、生成模块和发送模块的各种功能。

图12为依据本发明一实施例的搜索客户端1200的结构示意图。其中,搜索客户端1200包括接收模块1210、选择模块1220和发送模块1230。其中,

接收模块1210,用于接收针对一视频文件的字幕文件的搜索请求;

发送模块1230,用于将接收模块1210接收的搜索请求发送给搜索服务器,以使搜索服务器基于搜索请求查找该视频文件对应的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;

接收模块1210,用于接收搜索服务器返回的字幕文件列表;

选择模块1220,用于从接收模块1210接收的字幕文件列表中选择一字幕文件;

发送模块1230,用于向搜索服务器发送携带选择模块1220确定的字幕文件的下载请求;

接收模块1210,用于从搜索服务器将所选择的字幕文件下载到本地。

在一实施例中,字幕文件列表进一步列出各字幕文件各自对应的语言和/或文件格式,以使用户根据播放该视频文件时所需的语言和/或文件格式从字幕文件列表中确定所需的字幕文件;

相应地,选择模块1230,用于响应于用户操作,从字幕文件列表中选择一字幕文件。

图13为依据本发明另一实施例的搜索客户端1300的结构示意图。其中,搜索客户端1300在图12所示的搜索客户端1200基础之上,还包括:

加载模块1240,用于打开该视频文件,加载接收模块1210下载到本地的字幕文件;

播放模块1250,用于播放该视频文件,并同步展示加载模块1240加载的字幕文件。

图14为依据本发明又一实施例的搜索客户端1400的结构示意图。该媒体播放设备1400可包括:处理器1410、存储器1420、端口1430以及总线1440。处理器1410 和存储器1420通过总线1440互联。处理器1410可通过端口1430接收和发送数据。其中,

处理器1410用于执行存储器1420存储的机器可读指令模块。

存储器1420存储有处理器1410可执行的机器可读指令模块。处理器1410可执行的指令模块包括:接收模块1421、选择模块1422和发送模块1423。其中,

接收模块1421被处理器1410执行时可以为:接收针对一视频文件的字幕文件的搜索请求;

发送模块1422,用于将接收模块1421接收的搜索请求发送给搜索服务器,以使搜索服务器基于搜索请求查找该视频文件对应的各资源包;确定查找到的各资源包中各字幕文件的相关性;根据相关性对查找到的各资源包中的各字幕文件进行排序;生成该视频文件的字幕文件列表,字幕文件列表中列出了排序后的查找到的各资源包中的各字幕文件;

接收模块1421,用于接收搜索服务器返回的字幕文件列表;

选择模块1422,用于从接收模块1421接收的字幕文件列表中选择一字幕文件;

发送模块1423,用于向搜索服务器发送携带选择模块1422确定的字幕文件的下载请求;

接收模块1421,用于从搜索服务器将所选择的字幕文件下载到本地。

在一实施例中,搜索客户端1400还包括:

加载模块1424,用于打开该视频文件,加载接收模块1421下载到本地的字幕文件;

播放模块1425,用于播放该视频文件,并同步展示加载模块1424加载的字幕文件。

由此可以看出,当存储在存储器1420中的指令模块被处理器1410执行时,可实现前述各个实施例中接收模块、选择模块、发送模块、加载模块和播放模块的各种功能。

上述装置实施例中,各个模块及单元实现自身功能的具体方法在方法实施例中均有描述,这里不再赘述。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以 是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

另外,本发明的每一个实施例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本发明。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和或内存)中执行。因此,这样的存储介质也构成了本发明。存储介质可以使用任何类型的记录方式,例如纸张存储介质(如纸带等)、磁存储介质(如软盘、硬盘、闪存等)、光存储介质(如CD-ROM等)、磁光存储介质(如MO等)等。

因此,本发明还公开了一种存储介质,其中存储有数据处理程序,该数据处理程序用于执行本发明上述方法的任何一种实施例。

以上仅为本发明所述的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1