视频资源信息的排序方法及其系统的制作方法

文档序号:6526257阅读:172来源:国知局
视频资源信息的排序方法及其系统的制作方法
【专利摘要】本发明公开了一种视频资源信息的排序方法及其系统,其中该方法包括:从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集;提供排序参数信息,并接收用户选定的排序参数;根据接收到的排序参数对倒排索引结果集进行排序。通过本发明提高了检索效率并提升了用户体验。
【专利说明】视频资源信息的排序方法及其系统
【技术领域】
[0001]本发明涉及信息检索技术,尤其涉及一种视频资源信息的排序方法及其系统。
【背景技术】
[0002]随着科技的发展,越来越多的用户通过互联网搜索并观看各种视频。由于互联网提供的视频信息十分丰富,并具有不断变化及更新的特点,随之产生了多种搜索引擎进行视频信息检索。
[0003]在关系数据库系统中,索引是检索数据最有效率的方式。但对于全网的视频搜索引擎,并不能满足其特殊要求。由于搜索引擎面对的是全网的海量视频数据,例如乐视网等大型的视频网站搜索引擎索引都是亿级甚至几千亿的网页数量,面对如此海量的视频数据,使得数据库系统很难有效的管理。
[0004]在进行全网搜索时,会产生大量的检索结果,而用户需要的有用信息不能快速地查找到,不能够满足排序需求。
[0005]综上所述可知,现有技术中存在对于海量视频信息的大量检索结果没有提供有效排序方案的技术问题,因此有必要提出改进的技术方案解决上述问题。

【发明内容】

[0006]本发明的主要目的在于提供一种视频资源信息的排序方法及其系统,以解决现有技术存在的对于海量视频信息的大量检索结果没有有效排序方案的技术问题。
[0007]为了解决上述问题,根据本发明的一方面,提供了一种视频资源信息的排序方法,其包括:从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集;提供排序参数信息,并接收用户选定的排序参数;根据接收到的排序参数对倒排索引结果集进行排序。
[0008]其中,所述排序参数信息包括:视频类型、上映时间、播放时长、视频文件相关的信
肩、O
[0009]其中,所述方法还包括:建立视频文件的倒排索引文件;所述从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集,具体为:接收对于视频资源信息的检索信息;在所述倒排索引文件中匹配所述检索信息;根据与所述检索信息匹配的所述倒排索引文件中的数据得到倒排索引结果集。
[0010]其中,所述建立视频文件的倒排索引文件包括:通过预设的分词方式对视频文件信息进行分词处理得到关键词;建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。
[0011]其中,所述方法还包括:提供词库,所述词库的数据来源包括:基础词库、视频版权词库、用户生成内容;所述通过预设的分词方式对视频文件信息进行分词处理得到关键词的步骤包括:通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇;根据所述词库对所述初步分词词汇进行调整,得到关键词。[0012]根据本发明的另一方面,还提供了一种视频资源信息的排序系统,其包括:获取模块,用于从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集;参数提供模块,用于提供排序参数信息;参数接收模块,用于接收用户选定的排序参数;排序模块,用于根据所述接收模块接收到的排序参数对倒排索引结果集进行排序。
[0013]其中,所述排序参数信息包括:视频类型、上映时间、播放时长、视频文件相关的信肩、O
[0014]其中,所述系统还包括:建立模块,用于建立视频文件的倒排索引文件;所述获取模块进一步用于,用于接收对于视频资源信息的检索信息,在所述倒排索引文件中匹配所述检索信息,根据与所述检索信息匹配的所述倒排索引文件中的数据得到倒排索引结果集。
[0015]其中,所述建立模块包括:关键词获取模块,用于通过预设的分词方式对视频文件信息进行分词处理得到关键词;倒排索引建立模块,用于建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。
[0016]其中,所述系统还包括:词库维护模块,用于建立并维护词库,所述词库的数据来源包括:基础词库、视频版权词库、用户生成内容;所述关键词获取模块通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇;根据所述词库对所述初步分词词汇进行调整,得到关键词。
[0017]根据本发明的技术方案,通过获取视频文件的倒排索引结果集,根据接收到的排序参数对倒排索引结果集进行排序,在面对海量的视频检索信息时,通过倒排索引缩小了结果集,通过正排二次排序满足了排序需求,从而提高了检索效率并提升了用户体验。
【专利附图】

【附图说明】
[0018]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0019]图1是根据本发明一个实施例的视频资源信息的排序方法的流程图;
[0020]图2是根据本发明另一实施例的视频资源信息的排序方法的流程图;
[0021]图3是根据本发明一个实施例的视频资源信息的排序系统的结构框图;
[0022]图4是根据本发明另一实施例的视频资源信息的排序系统的结构框图。
【具体实施方式】
[0023]为使本发明的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本发明作进一步地详细说明。
[0024]根据本发明的实施例,提供了 一种视频资源信息的排序方法。
[0025]图1是根据本发明实施例的视频资源信息的排序方法的流程图,如图1所示,该方法包括以下步骤(步骤S102-S106):
[0026]步骤S102,从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集。
[0027]通过与多种来源的数据源相匹配的数据模型,建立符合搜索架构的数据结构,从而建立视频文件的倒排索引文件。提供对外(用户)的查询引擎,接收对于视频资源信息的检索信息,在所述倒排索引文件中匹配所述检索信息,根据与所述检索信息匹配的所述倒排索引文件中的数据倒排索引结果,并输出包含有多个视频信息的倒排索引结果集。
[0028]其中,上述的数据源的来源渠道包括:DB (视频数据库)、xml (可扩展标记语言)、文件系统等。
[0029]步骤S104,提供排序参数信息,并接收用户选定的排序参数。
[0030]在实际应用中,可以通过用户界面(User Interface)与用户交互,提供用于排序的参数信息、并接收用户选定的排序参数。所述排序参数信息包括但不限于:上映时间、播放时长、视频文件相关的信息。其中,上映时间或称为发布时间,是视频信息首次上映或发布的年、月、日等时间信息;播放时长,是视频信息的时间长度的信息;视频文件相关的信息,是根据该视频文件的特点提供的信息,对于专辑来说,包括期数、辑数、以及视频内容、视频中出现的人员姓名等等进一步详细的信息。
[0031]步骤S106,根据接收到的排序参数对倒排索引结果集进行排序。
[0032]通过上述实施例,在面对海量的视频检索信息时,通过倒排索引缩小了结果集,通过正排排序满足了排序需求,从而提高了检索效率并提升了用户体验。
[0033]下面结合图2详细描述本发明实施例。图2是根据本发明实施例的视频资源信息的排序方法的优选处理方案的流程图,如图2所示,包括以下步骤:
[0034]步骤S202,提供词库,所述词库的数据来源包括但不限于:基础词库、视频版权词库、用户生成内容(User-generated content,简称为UGC)。
[0035]其中,基础词库包括各种字典和词典,由于视频文件并不严格与词典的词条相一致,因此还需用到视频版权词库。视频版权词库为根据具有版权的视频资源信息得到的词库,该词库能够符合视频文件信息分词处理的需求。而UGC是由用户生成的或提供的或原创的内容,补充了基础词库和视频版权词库中不具有的一些新词。通过上述多种词库相互配合及补充,经过分词处理后能够得到较理想的关键词。
[0036]步骤S204,通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇。其中,预设的分词方式例如二元分词法、最大匹配法、统计方法等算法,此处不赘述。
[0037]步骤S206,根据所述词库对初步分词词汇进行调整,从而得到关键词。
[0038]在步骤S206中,对步骤S204中得到的初步分词词汇,可以在所述词库中进行搜索,若搜索到所述分词词汇,则认为初步分词准确,将所述初步分词词汇确定为关键词;当没有搜索到所述分词词汇,则认为初步分词不准确,继续采用预设的分词方式进行初步分词处理。
[0039]步骤S208,建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频资源的倒排索引文件。
[0040]步骤S210,提供查询引擎,接收用户输入的视频资源信息的检索信息,在所述倒排索引文件中匹配该检索信息,根据与所述检索信息匹配的倒排索引文件中的数据得到倒排索引结果集。
[0041]例如,用户输入检索词“中国好声音”,根据倒排索引文件在全网搜索关于“中国好声音”的视频文件,得到相关的大量视频文件。
[0042]步骤S212,提供排序参数信息,并接收用户选定的排序参数。
[0043]承上述例子,由于网络中关于“中国好声音”的视频文件的数量非常巨大,由此第一次搜索的结果并不理想。在本发明实施例中,提供多种排序参数信息,由用户选择适合自己的条件进行第二次排序。在实际应用中,排序参数信息包括但不限于:上映时间、播放时长、期数、导师姓名、学员姓名等视频文件相关的信息。
[0044]步骤S214,根据接收到的排序参数对倒排索引结果集进行排序。
[0045]根据上述实施例,通过二次排序进一步缩小了结果集,满足了排序需求,从而提高了检索效率并提升了用户体验。
[0046]根据本发明的实施例,还提供了一种视频资源信息的排序系统。
[0047]图3是根据本发明实施例的视频资源信息的排序系统的结构框图,如图3所示,所述系统至少包括:获取模块10、参数提供模块20、参数接收模块30和排序模块40,下面详细描述各模块的结构和连接关系。
[0048]获取模块10,用于从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集。
[0049]参数提供模块20,用于提供排序参数信息。其中,所述排序参数信息包括但不限于:视频类型、上映时间、播放时长、视频文件相关的信息。
[0050]参数接收模块30与参数提供模块20耦接,用于接收用户选定的排序参数。
[0051]排序模块40分别与获取模块10和参数接收模块30耦接,用于根据所述接收模块接收到的排序参数对倒排索引结果集进行排序。
[0052]参考图4,在本发明的一个实施例中,在图3的基础上,所述系统还包括:建立模块50,用于建立视频文件的倒排索引文件。基于此,所述获取模块10进一步用于,接收对于视频资源信息的检索信息,在所述倒排索引文件中匹配所述检索信息,根据与所述检索信息匹配的所述倒排索引文件中的数据得到倒排索引结果集。
[0053]其中,建立模块50进一步包括:关键词获取模块(图中未示出),用于通过预设的分词方式对视频文件信息进行分词处理得到关键词;倒排索引建立模块(图中未示出),用于建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。
[0054]另外,在本发明的一个实施例中,所述视频资源信息的排序系统还包括有:词库维护模块(图中未示出),用于建立并维护词库,所述词库的数据来源包括但不限于:基础词库、视频版权词库、用户生成内容。基于此,所述关键词获取模块通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇;根据所述词库对所述初步分词词汇进行调整,得到关键词。
[0055]本发明的方法的操作步骤与系统的结构特征对应,可以相互参照,不再一一赘述。
[0056]综上所述,根据本发明的技术方案,通过获取视频文件的倒排索引结果集,根据接收到的排序参数对倒排索引结果集进行排序,在面对海量的视频检索信息时,通过倒排索引缩小了结果集,通过正排二次排序满足了排序需求,从而提高了检索效率并提升了用户体验。
[0057]以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
【权利要求】
1.一种视频资源信息的排序方法,其特征在于,包括: 从预先建立的视频文件的倒排索引文件中获取对于所述视频文件的倒排索引结果集; 提供排序参数信息,并接收用户选定的排序参数; 根据接收到的排序参数对倒排索引结果集进行排序。
2.根据权利要求1所述的方法,其特征在于,所述排序参数信息包括:视频类型、上映时间、播放时长、视频文件相关的信息。
3.根据权利要求1所述的方法,其特征在于,还包括: 建立视频文件的倒排索引文件; 所述从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集,具体为: 接收对于视频资源信息的检索信息; 在所述倒排索引文件中匹配所述检索信息;` 根据与所述检索信息匹配的所述倒排索引文件中的数据得到倒排索引结果集。
4.根据权利要求3所述的方法,其特征在于,所述建立视频文件的倒排索引文件包括: 通过预设的分词方式对视频文件信息进行分词处理得到关键词; 建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。
5.根据权利要求4所述的方法,其特征在于,还包括: 提供词库,所述词库的数据来源包括:基础词库、视频版权词库、用户生成内容; 所述通过预设的分词方式对视频文件信息进行分词处理得到关键词的步骤包括:通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇; 根据所述词库对所述初步分词词汇进行调整,得到关键词。
6.一种视频资源信息的排序系统,其特征在于,包括: 获取模块,用于从预先建立的视频文件的倒排索引文件中获取对于视频文件的倒排索引结果集; 参数提供模块,用于提供排序参数信息; 参数接收模块,用于接收用户选定的排序参数; 排序模块,用于根据所述接收模块接收到的排序参数对倒排索引结果集进行排序。
7.根据权利要求6所述的系统,其特征在于,所述排序参数信息包括:视频类型、上映时间、播放时长、视频文件相关的信息。
8.根据权利要求6所述的系统,其特征在于,还包括: 建立模块,用于建立视频文件的倒排索引文件; 所述获取模块进一步用于,接收对于视频资源信息的检索信息,在所述倒排索引文件中匹配所述检索信息,根据与所述检索信息匹配的所述倒排索引文件中的数据得到倒排索引结果集。
9.根据权利要求8所述的系统,其特征在于,所述建立模块包括: 关键词获取模块,用于通过预设的分词方式对视频文件信息进行分词处理得到关键词;倒排索引建立模块,用于建立所述关键词与具有所述关键词的视频文件信息之间的索引关系,从而建立视频文件的倒排索引文件。
10.根据权利要求9所述的系统,其特征在于,还包括: 词库维护模块,用于建立并维护词库,所述词库的数据来源包括:基础词库、视频版权词库、用户生成内容; 所述关键词获取模块通过预设的分词方式对文件视频信息进行分词处理,得到初步分词词汇;根据所述词库对所述初步分词词汇进行调整,得到关键词。
【文档编号】G06F17/30GK103699658SQ201310739976
【公开日】2014年4月2日 申请日期:2013年12月26日 优先权日:2013年12月26日
【发明者】曹坤波, 郑磊 申请人:乐视网信息技术(北京)股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1