视频匹配方法和装置的制造方法

文档序号:9524208阅读:146来源:国知局
视频匹配方法和装置的制造方法
【技术领域】
[0001]本发明涉及计算机网络技术领域,特别是涉及一种视频匹配方法和装置。
【背景技术】
[0002]随着互联网技术的迅速发展,网络上的视频资源越来越丰富,人们随时可以通过网络向服务器发出请求以浏览视频。但随着服务器存储的视频越来越多,如何有效地组织视频资源越来越成为一个重要的问题。例如,在一些场景中,用户向视频网站服务器请求点播一个视频,服务器如何快速向用户推荐相似的视频,或者服务器如何根据用户已经浏览过的视频,向用户推荐相似的视频,服务器匹配相似视频功能的快速与否,关系到视频网站服务器是否能够吸引用户和提高用户体验。而目前一些视频匹配方法,通常会有匹配不准确,处理较慢的技术问题。

【发明内容】

[0003]基于此,有必要提供一种视频匹配方法和装置,能够根据输入的待匹配视频,与预存视频进行匹配得到与其相似的视频,提高准确度和速度。
[0004]一种视频匹配方法,包括:
[0005]获取待匹配视频的第一描述性元数据;
[0006]确定所述第一描述性元数据中所包含的独立分词,并计算各独立分词对应的第一权重因子;
[0007]将所述第一描述性元数据中的独立分词,与预存视频的第二描述性元数据中的独立分词,进行近义词分析,并根据所述第一权重因子及所述第二描述性元数据中独立分词对应的第二权重因子,确定所述待匹配视频与所述预存视频的匹配度;
[0008]输出匹配度最高的预设数目的预存视频作为结果。
[0009]在一个实施例中,在获取待匹配视频的第一描述性元数据的步骤之前,所述方法还包括:
[0010]预先确定所述预存视频的第二描述性元数据中所包含的独立分词,并计算各独立分词对应的第二权重因子,并存储所述独立分词和所述第二权重因子。
[0011]在一个实施例中,所述确定所述第一描述性元数据中所包含的独立分词,并计算各独立分词对应的第一权重因子的步骤,包括:
[0012]对所述第一描述性元数据中的各元数据项进行分词处理,得到元数据项分词;
[0013]合并所有所述元数据项中的相同分词,得到所述独立分词;
[0014]根据各所述独立分词对应的元数据项分词的预设权重,计算各所述独立分词对应的第一权重因子;
[0015]所述确定所述第二描述性元数据中所包含的独立分词,并计算各独立分词对应的第二权重因子的步骤,包括:
[0016]对所述第二描述性元数据中的各元数据项进行分词处理,得到元数据项分词;
[0017]合并所有所述元数据项中的相同分词,得到所述独立分词;
[0018]根据各所述独立分词对应的元数据项分词的预设权重,计算各所述独立分词对应的第二权重因子。
[0019]在一个实施例中,在所述对所述第一描述性元数据中的各元数据项进行分词处理,得到元数据项分词的步骤,以及所述对所述第二描述性元数据中的各元数据项进行分词处理,得到元数据项分词的步骤中,包括:
[0020]去除元数据项分词中的无语义分词。
[0021 ] 在一个实施例中,所述方法还包括:
[0022]根据UNICODE编码对所述第一描述性元数据中所包含的独立分词进行排序;以及
[0023]根据UNICODE编码对所述第二描述性元数据中所包含的独立分词进行排序。
[0024]一种视频匹配装置,包括:
[0025]输入模块,用于获取待匹配视频的第一描述性元数据;
[0026]分析模块,用于确定所述第一描述性元数据中所包含的独立分词,并计算各独立分词对应的第一权重因子;
[0027]存储模块,用于存储预存视频的第二描述性元数据中的独立分词及对应的第二权重因子;
[0028]匹配模块,用于将所述第一描述性元数据中的独立分词,与预存视频的第二描述性元数据中的独立分词,进行近义词分析,并根据所述第一权重因子及所述第二描述性元数据中独立分词对应的第二权重因子,确定所述待匹配视频与所述预存视频的匹配度;
[0029]输出模块,用于输出匹配度最高的预设数目的预存视频作为结果。
[0030]在一个实施例中,所述分析模块,还用于预先确定所述预存视频的第二描述性元数据中所包含的独立分词,并计算各独立分词对应的第二权重因子。
[0031]在一个实施例中,所述分析模块,用于对所述第一描述性元数据中的各元数据项进行分词处理,得到元数据项分词;以及合并所有所述元数据项中的相同分词,得到所述独立分词;以及根据各所述独立分词对应的元数据项分词的预设权重,计算各所述独立分词对应的第一权重因子;
[0032]所述分析模块,还用于对所述第二描述性元数据中的各元数据项进行分词处理,得到元数据项分词;以及合并所有所述元数据项中的相同分词,得到所述独立分词;以及根据各所述独立分词对应的元数据项分词的预设权重,计算各所述独立分词对应的第二权重因子。
[0033]在一个实施例中,所述分析模块,还用于去除元数据项分词中的无语义分词。
[0034]在一个实施例中,所述分析模块,还用于根据UNICODE编码对所述第一描述性兀数据中所包含的独立分词进行排序;以及根据UNICODE编码对所述第二描述性元数据中所包含的独立分词进行排序。
[0035]上述视频匹配方法和装置,获取待匹配视频的第一描述性元数据,确定其中包含的独立分词,并计算各独立分词的第一权重因子。再将第一描述性元数据中的独立分词与预存视频的独立分词,进行近义词分析,确定匹配度,将匹配度最高的预设数目的预存视频输出作为结果,由此能够根据输入的待匹配视频,与预存视频进行匹配得到与其相似的视频,提高准确度和速度。
【附图说明】
[0036]图1为一个实施例中的视频匹配方法的流程示意图;
[0037]图2为一个实施例中的视频匹配装置的结构示意图。
【具体实施方式】
[0038]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0039]参见图1,在一个实施例中,提供了一种视频匹配方法。该方法可以但不限于应用与视频点播服务器中,在用户点播一视频或者用户浏览一视频后,该视频点播服务器可以基于该方法将点播的视频与预存的视频进行匹配,得到相似的若干视频,并推荐给用户。该视频匹配方法包括:
[0040]步骤101,获取待匹配视频的第一描述性元数据。
[0041]具体的,在本实施例中,描述性元数据是指对视频进行描述的信息,例如影片名称、导演名称、演员信息等等。一些视频如影片的描述性元数据可以预先由制作方进行制作,而一些视频的描述性元数据需要人工标注,从而建立视频与描述性元数据的映射关系。在视频点播服务器确定用户点播的视频后,将该视频作为待匹配视频,并根据映射关系获取对应的第一描述性元数据。
[0042]步骤102,确定第一描述性元数据中所包含的独立分词,并计算各独立分词对应的第一权重因子。
[0043]具体的,视频点播服务器获取第一描述性元数据后,按下列方式进行处理:
[0044](a)对第一描述性元数据中的各元数据项进行分词处理,得到元数据项分词。
[0045]将描述性元数据中数据划分为不同的元数据项,例如可以包括标题、关键词、摘要、分类等。其中,标题可以是影片名称、视频名称等,关键词可以但不限于导演、演员等信息,摘要可以包含影片内容介绍的关键词语,分类提供影片的类别等。将各元数据项进行分词可以依照语言来分类处理。如果是英文信息,由于英文单词之间有自然的分隔符(空格),可以依照分隔符对元数据项进行分词。而如果是中文信息,还需要进行语义分析,从而根据语义进行分词处理,这里的语义可以参照传统技术,在此并不限定。由此,对各元数据项进行分词处理后,可以得到标题分词{X1、X2......},摘要分词{Y1、Y2......}等。
[0046]以视频《疯狂原始人》为例,假设其第一描述性元数据仅包括标题和摘要。其中标题为:疯狂原始人,摘要为:原始人克鲁德一家六口在老爸的庇护下生活。则进行分词处理后,标题分词包括{疯狂、原始人},摘要分词包括{原始人、克鲁德、一家、六、口、在、老爸、的、庇护、下、生活}。
[0047]可选的,在本实施例中,可以进一步去除元数据项分词中的无语义分词,从而能够减少处理的数据量,提高处理速度。例如在《疯狂原始人》的例子中,可以去除"在"、"的"等分词。
[0048](b)合并所有元数据项中的相同分词,得到独立分词。
[0049]具体的,对所有元数据项中的相同分词合并为一个独立分词。
[0050]以上述《疯狂原始人》为例,标题分词"原始人"和摘要分词"原始人"合并为一独立分词。标题分词"疯狂"可以作为一独立分词......
[0051](c)根据各独立分词对应的元数据项分词的预设权重,计算各所述独立分词对应的第一权重因子。
[0052]在本实施例中,根据不同元数据项的相对重要性的经验值,为不同类型的元数据项分词定义一预设权重。将独立分词对应的各元数据项分词的预设权重累加作为权重。再根据独立分词的权重与所有独立分词总权重的比例,确定独立分词对应的第一权重因子。
[0053]同样以上述《疯狂原始人》为例,标题分词和摘要分词的预设权重可以分别设为70和30,总计为100。则合并分词后,独立分词"原始人"的权重为100 (70+30),独立分词"
疯狂"的权重为70......依次类推,将各独立分词的权重累加得到总权重为470(这里以未去除无语义分词为例)。根据独立分词"疯狂"的权重占总权重的比例,将该独立分词的权重转换到100范围内为对应的第一权重因子14.9。
[0054]步骤1
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1