视频搜索结果的展示方法及其系统的制作方法

文档序号:6339229阅读:185来源:国知局
专利名称:视频搜索结果的展示方法及其系统的制作方法
技术领域
本发明涉及一种视频搜索结果的展示方法及其系统,属于搜索引擎技术领域。
技术背景
过去十几年以来,人们越来越依赖于互联网提供的丰富、快捷、及时的信息。但是 如何在浩如烟海的信息中找到待搜寻的信息,成为一项迫切需要解决的问题,相应地,众 多的互联网搜索引擎及对应的网站应运而生,这中间的佼佼者包括百度公司的百度搜索 (www. baidu. com)禾口谷歌公司的谷歌搜索(www. google, cn)。
随着网络技术的不断发展,用户可以通过搜索引擎查询自己需要的视频文件。例 如,用户从搜索页面输入查询信息(query),如“武林外传”,搜索引擎只要在视频文件的 标题或内容中搜索到“武林外传”这几个关键词,均会被认为是与查询信息相匹配的视频文 件。这样导致的问题请参图1所示,搜索引擎返回的结果页面中有不同的第三方视频链接, 而且每集的信息都是散乱的排布于结果页面。如果用户只是想看其中的某一集,就需要从 杂乱的结果页面中查找,从而导致用户查找时间较长、网络流量较大。现有的搜索系统对用 户的要求较高,用户需要预先选择关键词,而且关键词的选取至关重要,因为查询质量在很 大程度上依赖于关键词选取的好坏。
与本发明相关的现有技术可参阅2007年11月观日公开的中国发明专利第 CN101079033A号,该发明揭示了一种综合搜索结果的排序系统及其方法,所述系统包括数 据分析模块、数据库和排序模块;所述数据分析模块提供可用于排序算法的数据信息,并导 入所述数据库中存储;所述数据库用于存储数据分析模块提供的数据信息,供应所述排序 模块执行排序算法时提取,并存储所述排序模块得到的最终排序信息;所述排序模块用于 根据所述数据库中存储的数据信息执行排序算法,对所述垂直搜索引擎进行排序,并将最 终排序信息存储到所述数据库中。所述方法包括以下步骤:A.在所述综合搜索引擎中输入 检索词进行搜索,得到全部垂直搜索引擎搜索的结果;B.所述排序模块从所述数据库提取 数据信息,采取排序算法计算该次搜索中每种垂直搜索引擎的综合值;C.对所述每种垂直 搜索引擎的综合值进行比较,对所述垂直搜索引擎进行排序,并将最终排序信息显示输出。
虽然,该现有技术已经揭示了利用排序模块对搜索的数据信息进行排序并最终将 排序信息显示输出,然而,仅仅将序列化的数据信息展示给用户,往往还不能够满足用户的 需求,因为在某些情况下即使已经序列化的数据信息仍不能帮助用户判断其真正需要的哪 一个,进而导致用户查找时间较长、网络流量较大。发明内容
本发明所要解决的技术问题在于提供一种改进的视频搜索结果的展示方法。
本发明所要解决的技术问题还在于提供一种改进的视频搜索结果的展示系统。
相应地,本发明的一种视频搜索结果的展示方法,包括
Si,接收输入的查询信息;
S2,挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周期性进行排 续;
S3,搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图 片;
S4,将排序后的所述文本信息及其对应的展示图片输出。
作为本发明的进一步改进,步骤S4中,所述文本信息及其对应的展示图片输出至第一结果页面。
作为本发明的进一步改进,在所述第一结果页面中,所述文本信息或者所述展示 图片具有进入第二结果页面的精确链接。
作为本发明的进一步改进,所述第二结果页面包括至少一个第三方视频播放页面 链接。
作为本发明的进一步改进,所述第二结果页面是嵌着第三方视频播放器的页面。
作为本发明的进一步改进,所述S3包括图片去重步骤和展示图片挑选步骤。
作为本发明的进一步改进,所述图片去重步骤包括
接收预选图片;
计算所述预选图片与已有的候选展示图片的方差;
判断方差是否大于等于设定阈值;
如果是,则判定为两张图片不相似;
如果否,则判定为两张图片相似,并删除其中一张图片。
作为本发明的进一步改进,在所述“接收预选图片”和“计算所述预选图片与已有 的候选展示图片的方差”之间,还包括以下步骤
判断该预选图片是否为接收到的第一张预选图片;
如果是,则直接运用该预选图片为候选展示图片;
如果否,则执行“计算所述预选图片与已有的候选展示图片的方差”步骤。
作为本发明的进一步改进,所述展示图片挑选步骤,包括
接收与同一文本信息相对应的候选展示图片;
判断所述候选展示图片是否为单色图片;
如果均为单色图片,则挑选一张熵最大的候选展示图片作为展示图片;
如果不完全是单色图片,则过滤单色图片。
作为本发明的进一步改进,在“过滤单色图片”后,还包括
判断候选展示图片是否为马赛克图片;
如果均为马赛克图片,则挑选马赛克块最小的一张做为展示图片;
如果不完全是马赛克图片,则过滤掉马赛克图片。
作为本发明的进一步改进,在“过滤掉马赛克图片”后,还包括
计算所述候选展示图片的熵值;
过滤掉熵值最小的候选展示图片;
计算所计算候选展示图片的中心区域和图片边缘区域的边缘密度比值;
根据所述边缘密度比值的结果设置加权因子,计算清晰度加权值;
计算清晰度加权值和边缘密度比值的加权和;
选择加权和最大的候选展示图片作为展示图片。
作为本发明的进一步改进,如果查询信息所对应的是连续剧,则步骤S2中文本信 息排序为按照所述连续剧的顺序进行排序。
作为本发明的进一步改进,步骤S2还包括对所述连续剧总集数的判断步骤。
相应地,本发明的一种搜索结果的序列化展示装置,包括
查询模块,用于接收输入的查询信息;
挖掘排序模块,用于挖掘与所述查询信息相关的文本信息,并对所述文本信息按 照周期性进行排续;
取图选图模块,用于搜集与所述文本信息相对应的预选图片,并从所述预选图片 中挑选出展示图片;以及
展示模块,用于将排序后的所述文本信息及其对应的展示图片输出。
作为本发明的进一步改进,所述展示模块将所述文本信息及其对应的展示图片输 出至第一结果页面。
作为本发明的进一步改进,在所述第一结果页面中,所述文本信息或者所述展示 图片具有进入第二结果页面的精确链接。
作为本发明的进一步改进,所述第二结果页面包括至少一个第三方视频播放页面 链接。
作为本发明的进一步改进,所述第二结果页面是嵌着第三方视频播放器的页面。
作为本发明的进一步改进,所述取图选图模块可将所述预选图片去重,得到候选 展示图片。
作为本发明的进一步改进,所述取图选图模块可在所述候选展示图片中挑选出展 示图片。
作为本发明的进一步改进,所述取图选图模块包括
取图子模块,用于搜集与所述文本信息相对应的预选图片;
选图子模块,用于从所述预选图片中挑选出所述展示图片。
作为本发明的进一步改进,所述挖掘排序模块包括
判断单元,用于在文本挖掘的过程中对文本信息的真伪进行判断。
相较于现有技术,本发明的有益效果是通过展示序列化的文本信息及其对应的 图片,可以方便用户查找,提高用户查找效率,节约网络流量。


图1是现有技术中的搜索结果页面示意图。
图2是本发明展示序列化搜索结果的系统的模块图。
图3是本发明展示序列化搜索结果的系统另一种实施方式的模块图。
图4是本发明视频搜索结果的展示方法的流程图。
图5是本发明视频搜索结果的展示方法另一种实施方式的流程图。
图6是本发明视频搜索结果的展示方法再一种实施方式的流程图。
图7是本发明预选图片筛选步骤中的图片去重步骤的流程图。
图8是本发明预选图片筛选步骤中的展示图片挑选步骤的流程图。
图9是利用本发明视频搜索结果的展示方法及其系统所返回的中间页面示意图。
具体实施方式
请参图2所示,本发明揭示了一种视频搜索结果的展示系统,其包括查询模块1、 挖掘排序模块2、取图选图模块3及展示模块4。
所述查询模块1用于接收用户输入的查询信息,例如连续剧的名称、周期性视频 文件的名称等等。在本实施方式中为连续剧“武林外传”。
所述挖掘排序模块2用于根据用户输入的查询信息挖掘出与该查询信息相关的 文本信息,并对所述文本信息按照周期性进行排序。
取图选图模块3用于搜集与所述文本信息相对应的预选图片,并从所述预选图片 中挑选出展示图片。其中,所述取图选图模块3包括取图子模块31及选图子模块32。取图 子模块31用于搜集与所述文本信息相对应的预选图片,而选图子模块32用于从所述预选 图片中挑选出所述展示图片,供用户识别。
所述展示模块4用于将序列化排序后的文本信息及其对应的展示图片向用户展7J\ ο
以下结合视频文件以更好的描述本发明。请参图2所示,首先,以视频文件为连续 剧“武林外传”为例,挖掘排序模块2首先对各种视频网站进行搜索,通过文本挖掘可以得 到“武林外传”每一集的相关资源,例如武林外传第一集、武林外传第二集、武林外传第三 集等等,并将每一集与其对应的URL资源建表存于数据库。通过对各种视频网站进行搜索 并保存URL资源,能够充分地利用网络资源,不需要将文件的全部内容保存到数据库中,以 节省数据库的容量。通常情形下,视频文件的档案较大,如果将各种视频文件的全部内容都 保存到数据库中,则需要数据库具备很大的容量,并且维护起来也非常不便。所述挖掘排序 模块2对每一集的相关资源进行聚类,按照连续剧每一集的顺序进行排列。
取图子模块31用于根据挖掘排序模块2所搜集到的文本信息,从各种视频网站中 查找与集数相对应的所有预选图片,并将URL资源对应的预选图片建表存于数据库中。由 于不同的视频网站对同一集连续剧所展示出来的预选图片往往是不同的,所以,取图子模 块31可以从不同的视频网站搜集各种不同的预选图片。当然,通过设定程序,可以对数据 库中的文本信息、预选图片、及URL资源进行定期更新。
选图子模块32用于从所述预选图片中挑选出所述展示图片。即是对挖掘到的视 频每一集选取合适的展示图片,并将每一集与该集相对应的展示图片关联后建表存于数据 库。由于取图子模块31搜集到的预选图片是各种各样的,有的是片头、有的是片尾、有的是 模糊的、有的是色彩暗淡的、有的是清楚且色彩亮丽的、有的是内容空洞的等等。当然,这些 预选图片中也极可能存在相互重复的。总之,这些预选图片中并不是都是适合展示的。为 了挑选出适合的展示图片,所述选图子模块32通过一定的算法将重复的预选图片删除,该 算法将在下面结合图7进行具体说明。由于每一集的片头及每一集的片尾的预选图片均比 较近似,用户难以通过这些预选图片对该集的内容做区分,因此,选图子模块32 —般情况 下不会将每一集的片头及片尾作为最终选取的展示图片。在本实施方式中,选图子模块32 通过一定的算法,将颜色亮丽的图片作为最终被挑选出来展示给用户的展示图片,该算法 将在下面结合图8进行具体说明。
所述展示模块4把经过序列化排序的文本信息及其对应的展示图片结合起来并 展示给用户。如果用户明确知道需要寻找的集数,可以通过已经排序的集数迅速找到。如 果用户不确定需要寻找的集数,可以参考选图子模块32所挑选出来的展示图片,帮助其判 断需要寻找的是第几集,进而使本发明展示序列化搜索结果的系统用户查找效率较高,节 约网络流量。
请参图3所示,在本发明展示序列化搜索结果的系统另一种实施方式中,所述挖 掘排序模块2包括一个判断单元21,用于在文本挖掘的过程中对文本信息的真伪进行判 断。例如该判断单元21用以在文本挖掘的过程中对连续剧“武林外传”的总集数进行判 断。当然,判断的方法有很多种,例如通过资源的头、尾可以对连续剧的总集数进行判断;另 外,也可以根据挖到的每一集资源的数目来做判断,例如“武林外传”实际上只有81集,在 81集之前每一集挖到的资源都很多,而第82集的资源突然很少,此时判断单元21就可以认 为第82集是不真实的,从而得出“武林外传”的总集数为81集。另外,如果某些视频文件 的出现是周期性的或者具有某些时间特征,判断单元21对于这些视频文件真实性的判断 可以采用如下规则(1).通过监测视频文件(如连续剧)的首映时间,可以判断凡是在该 首映时间之前出现的资源都是不真实的;(2).由于一般连续剧每集的播放时间比较类似, 通过设定算法,可以从播放时间上排除那些明显不正确的集数。总之,周期性视频文件的总 集数的判断方式有很多,在此不再赘述。
当查询模块1接受到用户输入的查询信息为“武林外传”时,由于相关资源已经事 先被搜索出来且存于数据库中(如前所述),所以挖掘排序模块2只需要从该数据库中搜索 相关文本信息并对这些文本信息进行排序。另外,取图选图模块3也只需要从数据库中选 取适合的展示图片。展示模块4最终把已经序列化排序的文本信息及其展示图片展示给用 户即可。在本实施方式中,所述展示模块4会先向用户返回一个中间页面,如图9所示。该 中间页面所展示的内容包括序列化排序的文本信息及与这些文本信息相对应的展示图片。 用户通过序列化排序的文本信息及展示出来的展示图片,可以很容易的判断其需要寻找的 集数,使用方便、用户查找效率高。由于中间页面显示的每一集的文本信息或者展示图片的 后面都隐藏着一个精确的链接,故只需点击该文本信息或展示图片,就可以搜索至结果页 面。结果页面的显示方式有两种,一种是包括至少一个第三方视频播放页面链接,例如当点 击第一集时,会出现之前已经挖掘到的所有第一集的第三方视频,可能包含优酷的、酷6的 等等;另一种是嵌着第三方视频播放器的页面。
当然,在其它实施方式中,当查询模块1接受到用户输入的查询信息为“武林外 传”时,挖掘排序模块2即时去各种视频网站进行搜索,通过文本挖掘可以得到“武林外传” 每一集的相关资源,例如武林外传第一集、武林外传第二集、武林外传第三集等等,并将每 一集与其对应的URL资源建表存于数据库,此外,挖掘排序模块2对所搜集到的文本信息进 行排序;然后,取图子模块31根据挖掘排序模块2所搜集到的文本信息,从各种视频网站中 查找与集数相对应的所有预选图片,并将URL资源对应的预选图片建表存于数据库中;选 图子模块32再对挖掘到的视频每一集选取合适的展示图片,并将每一集与该集相对应的 展示图片建表存于数据库;最终,展示模块4将已经序列化排序的文本信息及其展示图片 展示给用户即可。通过该动作过程,同样可以实现本发明的目的。
请参图4所示,本发明还揭示了一种视频搜索结果的展示方法,其包括如下步骤
Si,接收用户输入的查询信息,例如连续剧的名称、周期性视频文件的名称等等。 在本实施方式中为连续剧“武林外传”。
S2,从本地数据库中挖掘出与该查询信息相关的文本信息(例如,武林外传第一 集、武林外传第二集、武林外传第三集、及剧情介绍等等),并对这些文本信息按照周期性进 行排续(在本实施方式中即对连续剧的剧集顺序进行排序);
S3,从数据库中搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑 选出展示图片。由于搜集到的预选图片是各种各样的,有的是片头、有的是片尾、有的是模 糊的、有的是色彩暗淡的、有的是清楚且色彩亮丽的、有的是内容空洞的等等。当然,这些预 选图片中也极可能存在相互重复的。总之,这些预选图片中并不是都是适合展示的。为了 挑选出适合的展示图片,通过一定的算法将重复的预选图片删除,该算法将在下面结合图7 进行具体说明。由于每一集的片头及每一集的片尾的预选图片均比较近似,用户难以通过 这些预选图片对该集的内容做区分,因此,一般情况下不会将每一集的片头及片尾作为最 终选取的展示图片。在本实施方式中,通过一定的算法,将颜色亮丽的图片作为最终被挑选 出来展示给用户的展示图片,该算法将在下面结合图8进行具体说明。
S4,将上述已经序列化排序的文本信息及其对应的展示图片输出,在本实施方式 中,序列化排序的文本信息及其对应的展示图片通过返回给用户的中间页面展示出来。
步骤S4中,由于中间页面显示的每一集的文本信息或者展示图片的后面都隐藏 着一个精确的链接,故只需点击该文本信息或展示图片,就可以搜索至结果页面。结果页面 的显示方式有两种,一种是包括至少一个第三方视频播放页面链接,例如当点击第一集时, 会出现之前已经挖掘到的所有第一集的第三方视频,可能包含优酷的、酷6的等等;另一种 是嵌着第三方视频播放器的页面。
步骤S2中,与查询信息相关的URL资源及与该URL资源对应的预选图片均被建表 存于本地数据库中。在本实施方式中,所述URL资源及与该URL资源对应的预选图片是通 过抓取各种视频网站数据而得到的。
当然,在其它实施方式中,步骤S4可以将上述文本信息及其对应的展示图片通过 结果页面直接展示出来。
请参图5所示,本发明视频搜索结果的展示方法的另一种实施方式,其中,在步骤 S2还包括所述视频连续剧总集数的判断步骤,例如,在文本挖掘的过程中对连续剧“武林外 传”的总集数进行判断。当然,判断的方法有很多种,例如通过资源的头、尾可以对连续剧的 总集数进行判断;另外,也可以根据挖到的每一集资源的数目来做判断,例如“武林外传”实 际上只有81集,在81集之前每一集挖到的资源都很多,而第82集的资源突然很少,此时判 断单元21就可以认为第82集是不真实的,从而得出“武林外传”的总集数为81集。另外, 如果某些视频文件的出现是周期性的或者具有某些时间特征,对于这些视频文件真实性的 判断可以采用如下规则(1).通过监测视频文件(如连续剧)的首映时间,可以判断凡是 在该首映时间之前出现的资源都是不真实的;(2).由于一般连续剧每集的播放时间比较 类似,通过设定算法,可以从播放时间上排除那些明显不正确的集数。总之,周期性视频文 件的总集数的判断方式有很多,在此不再赘述。如果文本信息齐备,则对这些文本信息进行 排序,如果文本信息不齐备,则继续挖掘该文本信息。如果连续剧的某一集资源突然变得很 少,则判断连续剧的总集数为该集对应的数字减去1。
请参图6所示,本发明视频搜索结果的展示方法的再一种实施方式,其包括如下 步骤
Si’,接收用户输入的查询信息,例如连续剧的名称、周期性视频文件的名称等等。 在本实施方式中为连续剧“武林外传”;
S2’,即时去各种视频网站进行搜索,并挖掘出与该查询信息相关的文本信息(例 如,武林外传第一集、武林外传第二集、武林外传第三集、及剧情介绍等等),并将每一集与 其对应的URL资源建表存于数据库,然后对这些文本信息进行周期性排续(在本实施方式 中即对连续剧的总集数进行排序);
S3’,根据S2’步骤所搜集到的文本信息,从各种视频网站中查找与集数相对应的 预选图片,并将URL资源对应的预选图片建表存于数据库中;并通过一定的算法最终选择 出适当的展示图片;由于搜集到的预选图片是各种各样的,有的是片头、有的是片尾、有的 是模糊的、有的是色彩暗淡的、有的是清楚且色彩亮丽的、有的是内容空洞的等等。当然,这 些预选图片中也极可能存在相互重复的。总之,这些预选图片中并不是都是适合展示的。为 了挑选出适合的展示图片,通过一定的算法将重复的预选图片删除,该算法将在下面结合 图7进行具体说明。由于每一集的片头及每一集的片尾的预选图片均比较近似,用户难以 通过这些预选图片对该集的内容做区分,因此,一般情况下不会将每一集的片头及片尾作 为最终选取的展示图片。在本实施方式中,通过一定的算法,将颜色亮丽的图片作为最终被 挑选出来展示给用户的展示图片,该算法将在下面结合图8进行具体说明。
S4’,将上述已经序列化排序的文本信息及其对应的展示图片输出,在本实施方式 中,序列化排序的文本信息及其对应的展示图片通过返回给用户的中间页面展示出来。
步骤S4’中,由于中间页面显示的每一集的文本信息或者展示图片的后面都隐藏 着一个精确的链接,故只需点击该文本信息或展示图片,就可以搜索至结果页面。结果页面 的显示方式有两种,一种是包括至少一个第三方视频播放页面链接,例如当点击第一集时, 会出现之前已经挖掘到的所有第一集的第三方视频,可能包含优酷的、酷6的等等;另一种 是嵌着第三方视频播放器的页面。
步骤S2’中,与查询信息相关的URL资源及与该URL资源对应的预选图片均被建 表存于本地数据库中。在本实施方式中,所述URL资源及与该URL资源对应的预选图片是 通过抓取各种视频网站数据而得到的。
当然,在其它实施方式中,步骤S4’可以将上述文本信息及其对应的展示图片通过 结果页面直接展示出来。
步骤S2’还包括所述视频连续剧总集数的判断步骤,例如,在文本挖掘的过程中对 连续剧“武林外传”的总集数进行判断。当然,判断的方法有很多种,例如通过资源的头、尾 可以对连续剧的总集数进行判断;另外,也可以根据挖到的每一集资源的数目来做判断,例 如“武林外传”实际上只有81集,在81集之前每一集挖到的资源都很多,而第82集的资源 突然很少,此时判断单元21就可以认为第82集是不真实的,从而得出“武林外传”的总集 数为81集。另外,如果某些视频文件的出现是周期性的或者具有某些时间特征,对于这些 视频文件真实性的判断可以采用如下规则(1).通过监测视频文件(如连续剧)的首映时 间,可以判断凡是在该首映时间之前出现的资源都是不真实的;(2).由于一般连续剧每集 的播放时间比较类似,通过设定算法,可以从播放时间上排除那些明显不正确的集数。总之,周期性视频文件的总集数的判断方式有很多,在此不再赘述。如果文本信息齐备,则对 这些文本信息进行排序,如果文本信息不齐备,则继续挖掘该文本信息。如果连续剧的某一 集资源突然变得很少,则判断连续剧的总集数为该集对应的数字减去1。
前述步骤S3或S3’还包括图片去重步骤和展示图片挑选步骤。
请参图7所示,其中图片去重步骤,包括
步骤S31,接收预选图片;
步骤S32,判断该预选图片是否为接收到的第一张预选图片;
如果是,则执行步骤S33,直接运用该预选图片为候选展示图片;
如果否,则执行步骤S34,计算该预选图片与已有的候选展示图片的方差;
步骤S35,判断方差是否大于等于设定阈值;
如果是,执行步骤S36,判定为两张图片不相似;
如果否,执行步骤S37,判定为两张图片相似,并删除其中一张图片,优选地,是删 除所述预选图片。
利用以上算法可以对图片进行去重,从而将其中重复的图片删除掉。
在图片去重步骤后,进行展示图片挑选步骤。通常情况下,展示图片需要能够体现 视频主题、画面干净清晰、主体内容突出。
体现视频主题方面一个视频往往会描述多个内容实体,有多个不同的场景,单靠 一张图像来代表整个视频,要达到体现视频主题是比较困难的。所以,在这一方面将重点放 在过滤方面,而不是每个帧的语义分析上。需要过滤主要包括黑屏、绿屏、整体颜色过暗或 者过亮、虚镜头、叠影和马赛克等。
画面干净清晰方面图像清晰通过清晰度来表示,图像是否干净可以用边缘密度 来判断。
主题内容突出方面通过边缘密度比值比和视觉黄金区域等权重计算来表达。
请参图8所示,展示图片挑选步骤的流程如下
步骤S301,接收与同一文本信息相对应的候选展示图片;
步骤S302,过滤单色图片;即判断输入的候选展示图片是否为单色图片,如果都 为单色图片,则挑选一张熵最大的候选展示图片作为展示图片,如果不完全是单色的图片, 则过滤掉单色图片;
步骤S303,过滤马赛克图片;即判断候选展示图片是否为马赛克图片,如果都是 马赛克图片则挑选马赛克块最小的一张做为展示图片,如果不完全是马赛克图片,则过滤 掉马赛克图片;
步骤S304,计算候选展示图片的熵值;
步骤S305,过滤掉熵值最小的候选展示图片(在本实施方式中使用K均值算法,过 滤掉熵值最小的候选展示图片);
步骤S306,计算边缘比值密度;在本实施方式中,利用黄金视觉区域划分,计算候 选展示图片的中心区域和图片边缘区域的边缘密度比值,同时计算整个候选展示图片的边 缘密度,去掉部分边缘密度过高的候选展示图片;
步骤S307,计算清晰度;即根据边缘密度比值的结果设置加权因子,计算清晰度 加权值;
步骤S308,计算清晰度和边缘密度比值的加权和;即使用清晰度和边缘比值进行 加权计算;
步骤S309,选择加权和最大的候选展示图片作为展示图片;即选择出图片清晰且 主体内容出现在图片中间部分的候选展示图片作为展示图片;
请参图9所示,相较于现有技术,本发明通过不直接展现搜索到的第三方视频链 接结果,而是在用户输入查询信息后,先向用户返回有视频排序结果的中间页面,通过该中 间页面的引导到达嵌入第三方视频页面的播放页面,从而实现了对用户搜索的有顺序关系 的视频进行排序显示的功能,使用方便、用户查询效率较高、网络流量较小。
综上所述,以上仅为本发明的较佳实施例而已,不应以此限制本发明的范围,即凡 是依本发明权利要求书及发明说明书内容所作的简单的等效变化与修饰,皆应仍属本发明 专利涵盖的范围内。
权利要求
1.一种视频搜索结果的展示方法,其特征在于,包括如下步骤 Si,接收输入的查询信息;S2,挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周期性进行排续; S3,搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片; S4,将排序后的所述文本信息及其对应的展示图片输出。
2.如权利要求1所述的视频搜索结果的展示方法,其特征在于步骤S4中,所述文本 信息及其对应的展示图片输出至第一结果页面。
3.如权利要求2所述的视频搜索结果的展示方法,其特征在于在所述第一结果页面 中,所述文本信息或者所述展示图片具有进入第二结果页面的精确链接。
4.如权利要求3所述的视频搜索结果的展示方法,其特征在于所述第二结果页面包 括至少一个第三方视频播放页面链接。
5.如权利要求3所述的视频搜索结果的展示方法,其特征在于所述第二结果页面是 嵌着第三方视频播放器的页面。
6.如权利要求1所述的搜索结果序列化展示方法,其特征在于,所述S3包括图片去重 步骤和展示图片挑选步骤。
7.如权利要求6所述的视频搜索结果的展示方法,其特征在于,所述图片去重步骤包括接收预选图片;计算所述预选图片与已有的候选展示图片的方差;判断方差是否大于等于设定阈值;如果是,则判定为两张图片不相似;如果否,则判定为两张图片相似,并删除其中一张图片。
8.如权利要求7所述的视频搜索结果的展示方法,其特征在于,在所述“接收预选图 片”和“计算所述预选图片与已有的候选展示图片的方差”之间,还包括以下步骤判断该预选图片是否为接收到的第一张预选图片;如果是,则直接运用该预选图片为候选展示图片;如果否,则执行“计算所述预选图片与已有的候选展示图片的方差”步骤。
9.如权利要求6所述的视频搜索结果的展示方法,其特征在于,所述展示图片挑选步 骤,包括接收与同一文本信息相对应的候选展示图片; 判断所述候选展示图片是否为单色图片;如果均为单色图片,则挑选一张熵最大的候选展示图片作为展示图片; 如果不完全是单色图片,则过滤单色图片。
10.如权利要求9所述的视频搜索结果的展示方法,其特征在于,在“过滤单色图片” 后,还包括判断候选展示图片是否为马赛克图片;如果均为马赛克图片,则挑选马赛克块最小的一张做为展示图片; 如果不完全是马赛克图片,则过滤掉马赛克图片。
11.如权利要求10所述的视频搜索结果的展示方法,其特征在于,在“过滤掉马赛克图片”后,还包括计算所述候选展示图片的熵值; 过滤掉熵值最小的候选展示图片;计算所计算候选展示图片的中心区域和图片边缘区域的边缘密度比值; 根据所述边缘密度比值的结果设置加权因子,计算清晰度加权值; 计算清晰度加权值和边缘密度比值的加权和; 选择加权和最大的候选展示图片作为展示图片。
12.如权利要求1所述的视频搜索结果的展示方法,其特征在于如果查询信息所对应 的是连续剧,则步骤S2中文本信息排序为按照所述连续剧的顺序进行排序。
13.如权利要求12所述的视频搜索结果的展示方法,其特征在于步骤S2还包括对所 述连续剧总集数的判断步骤。
14.一种视频搜索结果的展示系统,其特征在于,该系统包括 查询模块,用于接收输入的查询信息;挖掘排序模块,用于挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周 期性进行排续;取图选图模块,用于搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑 选出展示图片;以及展示模块,用于将排序后的所述文本信息及其对应的展示图片输出。
15.如权利要求14所述的视频搜索结果的展示系统,其特征在于所述展示模块将所 述文本信息及其对应的展示图片输出至第一结果页面。
16.如权利要求15所述的视频搜索结果的展示系统,其特征在于在所述第一结果页 面中,所述文本信息或者所述展示图片具有进入第二结果页面的精确链接。
17.如权利要求16所述的视频搜索结果的展示系统,其特征在于所述第二结果页面 包括至少一个第三方视频播放页面链接。
18.如权利要求16所述的视频搜索结果的展示系统,其特征在于所述第二结果页面 是嵌着第三方视频播放器的页面。
19.如权利要求14所述的视频搜索结果的展示系统,其特征在于,所述取图选图模块 可将所述预选图片去重,得到候选展示图片。
20.如权利要求19所述的视频搜索结果的展示系统,其特征在于,所述取图选图模块 可在所述候选展示图片中挑选出展示图片。
21.如权利要求14或19或20所述的视频搜索结果的展示系统,其特征在于,所述取图 选图模块包括取图子模块,用于搜集与所述文本信息相对应的预选图片; 选图子模块,用于从所述预选图片中挑选出所述展示图片。
22.如权利要求14所述的视频搜索结果的展示系统,其特征在于所述挖掘排序模块 包括判断单元,用于在文本挖掘的过程中对文本信息的真伪进行判断。
全文摘要
本发明揭示了一种视频搜索结果的展示方法,包括S1,接收输入的查询信息;S2,挖掘与所述查询信息相关的文本信息,并对所述文本信息按照周期性进行排续;S3,搜集与所述文本信息相对应的预选图片,并从所述预选图片中挑选出展示图片;S4,将排序后的所述文本信息及其对应的展示图片输出。本发明还揭示了一种视频搜索结果的展示系统。相较于现有技术,本发明的有益效果是通过展示序列化的文本信息及其对应的图片,可以方便用户查找,提高用户查找效率,节约网络流量。
文档编号G06F17/30GK102033937SQ20101059676
公开日2011年4月27日 申请日期2010年12月20日 优先权日2010年12月20日
发明者陈海坤, 马洪旭 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1