基于短视频的问题检索反馈方法、装置及其设备与流程

文档序号:14940930发布日期:2018-07-13 20:45阅读:268来源:国知局

本申请涉及信息处理技术领域,尤其涉及一种基于短视频的问题检索反馈方法、装置及其设备。



背景技术:

人工智能(artificialintelligence),英文缩写为ai。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。

目前,随着互联网的发展从pc(personalcomputer,电脑)端进入到手机端之后,用户获取信息的方式已经从传统的web(worldwideweb,全球广域网)页面转移到了客户端、自媒体等平台上,这时内容消费形式也从单纯的以文字为主转移到了以图文为主的形式。

然而,在搜索结果页上关于检索的faq(frequentlyaskedquestions,经常问到的问题)产品,都是文字或图文结果。但是文字或图文的结果有以下几个弊端:首先,知识点较为散落,很多复杂的步骤读完以后仍然很难理解,对用户来说获取知识点不够直观全面,阅读过后往往很难有深刻的印象,记忆难度大;第二,大部分文字和图文结果内容冗长,大段的文字浏览体验差,常常使用户感到疲惫;第三,文字和图文结果的复制成本非常低,版权维护难度大,导致网络上经常出现重复的内容,对用户来说,重复阅读非常浪费时间,难以获得有价值的信息。

比如图1所示,用户输入检索信息“拉布拉多”时,搜索结果页中有关于“拉布拉多”的faq卡片,里面有用户关于“拉布拉多”最感兴趣或问得最多的问题,有“拉布拉多怎么训练”、“拉布拉多多少钱”和“拉布拉多怎么养”等等,检索能够回答这些问题的结果提供给用户。用户点击第一条问题进入结果“拉布拉多怎么训练”进行浏览,里面有大段的文字,内容冗长,浏览体验差,用户难以直观获取到知识点,并且记忆难度大。



技术实现要素:

本申请的目的旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本申请的第一个目的在于提出一种基于短视频的问题检索反馈方法,用于解决现有技术中的以图文形式对检索信息进行反馈导致的用户获取信息效率低下的问题。

本申请的第二个目的在于提出一种基于短视频的问题检索反馈装置。

本申请的第三个目的在于提出一种计算机设备。

本申请的第四个目的在于提出一种非临时性计算机可读存储介质。

本申请的第五个目的在于提出一种计算机程序产品。

为达上述目的,本申请第一方面实施例提出了一种基于短视频的问题检索反馈方法,所述方法包括以下步骤:获取用户输入的问题检索信息,分析所述问题检索信息提取实体信息;查询短视频数据库获取与所述实体信息相关的所有候选短视频;计算每个候选短视频与所述问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量;根据所述每个候选短视频与所述问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数;根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给所述用户。

本申请实施例的基于短视频的问题检索反馈方法,通过获取用户输入的问题检索信息,并分析问题检索信息提取实体信息,然后查询短视频数据库获取与实体信息相关的所有候选短视频,接着计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量,从而根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数,最后根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给用户。由此,通过短视频的方式对问题检索进行直观反馈,大大提升用户获取信息的效率,方便用户使用,提升用户体验。

为达上述目的,本申请第二方面实施例提出了一种基于短视频的问题检索反馈装置,所述装置包括:获取分析模块,用于获取用户输入的问题检索信息,分析所述问题检索信息提取实体信息;查询模块,用于查询短视频数据库获取与所述实体信息相关的所有候选短视频;第一计算模块,用于计算每个候选短视频与所述问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量;第二计算模块,用于根据所述每个候选短视频与所述问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数;处理模块,用于根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给所述用户。

本申请实施例的基于短视频的问题检索反馈装置,通过获取用户输入的问题检索信息,并分析问题检索信息提取实体信息,然后查询短视频数据库获取与实体信息相关的所有候选短视频,接着计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量,从而根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数,最后根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给用户。由此,通过短视频的方式对问题检索进行直观反馈,大大提升用户获取信息的效率,方便用户使用,提升用户体验。

为达上述目的,本申请第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如一种基于短视频的问题检索反馈方法,所述方法包括:获取用户输入的问题检索信息,分析所述问题检索信息提取实体信息;查询短视频数据库获取与所述实体信息相关的所有候选短视频;计算每个候选短视频与所述问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量;根据所述每个候选短视频与所述问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数;根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给所述用户。

为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行一种基于短视频的问题检索反馈方法,所述方法包括:获取用户输入的问题检索信息,分析所述问题检索信息提取实体信息;查询短视频数据库获取与所述实体信息相关的所有候选短视频;计算每个候选短视频与所述问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量;根据所述每个候选短视频与所述问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数;根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给所述用户。

为了实现上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于短视频的问题检索反馈方法,所述方法包括:获取用户输入的问题检索信息,分析所述问题检索信息提取实体信息;查询短视频数据库获取与所述实体信息相关的所有候选短视频;计算每个候选短视频与所述问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量;根据所述每个候选短视频与所述问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数;根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给所述用户。

本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1是根据现有技术中的问题检索反馈方式的示例图;

图2是根据本申请一个实施例的基于短视频的问题检索反馈方法的流程示意图;

图3是根据本申请一个实施例的反馈给用户的示例图;

图4是根据本申请另一个实施例的反馈给用户的示例图;

图5是根据本申请又一个实施例的反馈给用户的示例图;

图6是根据本申请另一个实施例的基于短视频的问题检索反馈方法的流程示意图;

图7是根据本申请一个实施例的基于短视频的问题检索反馈装置的结构示意图;

图8是根据本申请另一个实施例的基于短视频的问题检索反馈装置的结构示意图;

图9是根据本申请一个实施例的计算机设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的基于短视频的问题检索反馈方法、装置及其设备。

本申请实施例提供了一种基于短视频的问题检索反馈方法,可以挖掘用户关于检索下最感兴趣或问得最多的问题,检索并获得能够解答这些问题的高质量、权威视频资源进行聚合并排序后反馈给用户,让用户能够更轻松、更直观地获取到知识点。具体如下:

图2是根据本申请一个实施例的基于短视频的问题检索反馈方法的流程示意图。如图2所示,该基于短视频的问题检索反馈方法包括:

步骤101,获取用户输入的问题检索信息,分析问题检索信息提取实体信息。

步骤102,查询短视频数据库获取与实体信息相关的所有候选短视频。

需要说明的是,本发明实施例中的短视频即短片视频,是一种互联网内容传播方式,一般是在互联网新媒体上传播的时长在预设时长比如5分钟以内的视频传播内容。

在实际应用当中,用户可以根据需要输入问题检索信息。其中,不同的用户输入的问题检索信息不同,比如输入问题检索信息为“拉布拉多”、“熊猫”等,也可以输入问题检索信息为“拉布拉多怎么训练”、“熊猫为什么是国宝”等等。

因此,需要分析问题检索信息提取实体信息,比如上述问题检索信息的实体信息分别为“拉布拉多”和“熊猫”。

可以理解的是,短视频数据库中有关于很多实体信息的视频,根据提取实体信息在短视频数据库查询与其相关的所有短视频作为所有候选短视频。比如实体信息为“熊猫”,在短视频数据库中查询与“熊猫”相关的“熊猫图片”、“熊猫的画法”、“熊猫英语怎么读”、“熊猫为什么是国宝”、“大熊猫为什么有黑眼圈”、“熊猫的尾巴是什么颜色”、“熊猫怎么饲养”、“熊猫为什么只有中国有”和“熊猫为什么吃竹子”等短视频作作为所有候选短视频。

也就是说,可以围绕实体信息,基于全网用户的检索数据,以及全网文章内容等等挖掘实体相关候选短视频。

可以理解的是,在本发明实施例中,首先,短视频能够把知识点进行梳理和完善,让用户直观地获取到相应知识点且印象深刻;第二,短视频形式的浏览体验更好,让用户能够更轻松地获取知识和信息;第三,视频结果比文字或图文结果更具有不可替代性,从而保证了内容唯一性和高质量,能为用户提供更有价值的信息。

步骤103,计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量。

可以理解的是,并不是所有候选短视频与问题检索信息相关,比如上述例子中的“熊猫图片”、“熊猫的画法”等。因此,需要计算每个候选短视频与问题检索信息之间的相关度,以进一步满足用户需求。

作为一种可能实现方式,计算每个候选短视频与问题检索信息之间的语义相似度特征、文本相似度特征,应用预先训练的相关性模型对语义相似度特征和文本相似度特征进行处理,获取每个候选短视频与问题检索信息之间的相关度。

进一步地,可以采用很多种方式计算每个候选短视频的视频吸引度,以进一步满足用户需求。其中,每个候选短视频的视频吸引度是候选短视频对用户的吸引力程度。

作为一种可能实现方式,获取每个候选短视频的视频搜索特征,根据视频搜索特征计算每个候选短视频的吸引度统计分数,根据预先通过深度神经网络训练的视频吸引度模型计算每个候选短视频的吸引度模型分数,获取与吸引度统计分数对应的第一权重,以及与吸引度模型分数对应的第二权重,应用预设算法对吸引度统计分数、第一权重、吸引度模型分数,以及第二权重进行计算,获取每个候选短视频的视频吸引度。

具体地,首先基于统计计算,通过问题检索信息在搜索中的检索热度、作为文档标题在搜索中的点击率、以及关联短视频的点击播放量等衡量。然后基于深度神经网络预估,直接对问题的吸引度建模,存在样本标注量大、且样本整体量偏少等问题。为解决该问题,可以采用迁移学习的方式,通过深度神经网络对全网的高吸引度文章建模即训练吸引度模型,使用该模型计算每个候选短视频的吸引度模型分数。

在实际使用中,可以通过结合以上两种方式,来计算每个候选短视频的视频吸引度的视频吸引度:

其中v是所有短视频集合,si为问题的统计特征score(得分),ni为问题基于深度神经网络模型预估score,ai为综合计算得到的短视频的视频吸引度score。

进一步地,可以采用很多种方式计算每个候选短视频的视频质量,以进一步满足用户需求。作为一种可能实现方式,提取每个候选短视频的视频显示特征和视频来源特征,根据预设算法对视频显示特征和视频来源特征进行计算,获取每个候选短视频的视频质量。

其中,短视频质量计算可以通过短视频本身的质量(分辨率、清晰度、视频比例等)、以及视频来源特征(熊掌号、百家号、站点等分级信息),拟合计算出每个候选短视频的视频质量得分。

步骤104,根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数。

步骤105,根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给用户。

从而,在计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量之后,可以通过预设算法或者模型等方式根据实际应用需要,依据相关度、视频吸引度和视频质量三个方面计算出每个候选短视频的匹配分数,最后以匹配分数为标准将目标短视频进行排序后反馈给用户。

其中,作为一种可能实现方式,根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数的计算公式如下:

其中,c为所有候选短视频,ri为每个候选短视频与问题检索信息之间的相关度,ai为每个候选短视频的视频吸引度和视频质量,qi为每个候选短视频的视频吸引度和视频质量。f(*)为排序函数,为通过有监督训练得到的排序模型,应用中可以选择gbdt、gbrank等。

因此,对于所有候选短视频,按照以上计算的匹配分数进行排序,作为最终展现结果,返回给用户。比如在本申请实施例中,当用户输入“熊猫为什么是国宝”时,最终的再选排序结果为:“熊猫为什么是国宝”、“熊猫为什喜欢抱人腿”、“熊猫为什么喜欢吃竹子”和“大熊猫为什么有黑眼圈”。

可以理解的是,现有技术中除了是文字和图文结果组织而成之外,还需要用户来回点击切换多条结果进行浏览,交互复杂,信息的获取效率不高。继续以图1为例进行说明,如图1所示,用户点击第一条问题进入结果“拉布拉多怎么训练”进行浏览完毕后,用户需要回退到搜索结果,再次点击第三条问题进入结果“拉布拉多怎么养”并进行阅读,交互步骤繁琐。

因此,本申请实施例中,以便捷的交互方式进行跳转后连续播放短视频,用短视频解答的方式让用户高效地对该问题检索有更全面的认知。

也就是说,将目标短视频按照用户需求及相关度等方面进行排序,并在跳转后视频可连续播放(比如左右滑动可切换至上一个/下一个视频),缩短用户来回切换的操作路径,提升信息获取的效率。

作为一种示例,如图3所示,用户输入的问题检索信息“熊猫”,识别出其中的实体信息是“熊猫”,在搜索结果页中,增加“熊猫-大家常问的问题”,挖掘用户关于熊猫最感兴趣或问得最多的问题,发现有“熊猫为什么是国宝”、“熊猫该如何饲养”等,根据这些问题,检索或生产能够解答这些问题的所有候选短视频并进行聚合,让用户对熊猫有更全面的认知。用户点击第一个视频“熊猫为什么是国宝”进入后直接播放,以视频的形式直观地获取到该知识点,浏览完毕后向左滑动直接进入第二个视频“熊猫该如何饲养”并播放,大大提升用户获取信息的效率。

作为另一种示例,如图4所示,用户输入的问题检索信息“曼联”,识别出其中的实体信息是“曼联”,在搜索结果页中,增加“曼联-大家常问的问题”,挖掘用户关于曼联最感兴趣或问得最多的问题,发现有“曼联历史上有哪些著名球员”、“如何评价曼联主教穆里尼奥”等,根据这些问题,检索或生产能够解答这些问题的所有候选短视频并进行聚合,让用户对曼联有更全面的认知。用户点击第一个视频“曼联历史上有哪些著名球员”进入后直接播放,以视频的形式直观地获取到该知识点,浏览完毕后向左滑动直接进入第二个视频“如何评价曼联主教穆里尼奥”并播放,大大提升用户获取信息的效率。

作为又一种示例,如图5所示,用户搜索“无花果孕妇可以吃吗”,识别出其中的实体信息是“无花果”,在搜索结果页中,增加“无花果-大家常问的问题”,挖掘用户关于无花果最感兴趣或问得最多的问题,发现有“无花果孕妇可以吃吗”、“无花果有哪些吃法”等,根据这些问题,检索或生产能够解答这些问题的高质量权威视频,并将与「无花果孕妇可以吃吗」最相关的问题的所有候选短视频进行聚合,让用户对无花果有更全面的认知。用户点击第一个视频“无花果孕妇可以吃吗”进入后直接播放,以视频的形式直观地获取到该知识点,浏览完毕后向左滑动直接进入第二个视频“无花果有哪些吃法”并播放,大大提升用户获取信息的效率。

综上所述,本申请实施例的基于短视频的问题检索反馈方法,通过获取用户输入的问题检索信息,并分析问题检索信息提取实体信息,然后查询短视频数据库获取与实体信息相关的所有候选短视频,接着计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量,从而根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数,最后根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给用户。由此,通过短视频的方式对问题检索进行直观反馈,大大提升用户获取信息的效率,方便用户使用,提升用户体验。

基于上述实施例,可以理解的是,需要建立存储短视频数据库。具体结合图6进行具体说明如下:

图6是根据本申请另一个实施例的基于短视频的问题检索反馈方法的流程示意图。如图6所示,在步骤102之前,还包括:

步骤201,获取用户检索的历史问题实体信息,并根据短视频的资源标题获取与历史问题实体信息匹配的所有短视频资源。

其中,获取用户检索的历史实体信息及实体相关的需求信息集合,应用预设的问题分类模型获取实体相关需求信息中的相关问题信息集合,获取实体信息的相关问题信息集合中每个问题信息的所有对应短视频候选集合。

步骤202,应用预设的问题分类模型分析检索历史信息获取问题检索历史信息。

步骤203,获取与问题检索历史信息对应的网页主题,以及与网页主题对应的展现数据和点击数据生成样本集,训练排序模型。

步骤204,根据排序模型计算每个候选短视频与问题信息之间的相关度。

其中,问题分类模型的方式主要是以问答类站点的问题,及非问答类站点的文章标题,构建问题分类模型的样本集,训练问题分类模型来对问题检索信息是否为问题做分类,可以选择svm、基于卷积神经网络等的问题分类模型。对于问题检索信息,如果问题分类模型输出值,高于一定阈值,则判定为问题,否则为非问题。

或者可以直接通过构造模式的方式来判断,比如构造模式“实体”“为什么”“怎样”“w”“+”来匹配问题。

可以理解的是,由于问题的表述方式,跟全网资源中短视频主题的表述方式可能存在差异,因此不能直接采用文本全匹配的方式来做短视频资源的挖掘。

比如,可以通过粗粒度召回的方式,对全网资源中短视频主题做切词,选取主要词单元,组成词单元组合。将问题切词,选取主要词单元组合,通过改词单元组合与全网短视频资源主题词单元组合做匹配召回候选。以问题“熊猫为什么是国宝”为例,其主要词单元为“熊猫”、“国宝”,全网短视频资源中匹配的候选有“为什么熊猫是国宝”、“熊猫为何称为国宝”、“为什么会选择熊猫作为国宝”和“终于知道熊猫为什么是国宝啦”等等。

具体地,抽取搜索引擎历史中的检索历史信息,通过预设的问题分类模型来识别问题检索历史信息,从而获取这些问题检索历史信息即一段时间内(比如一年)的所有网页的主题、展现、点击信息等,得到与网页主题对应的展现数据和点击数据生成样本集来训练排序模型。在实际使用中,可以采用基于深度神经网络的排序模型等。

基于以上步骤训练得到的排序模型,计算每个候选短视频与问题检索信息之间的相关度。比如,在本申请实施例中,最终选择“为什么熊猫是国宝”作为问题检索信息“熊猫为什么是国宝”的关联短视频。

步骤205,根据预设算法从所有短视频资源中筛选出问题短视频。

步骤206,计算每个问题短视频的视频吸引度,以及计算每个问题短视频的视频质量。

步骤207,从所有的问题短视频中获取视频吸引度大于预设第一阈值,以及视频质量大于预设第二阈值的相关短视频。

步骤208,将历史问题实体信息与相关短视频存储在短视频数据库中。

其中,计算每个问题短视频的视频吸引度,以及计算每个问题短视频的视频质量的方式可以参见步骤103的描述,此处不再详述。

可以理解的是,可以过滤视频吸引度、视频质量低于一定阈值的候选短视频,从而保证召回均为优质有吸引力视频。以实体信息“熊猫”为例,过滤掉低视频吸引度的“熊猫英语怎么读”、“熊猫尾巴是什么颜色”等问题,最终可以得到“大熊猫为什么有黑眼圈”、“熊猫为什么是国宝”、“熊猫为什喜欢抱人腿”、“熊猫为什么只有中国有”、“熊猫为什么吃竹子”、“熊猫怎么饲养”等候选短视频。

从而,可以通过相关预设方式将历史问题实体信息与相关短视频存储在短视频数据库中,进一步满足用户检索查询需求。

为了实现上述实施例,本申请还提出一种基于短视频的问题检索反馈装置,图7是根据本申请一个实施例的基于短视频的问题检索反馈装置的结构示意图。如图7所示,该基于短视频的问题检索反馈装置包括:获取分析模块11、查询模块12、第一计算模块13、第二计算模块14和处理模块15。

其中,获取分析模块11,用于获取用户输入的问题检索信息,分析问题检索信息提取实体信息。

查询模块12,用于查询短视频数据库获取与实体信息相关的所有候选短视频。

第一计算模块13,用于计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量。

第二计算模块14,用于根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数。

处理模块15,用于根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给用户。

其中,在本申请的一个实施例中,第一计算模块13具体用于:计算每个候选短视频与问题检索信息之间的语义相似度特征和文本相似度特征;应用预先训练的相关性模型对所述语义相似度特征和文本相似度特征进行处理,获取每个候选短视频与所述问题检索信息之间的相关度。

其中,在本申请的一个实施例中,第一计算模块13具体用于:获取每个候选短视频的视频搜索特征,根据视频搜索特征计算每个候选短视频的吸引度统计分数,根据预先通过深度神经网络训练的视频吸引度模型计算每个候选短视频的吸引度模型分数,获取与吸引度统计分数对应的第一权重,以及与吸引度模型分数对应的第二权重,应用预设算法对吸引度统计分数、第一权重、吸引度模型分数,以及第二权重进行计算,获取每个候选短视频的视频吸引度。

其中,在本申请的一个实施例中,第一计算模块13具体用于:提取每个候选短视频的视频显示特征和视频来源特征,根据预设算法对视频显示特征和视频来源特征进行计算,获取每个候选短视频的视频质量。

需要说明的是,前述对基于短视频的问题检索反馈方法实施例的解释说明也适用于该实施例的基于短视频的问题检索反馈装置,此处不再赘述。

综上所述,本申请实施例的基于短视频的问题检索反馈装置,通过获取用户输入的问题检索信息,并分析问题检索信息提取实体信息,然后查询短视频数据库获取与实体信息相关的所有候选短视频,接着计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量,从而根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数,最后根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给用户。由此,通过短视频的方式对问题检索进行直观反馈,大大提升用户获取信息的效率,方便用户使用,提升用户体验。

图8是根据本申请另一个实施例的基于短视频的问题检索反馈装置的结构示意图。如图8所示,在图7的基础上还包括:获取匹配模块16、应用获取模块17、第一获取模块18、第三计算模块19、筛选模块110、第四计算模块111、第二获取模块112和存储模块113。

其中,获取匹配模块16,用于获取用户检索的历史问题实体信息,并根据短视频的资源标题获取与历史问题实体信息匹配的所有短视频资源。

应用获取模块17,用于应用预设的问题分类模型分析检索历史信息获取问题检索历史信息。

第一获取模块18,用于获取与问题检索历史信息对应的网页主题,以及与网页主题对应的展现数据和点击数据生成样本集,训练排序模型。

第三计算模块19,用于根据排序模型计算每个候选短视频与问题信息之间的相关度。

筛选模块110,用于根据预设算法从所有短视频资源中筛选出问题短视频。

第三计算模块111,用于计算每个问题短视频的视频吸引度,以及计算每个问题短视频的视频质量。

第二获取模块112,用于从所有的问题短视频中获取视频吸引度大于预设第一阈值,以及视频质量大于预设第二阈值的相关短视频。

存储模块113,用于将历史问题实体信息与相关短视频存储在短视频数据库中。

从而,可以通过相关预设方式将历史问题实体信息与相关短视频存储在短视频数据库中,进一步满足用户检索查询需求。

本申请提出一种计算机设备,图9是根据本申请一个实施例的计算机设备的结构示意图。如图9所示,存储器21、处理器22及存储在存储器21上并可在处理器22上运行的计算机程序。

处理器22执行所述程序时实现上述实施例中提供的基于短视频的问题检索反馈方法。

进一步地,计算机设备还包括:

通信接口23,用于存储器21和处理器22之间的通信。

存储器21,用于存放可在处理器22上运行的计算机程序。

存储器21可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。

处理器22,用于执行所述程序时实现上述实施例所述的基于短视频的问题检索反馈方法。

如果存储器21、处理器22和通信接口23独立实现,则通信接口21、存储器21和处理器22可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(industrystandardarchitecture,简称为isa)总线、外部设备互连(peripheralcomponent,简称为pci)总线或扩展工业标准体系结构(extendedindustrystandardarchitecture,简称为eisa)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

可选的,在具体实现上,如果存储器21、处理器22及通信接口23,集成在一块芯片上实现,则存储器21、处理器22及通信接口23可以通过内部接口完成相互间的通信。

处理器22可能是一个中央处理器(centralprocessingunit,简称为cpu),或者是特定集成电路(applicationspecificintegratedcircuit,简称为asic),或者是被配置成实施本申请实施例的一个或多个集成电路。

为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行一种基于短视频的问题检索反馈方法,所述方法包括:获取用户输入的问题检索信息,分析问题检索信息提取实体信息;查询短视频数据库获取与实体信息相关的所有候选短视频;计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量;根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数;根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给用户。

为了实现上述实施例,本申请还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于短视频的问题检索反馈方法,所述方法包括:获取用户输入的问题检索信息,分析问题检索信息提取实体信息;查询短视频数据库获取与实体信息相关的所有候选短视频;计算每个候选短视频与问题检索信息之间的相关度,计算每个候选短视频的视频吸引度,以及计算每个候选短视频的视频质量;根据每个候选短视频与问题检索信息之间的相关度,以及每个候选短视频的视频吸引度和视频质量,计算每个候选短视频的匹配分数;根据所有候选短视频的匹配分数对反馈的目标短视频进行排序后反馈给用户。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1