内容推荐方法、装置、计算机设备和存储介质与流程

文档序号:22324509发布日期:2020-09-25 17:52阅读:90来源:国知局
内容推荐方法、装置、计算机设备和存储介质与流程
本申请涉及计算机
技术领域
,特别是涉及一种内容推荐方法、装置、计算机设备和存储介质。
背景技术
:随着互联网技术的迅速发展,视频网站日益盛行,通过在视频内容中插入推荐内容的方式逐渐普及,从而实现在视频中进行信息推送。传统方式中,通常是通过人工识别与视频内容相匹配的推送信息,或者根据视频内容中的视频关键帧,识别适合进行信息推送的视频关键帧,并推送预设的推送信息。然而,人工识别推荐时间和推送信息的方式,人力成本较大且容易错过最佳推荐时机;而根据视频关键帧确定推荐内容的方式,无法有效地推送较为匹配的推送信息,导致在视频内容中推荐信息的效率和推荐精准度较低。技术实现要素:基于此,有必要针对上述技术问题,提供一种能够有效提高在视频内容中推荐信息的效率和推荐精准度的内容推荐方法、装置、计算机设备和存储介质。一种内容推荐方法,所述方法包括:获取从视频内容划分出的至少两个视频片段;基于各所述视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与所述待推荐对象之间的匹配度;根据所述匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容;通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与所述待推荐对象对应的推荐内容;根据筛选出的视频片段内容确定推荐时间点,并在所述视频内容播放到所述推荐时间点时播放所述推荐内容。一种内容推荐装置,所述装置包括:信息获取模块,用于获取从视频内容划分出的至少两个视频片段;内容匹配模块,用于基于各所述视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与所述待推荐对象之间的匹配度;根据所述匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容;内容生成模块,用于通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与所述待推荐对象对应的推荐内容;内容推荐模块,用于根据筛选出的视频片段内容确定推荐时间点,并在所述视频内容播放到所述推荐时间点时播放所述推荐内容。在其中一个实施例中,所述信息获取模块还用于识别所述视频内容中的视频文本内容;基于所述视频文本内容,从所述视频内容划分出至少两个视频片段,并获得各视频片段对应的视频文本内容。在其中一个实施例中,所述视频文本内容包括字幕文本内容;所述信息获取模块还用于当所述视频内容中包括字幕文本内容时,根据所述字幕文本内容,从所述视频内容划分出至少两个视频片段;对所述字幕文本内容进行文本提取,获得各视频片段对应的视频文本内容。在其中一个实施例中,所述视频文本内容包括音频文本内容;所述信息获取模块还用于对所述视频内容进行音频识别,获得所述视频内容对应的音频文本内容;根据所述音频文本内容,从所述视频内容划分出至少两个视频片段;对所述音频文本内容进行文本提取,获得各视频片段对应的视频文本内容。在其中一个实施例中,所述内容匹配模块还用于提取所述描述信息对应的对象关键词;根据各所述视频文本内容提取各视频片段对应的视频关键词;确定各所述视频关键词与所述对象关键词之间的语义相似度;根据所述语义相似度,确定各视频片段与所述待推荐对象之间的匹配度。在其中一个实施例中,所述内容匹配模块还用于获取各所述视频片段对应的弹幕内容;根据各所述视频片段的视频文本内容和弹幕内容,确定各视频片段对应的视频关键词。在其中一个实施例中,所述内容生成模块还用于将筛选出的视频文本内容输入至预训练的内容生成模型;通过所述内容生成模型,对所述视频文本内容进行语义特征提取,获得视频语义特征;根据所述视频语义特征,生成目标文本内容;基于所述目标文本内容,生成与所述待推荐对象对应的推荐内容。在其中一个实施例中,所述内容生成模块还用于将所述目标文本内容和所述待推荐对象的描述信息进行拼接,生成与所述待推荐对象对应的推荐内容。在其中一个实施例中,所述内容生成模块还用于获取筛选出的视频片段对应的弹幕内容;将筛选出的视频文本内容和弹幕内容,输入至预训练的内容生成模型;通过所述内容生成模型,对所述视频文本内容和所述弹幕内容进行语义特征提取,获得视频语义特征;根据所述视频语义特征,生成目标文本内容;基于所述目标文本内容,生成与所述待推荐对象对应的推荐内容。在其中一个实施例中,所述内容生成模块还用于将筛选出的视频文本内容和所述待推荐对象的描述信息,输入至预训练的内容生成模型;通过所述内容生成模型对所述视频文本内容进行语义特征提取,获得视频语义特征;对所述待推荐对象的描述信息进行语义特征提取,获得对象语义特征;基于所述视频语义特征和所述对象语义特征,生成与所述待推荐对象对应的推荐内容。在其中一个实施例中,所述内容生成模型通过训练步骤训练获得,所述装置还包括模型训练模块,用于获取训练样本和训练标签;所述训练样本包括样本文本内容和样本推荐内容,所述训练标签是所述训练样本中所述样本文本内容与所述样本推荐内容之间的样本评分;基于所述训练样本和所述训练标签训练内容生成模型。在其中一个实施例中,所述模型训练模块还用于通过所述内容生成模型,对所述样本文本内容进行语义特征提取,获得样本文本语义特征;通过所述内容生成模型,根据所述样本文本语义特征,生成样本目标内容;基于所述样本目标内容与所述训练标签的差异,调整所述内容生成模型的参数并继续训练,直至满足训练条件时停止训练。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取从视频内容划分出的至少两个视频片段;基于各所述视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与所述待推荐对象之间的匹配度;根据所述匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容;通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与所述待推荐对象对应的推荐内容;根据筛选出的视频片段内容确定推荐时间点,并在所述视频内容播放到所述推荐时间点时播放所述推荐内容。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取从视频内容划分出的至少两个视频片段;基于各所述视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与所述待推荐对象之间的匹配度;根据所述匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容;通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与所述待推荐对象对应的推荐内容;根据筛选出的视频片段内容确定推荐时间点,并在所述视频内容播放到所述推荐时间点时播放所述推荐内容。上述内容推荐方法、装置、计算机设备和存储介质,获取从视频内容划分出的至少两个视频片段后,基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度;根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容,由此能够精准地确定视频内容中适合进行内容推荐的时频片段和时频文本内容。通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与待推荐对象对应的推荐内容,从而能够高效精准地生成与视频内容相关联的推荐内容。根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。由此能够在分析出的视频片段中,根据视频内容精准地进行内容推荐,从而有效提高了信息的推送效率和推送精准度。附图说明图1为一个实施例中内容推荐方法的应用环境图;图2为一个实施例中内容推荐方法的流程示意图;图3为另一个实施例中内容推荐方法的流程示意图;图4为一个具体的实施例中筛选出的视频片段的界面图;图5为一个具体的实施例中在视频内容中播放推荐内容的界面图;图6为又一个实施例中内容推荐方法的流程示意图;图7为再一个实施例中内容推荐方法的流程示意图;图8为另一个实施例中内容推荐方法的流程示意图;图9为一个具体的实施例中内容推荐方法的流程示意图;图10为一个实施例中内容推荐装置的结构框图;图11为另一个实施例中内容推荐装置的结构框图;图12为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例提供的方案涉及人工智能、机器学习(machinelearning,ml)和计算机视觉(computervision,cv)和图像处理等技术。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、技术及应用系统,使机器具有感知、推理与决策的功能。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。计算机视觉和图像处理技术是通过计算机设备代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,试图建立能够从图像或者多维数据中获取信息的人工智能系统。通过对视频内容所对应的各种信息进行基于机器学习和图像处理技术等处理,从而能够有效实现对待推荐的内容进行智能推荐。本申请提供的内容推荐方法,可以应用于计算机设备中。计算机设备可以为终端或服务器。可以理解的是,本申请提供的内容推荐方法可以应用于终端,也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。在一个实施例中,计算机设备可以为服务器。本申请提供的内容推荐方法,可以应用于如图1所示的应用环境中,该应用环境包括终端和服务器的系统,并通过终端和服务器的交互实现。其中,终端102通过网络与服务器104进行通信。服务器104获取从视频内容划分出的至少两个视频片段后,基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度;根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容。服务器104通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与待推荐对象对应的推荐内容,根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。终端102则在视频内容播放到推荐时间点时,在视频内容中播放并显示推荐内容。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种内容推荐方法,以该应用于计算机设备来举例说明,该计算机设备具体可以是终端或者服务器。本实施例中,该方法包括以下步骤:s202,获取从视频内容划分出的至少两个视频片段。其中,视频泛指将一系列静态影像以电信号的方式加以捕捉、纪录、处理、储存、传送与重现的各种技术。网络技术的发达也促使视频的纪录片段以串流媒体的形式存在于因特网之上并可被电脑接收与播放。视频内容即为视频数据,视频数据是随时间变化的图像流,含有更为丰富的其他媒体所无法表达的信息和内容。以视频的形式来传递信息,能够直观、生动、真实、高效地表达所要传递的内容。视频内容可以是视频网站播放的视频,或者网页中插入的视频等。例如可以是各种影视视频、直播视频、节目视频以及自媒体视频等等。视频内容中包括至少两个视频片段。待处理的视频内容可以是从视频网站获取的,也可以是从视频数据库中获取的。在对视频内容进行处理之前,计算机设备可以基于视频处理指令对待处理的视频内容进行处理。视频处理指令可以是系统自动生成的,例如当需要对待推荐对象进行推送时,可以将待推荐对象的描述信息上传至视频网站,视频网站对应的后台服务器可以自动生成视频处理指令。视频处理指令也可以是用户手动触发生成的,例如,用户通过终端浏览视频内容时,可以触发视频处理指令。计算机设备获取待处理的视频内容后,按照预设划分方式对视频内容进行划分,将视频内容划分为至少两个视频片段。具体地,计算机设备通过识别视频内容中的视频文本内容,并根据视频文本内容将视频内容划分为至少两个视频片段。其中,视频文本内容可以根据视频内容中的字幕信息或者音频信息提取得到。例如,计算机设备可以按照文本句或文本段,将每一句的视频内容划分为对应的一个视频片段,或者将每一段的视频内容划分为对应的一个视频片段。s204,基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度。其中,视频文本内容是指从视频内容中所提取的书面语言的表现形式,通常,视频内容中包含的文本内容,能够更加直观清楚地反映视频内容所要表达的含义。视频文本内容可以包括句子或多个句子的组合。一个文本可以是一个句子、一个段落或者一个篇章等。其中,文本还可以由各种字符组成。待推荐对象是指用于在视频内容中进行推荐的目标对象,待推荐对象可以是产品、应用软件、用户对象等目标事物。例如,待推荐对象还可以对应相应的应用平台。在其中一个实施例中,视频网站平台还可以预先配置至少一个待推荐对象。待推荐对象的描述信息,是用于描述待推荐对象所产生的信息,例如包括待推荐对象的属性信息等,还可以是待推荐对象对应的关键词。计算机设备获取从视频内容划分出的至少两个视频片段,以及各视频片段对应的视频文本内容后,确定各视频片段与待推荐对象之间的匹配度。具体地,计算机设备通过分别计算各视频片段对应的视频文本内容,与待推荐对象的描述信息之间的相似度,进而根据视频文本内容与描述信息之间的相似度,确定各视频片段与待推荐对象之间的匹配度。s206,根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容。其中,匹配度反映了视频片段与待推荐对象进行比较的相似度的数据化衡量。视频片段的视频文本内容与待推荐对象之间的匹配度越高,表示在该视频片段内更加适合推送该待推荐对象,在该视频片段对应的位置进行推荐,推荐效果更加精准。一个视频内容中符合推荐条件的视频片段可以为一个,也可以为多个。其中,多个是指两个以上。计算机设备根据各视频片段对应的视频文本内容与描述信息之间的相似度,得到各视频片段与待推荐对象之间的匹配度后,将匹配度与预设的匹配度阈值进行比较,将匹配度大于匹配度阈值的视频文本内容对应的视频片段,确定为符合推荐条件的视频片段。计算机设备进而根据匹配度,筛选出符合推荐条件的视频片段以及对应的视频文本内容。其中,推荐条件还可以包括预设的数量阈值。比如预设数量可以为预设的数值范围,当达到匹配度阈值的视频片段有多个时,则可以根据匹配度阈值和数量阈值选取满足推荐条件的视频片段。在其中一个实施例中,待推荐对象也可以包括多个,推荐条件包括匹配度阈值和数量阈值。计算机设备在筛选符合推荐条件的视频片段时,首先根据匹配度阈值筛选符合推荐条件的视频片段和待推荐对象,再根据数量阈值进一步筛选匹配度最高的预设数量的视频片段和待推荐对象。例如,当该视频内容中,确定当前视频片段对应有满足推荐条件的待推荐对象时,获取匹配度最高的待推荐对象,并确定为当前视频片段的待推荐对象。若视频内容中已经出现过待推荐对象,则可以跳过该待推荐对象,因此在筛选时,还可以依次选取匹配度第二或第三等的待推荐对象,作为相应的视频片段对应的待推荐对象。s208,通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与待推荐对象对应的推荐内容。其中,内容生成模型是经过训练后具有文本生成能力的模型。预训练的内容生成模型,可以采用基于seq2seqmodel的模型。除此之外,还可以采用基于lstm(longshort-termmemory,长短期记忆网络)模型、基于dnn(deepneuralnetworks,深度神经网络)模型或基于cnn(convolutionalneuralnetworks,卷积神经网络)模型等的文本生成网络模型,在此不做限定。计算机设备筛选出符合推荐条件的视频片段以及对应的视频文本内容后,则将筛选出的视频文本内容输入至预训练的内容生成模型,通过内容生成模型,对视频文本内容进行语义特征提取,获得视频语义特征,根据视频语义特征,生成与待推荐对象对应的推荐内容。通过利用预训练的内容生成模型,基于视频文本内容生成推荐内容,从而能够高效精准地生成与视频内容相关联的推荐内容。s210,根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。其中,视频内容包括对应的视频时间轴,时间轴是指按时间顺序串联的记录体系。视频时间轴表示将连续的多帧图像用时间轨迹串联起来。视频内容中的各视频片段是按照视频内容的视频时间轴划分的。每个视频片段在视频内容的视频时间轴上有相对应的时间段。推荐时间点是指视频内容中视频时间轴上的时间点,用于在视频内容中的推荐时间点插入待推荐的推荐内容。其中,推荐内容可以是预先配置的待推荐对象对应的内容,推荐内容可以是预先配置的信息。推荐对象是指作为推荐目标的事物,比如,推荐对象可以包括产品、应用软件、用户、推广信息等等。推荐内容可以包括纯文本、纯图片、图标或者图文结合等各种形式的信息。推荐内容还可以包括播放时长、播放位置等属性信息。例如,推荐内容可以包括用户推送信息、资源推广信息以及各种广告信息等等。计算机设备生成与待推荐对象对应的推荐内容后,根据筛选出的视频片段,确定该视频内容中的推荐时间点。视频内容中的推荐时间点可以为一个,也可以为多个。当筛选出的视频片段为多个时,推荐时间点与相应的视频片段对应,即也为多个。具体地,计算机设备可以将筛选出的视频片段的下一帧的位置确定为推荐时间点,例如,可以在筛选出的视频片段对应的视频文本内容的下一幕,开始播放推荐内容。进一步地,计算机设备还可以将筛选出的视频片段的片段起始点,即视频片段的片段起始点在视频内容中的时间点,确定为推荐时间点。例如,还可以根据视频片段的中间点或者终止点,确定该视频内容中的推荐时间点。计算机设备确定该视频内容中的推荐时间点后,则获取待推荐对象对应的推荐内容,并在视频内容播放到推荐时间点时播放推荐内容。其中,推荐内容可以按照预设格式生成相应的信息,例如文字、图形、图标、图文结合等格式。推荐内容还包括预设的显示位置、显示形式和显示时长等属性信息。例如,显示形式包括角标、压屏条等形式。推荐内容可以按照嵌入的方式插入视频内容中进行播放,而不影响视频内容本身的播放,从而能够有效实现在视频内容中进行内容推荐。用户通过对应的用户终端加载该添加推荐内容的视频内容后,当用户终端的视频显示界面中,在视频内容播放到推荐时间点时,播放相应的推荐内容。用户还可以在视频显示界面点击该推荐内容,从而跳转至待推荐对象的相关页面,以实现对待推荐内容进行推荐。上述内容推荐方法中,计算机设备获取从视频内容划分出的至少两个视频片段后,基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度;根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容,由此能够精准地确定视频内容中适合进行内容推荐的时频片段和时频文本内容。计算机设备通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与待推荐对象对应的推荐内容,从而能够高效精准地生成与视频内容相关联的推荐内容。根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。由此能够在分析出的视频片段中,根据视频内容精准地进行内容推荐,从而有效提高了信息的推送效率和推送精准度。在一个实施例中,获取从视频内容划分出的至少两个视频片段,包括:识别视频内容中的视频文本内容;基于视频文本内容,从视频内容划分出至少两个视频片段,并获得各视频片段对应的视频文本内容。其中,视频内容中包括字幕信息和音频信息。字幕是指以文字形式显示影视作品中的对话等内容,字幕是将视频的语音内容或描述内容以字幕方式显示。其中,字幕形式包括图形格式和文本格式。计算机设备获取视频内容的字幕信息时,可以仅获取文本格式的字幕信息。计算机设备可以通过字幕信息或者音频信息识别视频内容中的视频文本内容,进而根据视频文本内容对视频内容进行划分,从视频内容划分出至少两个视频片段,并获得各视频片段对应的视频文本内容。由此能够有效地根据视频文本内容对视频内容进行片段划分,获得多个包含视频文本内容的视频片段。在其中一个实施例中,视频内容中可能包括不含视频文本内容的视频片段。计算机设备从视频内容划分出至少两个视频片段后,还可以仅获取包含视频文本内容的视频片段,以及各视频片段对应的视频文本内容。在其中一个实施例中,若该视频内容存在字幕信息时,可以直接根据字幕信息获取视频文本内容,即可以直接将字幕信息作为视频内容的视频文本内容。若该视频内容中不存在字幕信息时,通过识别视频内容中的音频信息,通过音频识别提取其音频对应的文本内容,从而确定视频内容中的视频文本内容。本实施例中,通过根据视频文本内容对视频内容进行划分,由此能够有效地将视频内容划分为多个包含视频文本内容的视频片段。在一个实施例中,视频文本内容包括字幕文本内容;基于视频文本内容,从视频内容划分出至少两个视频片段,并获得各视频片段对应的视频文本内容,包括:当视频内容中包括字幕文本内容时,根据字幕文本内容,从视频内容划分出至少两个视频片段;对字幕文本内容进行文本提取,获得各视频片段对应的视频文本内容。其中,字幕文本内容是指从该视频内容的字幕信息中,提取的文本格式的文本内容。当视频内容中包括字幕信息时,计算机设备则从字幕信息中获取相应的字幕文本内容,进而根据字幕文本内容,从视频内容划分出至少两个视频片段。具体地,计算机设备可以识别字幕文本内容中的各个文本句或文本段,将字幕文本内容按照文本句或文本段进行划分,划分为多个文本句或文本段。计算机设备进而以各文本句或文本段为单位,对相应的部分视频内容进行划分,从而划分为包括各文本句或文本段的视频片段,并将文本句或文本段作为各视频片段对应的视频文本内容。本实施例中,通过基于字幕信息进行文本提取,能够快速有效地提取视频内容中的视频文本内容,进而能够精准有效地将视频内容划分为多个包含视频文本内容的视频片段。在一个实施例中,视频文本内容包括音频文本内容;基于视频文本内容,从视频内容划分出至少两个视频片段,并获得各视频片段对应的视频文本内容,包括:对视频内容进行音频识别,获得视频内容对应的音频文本内容;根据音频文本内容,从视频内容划分出至少两个视频片段;对音频文本内容进行文本提取,获得各视频片段对应的视频文本内容。其中,视频内容中包括音频信息,音频信息可以是视频内容中语言的音频表现形式,记录了视频内容中的语言等声音内容。若视频内容中不包含字幕信息时,计算机设备则获取视频内容中的音频信息,进而对音频信息进行音频识别,得到音频信息对应的文本内容。具体地,计算机设备获取该视频内容对应的音频信息后,通过音频识别技术对音频信息进行语音识别,以提取出其音频对应的文本内容,从而得到视频内容对应的音频文本内容。其中,音频识别技术已经较为成熟,在此不再赘述。计算机设备获得视频内容对应的音频文本内容后,进而根据音频文本内容,从视频内容划分出至少两个视频片段。具体地,计算机设备可以识别音频文本内容中的各个文本句或文本段,将音频文本内容按照文本句或文本段进行划分,划分为多个文本句或文本段。计算机设备进而以各文本句或文本段为单位,对相应的部分视频内容进行划分,从而划分为包括各文本句或文本段的视频片段,并将文本句或文本段作为各视频片段对应的视频文本内容。本实施例中,通过基于音频信息进行文本提取,能够精准有效地提取视频内容中的视频文本内容,进而能够精准有效地将视频内容划分为多个包含视频文本内容的视频片段。在一个实施例中,基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度,包括:提取描述信息对应的对象关键词;根据各视频文本内容提取各视频片段对应的视频关键词;确定各视频关键词与对象关键词之间的语义相似度;根据语义相似度,确定各视频片段与待推荐对象之间的匹配度。其中,语义相似度是指句子或词语之间的语义近似程度,通过计算视频关键词与对象关键词之间的语义相似度,能够确定各视频片段的内容与待推荐对象之间的相似关系。计算机设备获取视频内容中各视频片段对应的视频文本内容,以及待推荐对象的描述信息后,分别提取各视频文本内容提取各视频片段对应的视频关键词,和待推荐对象的描述信息对应的对象关键词。具体地,计算机设备可以通过预设的关键词提取模型对视频文本内容和描述信息进行关键词提取。例如,关键词提取模型可以为基于tf-idf或者textrank的语言模型。例如,对于视频内容而言,视频中的文本内容通常较短,因此可以采用基于textrank的关键词提取模型视频文本内容进行关键词提取,可以有更好的表现。以基于textrank的关键词提取模型为例,通过关键词提取模型对视频文本内容进行分词,可以得到词之间的相邻关系并构建网络,然后通过pagerank迭代计算每个节点的rank(等级)值,排序rank值即可得到关键词,还可以得到各个关键词的权重。其中,迭代计算公式可以如下:其中,pr(vi)表示结点vi的rank值,in(vi)表示结点vi的前驱结点集合,out(vj)表示结点vj的后继结点集合,d为dampingfactor(阻尼比)用于做平滑。例如,以视频文本内容为“你怎么出去买东西了”为例,如下表一所示,通过关键词提取模型对视频文本内容进行关键词提取,所得到的关键词和对应的权重。关键词权重出去0.3333333买东西0.6666666表一计算机设备分别提取出各视频文本内容对应的视频关键词,以及待推荐对象的描述信息对应的对象关键词后,进一步分别计算各视频关键词与对象关键词之间的语义相似度,并根据语义相似度确定各视频片段与待推荐对象之间的匹配度。通过分别计算各视频关键词与对象关键词之间的相似度,从而能够有效判断当前视频片段的内容与待推荐对象是否相匹配。具体地,可以基于词向量计算各个视频关键词与对象关键词间的语义相似度,由于词向量可以作为关键词语义信息的一种表示,可以用来计算单词之间的相似度。计算机设备还可以通过预训练的词向量模型提取各个视频关键词与对象关键词的词向量,并基于词向量计算各个视频关键词与对象关键词间的语义相似度。以视频文本内容为“你怎么出去买东西了”,待推荐对象的描述信息为“购物、开心、快、好”为例,其中,由于文本存在内容不一致但语义类似的情况。例如“买东西”与“购物”虽然内容不一致,但其语义一致。以预训练的开源的word2vec词向量模型为例,对关键词“买东西”提取预设维度的词向量表示,“买东西”的词向量表示可以如下,其中多余部分用省略号代替:[0.032159-0.612580.303454-0.2166220.1246040.167917-0.0389620.021676-0.1336960.252262-0.011379-0.164580.08118-0.116419…]对关键词“购物“提取预设维度的词向量表示如下:[0.150499-0.5974090.212758-0.213113-0.270041-0.0314230.0696210.172485-0.1079460.6516780.022603-0.191477-0.146277-0.086974…]通过利用余弦相似度计算和所有“买东西“的相似度,得到从大到小得到语义相似的词,可以如下所示:[(购物,0.7477185726165771),(逛街,0.7307931184768677),(消费,0.724926352500915),(网购,0.701110482215881)(买买买,0.693654596805572),(旅游,0.6722322702407837),(休闲娱乐,0.6502475738525391),(购物中心,0.6446495056152344),(逛,0.6428323984146118),(商场,0.6405168175697327)]。其中,小数表示相似度,范围为0-1。因此如果存在与当前视频片段的视频关键词相似度大于一定阈值的对象关键词,例如阈值可设为0.6,则表示可以在该视频片段推荐对应的待推荐对象。例如,对象关键词中存在与“买东西”相似的关键词,如某待推荐对象的关键词“购物、开心、快、好”,则确定该视频片段的视频文本内容与待推荐对象的内容相匹配,进而将该待推荐对象,确定为该视频片段的待推荐对象。本实施例中,通过提取各视频文本内容的视频关键词和待推荐对象的描述信息的对象关键词,并通过计算各视频关键词与对象关键词之间的语义相似度,从而能够精准有效地确定各视频片段的内容与待推荐对象之间的匹配度。在一个实施例中,根据各视频文本内容提取各视频片段对应的视频关键词,包括:获取各视频片段对应的弹幕内容;根据各视频片段的视频文本内容和弹幕内容,确定各视频片段对应的视频关键词。其中,弹幕内容是指在网络上观看视频时以弹出形式播放的评论性字幕。这些弹幕信息会被保存起来,当视频内容被浏览用户再次点播时,弹幕信息就会在播放器加载视频文件的同时被载入,并在视频内容中对应的时间点出现。计算机设备获取从视频内容划分出的至少两个视频片段之后,还可以获取各视频片段对应的弹幕内容。计算机设备进而对各视频片段的视频文本内容进行关键词提取,并对各视频片段的弹幕内容进行关键词提取,进而根据视频文本内容的关键词和弹幕内容的关键词,共同确定各视频片段对应的视频关键词。从而能够有效地结合视频文本内容和弹幕内容确定各视频片段对应的视频关键词。在其中一个实施例中,还可以分别设置视频文本内容和弹幕内容相应的权重。具体地,计算机设备分别提取视频文本内容的关键词和弹幕内容的关键词后,还可以根据相应的权重生成各视频片段对应的视频关键词。本实施例中,由于弹幕内容具有趣味性和话题性,因此可以反应出观影用户的在浏览视频内容时所抒发的情绪。通过对各视频片段对应的视频文本内容和弹幕内容进行结合分析,从而可以根据用户的观影情绪和视频内容本身所表达的内容,分析出视频内容中哪些片段比较适合进行内容推送,由此能够有效提高在视频内容中进行内容推荐的精准度。在一个实施例中,通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与待推荐对象对应的推荐内容,包括:将筛选出的视频文本内容输入至预训练的内容生成模型;通过内容生成模型,对视频文本内容进行语义特征提取,获得视频语义特征;根据视频语义特征,生成目标文本内容;基于目标文本内容,生成与待推荐对象对应的推荐内容。其中,内容生成模型是经过训练后具有文本生成能力的模型。内容生成模型可以包括输入层、编码层、解码层、连接层和输出层。其中,编码层用于将输入序列转化成一个固定长度的向量;解码层用于将之前生成的固定向量再转化成输出序列。计算机设备获取从视频内容划分出的至少两个视频片段,以及各视频片段对应的视频文本内容,根据各视频片段与待推荐对象之间的匹配度,筛选符合出推荐条件的视频片段以及对应的视频文本内容后,将筛选出的视频文本内容输入至预训练的内容生成模型,通过内容生成模型根据筛选出的视频文本内容,生成与待推荐对象对应的推荐内容。计算机设备则通过内容生成模型,对输入的视频文本内容进行语义特征提取,得到对应的视频语义特征。内容生成模型中的文本生成网络进而根据视频语义特征生成相应的目标文本内容。具体地,计算机设备将视频文本内容输入至内容生成模型后,通过内容生成模型的输入层对输入的视频文本内容做embedding(嵌入),得到视频文本内容对应的嵌入表示,即可以为视频文本内容对应的文本向量,并作为编码层中的循环神经网络的源句表示。其中,编码层可以为encoder编码器,具体可以为cnn、rnn或lstm网络;解码层可以为decoder解码器,具体可以为也可以网络cnn、rnn或lstm;编码层和解码层还可以是各种神经网络的组合。编码层通过学习输入的源句表示,将其编码成一个固定大小的状态向量,继而将状态向量传给解码层中的网络,解码层再通过对状态向量的学习来进行输出。其中,状态向量可以通过连接层传递和输出。通过两个循环神经网络连接encoder和decoder,可以将两个平行表示连接起来,得到目标文本表示。文本生成模型的输出成则根据目标文本表示输出对应的目标文本内容。例如,以筛选出的视频文本内容为“你怎么出去买东西了”为例,将该视频文本内容输入至内容生成模型,通过内容生成模型可以得到“出门买不如上**买”的目标文本内容。计算机设备通过预训练的内容生成模型,根据视频文本内容生成对应的目标文本内容后,进一步根据目标文本内容生成与待推荐对象对应的推荐内容。例如,可以根据待推荐对象的对象标识,结合目标文本内容,从而生成与待推荐对象对应的推荐内容。由此能够有效地生成与视频文本内容和待推荐对象相匹配的推荐内容。本实施例中,通过利用预训练的内容生成模型,从而能够高效精准地生成与视频内容高度关联和匹配的推荐内容。由此能够根据视频内容的文本内容精准地进行内容推荐,从而有效提高了信息的推送效率和推送精准度。在一个实施例中,如图3所示,提供了另一种内容推荐方法,该方法包括以下步骤:s302,获取从视频内容划分出的至少两个视频片段。s304,基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度。s306,根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容。s308,将筛选出的视频文本内容输入至预训练的内容生成模型。s310,通过内容生成模型,对视频文本内容进行语义特征提取,获得视频语义特征。s312,通过内容生成模型,根据视频语义特征,生成目标文本内容。s314,将目标文本内容和待推荐对象的描述信息进行拼接,生成与待推荐对象对应的推荐内容。s316,根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。其中,待推荐对象的描述信息中包括推荐对象标识、推荐对象名称等属性信息。计算机设备获取从视频内容划分出的至少两个视频片段,以及各视频片段对应的视频文本内容,根据各视频片段与待推荐对象之间的匹配度,筛选符合出推荐条件的视频片段以及对应的视频文本内容后,将筛选出的视频文本内容输入至预训练的内容生成模型,通过内容生成模型根据视频文本内容生成对应的目标文本内容后,进一步根据目标文本内容生成与待推荐对象对应的推荐内容。具体地,计算机设备将目标文本内容和待推荐对象的描述信息进行拼接,生成与待推荐对象对应的推荐内容。其中,计算机设备可以目标内容文本和待推荐对象的推荐对象名称进行拼接,从而生成与待推荐对象对应的推荐内容。例如,如图4所示,为一个具体的实施例中筛选出的视频片段的界面图。如图4中的字幕文本内容所示,筛选出的视频文本内容即为“你怎么出去买东西了”。计算机设备将该视频文本内容输入至内容生成模型,通过内容生成模型可以得到“出门买不如上**买”的目标文本内容。进一步地,以待推荐对象为“xxx购物网站”为例,计算机设备进而将目标文本内容和待推荐对象的描述信息进行拼接,由此可以生成“出门买不如上xxx购物网站买”的推荐内容。根据筛选出的视频片段内容确定推荐时间点后,并在视频内容播放到推荐时间点时播放推荐内容。如图5所示,为一个实施例中在视频内容中播放推荐内容的界面图。由此能够精准有效地生成与视频内容以及待推荐对象高度关联和匹配的推荐内容。在一个实施例中,如图6所示,提供了另一种内容推荐方法,该方法包括以下步骤:s602,获取从视频内容划分出的至少两个视频片段。s604,基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度。s606,根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容。s608,获取筛选出的视频片段对应的弹幕内容。s610,将筛选出的视频文本内容和弹幕内容,输入至预训练的内容生成模型。s612,通过内容生成模型,对视频文本内容和弹幕内容进行语义特征提取,获得视频语义特征。s614,根据视频语义特征,生成目标文本内容。s616,基于目标文本内容,生成与待推荐对象对应的推荐内容。s618,根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。其中,视频内容中可能还包括弹幕内容,可以反应出观影用户的在浏览视频内容时所抒发的情绪。因此,若视频内容中包括弹幕内容,根据视频文本内容生成推荐内容时,还可以结合相应的弹幕内容生成推荐内容。计算机设备获取从视频内容划分出的至少两个视频片段,以及各视频片段对应的视频文本内容,根据各视频片段与待推荐对象之间的匹配度,筛选符合出推荐条件的视频片段以及对应的视频文本内容后,计算机设备还获取筛选出的视频片段对应的弹幕内容。具体地,计算机设备则将筛选出的视频文本内容以及对应的弹幕内容,输入至预训练的内容生成模型,通过内容生成模型,对视频文本内容和弹幕内容进行语义特征提取,获得视频语义特征。内容生成模型进而根据视频语义特征,生成目标文本内容。其中,内容生成模型中还可以预先配置视频文本内容和弹幕内容分别对应的权重,例如,视频文本内容的权重可以大于弹幕内容的权重,进而根据视频文本内容和弹幕内容分别对应的权重,得到该视频片段对应的视频语义特征,从而获得目标文本内容。通过内容生成模型根据视频文本内容生成对应的目标文本内容后,进一步根据目标文本内容生成与待推荐对象对应的推荐内容。由此能够有效地生成与视频文本内容和待推荐对象相匹配的推荐内容。本实施例中,通过利用预训练的内容生成模型,结合视频片段对应的视频文本内容和弹幕内容生成推荐内容,由此能够高效精准地生成与视频内容、弹幕内容以及待推荐对象高度关联和匹配的推荐内容,从而能够有效提高在视频内容中进行内容推荐的精准度。在一个实施例中,如图7所示,提供了另一种内容推荐方法,该方法包括以下步骤:s702,获取从视频内容划分出的至少两个视频片段。s704,基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度。s706,根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容。s708,将筛选出的视频文本内容和待推荐对象的描述信息,输入至预训练的内容生成模型。s710,通过内容生成模型对视频文本内容进行语义特征提取,获得视频语义特征。s712,对待推荐对象的描述信息进行语义特征提取,获得对象语义特征。s714,基于视频语义特征和对象语义特征,生成与待推荐对象对应的推荐内容。s716,根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。其中,待推荐对象的描述信息可以包括推荐对象标识、推荐对象名称等信息。计算机设备获取从视频内容划分出的至少两个视频片段,以及各视频片段对应的视频文本内容,根据各视频片段与待推荐对象之间的匹配度,筛选符合出推荐条件的视频片段以及对应的视频文本内容后,计算机设备将筛选出的视频文本内容和待推荐对象的描述信息作为预训练的内容生成模型的输入。具体地,计算机设备将筛选出的视频文本内容和待推荐对象的描述信息输入至内容生成模型。内容生成模型则分别对视频文本内容和描述信息进行语义特征提取。通过内容生成模型对视频文本内容进行语义特征提取,获得视频语义特征;并对待推荐对象的描述信息进行语义特征提取,获得对象语义特征。内容生成模型还可以进一步对视频语义特征和对象语义特征进行特征融合,得到目标语义特征,进而根据目标语义特征生成相应的目标文本内容。通过内容生成模型生成目标文本内容后,则可以直接将生成的目标文本内容确定为与待推荐对象对应的推荐内容。计算机设备进而根据筛选出的视频片段内容确定推荐时间点后,并在视频内容播放到推荐时间点时播放推荐内容。本实施例中,根据各视频片段与待推荐对象之间的匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容后,通过预训练的内容生成模型,结合视频文本内容和待推荐对象的描述信息生成推荐内容,从而能够高效精准地生成与视频内容和待推荐对象高度关联和匹配的推荐内容,由此能够在分析出的视频片段中,根据视频内容精准地进行内容推荐。在一个实施例中,内容生成模型通过训练步骤训练获得,该训练步骤包括:获取训练样本和训练标签;训练样本包括样本文本内容和样本推荐内容,训练标签是训练样本中样本文本内容与样本推荐内容之间的样本评分;基于训练样本和训练标签训练内容生成模型。其中,内容生成测模型是利用训练样本训练得到的。通过内容生成模型生成推荐内容之前,需要预先训练出所需的内容生成模型。训练样本包括样本文本内容和样本推荐内容,样本文本内容具体可以为从历史样本视频内容中获取的样本文本内容,也可以从预设数据库或第三方平台获取的样本文本内容。训练样本中还包括样本文本内容与样本推荐内容之间的样本评分,并将样本评分作为训练标签。样本评分具体可以是人工打分获得,还可以获取历史样本视频内容中的样本推荐内容,在历史时间段内真实的历史评分,将历史评分作为相应样本文本内容的样本评分。在训练内容生成模型的过程中,将样本文本内容作为用于训练的训练样本,将样本评分作为训练标签。训练标签用于对每次的训练结果进行调参等处理,以进一步训练和优化内容生成模型。训练样本可以是从预设样本库中获取的,也可以从各种平台中获取的,如视频播放网络、视频分享网络、各种网页等平台发布或分享的视频文本内容。具体地,计算机设备获取训练样本后,将训练样本中的样本文本内容,输入至预设的内容生成模型中进行训练,并利用训练标签对内容生成模型进行调参和优化,以训练出满足条件的内容生成模型。通过利用训练样本和训练标签训练内容生成模型,从而能够有效地获得具有文本内容生成能力的内容生成模型。在一个实施例中,如图8所示,为一个实施例中内容生成模型的训练步骤的流程示意图,具体包括以下内容:s802,获取训练样本和训练标签;训练样本包括样本文本内容和样本推荐内容,训练标签是训练样本中样本文本内容与样本推荐内容之间的样本评分。s804,通过内容生成模型,对样本文本内容进行语义特征提取,获得样本文本语义特征。s806,通过内容生成模型,根据样本文本语义特征,生成样本目标内容。s808,基于样本目标内容与训练标签的差异,调整内容生成模型的参数并继续训练,直至满足训练条件时停止训练。计算机设备获取训练样本和训练标签后,将训练样本中的样本文本内容输入至预设的内容生成模型后,通过内容生成模型对样本文本内容进行语义特征提取,获得样本文本语义特征。进一步通过内容生成模型,根据样本文本语义特征,生成样本目标内容。具体地,内容生成模型还可以包括输入层、编码层、解码层、连接层和输出层。计算机设备将样本文本内容输入至内容生成模型的输入层后,通过内容生成模型的输入层对样本文本内容进行嵌入处理,得到对应的嵌入表示。进而通过内容生成模型的编码层对样本文本内容的嵌入表示进行编码学习,将其编码成一个固定大小的状态向量,继而将状态向量传给解码层中的网络,解码层再通过对状态向量的学习,并通过连接层来连接相应的文本表示,进而得到样本目标文本表示,并通过输出层输出样本目标内容。计算机设备进而基于样本目标内容与样本标签的差异,调整内容生成模型的参数并继续训练,直至满足训练条件时停止训练。其中,样本目标内容与样本标签的差异可以损失函数来衡量,例如可以选择平均绝对值损失函数(mae)、平滑平均绝对误差(huber损失)、交叉熵损失函数等函数作为损失函数。训练条件是结束模型训练的条件。训练停止条件可以是达到预设的迭代次数,或者是调整参数后的内容生成模型的预测性能指标达到预设指标。在其中一个实施例中,内容生成模型中各层网络的参数可以在训练内容生成模型的过程中进行迁移学习,以对参数进行微调,比如可以采用fine-tune(微调)方式。计算机设备通过样本文本内容的样本语义特征进行样本内容生成训练,得到样本目标内容,进而可以根据得到的样本目标内容与训练标签的差异,逐步对点内容生成模型中的参数进行调整。由此在参数调整过程中,使得内容生成模型能够同时根据样本语义特征和样本推荐内容的语义特征,捕获样本文本内容与样本推荐内容的之间的关联关系和隐含关系,由此能够训练得到推荐内容生成的准确度较高的内容生成模型,从而提高了内容生成模型进行内容生成的准确性。在一个具体的实施例中,如图9所示,提供了一种具体的内容推荐方法,包括以下步骤:s902,识别视频内容中的视频文本内容。s904,基于视频文本内容,从视频内容划分出至少两个视频片段,并获得各视频片段对应的视频文本内容。s906,提取描述信息对应的对象关键词。s908,根据各视频文本内容提取各视频片段对应的视频关键词。s910,确定各视频关键词与对象关键词之间的语义相似度。s912,根据语义相似度,确定各视频片段与待推荐对象之间的匹配度。s914,根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容。s916,将筛选出的视频文本内容输入至预训练的内容生成模型。s918,通过内容生成模型,对视频文本内容进行语义特征提取,获得视频语义特征。s920,通过内容生成模型,根据视频语义特征,生成目标文本内容。s922,基于目标文本内容,生成与待推荐对象对应的推荐内容。s924,根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。本实施例中,通过根据各视频片段对应的视频文本内容和待推荐对象的描述信息之间的匹配度,能够精准地筛选出符合推荐条件的视频片段以及对应的视频文本内容,由此能够精准地确定视频内容中适合进行内容推荐的时频片段和时频文本内容。通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与待推荐对象对应的推荐内容,从而能够高效精准地生成与视频内容相关联的推荐内容。根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。由此能够在分析出的视频片段中,根据视频内容精准地进行内容推荐,从而有效提高了信息的推送效率和推送精准度。本申请还提供一种应用场景,该应用场景应用上述的内容推荐方法。具体地,该内容推荐方法在该应用场景的应用如下:计算机设备获取待处理的视频内容后,从视频内容划分出的至少两个视频片段以及各视频片段对应的视频文本内容;基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度;根据匹配度筛选出符合推荐条件的视频片段以及对应的视频文本内容。计算机设备进而通过预训练的内容生成模型根据筛选出的视频文本内容,生成与待推荐对象对应的推荐内容,根据筛选出的视频片段内容确定推荐时间点,并将推荐内容添加至视频内容的推荐时间点对应的位置。其中,推荐内容可以为预设格式的信息,例如文字、图形、图标、图文结合等格式。推荐内容还包括预设的显示位置、显示形式和显示时长等属性信息。例如,显示形式包括角标、压屏条等形式。当用户通过对应的用户终端浏览该添加了推荐内容的视频内容时,用户终端加载视频内容后,在用户终端中播放该视频内容后,并在视频内容播放到推荐时间点时,在视频内容的预设位置按照相应的显示形式,在视频内容中以插播的方式播放该推荐内容。由此能够精准有效地在视频内容中进行内容推荐。本申请还另外提供一种应用场景,该应用场景应用上述的内容推荐方法。具体地,该内容推荐方法在该应用场景的应用如下:计算机设备获取待处理的视频内容后,从视频内容划分出的至少两个视频片段以及各视频片段对应的视频文本内容;基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度;根据匹配度筛选出符合推荐条件的视频片段以及对应的视频文本内容。计算机设备进而通过预训练的内容生成模型根据筛选出的视频文本内容,生成与待推荐对象对应的推荐内容,根据筛选出的视频片段内容确定推荐时间点,并将推荐内容添加至视频内容的推荐时间点对应的位置。其中,推荐内容可以为弹幕推荐内容,弹幕推荐内容可以为预设格式的信息,例如文字、图形、图标、图文结合等格式。当用户通过对应的用户终端浏览该视频内容时,加载视频内容后,且用户终端开启弹幕显示功能后,在视频内容播放到推荐时间点时,在视频内容的弹幕区域播放推荐内容。由此能够精准有效地在视频内容的弹幕区域进行内容推荐。应该理解的是,虽然图2-3、6-9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3、6-9中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。在一个实施例中,如图10所示,提供了一种内容推荐装置1000,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:信息获取模块1002、内容匹配模块1004、内容生成模块1006和内容推荐模块1008,其中:信息获取模块1002,用于获取从视频内容划分出的至少两个视频片段;内容匹配模块1004,用于基于各视频片段对应的视频文本内容和待推荐对象的描述信息,确定各视频片段与待推荐对象之间的匹配度;根据匹配度,筛选符合推荐条件的视频片段以及对应的视频文本内容;内容生成模块1006,用于通过预训练的内容生成模型,基于筛选出的视频文本内容,生成与待推荐对象对应的推荐内容;内容推荐模块1008,用于根据筛选出的视频片段内容确定推荐时间点,并在视频内容播放到推荐时间点时播放推荐内容。在一个实施例中,信息获取模块1002还用于识别视频内容中的视频文本内容;基于视频文本内容,从视频内容划分出至少两个视频片段,并获得各视频片段对应的视频文本内容。在一个实施例中,视频文本内容包括字幕文本内容;信息获取模块1002还用于当视频内容中包括字幕文本内容时,根据字幕文本内容,从视频内容划分出至少两个视频片段;对字幕文本内容进行文本提取,获得各视频片段对应的视频文本内容。在一个实施例中,视频文本内容包括音频文本内容;信息获取模块1002还用于对视频内容进行音频识别,获得视频内容对应的音频文本内容;根据音频文本内容,从视频内容划分出至少两个视频片段;对音频文本内容进行文本提取,获得各视频片段对应的视频文本内容。在一个实施例中,内容匹配模块1004还用于提取描述信息对应的对象关键词;根据各视频文本内容提取各视频片段对应的视频关键词;确定各视频关键词与对象关键词之间的语义相似度;根据语义相似度,确定各视频片段与待推荐对象之间的匹配度。在一个实施例中,内容匹配模块1004还用于获取各视频片段对应的弹幕内容;根据各视频片段的视频文本内容和弹幕内容,确定各视频片段对应的视频关键词。在一个实施例中,内容生成模块1006还用于将筛选出的视频文本内容输入至预训练的内容生成模型;通过内容生成模型,对视频文本内容进行语义特征提取,获得视频语义特征;根据视频语义特征,生成目标文本内容;基于目标文本内容,生成与待推荐对象对应的推荐内容。在一个实施例中,内容生成模块1006还用于将目标文本内容和待推荐对象的描述信息进行拼接,生成与待推荐对象对应的推荐内容。在一个实施例中,内容生成模块1006还用于获取筛选出的视频片段对应的弹幕内容;将筛选出的视频文本内容和弹幕内容,输入至预训练的内容生成模型;通过内容生成模型,对视频文本内容和弹幕内容进行语义特征提取,获得视频语义特征;根据视频语义特征,生成目标文本内容;基于目标文本内容,生成与待推荐对象对应的推荐内容。在一个实施例中,内容生成模块1006还用于将筛选出的视频文本内容和待推荐对象的描述信息,输入至预训练的内容生成模型;通过内容生成模型对视频文本内容进行语义特征提取,获得视频语义特征;对待推荐对象的描述信息进行语义特征提取,获得对象语义特征;基于视频语义特征和对象语义特征,生成与待推荐对象对应的推荐内容。在一个实施例中,内容生成模型通过训练步骤训练获得,如图11所示,上述内容推荐装置还包括模型训练模块1001,用于获取训练样本和训练标签;训练样本包括样本文本内容和样本推荐内容,训练标签是训练样本中样本文本内容与样本推荐内容之间的样本评分;基于训练样本和训练标签训练内容生成模型。在一个实施例中,训练模块1001还用于通过内容生成模型,对样本文本内容进行语义特征提取,获得样本文本语义特征;通过内容生成模型,根据样本文本语义特征,生成样本目标内容;基于样本目标内容与训练标签的差异,调整内容生成模型的参数并继续训练,直至满足训练条件时停止训练。关于内容推荐装置的具体限定可以参见上文中对于内容推荐方法的限定,在此不再赘述。上述内容推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储视频内容、视频片段、视频文本内容、待推荐对象的描述信息以及推荐内容等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种内容推荐方法。本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-onlymemory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(randomaccessmemory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(staticrandomaccessmemory,sram)或动态随机存取存储器(dynamicrandomaccessmemory,dram)等。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1