信息推荐方法、装置、计算机可读介质及电子设备与流程

文档序号：15888517发布日期：2018-11-09 19:49阅读：202来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及数据处理技术领域，具体而言，涉及一种信息推荐方法、装置、计算机可读介质及电子设备。

背景技术

目前，相关技术中在将相同的内容推荐给用户时，展示出的摘要内容都是相同的，因此用户可能察觉不到推荐内容的感兴趣之处，进而不会点击观看内容全文，严重影响了推荐内容的点击率。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现要素：

本发明实施例的目的在于提供一种信息推荐方法、装置、计算机可读介质及电子设备，进而至少在一定程度上实现推荐信息的个性化展示，以提高推荐信息的点击率。

本发明的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本发明的实践而习得。

根据本发明实施例的一个方面，提供了一种信息推荐方法，包括：获取待推荐给用户的信息；根据所述用户的特征，确定向所述用户推荐所述信息时所采用的目标展示方案；基于所述目标展示方案向所述用户推荐所述信息。

根据本发明实施例的一个方面，提供了一种信息推荐装置，包括：第一获取单元，用于获取待推荐给用户的信息；处理单元，用于根据所述用户的特征，确定向所述用户推荐所述信息时所采用的目标展示方案；推荐单元，用于基于所述目标展示方案向所述用户推荐所述信息。

在本发明的一些实施例中，基于前述方案，所述处理单元包括：展示方案生成单元，用于根据所述信息生成多个候选展示方案；第二获取单元，用于获取各个所述候选展示方案的内容特征；展示方案选择单元，用于根据所述内容特征，从所述多个候选展示方案中选择与所述用户的特征相匹配的候选展示方案作为所述目标展示方案。

在本发明的一些实施例中，基于前述方案，所述展示方案生成单元包括：第一提取单元，用于提取所述信息中的文本内容；摘要及标题生成单元，用于根据所述文本内容，生成多个候选的摘要及标题。

在本发明的一些实施例中，基于前述方案，所述摘要及标题生成单元用于：针对所述文本内容的多个维度，生成与所述多个维度中每个维度对应的摘要及标题，以得到所述多个候选的内容摘要及标题。

在本发明的一些实施例中，基于前述方案，所述展示方案生成单元包括：第二提取单元，用于提取所述信息中的图片和/或视频；图片生成单元，用于根据所述图片和/或视频，生成多个候选图片。

在本发明的一些实施例中，基于前述方案，所述图片生成单元包括：第一生成单元，用于将从所述信息中提取的图片作为所述候选图片；和/或第二生成单元，用于从所述视频中提取至少一个关键帧，将所述至少一个关键帧作为所述候选图片。

在本发明的一些实施例中，基于前述方案，所述第二生成单元包括：聚类单元，用于将所述视频包含的图像帧进行聚类处理，得到至少一个类；图像帧选择单元，用于从每个所述类中选择距离聚类中心最近的图像帧作为所述关键帧。

在本发明的一些实施例中，基于前述方案，所述第二生成单元还包括：切分单元，用于在所述聚类单元将所述视频包含的图像帧进行聚类处理之前，将所述视频切分为至少一个镜头画面，并删除所述至少一个镜头画面之外的图像帧。

在本发明的一些实施例中，基于前述方案，所述切分单元包括：差别计算单元，用于依次计算所述视频中相邻两帧图像的差别；切分点确定单元，用于根据所述视频中相邻两帧图像的差别，确定所述视频中的镜头切分点；执行单元，用于基于确定的镜头切分点，将所述视频切分为至少一个镜头画面。

在本发明的一些实施例中，基于前述方案，所述切分点确定单元用于：在所述视频中的第l帧图像与第l-1帧图像的差别大于或等于第一阈值时，将所述第l-1帧图像与所述第l帧图像之间作为所述视频的一个镜头切分点，其中，所述l大于或等于2。

在本发明的一些实施例中，基于前述方案，所述切分点确定单元还用于：在所述第l帧图像与所述第l-1帧图像的差别小于所述第一阈值，且大于或等于第二阈值时，从所述视频中的所述第l帧图像开始，依次累加相邻两帧图像的差别；当所述第l帧图像与所述视频中的第l+n帧图像之间相邻两帧图像的差别总和大于或等于所述第一阈值，且所述第l+n帧图像与所述视频中的第l+n-1帧图像的差别小于所述第二阈值时，将所述第l帧图像和所述第l+n帧图像作为所述视频的镜头切分点，并将所述第l帧图像和所述第l+n帧图像之间的图像帧作为所述至少一个镜头画面之外的图像帧，其中，所述n大于或等于1。

在本发明的一些实施例中，基于前述方案，所述差别计算单元用于：依次计算所述视频中相邻两帧图像的灰度差值；或依次计算所述视频中相邻两帧图像的颜色直方图特征的差值；或依次计算所述视频中相邻两帧图像的边缘特征的差值。

在本发明的一些实施例中，基于前述方案，所述第二生成单元用于：从所述视频中提取包含有指定内容的图像帧作为所述关键帧。

在本发明的一些实施例中，基于前述方案，所述展示方案选择单元用于：获取经过训练的预测模型；基于所述用户的特征和所述内容特征，通过所述预测模型预测所述信息通过各个所述候选展示方案展示时被所述用户选择的概率；将对应的概率最高的候选展示方案作为所述目标展示方案。

在本发明的一些实施例中，基于前述方案，所述第一获取单元用于：根据所述用户的特征，从已有的信息库中匹配与所述用户的特征相对应的信息，并将匹配到的信息作为待推荐给所述用户的信息。

在本发明的一些实施例中，基于前述方案，所述的信息推荐装置还包括：推荐理由生成单元，用于生成向所述用户推荐所述信息的理由；所述推荐单元还用于将所述理由发送给所述用户。

根据本发明实施例的一个方面，提供了一种计算机可读介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述实施例中所述的信息推荐方法。

根据本发明实施例的一个方面，提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述实施例中所述的信息推荐方法。

在本发明的一些实施例所提供的技术方案中，通过获取待推荐给用户的信息，并根据用户的特征确定向用户推荐信息时所采用的目标展示方案，使得能够基于与用户的特征相匹配的展示方案来向用户推荐信息，实现了推荐信息的个性化展示，进而能够提高推荐的信息的点击率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了可以应用本发明实施例的信息推荐方法或信息推荐装置的示例性系统架构的示意图；

图2示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图；

图3示意性示出了根据本发明的一个实施例的信息推荐方法的流程图；

图4示出了根据本发明的一个实施例的推荐信息的显示效果示意图；

图5示意性示出了根据本发明的另一个实施例的信息推荐方法的流程图；

图6示意性示出了图5中所示的步骤s520的一种实现过程的流程图；

图7示意性示出了根据本发明的一个实施例的生成候选展示方案的流程图；

图8示意性示出了根据本发明的另一个实施例的生成候选展示方案的流程图；

图9示意性示出了根据本发明的一个实施例的从视频中提取关键帧的流程图；

图10示意性示出了根据本发明的一个实施例的将视频切分为至少一个镜头画面的流程图；

图11示意性示出了图6中所示的步骤s630的一种实现过程的流程图；

图12示意性示出了根据本发明的又一个实施例的信息推荐方法的流程图；

图13示意性示出了根据本发明的一个实施例的根据推荐内容确定个性化展示方案的流程图；

图14示意性示出了根据本发明的一个实施例的基于聚类的方案提取视频中的关键帧的流程图；

图15示意性示出了根据本发明的实施例的基于lr模型确定用户是否会点击推荐内容的流程图；

图16示意性示出了根据本发明的一个实施例的信息推荐装置的框图；

图17示意性示出了根据本发明的另一个实施例的信息推荐装置的框图；

图18示意性示出了根据本发明的一个实施例的处理单元的框图；

图19示意性示出了根据本发明的一个实施例的展示方案生成单元的框图；

图20示意性示出了根据本发明的另一个实施例的展示方案生成单元的框图；

图21示意性示出了根据本发明的一个实施例的图片生成单元的框图；

图22示意性示出了根据本发明的一个实施例的第二生成单元的框图；

图23示意性示出了根据本发明的另一个实施例的第二生成单元的框图；

图24示意性示出了根据本发明的一个实施例的切分单元的框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本发明将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本发明的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本发明的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

图1示出了可以应用本发明实施例的信息推荐方法或信息推荐装置的示例性系统架构100的示意图。

如图1所示，系统架构100可以包括终端设备101、102、103中的一种或多种，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器。例如服务器105可以在获取到待推荐给用户的信息之后，根据用户的特征确定向该用户推荐信息时所采用的展示方案，进而基于确定的展示方案将信息发送到用户的终端设备103(也可以是终端设备101或102)，由于信息的展示方案是与用户的特征相匹配的，因此实现了推荐信息的个性化展示，有利于提高推荐的信息的点击率。

同时，服务器105可以根据用户的特征来确定待推荐给用户的信息，这样能够确保向用户推荐的信息与用户自身的特征相匹配，提高了信息推荐的精确度。

需要说明的是，本发明实施例所提供的信息推荐方法一般由服务器105执行，相应地，信息推荐装置一般设置于服务器105中。

图2示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。

需要说明的是，图2示出的电子设备的计算机系统200仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图2所示，计算机系统200包括中央处理单元(cpu)201，其可以根据存储在只读存储器(rom)202中的程序或者从存储部分208加载到随机访问存储器(ram)203中的程序而执行各种适当的动作和处理。在ram203中，还存储有系统操作所需的各种程序和数据。cpu201、rom202以及ram203通过总线204彼此相连。输入/输出(i/o)接口205也连接至总线204。

以下部件连接至i/o接口205：包括键盘、鼠标等的输入部分206；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分207；包括硬盘等的存储部分208；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至i/o接口205。可拆卸介质211，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器210上，以便于从其上读出的计算机程序根据需要被安装入存储部分208。

特别地，根据本发明的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分209从网络上被下载和安装，和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(cpu)201执行时，执行本申请的系统中限定的各种功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如下述实施例中所述的方法。例如，所述的电子设备可以实现如图3、图5至图15所示的各个步骤。

以下对本发明实施例的技术方案的实现细节进行详细阐述：

在本发明的一个实施例中，在向用户推荐信息时，可以根据用户的个人特征和推荐内容的特征进行匹配，以找到最适合用户的信息进行推送。具体如图3所示，根据本发明的一个实施例的信息推荐方法(该信息推荐方法适用于前述实施例中所述的电子设备)，包括如下步骤：

步骤s310，提取用户特征。

在本发明的一个实施例中，用户特征是根据用户的社会属性、生活习惯和消费行为等信息抽象出的用户模型，比如可以基于用户的年龄、居住地、性别、工作、学校、兴趣爱好、收入等来确定用户特征。

步骤s320，提取内容特征。

在本发明的一个实施例中，可以基于内容的类别、内容的关键字、内容对应的游戏、内容受欢迎程度等来构建内容的特征。

需要说明的是，本发明的实施例对于步骤s310和步骤s320的执行先后顺序并不作具体限定，在实际执行时，既可以先执行步骤s310，再执行步骤s320；或者也可以先执行步骤s320，再执行步骤s310；也可以同时执行步骤s310和步骤s320。

步骤s330，用户特征和内容特征交叉组合。

在本发明的一个实施例中，可以建立一个推荐模型，并根据样本数据的特征来对该推荐模型进行训练，然后将步骤s310中提取出的用户特征和步骤s320中提取出的内容特征输入训练后的推荐模型，以根据训练后的推荐模型的输出结果来确定推荐结果。

步骤s340，生成推荐结果。

在本发明的一个实施例中，推荐模型的输出结果是一个概率值，在具体选择时，可以选择概率值最大的内容作为向用户推荐的结果。由于向用户推荐的内容是与用户的特征相匹配的，因此能够确保向用户推荐的内容更加符合用户的需求。

步骤s350，推荐内容展示。

在本发明的一个实施例中，如图4所示，当向用户推荐内容时，一般是展示内容的标题、摘要及缩略图，具体如图4中的402所示。因此，在向用户推荐内容时，不仅推荐的内容影响着用户是否会点击查看，而且如何呈现推荐的内容也会影响用户的决策，进而影响着推荐内容的点击率。

基于此，本发明的实施例提供了如下的优化方案：

图5示意性示出了根据本发明的另一个实施例的信息推荐方法的流程图，该信息推荐方法适用于前述实施例中所述的电子设备。参照图5所示，该信息推荐方法至少包括步骤s510至步骤s530，详细介绍如下：

在步骤s510中，获取待推荐给用户的信息。

在本发明的一个实施例中，待推荐给用户的信息可以是广告、游戏、文章、视频等。其中，待推荐给用户的信息针对所有用户而言可以是相同的内容，也可以是不同的内容。

比如，可以根据用户的特征从已有的信息库中匹配与用户的特征相对应的信息，并将匹配到的信息作为待推荐给所述用户的信息。在从信息库中匹配与用户的特征相对应的信息时可以参考上述图3所示的过程，即根据用户的特征和信息库中各个信息的特征来确定向用户推荐的信息，以满足不同用户的个性化需求，确保向各个用户推荐的信息能够与用户的自身特征相匹配，进而提高推荐的信息的精确度。

在步骤s520中，根据所述用户的特征，确定向所述用户推荐所述信息时所采用的目标展示方案。

在本发明的实施例中，通过根据用户的特征确定向用户推荐信息时所采用的目标展示方案，使得能够基于与用户的特征相匹配的展示方案来向用户推荐信息，实现了推荐信息的个性化展示，进而能够提高推荐的信息的点击率。对于步骤s520的实现细节将在以下内容中进行详细阐述。

继续参照图5所示，在步骤s530中，基于所述目标展示方案向所述用户推荐所述信息。

在本发明的一个实施例中，可以按照图4中所示的方式来向用户推荐信息，即可以通过缩略图、标题、摘要等形式来向用户推荐信息。由于本发明的实施例中可以针对不同的用户采用不同的展示方案，如同一信息向不同用户推荐时对应的缩略图、标题和摘要可能并不相同，因此实现了个性化的展示，有利于提高推荐的信息的点击率。比如，同样一个游戏视频，推荐给高级玩家时标题上可以强调操作的精彩程度，推荐给休闲玩家时标题上可以强调内容的有趣性；如果是英雄a的玩家，则缩略图可以截取英雄a在视频中的表现，如果是英雄b的玩家，则缩略图要选取能突出英雄b的画面，从而可以更加吸引用户来点击观看内容。

在本发明的一个实施例中，还可以生成向所述用户推荐所述信息的理由，并将生成的理由发送给所述用户。在本发明的实施例中，该理由可以是基于好友观看、用户关注点等生成的。

以下对图5中所示的步骤s520的实现细节进行详细阐述：

如图6所示，在本发明的一个实施例中，步骤s520中根据用户的特征，确定向所述用户推荐所述信息时所采用的目标展示方案的过程可以包括步骤s610至步骤s630，以下对各个步骤的实现细节进行详细阐述：

在步骤s610中，根据待推荐给用户的信息生成多个候选展示方案。

在本发明的一个实施例中，待推荐给用户的信息中可能包含有文本内容、图片和视频等，以下针对文本内容、图片和视频分别阐述如何生成上述的候选展示方案：

针对文本内容生成候选展示方案：

在本发明的一个实施例中，参照图7所示，根据本发明的一个实施例的生成候选展示方案的流程，包括：

步骤s710，提取待推荐给用户的信息中的文本内容。

在本发明的一个实施例中，可以基于文本识别技术来识别待推荐给用户的信息中包含的文本内容，然后提取出识别到的文本内容。

步骤s720，根据所述文本内容，生成多个候选的摘要及标题。

在本发明的一个实施例中，步骤s720中根据所述文本内容，生成多个候选的摘要及标题，包括：针对所述文本内容的多个维度，生成与所述多个维度中每个维度对应的摘要及标题，以得到所述多个候选的内容摘要及标题。

具体地，在本发明的一个实施例中，文本内容的多个维度可以包括信息维度(如突出待推荐信息中提到的不同角色)、用户维度(如突出待推荐信息被多个好友查看过)、传播维度(如突出待推荐信息的热度)、关键词维度(如突出待推荐信息中包含的一些热词)等。

需要说明的是，根据文本内容生成多个候选的摘要及标题的过程可以是通过机器学习的方法来自动生成的，比如建立机器学习模型，通过训练样本来对机器学习模型进行训练，进而基于训练后的模型来输出文本内容的候选摘要及标题。

在本发明的上述实施例中，通过根据待推荐给用户的信息中的文本内容生成多个候选的摘要及标题，以及根据待推荐给用户的信息中的图片和/或视频生成多个候选图片，使得能够自动生成多个候选展示方案，提高了候选展示方案的生成效率。

针对图片和/或视频生成候选展示方案：

在本发明的一个实施例中，参照图8所示，根据本发明的另一个实施例的生成候选展示方案的流程，包括：

步骤s810，提取待推荐给用户的信息中的图片和/或视频；

步骤s820，根据所述图片和/或视频，生成多个候选图片。

在本发明的一个实施例中，可以将从待推荐给用户的信息中提取的图片作为所述候选图片；和/或从待推荐给用户的信息包含的视频中提取至少一个关键帧，将所述至少一个关键帧作为所述候选图片。

在本发明的一个实施例中，可以从视频中提取包含指定内容的图像帧作为关键帧，比如从视频中提取包含某一角色的图像帧作为关键帧。

在本发明的另一个实施例中，可以通过对视频中包含的图像帧进行聚类处理来得到关键帧，具体过程如图9所示，包括如下过程：

步骤s910，将所述视频包含的图像帧进行聚类处理，得到至少一个类。

在本发明的实施例中，进行聚类处理的算法可以采用层次聚类算法、k-means算法、k-medoids算法等。比如在采用k-means算法时，聚类过程包括如下步骤：

(1)从视频包含的图像帧中任意选择k个对象作为初始聚类中心；

(2)计算各个图像帧与这k个聚类中心的距离，并根据最小距离重新对各个图像帧所属的类进行划分；

(3)重新计算每个聚类的聚类中心；

(4)计算标准测度函数，当满足一定条件，如函数收敛时，则算法终止；如果条件不满足则回到上述步骤(2)。

步骤s920，从每个所述类中选择距离聚类中心最近的图像帧作为所述关键帧。

需要说明的是，由于视频中包含多个镜头的画面，而镜头画面的切换过程中会加入一些空间或者时间上的编辑效果，如淡入淡出等，因此在本发明的一个实施例中，在步骤s910之前，即将所述视频包含的图像帧进行聚类处理之前，还可以包括：将所述视频切分为至少一个镜头画面，并删除所述至少一个镜头画面之外的图像帧。

在该实施例中，通过将视频切分为至少一个镜头画面，并删除镜头画面之外的图像帧，使得能够删除一些在空间或时间上的效果画面，如淡入淡出画面，进而能够减少视频中的效果画面在聚类处理时造成的影响，以保证通过聚类确定的关键帧能够反映视频的实质内容。

在本发明的一个实施例中，如图10所示，根据本发明的一个实施例的将视频切分为至少一个镜头画面的流程，包括步骤s101至步骤s103，各个步骤详细阐述如下：

在步骤s101中，依次计算所述视频中相邻两帧图像的差别。

在本发明的一个实施例中，步骤s101中依次计算所述视频中相邻两帧图像的差别可以是计算视频中相邻两帧图像的灰度差值，也可以是计算相邻两帧图像的颜色直方图特征的差值，还可以是计算相邻两帧图像的边缘特征的差值。

在步骤s102中，根据所述视频中相邻两帧图像的差别，确定所述视频中的镜头切分点。

在本发明的一个实施例中，确定视频中的镜头切分点的过程可以包括：若所述视频中的第l帧图像与第l-1帧图像的差别大于或等于第一阈值，则将所述第l-1帧图像与所述第l帧图像之间作为所述视频的一个镜头切分点，其中，所述l大于或等于2。

在该实施例中，当相邻两帧图像的差别较大时，说明镜头发生了切换，因此可以将第l-1帧图像与第l帧图像之间作为一个镜头切分点。

在本发明的一个实施例中，确定视频中的镜头切分点的过程还可以包括：若所述第l帧图像与所述第l-1帧图像的差别小于所述第一阈值，且大于或等于第二阈值，则从所述视频中的所述第l帧图像开始，依次累加相邻两帧图像的差别；当所述第l帧图像与所述视频中的第l+n帧图像之间相邻两帧图像的差别总和大于或等于所述第一阈值，且所述第l+n帧图像与所述视频中的第l+n-1帧图像的差别小于所述第二阈值时，将所述第l帧图像和所述第l+n帧图像作为所述视频的镜头切分点，并将所述第l帧图像和所述第l+n帧图像之间的图像帧作为所述至少一个镜头画面之外的图像帧，其中，所述n大于或等于1。

在该实施例中，当第l帧图像与第l-1帧图像的差别小于第一阈值，且大于或等于第二阈值时，说明从第l帧开始是镜头渐变切换的开始位置；当第l帧图像与第l+n帧图像之间相邻两帧图像的差别总和大于或等于第一阈值，且第l+n帧图像与第l+n-1帧图像的差别小于第二阈值时，说明第l+n帧图像是镜头渐变切换的结束位置，因此可以将第l帧图像和第l+n帧图像作为视频的镜头切分点，并将第l帧图像和第l+n帧图像之间的图像帧作为所述至少一个镜头画面之外的图像帧。

继续参照图10所示，在步骤s103中，基于确定的镜头切分点，将所述视频切分为至少一个镜头画面。

在本发明的实施例中，在将视频切分为至少一个镜头画面之后，可以对得到的至少一个镜头画面中包含的图像帧进行聚类处理，以基于聚类结果获取到视频中的关键帧。

继续参照图6所示，在步骤s620中，获取各个所述候选展示方案的内容特征。

在本发明的一个实施例中，候选展示方案可以包括标题、摘要和缩略图，候选展示方案的内容特征即为标题特征、摘要特征和图片特征等。

继续参照图6所示，在步骤s630中，根据所述内容特征，从所述多个候选展示方案中选择与所述用户的特征相匹配的候选展示方案作为所述目标展示方案。

在本发明的一个实施例中，参照图11所示，步骤s630可以包括：

步骤s111，获取经过训练的预测模型。

在本发明的一个实施例中，可以根据样本数据来对预测模型进行训练，训练后的预测模型的输出结果是一个概率值。

步骤s112，基于所述用户的特征和所述内容特征，通过所述预测模型预测所述信息通过各个所述候选展示方案展示时被所述用户选择的概率；

步骤s113，将对应的概率最高的候选展示方案作为所述目标展示方案。

在该实施例中，由于选择的目标展示方案是预测模型预测到的概率最高的展示方案，因此能够基于与用户的特征相匹配的展示方案来向用户推荐信息，实现了推荐信息的个性化展示，进而能够提高向用户推荐的信息的点击率。

以上对本发明实施例的技术方案及实现细节进行了详细阐述，以下以向用户推荐包含有文本、图片和视频的内容为例，对本发明实施例的信息推荐方案的一个具体应用场景进行说明。

在本发明的一个具体应用场景中，如图12所示，根据本发明的又一个实施例的信息推荐方案，主要包括如下过程：

步骤s121，将内容特征输入至推荐模型。

在本发明的一个实施例中，可以将内容库(即存储待推荐内容的数据库)中的各个内容通过特征工程(特征工程是利用数据领域的相关知识来创建能够使算法达到最佳性能的特征的过程)来获取到内容特征。

步骤s122，将用户画像输入至推荐模型。

在本发明的一个实施例中，可以通过特征工程来获取到用户的特征，进而构建用户画像。

需要说明的是，本发明的实施例对于步骤s121和步骤s122的执行先后顺序并不作具体限定，在实际执行时，既可以先执行步骤s121，再执行步骤s122；或者也可以先执行步骤s122，再执行步骤s121；也可以同时执行步骤s121和步骤s122。

在本发明的一个实施例中，推荐模型是通过样本数据(样本数据可以根据历史数据获得)训练过的机器学习模型。

步骤s123，推荐模型根据输入的内容特征和用户画像输出推荐内容。

步骤s124，将推荐内容输入至展示模型。

步骤s125，将用户画像输入至展示模型。

需要说明的是，本发明的实施例对于步骤s124和步骤s125的执行先后顺序并不作具体限定，在实际执行时，既可以先执行步骤s124，再执行步骤s125；或者也可以先执行步骤s125，再执行步骤s124；也可以同时执行步骤s124和步骤s125。

在本发明的一个实施例中，展示模型也是通过样本数据(样本数据可以根据历史数据获得)训练过的机器学习模型。

步骤s126，展示模型根据输入的推荐内容和用户画像输出个性化的展示内容，即基于用户画像，通过展示模型来确定推荐内容的展示方案，如展示什么缩略图、展示什么标题和摘要、向用户推荐的理由等。

图12中所示的流程包含了确定推荐内容的过程和根据推荐内容确定个性化展示方案的过程，其中，确定推荐内容的过程可以参照图3所示，根据推荐内容确定个性化展示方案的过程可以参照图13所示，具体包括如下步骤：

步骤s131，通过特征工程获取到用户画像。

步骤s132，将推荐内容分为文本和图片/视频。

步骤s133，针对文本生成文本摘要和标题。

在本发明的一个实施例中，可以从不同的角度来生成多个摘要和标题，以作为展示文本的候选。其中，不同的角度是用于突出文本的不同侧面，例如针对一篇文章，可以通过以下维度来生成内容摘要：

a)信息维度：如突出文章中提到的不同角色

b)用户维度：如突出文章被多个好友看过

c)传播维度：如突出文章的热度

d)关键词维度：如突出文章的一些热词

需要说明的是，在本发明的实施例中，生成的摘要及标题既可以是由人工生成的，也可以通过机器学习的方法来自动生成。

步骤s134，根据图片/视频生成图片摘要。该过程主要包括针对图片生成候选图片的过程和针对视频生成候选图片的过程。

在本发明的一个实施例中，如果推荐内容中包含有多个图片，则可以将这些图片作为展示用的候选图片，以针对不同的用户展示不同的图片。

在本发明的一个实施例中，对于推荐内容中包含的视频，可以从视频中提取多个关键帧，将提取出的多个关键帧作为展示用的候选图片。

在本发明的实施例中，在提取视频中的关键帧时，可以采用基于镜头的方法、基于运动分析的方法、基于聚类的方法等。其中，基于镜头的方法是将视频分为多个镜头画面，从各个镜头画面中选取一个或多个关键帧；基于运动分析的方法是确定视频中相邻图像帧之间的变化幅度，若变化幅度较大，则作为不同的类，如果变化幅度较小，则作为相同的类，然后从各个类中选取一个或多个关键帧。

以下详细介绍基于聚类的方法：

具体过程参照图14所示，主要包括步骤s141和步骤s142。

在步骤s141中，将视频分割为多个镜头画面。

在本发明的实施例中，将视频分割成多个镜头画面，主要是寻找视频镜头的边界，一个镜头画面是描绘同一场景的一个事件或连续的动作，因此当镜头画面发生变化的时候，图像帧之间发生的变化会比较大，而在同一个镜头画面内的图像帧的差别会比较小，因此可以通过判断相邻两帧图像的差别来判断是否属于同一个镜头画面。

在本发明的一个实施例中，两帧图像之间的差别可以通过计算灰度差的方法来得到，具体如公式1所示：

在公式1中，dis表示两帧图像之间的差别；m表示两帧图像i1和i2的像素数；x和y表示图像i1和i2对应的像素点的位置。

在本发明的其它实施例中，两帧图像之间的差别也可以通过比较两帧图像的颜色直方图特征和边缘特征等方法来得到。

由于镜头的变换包括：突变和渐变。突变是指视频中直接从一个镜头转换成下一个镜头；渐变是指在镜头在切换过程中加入一些空间或者时间上的编辑效果，如淡入淡出等。因此在通过比较图像帧之间的差别来确定镜头是否切换时，可以使用双阈值比较法来确定，具体方案如下：

步骤(1)，对于视频中的第l帧，计算当前帧(即第l帧)和前一帧(即第l-1帧)的帧间差dis(il,il-1)；然后转到步骤(2)。

步骤(2)，如果当前帧间差(即上述的dis(il,il-1))大于阈值t1，则认为该帧(即第l帧)是镜头突变的切换帧，然后进行镜头切割。如果当前帧间差小于阈值t1，但是大于阈值t2，则认为该帧(即第l帧)是镜头渐变切换的开始位置，转到步骤(3)；如果当前帧间差小于阈值t2，则认为该帧(即第l帧)不是镜头分割的位置，转回步骤(1)。

步骤(3)，从第l+1帧开始，计算每一帧的当前帧间差，并累加相邻两帧的帧间差。如果计算到第l+n帧时，累加的帧间差大于阈值t1，并且当前帧间差(即dis(il+n,il+n-1))小于阈值t2，则认为该帧(即第l+n帧)是镜头渐变切换的结束位置，进行镜头切割。如果累加的帧间差小于阈值t1，并且当前帧间差(即dis(il+n,il+n-1))也小于阈值t2，则认为这不是一次镜头渐变切换，转到步骤(1)继续计算，直到将视频中的图像帧全部遍历完成为止。

在上述实施例中，通过对视频进行镜头切分，使得能够将视频中包含的渐变图像帧(即渐变切换的开始位置和结束位置之间的图像帧)删除掉，以避免后续在提取关键帧时由于渐变图像帧的存在而导致提取的关键帧不准确的问题。

在步骤s142中，从分割得到的镜头图像中提取关键帧。

在本发明的实施例中，可以对得到的多个镜头中的每一帧图像都提取图像特征(比如颜色特征、直方图特征、形状特征、运动特征等)，然后基于k-means方法把所有图像帧分成k类，最后在每一类中选取离聚类中心最近的一帧作为该类的关键帧。

需要说明的是，在进行聚类处理时，也可以采用其它的聚类算法，比如层次聚类算法、k-medoids算法等。

继续参照图13所示，根据推荐内容确定个性化展示方案的过程还可以包括：

步骤s135a，将用户画像输入至机器学习模型；步骤s135b，将确定的候选摘要及标题输入至机器学习模型；步骤s135c，将确定的候选图片输入至机器学习模型。其中，本发明的实施例不对步骤s135a、步骤s135b和步骤s135c的执行顺序进行严格限定。

步骤s136，机器学习模型根据用户画像、候选摘要及标题、候选图片输出个性化的推荐内容展示方案。

在本发明的一个实施例中，可以根据用户画像得到用户特征，对候选摘要及标题提取文本特征，对候选图片提取颜色直方图等特征，然后对各项特征进行交叉，使用lr模型(logisticregression，逻辑回归)预测用户点击该推荐内容的概率。其中，摘要及标题的文本特征包括基于tf-idf(termfrequency–inversedocumentfrequency，一种用于信息检索与数据挖掘的常用加权技术)的bagofword特征和doc2vec特征等。

上述过程可以参照图15所示，主要包括：步骤s152a，将用户特征输入至lr模型；步骤s152b，将文本特征输入至lr模型；步骤s152c，将图片特征输入至lr模型。步骤s154，通过lr模型确定用户是否会点击推荐的内容。其中，本发明的实施例不对步骤s152a、步骤s152b和步骤s152c的执行顺序进行严格限定。

其中，lr模型的输出是用户点击该推荐内容的概率，因此对于推荐内容的每个候选方案(即通过哪个候选摘要及标题、通过哪个候选图片进行展示)，都可以得到一个用户是否点击的概率，进而可以选择概率最高的展示方案作为最终展示推荐内容的方案即可。

在本发明的一个实施例中，在通过上述的lr模型输出各个候选方案的概率之前，需要对lr模型进行训练。其中，对lr模型进行训练的过程如下：

首先，根据历史数据处理得到一组训练数据d：

d＝(x¹,y¹),(x²,y²)…(xⁿ,yⁿ)

其中，x代表一个m维特征向量(包括用户特征和推荐内容的特征)；y代表用户是否会点击该内容，1表示会点击，0表示不会点击。

模型训练的目的是希望找到一个函数f，使得损失函数的值最小。在lr模型下，这个函数被定义为：

基于上述函数，模型训练的目标就是要找到一组能够最小化损失函数的参数θ，然后应用这组参数来对新的数据进行预测。

需要说明的是，上述实施例中以lr模型进行预测为例进行了说明，在本发明的其它实施例中，也可以选取lr之外的机器学习算法，如神经网络算法、随机森林算法等，具体可以基于现有的数据和应用场景来进行选取。

同时，上述实施例是以向用户推荐包含有文本、图片和视频的内容为例来说明本发明实施例的信息推荐方案的一个具体应用场景，在本发明的其它应用场景中，还可以对广告信息进行推荐、对游戏进行推荐等，不管对哪种信息进行推荐，在应用本发明实施例的信息推荐方案之后，都能够基于与用户的特征相匹配的展示方案来向用户推荐信息，实现了推荐信息的个性化展示，进而能够提高推荐的信息的点击率。

以下介绍本发明的装置实施例，可以用于执行本发明上述实施例中的信息推荐方法。对于本发明装置实施例中未披露的细节，请参照本发明上述的信息推荐方法的实施例。

图16示意性示出了根据本发明的一个实施例的信息推荐装置的框图。

参照图16所示，根据本发明的一个实施例的信息推荐装置160，包括：第一获取单元161、处理单元162和推荐单元163。

其中，第一获取单元161用于获取待推荐给用户的信息；处理单元162用于根据所述用户的特征，确定向所述用户推荐所述信息时所采用的目标展示方案；推荐单元163用于基于所述目标展示方案向所述用户推荐所述信息。

图17示意性示出了根据本发明的另一个实施例的信息推荐装置的框图。

参照图17所示，根据本发明的另一个实施例的信息推荐装置170，在图16所示的信息推荐装置的基础上，还包括：推荐理由生成单元164。

其中，推荐理由生成单元164用于生成向所述用户推荐所述信息的理由；所述推荐单元163还用于将所述理由发送给所述用户。

在本发明的一些实施例中，图16和图17中所示的第一获取单元161用于：根据所述用户的特征，从已有的信息库中匹配与所述用户的特征相对应的信息，并将匹配到的信息作为待推荐给所述用户的信息。

参照图18所示，在本发明的一个实施例中，图16和图17中所示的处理单元162包括：展示方案生成单元1621、第二获取单元1622和展示方案选择单元1623。

其中，展示方案生成单元1621，用于根据所述信息生成多个候选展示方案；第二获取单元1622，用于获取各个所述候选展示方案的内容特征；展示方案选择单元1623，用于根据所述内容特征，从所述多个候选展示方案中选择与所述用户的特征相匹配的候选展示方案作为所述目标展示方案。

在本发明的一些实施例中，基于前述方案，所述展示方案选择单元1621用于：获取经过训练的预测模型；基于所述用户的特征和所述内容特征，通过所述预测模型预测所述信息通过各个所述候选展示方案展示时被所述用户选择的概率；将对应的概率最高的候选展示方案作为所述目标展示方案。

参照图19所示，在本发明的一个实施例中，展示方案生成单元1621包括：第一提取单元191和摘要及标题生成单元192。

其中，第一提取单元191用于提取所述信息中的文本内容；摘要及标题生成单元192用于根据所述文本内容，生成多个候选的摘要及标题。

在本发明的一些实施例中，基于前述方案，摘要及标题生成单元192用于：针对所述文本内容的多个维度，生成与所述多个维度中每个维度对应的摘要及标题，以得到所述多个候选的内容摘要及标题。

参照图20所示，在本发明的另一个实施例中，展示方案生成单元1621包括：第二提取单元193和图片生成单元194。

其中，第二提取单元193用于提取所述信息中的图片和/或视频；图片生成单元194用于根据所述图片和/或视频，生成多个候选图片。

需要说明的是，在本发明的又一个实施例中，展示方案生成单元1621可以包括上述的第一提取单元191、摘要及标题生成单元192、第二提取单元193和图片生成单元194。

参照图21所示，在本发明的一个实施例中，图片生成单元194包括：第一生成单元1941和/或第二生成单元1942。

其中，第一生成单元1941用于将从所述信息中提取的图片作为所述候选图片；第二生成单元用于从所述视频中提取至少一个关键帧，将所述至少一个关键帧作为所述候选图片。

参照图22所示，在本发明的一个实施例中，第二生成单元1942包括：聚类单元221和图像帧选择单元222。

其中，聚类单元221用于将所述视频包含的图像帧进行聚类处理，得到至少一个类；图像帧选择单元222用于从每个所述类中选择距离聚类中心最近的图像帧作为所述关键帧。

参照图23所示，在本发明的另一个实施例中，第二生成单元1942在具有聚类单元221和图像帧选择单元222的基础上，还包括：切分单元223，用于在所述聚类单元221将所述视频包含的图像帧进行聚类处理之前，将所述视频切分为至少一个镜头画面，并删除所述至少一个镜头画面之外的图像帧。

参照图24所示，在本发明的一个实施例中，切分单元223包括：差别计算单元2231、切分点确定单元2232和执行单元2233。

其中，差别计算单元2231用于依次计算所述视频中相邻两帧图像的差别；切分点确定单元2232用于根据所述视频中相邻两帧图像的差别，确定所述视频中的镜头切分点；执行单元2233用于基于确定的镜头切分点，将所述视频切分为至少一个镜头画面。

在本发明的一些实施例中，基于前述方案，所述切分点确定单元2232用于：在所述视频中的第l帧图像与第l-1帧图像的差别大于或等于第一阈值时，将所述第l-1帧图像与所述第l帧图像之间作为所述视频的一个镜头切分点，其中，所述l大于或等于2。

在本发明的一些实施例中，基于前述方案，所述切分点确定单元2232还用于：在所述第l帧图像与所述第l-1帧图像的差别小于所述第一阈值，且大于或等于第二阈值时，从所述视频中的所述第l帧图像开始，依次累加相邻两帧图像的差别；当所述第l帧图像与所述视频中的第l+n帧图像之间相邻两帧图像的差别总和大于或等于所述第一阈值，且所述第l+n帧图像与所述视频中的第l+n-1帧图像的差别小于所述第二阈值时，将所述第l帧图像和所述第l+n帧图像作为所述视频的镜头切分点，并将所述第l帧图像和所述第l+n帧图像之间的图像帧作为所述至少一个镜头画面之外的图像帧，其中，所述n大于或等于1。

在本发明的一些实施例中，基于前述方案，所述差别计算单元2231用于：依次计算所述视频中相邻两帧图像的灰度差值；或依次计算所述视频中相邻两帧图像的颜色直方图特征的差值；或依次计算所述视频中相邻两帧图像的边缘特征的差值。

在本发明的一些实施例中，基于前述方案，所述第二生成单元1942用于：从所述视频中提取包含有指定内容的图像帧作为所述关键帧。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本发明实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是cd-rom，u盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：苏博览;杜家春;殷俊;程川;王锐;汪洋;江小琴;展俊领;薛扣英
技术所有人：腾讯科技(深圳)有限公司
我是此专利的发明人

上一篇：平行语句库的创建方法、设备及计算机可读存储介质与流程
上一篇：基于k-d树的LOF离群点检测方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。