内容的显示方法及装置、电子设备和可读存储介质与流程

文档序号:26347644发布日期:2021-08-20 20:19阅读:73来源:国知局
内容的显示方法及装置、电子设备和可读存储介质与流程

本发明涉及计算机技术领域,特别是涉及内容的显示方法及装置、电子设备和可读存储介质。



背景技术:

目前,在应用程序(app)互动区域的话题页面中,用户可以对话题进行评论,以及对评论进行回复和点赞。进而可以通过评论的回复数或点赞数对该话题的多个评论进行排序并显示排序结果,即将点赞数和回复数多的排序靠前,以便用户浏览当前热度较高的评论。但是,在实际app的互动区域的评论区域排序的对象可以是多种话题的内容,但现有技术也仅针对评论进行排序。可见,目前在app的在互动区域中,即使与该场景相关的内容可以有多个,但也只针对与该场景相关的一类内容进行排序,导致互动效果较弱。



技术实现要素:

本发明实施例的目的在于提供一种内容的显示方法及装置、电子设备和可读存储介质,解决了现有技术中在app的互动区域只针对与该场景相关的一类内容进行排序的问题。具体技术方案如下:

在本发明实施的第一方面,首先提供了一种内容的显示方法,包括:获取待显示内容,所述待显示内容包括第一内容与第二内容,所述第一内容为目标视频的互动区域的互动内容,所述第二内容是与所述第一内容相关联的互动内容;获取所述待显示内容的特征数据;利用所述特征数据,对所述待显示内容进行混合排序,得到混合排序结果;按照所述混合排序结果,在所述互动区域显示所述待显示内容。

在本发明实施的第二方面,还提供了一种内容的显示装置,包括:第一获取模块,用于获取待显示内容,所述待显示内容包括第一内容与第二内容,所述第一内容为目标视频的互动区域的互动内容,所述第二内容是与所述第一内容相关联的互动内容;第二获取模块,用于获取所述待显示内容的特征数据;排序模块,用于利用所述特征数据,对所述待显示内容进行混合排序,得到混合排序结果;显示模块,用于按照所述混合排序结果,在所述互动区域显示所述待显示内容。

在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的内容的显示方法。

在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的内容的显示方法。

在本申请实施例提供的内容的显示方式中,目标视频互动区域的待显示内容包括第一内容以及与其相关联的第二内容,对此,举例来说,第一内容可以是评论,第二内容可以是百科,如演职人员的百科;又或者,第一内容是图片和文本组合的信息流,第二内容为目标视频的关联视频。可见,待显示内容中具有关联关系的第一内容和第二内容可以是不同场景下的不同内容。进一步可以利用待显示内容的特征数据对待显示内容进行混合排序。换言之,在本申请中并不是仅针对同一场景下的同一内容进行单一排序,而是可以针对不同场景下的不同内容进行混合排序,进而显示该混合排序的结果。由此可见,通过本申请可以对待显示内容中的相关联的第一内容和第二内容进行混合排序,并显示混合排序结果,丰富了app的互动区域中内容的排序方式,而且也提升了用户在互动区域的互动效果,从而解决了现有技术中在app的互动区域只针对与该场景相关的一类内容进行排序的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例中内容的显示方法的流程图;

图2为本发明实施例中内容的显示装置的结构示意图;

图3为本发明实施例中电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

本申请实施例提供了一种内容的显示方法,如图1所示,该方法的步骤包括:

步骤102,获取待显示内容,待显示内容包括第一内容与第二内容,第一内容为目标视频的互动区域的互动内容,第二内容是与第一内容相关联的互动内容;

步骤104,获取待显示内容的特征数据;

步骤106,利用特征数据,对待显示内容进行混合排序,得到混合排序结果;

步骤108,按照混合排序结果,在互动区域显示待显示内容。

通过上述步骤102至步骤108可知,目标视频互动区域的待显示内容包括第一内容以及与其相关联的第二内容,对此,举例来说,第一内容可以是评论,第二内容可以是百科,如演职人员的百科;又或者,第一内容是图片和文本组合的信息流,第二内容为目标视频的关联视频。可见,待显示内容中具有关联关系的第一内容和第二内容可以是不同场景下的不同内容。进一步可以利用待显示内容的特征数据对待显示内容进行混合排序。换言之,在本申请中并不是仅针对同一场景下的同一内容进行单一排序,而是可以针对不同场景下的不同内容进行混合排序,进而显示该混合排序的结果。由此可见,通过本申请可以对待显示内容中的相关联的第一内容和第二内容进行混合排序,并显示混合排序结果,丰富了app的互动区域中内容的排序方式,而且也提升了用户在互动区域的互动效果,从而解决了现有技术中在app的互动区域只针对与该场景相关的一类内容进行排序的问题。

在本申请实施例的可选实施方式中,本申请实施例中的第一内容与第二内容可以通过以下至少一项相关联:话题、演职人员、视频属性信息、视频原著作品信息。

其中,在本申请实施例中,对于话题,如果目标视频为电视剧,则用户可以根据该电视剧的剧情发展设置与某一故事情节走向相关的话题。或者是在该电视剧的每一集播放之前,设置了一个与当前播放集的剧情相关的话题,每一集更新后,后台服务器可以在观看该集的互动区域中自动链接出该话题。又或者,可以根据当前电视剧的热度,从被讨论较多的话题中选择一个话题。可见,本申请实施例中话题可以是由用户自主设置,或者是事先通过后台设置与目标视频相关联的话题,又或者是根据目前该目标视频讨论话题中根据话题热度确定。也就是说,第一内容和第二内容可以基于上述方式设置的话题相关联。当然,上述设置话题的方式也仅仅是举例说明,也可以根据实际情况采用其他方式设置。

对于演职人员而言,在本申请实施例中可以是指目标视频的主演,当然也可以是非主演人员,具体是什么类型的演职人员可以根据实际情况确定,例如当前目标视频中的主演演技比较好,互联网上讨论热度非常高,则此时可以将主演人员确定该第一内容与第二内容相关联的演职人员。又或者,如果该目标视频中的某一非主演人员,其在该目标视频中的表现非常好,演技代入感很强,也可以将该非主演人员确定为第一内容与第二内容相关联的演职人员。当然也可以是其他演职人员,如导演、群演等等。具体是哪一类或哪一个演职人员可以根据实际需求设置,在本申请中对其并不限制。

对于视频属性信息,在本申请中可以包括但不限于:类型、集数、语种、年代、流量指数等至少一种。其中,类型可以包括:长视频、短视频。而长视频和短视频中所包括的视频类型进一步可以是:综艺、电视、电影、视频流。进一步综艺、电视、电影以及视频流所包括的视频类型进一步细分为:偶像爱情、古装历史、玄幻史诗、都市生活、当代主旋律、罪案谍战、喜剧、体育竞技等等。集数可以是几集、十几集、几十集等,具体根据目标视频确定。语种可以包括但不限于:中文、英文、韩语、日语等。年代可以包括视频的播放年代或视频剧情发生的年代,例如上世纪80年代播放的视频、或者当前播放的视频讲述的是上世纪80年代的故事。流量指数可以通过当前视频的播放量与其他视频的播放量确定,或者视频播放的同一时段的收视指数,或者是通过当前在互联网中被讨论的次数与其他视频讨论的次数确定等等。

基于上述对话题、演职人员、视频属性信息、视频原著作品信息的解释说明,在本申请的示例中,在第一内容为与当前播放的电视剧的相关的评论,且该评论中包括对当前播放的电视剧的主演的演技进行评述的情况下,该第二内容可以是与第一内容通过演职人员关联的百科,即第二内容为该主演的百科信息。又例如,在第一内容为与当前播放的电视剧的相关的评论,且该评论中包括对当前播放的电视剧的剧情进行评述的情况下,该第二内容可以是与第一内容通过视频原著作品信息关联的关联视频,即同一部原著作品翻拍成了多部电视剧,第二内容为翻拍中除当前播放的电视剧外的其他电视剧。上述是确定第一内容所包括的内容,然后通过关联关系确定第二内容。也可以是先确定第二内容所包括的内容,然后通过关联关系确定第一内容,至于具体第一内容和第二内容所包括的内容可以根据实际情况确定或设置。

在本申请的示例中,待显示内容可以包括但不限于:评论、百科、图片和文本组合的信息流、目标视频的关联视频。基于此,在本申请实施例的可选实施方式中,本申请实施例中的特征数据包括先验特征数据和后验特征数据中的至少一项。

其中,先验特征数据用于表征待显示内容的多维度特征。例如,待显示内容中包括文本,则该先验特征可以包括文本长度、文本的通顺度、本文来源、文本中文字符数。或者待显示内容包括图片,则该先验特征可以包括:图片数、图片的清晰度等。此外,如果待显示内容中如果还包括其他内容,则可以从该其他内容的多个维度以确定其对应的先验特征。

后验特征数据用于表征用户对待显示内容的感兴趣情况。其中,该用户对待显示内容的感兴趣情况可以通过以下来表示:用户对待显示内容的历史评论数、近期评论数、历史点赞率、近期点赞率、历史阅读数等。当然,上述仅仅是举例说明,还可以是阅读数、踩数、更新时间等等。至于具体的用户对待显示内容的感兴趣情况可以根据实际情况设置,在本申请中对此不做限定。

基于上述先验特征数据和后验特征数据,在本申请实施例中,在待显示内容包括评论的情况下,特征数据还可以包括:第一先验特征数据和/或第一后验特征数据;

其中,第一先验特征数据包括以下至少一种:评论的文本长度、通过文本质量分数模型确定的文本的质量分数、文本的通顺度、文本的重复度、文本的中文字符数、文本的嵌入表达;

需要说明的是,不同的评论对应不同的文本长度,如评论1“剧情好烧脑,有没有同感的”,评论2“好精彩”,评论3“好想一直不停看到大结局”。文本的长度为评论中文字数量之和,或者是每一个文字对应的比特数之和。另外,文本质量分数模型可以通过各个维度确定文本的质量分数,例如,维度可以包括:文本中是否出现错别字、文本是否通顺、文本的点赞数、文本的点踩数等等。从各个维度对文本进行质量评分,得到一个质量分数。另外,对于文本的通顺度是指评论中的文本是否出现错别字、语法错误、文本表达的意思是否有歧义等等。文本的重复度可以是指评论是重复出现的内容,例如评论1“剧情好烧脑,有没有同感的;剧情好烧脑,有没有同感的”,则其中出现了重复的内容,重复度可以通过重复内容所占比例来确定。例如评论1“剧情好烧脑,有没有同感的;剧情好烧脑,有没有同感的”的重复度为100%。当然,重复度也可以是根据是否出现重复内容,以及重复内容出现次数与预设值的比值来确定。对于文本的中文字符数,在很多评论中可能是中文或其他语言的组合评论,但对于中文以外的语言,其对大多数人而言是无效信息,即不清楚其表达的意思,因此,可以通过将评论中的中文字符数作为先验特征。文本的嵌入(embedding)表达是指将文本翻译成机器语言以提取文本中的关键词、相似度、质量等等,至于具体嵌入表达需要将文本输入到指定模型后才能确定。

其中,第一后验特征数据包括以下至少一种:点赞量、回复量、历史点赞率、历史回复率、历史时间段内的点赞率、历史时间段内的回复率、历史回复页查看率、历史时间段内的回复页查看率、历史时间段内的关联话题跳转率、历史关联话题跳转率、历史平均停留时长、历史时间段内的平均停留时长、历史时间段内点击发布者率、历史点击发布者率。

需要说明的是,历史点赞率可以通过以下方式确定:在有多个评论的情况下,每一个评论的点赞量与总的点赞量之间的比值。历史回复率可以通过以下方式确定:在有多个评论的情况下,每一个评论的回复量与总的回复量之间的比值。历史时间段可以是当前时间点之前的一段时间,例如近一个月,近一周。也可以是指历史时间点之前的一段时间,例如一周之前的一个月等。回复页查看是指评论下有用户对其进行回复,其他用户对该评论的回复进行查看,而回复页查看率可以是查看当前回复的数量与总的查看回复的数量的比值。在第一内容和第二内容基于话题相关联的情况下,关联话题跳转是指则从第一内容的评论跳转到第二内容的评论。此外,话题跳转还有可能是无关联的,因此,该关联话题跳转率是指关联话题之间的跳转次数与总的跳转次数(关联话题之间的跳转次数和非关联话题之间的跳转次数之和)的比值。多个内容可以由多个不同的发布者发布,则当前第一内容的点击发布者率可以包括点击第一内容的发布者的次数与总的点击发布者的次数(点击第一内容发布者次数和点击非第一内容发布者次数之和)的比值。

此外,需要说明的是,通常情况下,第一后验特征数据中各个特征数据中正向的特征数据对应的数值越高,表明用户对该评论的感兴趣程度越高,第一后验特征数据中各个特征数据中负向的特征数据对应的数值越高,表明用户对该评论的感兴趣程度越低。如正向特征数据可以包括:点赞量、好评回复量等;负向特征数据可以包括点踩量、差评回复量等。即点赞量越高、好评回复量越高,回复量越高表明用户对该评论很感兴趣,可以是对其评论的观点的赞同,或者是评论内容的幽默诙谐所吸引都可以对其点赞。点踩量越高、差评回复量越高表明用户对该评论不感兴趣,可以是对其评论的观点的不赞同,或者回复发表自己与其相反的看法。对于第一后验特征中的其他特征数据也是类似的,即正向的特征数据对应的数值越高,表明用户对该评论的感兴趣程度越高,负向的特征数据对应的数值越高,表明用户对该评论的感兴趣程度越低,例如正向特征数据中的历史回复页查看率越高,表明用户对其评论及其回复感兴趣程度越高,历史关联话题跳转率越高,表明对其关联的内容也是感兴趣程度越高,历史平均停留时长越长表明用户需要更多的时间了解该评论的回复,或者要针对评论进行回复等,历史点击发布者率越高,表明对评论的发布者感兴趣程度越高,负向特征数据中的历史回复页查看率越低,表明用户对其评论及其回复感兴趣程度越低,历史关联话题跳转率越低,表明对其关联的内容也是感兴趣程度越低等。

可见,第一后验特征数据中各特征数据与第一先验特征数据中各特征数据相关。例如,对于目标视频为悬疑类型的电视剧的情况下,对于某一评论是关于剧情推理的,其评论的内容较多,剧情推理也比较合理的,则对于该评论的点赞量、回复量、停留时间等比较长,也就表明用户对该评论比较感兴趣。但并不是评论的内容多,其对应的点赞量、回复量就高,而是需要通过用户对评论本身是否感兴趣,例如,很多用户对当前评论是不太认可的,然后对其点踩,而不是点赞。

由此可见,在第一内容和第二内容为评论,且是通过话题关联的情况下,则可以对不同话题下的多个评论基于特征数据进行混合排序,从而显示该混合排序结果,即可以对不同场景下的不同内容进行排序,而不仅仅是同一场景下的同一类内容进行排序。而且是通过待显示内容的特征数据进行混合排序,由上述可知,特征数据涵盖了待显示内容各个维度的特征以及用户对其的感兴趣情况,即排序结果更加贴近用户对待显示内容的感兴趣程度,提升了互动区域中的互动效果。

基于上述先验特征和后验特征,在本申请实施例中,在待显示内容包括百科的情况下,特征数据包括:第二先验特征数据和/或第二后验特征数据。进一步地,百科包括以下至少之一项:目标视频中演职人员的百科、目标视频的原著小说的百科、目标视频的百科、目标视频的主题曲的百科。

其中,目标视频中演职人员的百科可以包括:演职人员的基础信息,如出生地、年龄、身高、家庭情况、代表作等。目标视频的原著小说的百科可以包括:原著小说作者、原著小说的剧情介绍、原著小说的销量、原著小说所获得的成就等相关信息。目标视频的百科可以包括:目标视频的剧情介绍、目标视频的演职人员介绍、目标视频的导演、目标视频的上映时间、目标视频的视频类型等相关信息。目标视频的主题曲的百科可以包括:主题曲的演唱者、作曲者、编曲者等相关信息。

基于此,本申请实施例中的第二先验特征数据包括以下至少一种:百科中图片的数量、图片的清晰度、百科中文本的长度、文本来源、演职人员的热度、目标视频的热度、原著小说的热度、原著小说知名度、生产者得分、百科的更新时间,文本的嵌入表达,文本摘要的嵌入表达。

需要说明的是,该生产者是指制作百科的生产者。文本摘要是指文本中的一部分内容,该部分内容可以截取的一段,也可以是概括文本的部分。另外,百科的更新时间可以是百科中各种信息的更新时间,如演职人员信息的变动、目标视频获奖情况变动等等。

由于百科中包括文本和图片,因此,该第二先验特征数据除了与文本相关的特征数据外,还包括与图片相关的特征数据。其中关于文本的特征数据与第一先验特征数据中关于文本的特征数据的类型是类似的,不同的是具体文本内容。对于图片相关的特征数据,需要将图片的数量和图片的清晰度作为特征数据,因为通过第二后验特征数据可知,需要收集对百科的评论数、点赞数等。其图片的数量与清晰度均是影响评论数和点赞数的因素。

其中,演职人员的热度可以根据上热搜的次数、最近一年参演的影视剧数量等方式确定。即上热搜的次数越多、参演的影视剧越多其热度越高。目标视频的热度可以根据播放量、上热搜的次数等确定,即播放量越高或上热搜的次数越多其目标视频的热度越高。原著小说的知名度可以根据原著小说的销量,被改变的影视剧的播放量等确定,销量越高、播放量越高知名度越高。生产者得分可以根据生产者制作的百科的浏览量、生产者制作的百科数量。其中,浏览量或百科数量越高,生产者得分越高。

基于第二先验特征数据,本申请实施例中的第二后验特征数据包括以下至少一种:百科的历史评论数、历史时间段内的评论数、历史点赞数、历史时间段内的点赞数、历史踩数、历史时间段内的踩数、历史阅读数、历史时间段内的阅读数。

需要说明的是,第二后验特征数据中的历史点赞数、历史时间段内的点赞数,与第一后验特征数据中的评论的历史点赞数和历史时间段内的点赞数是类似的,不同的内容的不一样,即第一后验特征数据是针对评论,第二后验特征数据是针对百科。同样地,点赞数越高用户对其感兴趣程度越高。

此外,百科的历史评论数和历史时间段内的评论数可以是对百科中的任一信息进行评论,例如:对演职人员的获奖次数的评论、对演职人员的基础信息的评论、对原著小说剧情的评论,对主题曲的评论等等。对于该评论数可以是在考虑评论的具体内容的情况下,评论数越高,用户对其感兴趣的程度越高。或者是考虑评论的具体内容,区分好评和差评,根据好评与差评的比例来确定用户对其感兴趣的程度。

对于历史踩数与历史时间段内的踩数,与点赞数是相反的,即用户如果对其不感兴趣可以对其进行点踩,点踩数越高,用户感兴趣的程度越低。而对于历史阅读数和历史时间段内的阅读数,其阅读数越多则表明用户对其感兴趣程度越高。

但需要说明的是,第二后验特征数据中的特征数据所表征的感兴趣程度与第二先验特征数据中的特征数据均对感兴趣程度有相应的影响,但是两者之间的影响没有必然的关联关系,即不是第二先验特征数据中的图片数越多,其第二后验特征数据中的点赞数就越高,图片数量多可以吸引用户来浏览,但是是否是用户真正感兴趣的图片,需要通过用户反应来确定,不同的用户有不同的需求;例如,有些用户可能对其感兴趣,则可能会对其进行点赞,有些用户可能对其不感兴趣则不会点赞,反而可能会点踩。具体还是需要用户对待显示内容的具体内容进行判断后作出相应的操作来确定。因此,在待显示内容包括百科的情况下,则在本申请实施例中还可以对包括百科的第一内容和第二内容进行混合排序,而不仅仅局限于是对不同话题的内容进行排序,从而丰富了排序的对象。

基于上述先验特征和后验特征,在本申请实施例中,在待显示内容包括图片和文本组合的信息流的情况下,特征数据包括:第三先验特征数据和/或第三后验特征数据;

第三先验特征数据包括以下至少一种:信息流中图片的数量、图片的清晰度、信息流中文本的长度、文本来源、信息流所关联的演职人员的热度、信息流所关联的视频热度、生产者得分、信息流最近更新时间,文本的嵌入表达,文本的摘要的嵌入表达;

第三后验特征数据包括以下至少一种:信息流的历史评论数、历史时间段内的评论数、历史点赞数、历史时间段内的点赞数、历史踩数、历史时间段内的踩数、阅读数、历史阅读数、历史时间段内的阅读数、历史跳转其他内容率、历史时间段内的跳转其他内容率。

需要说明的是,对于第一先验特征与第三先验特征中包括相同的文本内容的情况下,则文本长度、文本清晰度在第一先验特征数据和第三先验特征数据中可以是相同的,但是用户对在第一后验特征数据和第三后验特征数据中的文本内容的感兴趣程度可能是不同的,因为第一先验特征数据和第一后验特征数据是针对评论,而第三先验特征数据和第三后验特征数据针对的是百科,因此,对于不同类型的相同内容,用户的感兴趣程度可能不一样。而且,在待显示内容包括图片和文本组合的信息流的情况下,则在本申请实施例中还可以对包括图片和文本组合的信息流的第一内容和第二内容进行混合排序,或者是第一内容为百科,关联的第二内容包括图片和文本组合的信息流,则可以对不同场景下的不同内容进行排序,进一步丰富了排序的对象,使得互动效果更好。

基于上述先验特征和后验特征,在本申请实施例中,在待显示内容包括目标视频的关联视频的情况下,特征数据包括:第四先验特征数据和/或第四后验特征数据;

第四先验特征数据包括以下至少一种:关联视频的热度、关联视频的时长、关联视频的清晰度、关联视频的分辨率、关联视频的日期、关联视频的关联专辑、关联视频的关联演职人员、关联视频的质量、关联视频的内容标签、关联视频的抽帧获取的嵌入表达、关联视频标题的嵌入表达、关联视频封面图的质量、封面图的清晰度;

需要说明的是,关联视频的热度与上述目标视频的热度的确定方式是类似的,在此不再赘述。关联视频的时长如果关联视频电视剧可以是指一集电视剧的时长,如果关联视频为电影则可以是指整个电影的时长。关联视频的清晰度是指关联视频原始的清晰度,而不是可以通过app可以调节的清晰度。关联视频的分辨率与关联视频的清晰度相关。关联视频的日期可以包括上映日期、下映日期等。关联视频的关联专辑可以是关联的音乐专辑,或者是关联的幕后花絮专辑等。关联视频的关联演职人员可以包括:主演、非主演、导演等。关联视频的质量可以通过各个评分平台评分确定。关联视频的内容标签包括:内容的类型标签、内容的质量标签、内容的时长标签等。关联视频的抽帧获取的嵌入表达和关联视频标题的嵌入表达与上述涉及到的嵌入表达是类似的,即是指关联视频中的抽帧和标题的关键词、相似度、质量等等,至于具体嵌入表达需要将文本输入到指定模型后才能确定嵌入(embedding)表达。

其中,第四后验特征数据包括以下至少一种:与关联视频关联的最热视频的热度、关联视频所关联的剧集热度、关联视频所关联的演职人员的历史热度、关联视频所关联的演职人员的当前热度、关联视频的评论条数、关联视频的历史热度、关联视频的当前热度、关联视频的历史弹幕条数、关联视频的当前弹幕条数、关联视频的历史播放次数、关联视频的播放完成率,关联视频播放平均中位数时间等,历史跳转相关内容率、近期跳转相关内容率。

需要说明的是,第四后验特征中的热度与前述第一至第三后验特征中的热度的确定方式是类似的,在此不再赘述。此外弹幕数包括用户在观看视频过程中发布的弹幕,发布的弹幕越多表明用户对该关联视频感兴趣程度越高。播放完成率是指观看关联视频的用户中有多少人是整个视频均观看完整。跳转相关内容率是指在观看关联视频跳转到其他视频内容用户数与观看关联视频的总的用户数的比值。

对于本申请实施例中的步骤102中获取待显示内容的具体实现方式,可以是获取后台自动推送的第一内容和第二内容,或者是基于用户设置关联方式进行关联的第一内容和第二内容,也可以是基于当前播放内容确定第一内容,再基于关联方式而获取与第一内容相关联的第二内容。如,用户对当前播放的视频进行了评述,则可以将该评述确定为第一内容,即第一内容为与当前播放的电视剧的相关的评论,且该评论中包括对当前播放的电视剧的主演的演技进行评述,基于此,后台服务器可以推送包括与第一内容通过演职人员关联的百科的第二内容。

换言之,在本方案中,第一内容与第二内容的关联方式,可以是提前预设的,也可以是用户自定义设置的。本发明实施例对此并无额外限制。

基于上述不同内容的特征数据中的先验特征数据和后验特征数据的解释说明,对于本申请步骤104中涉及到的获取待显示内容的特征数据,在示例中可以是获取第一内容中评论的第一先验特征数据中的多维度特征,如:文本长度、通过文本质量分数模型确定的文本的质量分数等,以及第一先验特征数据中用户对第一内容的感兴趣程度的数据,如点赞量、回复量、历史点赞率、历史回复率等,以及基于第二内容中百科的第一先验特征数据中的多维度特征如,演职人员的百科、原著小说的百科、视频的百科等,以及第二先验特征数据中用户对第二内容的感兴趣程度的数据,如百科的历史评论数、历史时间段内的评论数、历史点赞数等。

基于此,对于本申请实施例中步骤106中涉及到的利用特征数据,对待显示内容进行混合排序,得到混合排序结果的方式,可以是基于先验特征数据和后验特征数据对待显示内容进行混合排序。

在一个示例中,可以基于打分机制实现对第一内容和第二内容进行混合排序,也就是说,可以事先设置每一个特征数据与分值取值范围之间的对应关系,如可以根据不同的文本长度设置对应的分值。示例性的,可以根据百科的完善程度设置对应的分值,其他特征数据也是类似的处理方式。因此,可以对每一个先验特征数据和后验特征数据进行打分,从而得到第一内容和第二内容的分值。当然,上述分值的具体设置可以根据实际需求进行设置,例如用户感兴趣程度越高,分值对应越高。文本越清晰,分值越高,完善程度越高分值越高等。得到第一内容和第二内容的分值后,可以基于分值按照分值从高到低进行排序,也可以按照分值从低到高进行排序,从而得到混合排序的结果。具体排序可以根据实际情况进行相应的设置。

在另一个示例中,可以基于预先训练好的排序模型,实现对第一内容和第二内容进行混合排序。以下,首先解释该排序模型。

在可选实施方式中,本申请实施例的方法步骤还可以包括:

步骤201,获取多个第三内容的特征数据,特征数据包括先验特征数据和后验特征数据;

需要说明的是,该第三内容与上述待显示内容中的第一内容和第二内容是相当的,即该多个第三内容也包括评论、百科、图片和文本组合的信息流以及目标视频的关联视频。而且获取多个第三内容的特征数据,与本申请中获取待显示内容的特征数据的方式是一致的,而且具体的特征数据也是一致的。

步骤202,根据第三内容的后验特征数据对第三内容进行标记,得到标记结果,其中,标记结果用于表征第三内容为负向样本内容或正向样本内容;正向样本内容用于表征第三内容的排序靠前;负向样本内容用于表征第三内容的排序靠后;

步骤203,将第三内容的特征数据与标记结果作为一组训练样本,对初始排序模型进行训练。

需要说明的是,负向样本内容或正向样本内容是根据用户对第三内容的感兴趣情况确定的,例如,第三内容包括评论,则该评论的点赞数超过1000条则表明用户对该评论感兴趣程度较高,即可以标记为正向样本内容,反之则标记为负向样本内容。又或者,该评论的回复数超过了100条,则表明用户该评论的感兴趣程度较高,则标记为正向样本内容,反之则标记为负向样本内容。需要说明的是,上述1000和100的数值也仅仅是举例说明,可以根据具体情况设置为其他数值。此外,除了点赞数、回复数还可以是其他后验特征,例如,用户对该评论的停留时长等等,只要是可以表征用户对其感兴趣情况的特征数据均是可以的。另外,在存在多个后验特征数据的情况下,也可以是多个后验特征同时判断,可以是其中一个或部分满足要求则标记为正向样本内容或负向样本内容,又或者需要所有特征数据均满足该要求才标记为正向样本内容或负向样本内容。

本申请实施例中的排序模型是一种神经网络模型,即将第三内容的特征数据与标记结果作为一组训练样本,对初始排序模型进行训练之后得到的排序模型。可见,在本申请中可以基于机器学习的方式,通过排序模型学习用户对第三内容的偏好,进而在训练完成后,可以对多个内容进行排序,排序的依据是用户对其感兴趣的程度,以及待显示内容自身的属性信息进行排序。例如,将感兴趣程度高,以及待显示内容的文本清晰,图片清晰的排在前面。

也就是说,在本申请实施例中,对于上述步骤106中涉及到的利用特征数据,对待显示内容进行混合排序,得到混合排序结果的方式,进一步可以包括但不限于:利用训练好的排序模型,对特征数据进行处理,得到排序结果,其中,排序模型用于对至少两种内容进行混合排序。

由此可知,在本申请实施例中待显示内容中的第一内容和第二内容可以包括评论、百科、图片和文本组合的信息流、关联视频,而且第一内容和第二内容可以通过以下至少一项相关联:话题、演职人员、视频属性信息、视频原著作品信息。可见,第一内容和第二内容可以是两个不同场景下的内容,如第一内容包括当前播放视频的评论,第二内容可以是通过演职人员关联的百科;也就是说,可以将评论作为待显示内容进行混合排序的对象之一,而且还可以将与该评论通过演职人员关联的百科作为待显示内容进行混合排序的另一个对象。即可以实现在当前视频的评论中插入所关联的百科后,对两者进行混合排序。因此,本申请可以针对不同的场景下的内容,对其进行混合排序,相比于现有技术中,虽然实际app的互动区域的评论区域排序的对象可以是多种话题的内容,但也仅针对评论进行排序,而不会涉及其他场景下的内容,本申请不仅仅只针对单一场景下的同一内容进行排序。而且,在本申请中,排序是根据待显示内容的特征数据作为依据进行混合排序,由上述介绍可知,特征数据包括了先验特征数据和后验特征数据,且先验特征数据和后验特征数据又包括各个具体的特征数据,从而可以更加合理的对待显示中的多个不同的内容进行排序,得到混合排序结果。也就是说,通过本申请实施例的方式,不仅可以对多个不同内容进行排序,而且可以将用户更感兴趣的内容排序靠前,以提升用户在互动区域的互动效果。

另外,在本申请实施例中还可以对待显示内容的第一内容和第二内容进行去重处理,该去重处理可以是在排序之前也可以是和/或排序之后。去重处理基于第一内容和第二内容的相似度进行处理,相似度超过预设阈值则需要去重,反之则不需要,其中,具体可以基于最大边界相关法(maximalmarginalrelevance,mmr)进行相似度确定,具体是基于mmr算法确定预设的查询(query)语句是否存在于第一内容和第二内容中,进而确定第一内容和第二内容的相似度,例如查询语句在第一内容和第二内容中均存在,则第一内容和第二内容的相似度的取值相应的增加,如果查询语句只在其中之一存在,则相似度的取值不变;然后确定其他查询语句是否存在于第一内容和第二内容中,再进一步确定两者之间的相似度,以此循环操作最终得到相似度。当然,上述相似度确定的方式仅仅是举例说明,还可以是其他方式,具体可以根据实际情况进行相应的设置。通过去重处理可以避免用户连续看到相似内容,减少内容的重复度,提升用户观感上的新鲜度。

在本申请实施例提供了一种内容的显示装置,如图2所示,该装置包括:

第一获取模块22,用于获取待显示内容,待显示内容包括第一内容与第二内容,第一内容为目标视频的互动区域的互动内容,第二内容是与第一内容相关联的互动内容;

第二获取模块24,用于获取待显示内容的特征数据;

排序模块26,用于利用特征数据,对待显示内容进行混合排序,得到混合排序结果;

显示模块28,用于按照混合排序结果,在互动区域显示待显示内容。

通过本申请实施例中的装置,目标视频互动区域的待显示内容包括第一内容以及与其相关联的第二内容,对此,举例来说,第一内容可以是评论,第二内容可以是百科,如演职人员的百科;又或者,第一内容是图片和文本组合的信息流,第二内容为目标视频的关联视频。可见,待显示内容中具有关联关系的第一内容和第二内容可以是不同场景下的不同内容。进一步可以利用待显示内容的特征数据对待显示内容进行混合排序。换言之,在本申请中并不是仅针对同一场景下的同一内容进行单一排序,而是可以针对不同场景下的不同内容进行混合排序,进而显示该混合排序的结果。由此可见,通过本申请可以对待显示内容中的相关联的第一内容和第二内容进行混合排序,并显示混合排序结果,丰富了app的互动区域中内容的排序方式,而且也提升了用户在互动区域的互动效果,从而解决了现有技术中在app的互动区域只针对与该场景相关的一类内容进行排序的问题。

可选地,本申请实施例中的第一内容与第二内容通过以下至少一项相关联:话题、演职人员、视频属性信息、视频原著作品信息。

可选地,本申请实施例中的特征数据包括先验特征数据和后验特征数据中的至少一项;其中,先验特征数据用于表征待显示内容的多维度特征;后验特征数据用于表征用户对待显示内容的感兴趣情况。

可选地,在本申请实施例中,在待显示内容包括评论的情况下,特征数据包括:第一先验特征数据和/或第一后验特征数据;

第一先验特征数据包括以下至少一种:评论的文本长度、通过文本质量分数模型确定的文本的质量分数、文本的通顺度、文本的重复度、文本中文字符数、文本的嵌入表达;

第一后验特征数据包括以下至少一种:点赞量、回复量、历史点赞率、历史回复率、历史时间段内的点赞率、历史时间段内的回复率、历史回复页查看率、历史时间段内的回复页查看率、历史时间段内的关联话题跳转率、历史关联话题跳转率、历史平均停留时长、历史时间段内的平均停留时长、历史时间段内点击发布者率、历史点击发布者率。

可选地,在本申请实施例中,在待显示内容包括百科的情况下,特征数据包括:第二先验特征数据和/或第二后验特征数据;百科包括以下至少之一项:目标视频中演职人员的百科、目标视频的原著小说的百科、目标视频的百科、目标视频的主题曲的百科;

第二先验特征数据包括以下至少一种:百科中图片的数量、图片的清晰度、百科中文本的长度、文本来源、演职人员的热度、目标视频的热度、原著小说的热度、原著小说知名度、生产者得分、百科的更新时间,文本的嵌入表达,文本摘要的嵌入表达;

第二后验特征数据包括以下至少一种:百科的历史评论数、历史时间段内的评论数、历史点赞数、历史时间段内的点赞数、历史踩数、历史时间段内的踩数、历史阅读数、历史时间段内的阅读数。

可选地,在本申请实施例中,在待显示内容包括图片和文本组合的信息流的情况下,特征数据包括:第三先验特征数据和/或第三后验特征数据;

第三先验特征数据包括以下至少一种:信息流中图片的数量、图片的清晰度、信息流中文本的长度、文本来源、信息流所关联的演职人员的热度、信息流所关联的视频热度、生产者得分、信息流最近更新时间,文本的嵌入表达,文本的摘要的嵌入表达;

第三后验特征数据包括以下至少一种:信息流的历史评论数、历史时间段内的评论数、历史点赞数、历史时间段内的点赞数、历史踩数、历史时间段内的踩数、阅读数、历史阅读数、历史时间段内的阅读数、历史跳转其他内容率、历史时间段内的跳转其他内容率。

可选地,在本申请实施例中,在待显示内容包括目标视频的关联视频的情况下,特征数据包括:第四先验特征数据和/或第四后验特征数据;

第四先验特征数据包括以下至少一种:关联视频的热度、关联视频的时长、关联视频的清晰度、关联视频的分辨率、关联视频的日期、关联视频的关联专辑、关联视频的关联演职人员、关联视频的质量、关联视频的内容标签、关联视频的抽帧获取的嵌入表达、关联视频标题的嵌入表达、关联视频封面图的质量、封面图的清晰度;

第四后验特征数据包括以下至少一种:与关联视频关联的最热视频的热度、关联视频所关联的剧集热度、关联视频所关联的演职人员的历史热度、关联视频所关联的演职人员的当前热度、关联视频的评论条数、关联视频的历史热度、关联视频的当前热度、关联视频的历史弹幕条数、关联视频的当前弹幕条数、关联视频的历史播放次数、关联视频的播放完成率,关联视频播放平均中位数时间等,历史跳转相关内容率、近期跳转相关内容率。

可选地,本申请实施例中的排序模块26进一步可以包括:排序单元,永不利用训练好的排序模型,对特征数据进行处理,得到排序结果,其中,排序模型用于对至少两种内容进行混合排序。

可选地,在本申请实施例中装置还可以包括:第三获取模块,用于获取多个第三内容的特征数据,特征数据包括先验特征数据和后验特征数据;标记模块,用于根据第三内容的后验特征数据对第三内容进行标记,得到标记结果,其中,标记结果用于表征第三内容为负向样本内容或正向样本内容;正向样本内容用于表征第三内容的排序靠前;负向样本内容用于表征第三内容的排序靠后;训练模块,用于将第三内容的特征数据与标记结果作为一组训练样本,对初始排序模型进行训练。

本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,存储在存储器303上并可在处理器301上运行的程序或指令,该程序或指令被处理器301执行时实现上述内容的显示方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

上述终端提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的内容的显示方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的内容的显示方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1