基于生成对抗网络的云展会内容推荐方法、系统及设备与流程

文档序号:25949592发布日期:2021-07-20 17:05阅读:125来源:国知局
基于生成对抗网络的云展会内容推荐方法、系统及设备与流程

本发明涉及线上云展会系统数字化推荐技术领域,具体为一种基于生成对抗网络的云展会内容推荐方法、系统及设备。



背景技术:

云展会系统,是依托网络技术平台,不限时间、场地、人数和商品数量,运用文字、图像、视频的有机组合来操作一个展会项目。其本质是以互联网为基础,将云计算、大数据、移动互联网技术、社交社群、展会产业链中的各个实体构建起一个数字信息集成化的展示空间,从而形成全方位立体化的新型展览模式,这也是对线下展会一种延伸和补充,是线下实体展会的衍生产品,被誉为“永不落幕的展会”,云展会系统的数字化功能可以极大地助力实体展会行业经济提速。

传统的展会,通过专业的布展设计人员对展会现场进行设计,设计需要展示信息的参观路径、展示位置等信息,吸引参展者参与,尽可能的将参观者引导至感兴趣的展位,使参展者和参观者双方获益。

而传统展会的线上推荐系统,基于历史数据,在历史数据中找到用户与信息的关联信息,然后通过规则或者算法对用户进行推荐,一般来说这样的算法和数据分析需要大量的历史数据作为积累,所产生的的算法随着时间的推移准确率会越来越低。主要有以下集中方法:

1.基于人口统计学的推荐,当我们需要对一个user进行个性化推荐时,利用第一种userprofile计算其他用户与其之间的相似度,然后挑选出与其最相似的前k个用户,之后利用这些用户的购买和打分信息进行推荐。

2.基于内容的推荐,构建userprofile,例如将该user曾经打过份的所有item的itemprofile做一个加权平均,作为该user的profile。计算该用户未尝试过的item与该用户的userprofile之间的相似度,并按照相似度由大到小的顺序生成推荐列表。

3.协同过滤,利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。

以上所有的传统的推荐系统,最终目的是要以用户为中心,提升用户和商家的交互成果和效率。

但是在以用户为中心的推荐系统中,未体现如何能以自然、透明的方式与用户交互,了解用户真实的需求和偏好,以及通过与用户的自然交互,推荐系统估计、提取,同时也向用户反馈、影响用户的满意度、偏好、需求、兴趣、活动模式等隐含的状态,从而从用户的偏好、用户决策推理的行为过程出发,替用户做最好决定的技术方案。

与此同时,现有技术中体现的优化的目标都是短期收益,比如点击率、观看时长,很难对长期收益建模;最主要的是预测用户的兴趣,但模型都是基于loggedfeedback训练,样本和特征极度稀疏,大量的物料没有充分展示过,同时还是有大量的新物料和新用户涌入,存在大量的bias,另外,用户的兴趣变化剧烈,行为多样性,存在很多noise。



技术实现要素:

针对现有技术存在的不足,本发明目的是提供一种基于生成对抗网络的云展会内容推荐方法、系统及设备,以解决上述背景技术中提出的问题,本发明通过利用生成器、判别器对模拟器生成的用户浏览行为进行判断,丢弃无效数据、保留有效数据的方式,有效解决了训练样本的数据稀疏问题,以及通过采用基于序列建模的深度学习模型lstm作为判别器的方式,有效保留了用户浏览行为的时序信息,以确定分类结果更为准确,进而对用户行为的真实性进行客观判断,解决了现有技术中的问题。

为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于生成对抗网络的云展会内容推荐方法,包括以下步骤:

第一步,构建生成器,用于生成用户浏览行为score得分序列

s1-1、通过浏览行为模拟器获取用户浏览行为数据,其中,用户浏览行为数据包括用户特征数据以及内容特征数据;

s1-2、预设推荐系统,建立针对用户特征数据与内容特征数据组合的score得分计算模型;

s1-3、基于score得分计算模型计算得到用户浏览行为数据score得分序列;

第二步,构建判别器,对所述score得分序列进行真实性判断以得到有效用户浏览行为数据;

第三步,推荐唯一有效用户浏览行为数据以作为确定输出的目标结果。

作为对本发明中所述一种基于生成对抗网络的云展会内容推荐方法的改进,在步骤s1-2中,通过预设推荐系统得到所述score得分计算模型的具体实施方式为:

s1-21、获取训练样本,其中,所述训练样本中至少标注有第一训练特征信息和第二训练特征信息,所述第一训练特征信息用于表征用户浏览行为数据的特征向量信息,所述第二训练特征信息用于表征用户特征数据与内容特征数据组合的score分值信息;

s1-22,采用所述第一训练特征信息和第二训练特征信息输入至回归模型同时进行训练,得到score得分计算模型,其中,回归模型包括线性回归模型、多项式回归模型、回归树模型以及回归森林模型。

作为对本发明中所述一种基于生成对抗网络的云展会内容推荐方法的改进,在基于所述score得分计算模型得到所述score得分序列之后,且在所述判别器对所述score得分序列进行真实性判断之前,还包括

s1-31、score得分计算模型将得到的所述score得分序列转化为所述判别器输入形式的用户浏览行为序列。

作为对本发明中所述一种基于生成对抗网络的云展会内容推荐方法的改进,在第二步中,采用基于序列建模的深度学习模型lstm作为判别器,所述判别器的具体构建过程为:

s2-1、获取建模训练样本,其中,所述建模训练样本中至少标注有第三训练特征信息和第四训练特征信息,所述第三训练特征信息用于表征过往云展会的用户浏览行为数据信息,所述第四训练特征信息用于表征含有人工标记的过往云展会的用户浏览行为数据信息;

s2-2、规则建模:建立时间序列模型,以用于保留过往云展会的用户浏览行为的时序信息,以及在时间序列模型下的各个时刻所对应的用户特征信息以及内容特征信息,具体为:

s2-21、采用第三训练特征信息和第四训练特征信息输入至深度学习模型lstm,并同时进行建模训练;

s2-22、基于经训练后的深度学习模型lstm,且以时间值为单位将获取的所述建模训练样本的训练特征信息建模为用户浏览行为的行为序列,其中,所述建模训练样本的特征信息包括过往云展会的用户浏览行为数据信息以及含有人工标记的过往云展会的用户浏览行为数据信息;

s2-23、将所述score得分计算模型输出的用户浏览行为数据score得分序列与所述深度学习模型lstm输出的行为序列进行对比;

s2-24、根据对比结果对所述训练样本重新划分,以用于解决所述训练样本特征信息稀疏问题,与此同时,依据对比结果对所述score得分序列进行真实性判断,得到有效用户浏览行为数据。

作为对本发明中所述一种基于生成对抗网络的云展会内容推荐方法的改进,在步骤s2-22中,在以时间值为单位将获取的所述建模训练样本的训练特征信息建模为行为序列的过程中:

若存在建模训练样本的训练特征信息所对应的时间值小于所述建模时的时间值时,则按照所述建模时的时间值进行计算;

若存在建模训练样本的训练特征信息所对应的时间值大于所述建模时的时间值时,则将其拆分为多个时间步,并按照向上取整函数进行计算。

作为对本发明中所述一种基于生成对抗网络的云展会内容推荐方法的改进,在步骤s2-24中,在依据对比结果对所述训练样本重新划分之前,还包括

首先,将深度学习模型lstm输出行为序列中所包含的lstm隐层向量连接softmax分类器,以得到所述过往云展会的用户浏览行为数据信息的分类结果以及所述含有人工标记的过往云展会的用户浏览行为数据信息的人工标注结果,其中,

所述lstm隐层向量为深度学习模型lstm进行时间序列建模时的末端时间值处的隐层向量;

其次,预设交叉熵损失函数分别对所述分类结果和人工标注结果进行损失值计算,并同时进行深度学习模型lstm的训练,以用于衡量深度学习模型lstm的预测值与实际值。

作为对本发明中所述一种基于生成对抗网络的云展会内容推荐方法的改进,第三步中,在推荐唯一有效用户浏览行为数据以作为确定输出的目标结果的过程中:

需要对有效用户浏览行为数据进行测试,若达到测试目标结果,则直接输出;

反之,则返回步骤s1-2、将此有效用户浏览行为数据作为新的训练样本的训练特征信息,并代入至回归模型进行训练,得到新的推荐系统,并顺序执行后续步骤,直至达到测试目标结果后,直接输出。

作为本发明的第二方面,提出一种基于生成对抗网络的云展会内容推荐系统,包括生成器模块、判别器模块、目标结果测试输出模块,

所述生成器模块包括数据获取模块、数据推荐模块以及序列转化模块,其中,

数据获取模块,用于通过浏览行为模拟器获取用户浏览行为数据,用户浏览行为数据包括用户特征数据以及内容特征数据;

数据推荐模块,用于建立针对用户特征数据与内容特征数据组合的score得分计算模型,以得到用户浏览行为数据score得分序列;

序列转化模块,用于将所述score得分序列转化为所述判别器输入形式的用户浏览行为序列,

判别器模块,用于对所述score得分序列进行真实性判断以得到有效用户浏览行为数据;

目标结果测试输出模块,用于推荐唯一有效用户浏览行为数据以作为确定输出的目标结果。

在本发明第二方面的一种可能实现方式中,判别器模块包括训练样本采集模块、训练模块、数据对比模块以及score得分序列真实性判断模块,其中,

训练样本采集模块,用于获取建模训练样本的特征信息;

训练模块,用于输出过往云展会的用户浏览行为序列;

数据对比模块,用于将所述判别器输入形式的用户浏览行为序列与所述过往云展会的用户浏览行为序列进行对比,得到对比结果;

score得分序列真实性判断模块,用于根据对比结果对所述数据推荐模块中的训练样本重新划分,并得到有效用户浏览行为数据。

作为本发明的第三方面,提出一种基于生成对抗网络的云展会内容推荐设备,包括至少一个处理器以及与至少一个所述处理器建立信息交互通道的存储器,其中,

每个所述存储器存储有可被至少一个所述处理器执行的计算机程序;

所述计算机程序被至少一个所述处理器执行,以使至少一个所述处理器执行基于生成对抗网络的云展会内容推荐方法和/或基于生成对抗网络的云展会内容推荐系统。

与现有技术相比,本发明的有益效果:

1、本发明通过对用户特征、内容特征的建模,根据新用户的注册特征提供冷启动推荐,并同步利用不同用户的特征相似性提供基于用户特征的推荐以及利用内容特征进行推荐从多角度反应用户偏好的方式,达到对用户带来更多纬度的组合展示,以进行交互获取用户的反馈;

2、本发明采用端到端的方式来进行用户特征、内容特征组合的score计算,相较于手动设计的简单奖励函数,更能反应用户特征、内容特征之间的联系,且更方便进行计算更新;

3、通过利用生成器、判别器对模拟器生成的用户浏览行为进行判断,丢弃无效数据、保留有效数据,有效解决了现有问题中训练样本的数据稀疏问题;

4、与此同时,采用基于序列建模的深度学习模型lstm作为判别器,有效保留了用户浏览行为的时序信息、每个时刻的用户以及内容特征信息,从而达到分类结果更为准确。

附图说明

参照附图来说明本发明的公开内容。应当了解,附图仅仅用于说明目的,而并非意在对本发明的保护范围构成限制,在附图中,相同的附图标记用于指代相同的部件。其中:

图1为本发明一实施例中所提出展会内容经推荐系统生成对抗训练过程的整体流程示意图;

图2为本发明一实施例中所提出推荐系统训练流程示意图;

图3为本发明一实施例中所提出利用推荐系统进行用户特征数据、内容特征数据组合的score计算流程示意图;

图4为本发明一实施例中所提出利用生成器生成用户浏览行为score得分序列并转化为判别器输入形式的流程示意图;

图5为本发明一实施例中所提出判别器的训练流程示意图;

图6为本发明一实施例中所提出利用判别器对模拟用户行为进行真实性判断的流程示意图。

具体实施方式

容易理解,根据本发明的技术方案,在不变更本发明实质精神下,本领域的一般技术人员可以提出可相互替换的多种结构方式以及实现方式。因此,以下具体实施方式以及附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限定或限制。

如图1所示,作为本发明的一个实施例,本发明提供技术方案:一种基于生成对抗网络的云展会内容推荐方法,包括以下步骤:

第一步,构建生成器,用于生成用户浏览行为score得分序列,具体的为:

s1-1、通过浏览行为模拟器获取用户浏览行为数据,其中,用户浏览行为数据包括用户特征数据以及内容特征数据,内容特征数据为用户浏览内容的特征数据;

s1-2、预设推荐系统,建立针对用户特征数据与内容特征数据组合的score得分计算模型,可以理解的是,通过推荐系统建立score得分计算模型,以及对用户特征、内容特征的建模,可根据新用户的注册特征提供冷启动推荐,也可利用不同用户的特征相似性提供基于用户特征的推荐,利用内容特征进行推荐从多角度反应用户偏好,也可给推荐带来更多纬度的组合展示,利于进行交互获取用户的反馈。

而采用端到端的方式来进行用户特征、内容特征组合的score计算,相较于手动设计的简单奖励函数,更能反应用户特征、内容特征之间的联系,且更方便进行计算更新。

如图2-3所示,需要说明的是,在上述步骤s1-2中,通过预设推荐系统得到score得分计算模型的具体实施方式为:

s1-21、获取训练样本,其中,训练样本中至少标注有第一训练特征信息和第二训练特征信息,第一训练特征信息用于表征用户浏览行为数据的特征向量信息,第二训练特征信息用于表征用户特征数据与内容特征数据组合的score分值信息;

s1-22,采用第一训练特征信息和第二训练特征信息输入至回归模型同时进行训练,得到score得分计算模型,其中,回归模型包括线性回归模型、多项式回归模型、回归树模型以及回归森林模型;

具体实施时,选取用户浏览行为数据、内容特征数据以及用户在内容上的score作为训练样本,通过多项式回归、回归树等针对用户特征数据与内容特征数据组合的score计算模型训练,以建立针对用户特征数据与内容特征数据组合的score计算模型作为推荐系统;

s1-3、基于score得分计算模型计算得到用户浏览行为数据score得分序列。

如图4所示,需要说明的是,在基于score得分计算模型得到score得分序列之后,且在判别器对score得分序列进行真实性判断之前,还包括

s1-31、score得分计算模型将得到的score得分序列转化为判别器输入形式的用户浏览行为序列。

具体实施方式以举例说明:首先通过浏览行为模拟器获取用户浏览行为数据,自定义此时的用户浏览行为数据包括用户特征数据1、内容特征数据b;用户特征数据1、内容特征数据a;用户特征数据1、内容特征数据c等,通过推荐系统得到用户浏览行为数据score得分序列,其中,此用户浏览行为数据score得分序列将用户特征数据1、内容特征数据b的组合score得分计算值为1;将用户特征数据1、内容特征数据a的组合score得分计算值为3;将用户特征数据1、内容特征数据c的组合score得分计算值为2,最后转化为判别器的输入形式:以用户1特征数据、内容b特征;用户1特征数据、内容a特征;用户1特征数据、内容c特征,等判别器的用户浏览行为序列输入。

如图5所示,第二步,构建判别器,对score得分序列进行真实性判断以得到有效用户浏览行为数据,具体的为:

采用基于序列建模的深度学习模型lstm作为判别器,而,通过利用生成器、判别器对模拟器生成的用户浏览行为进行判断,目的在于,通过判别器直接筛选用户浏览行为序列的无效数据,使其丢弃,进而保留有效数据,有效解决了现有问题中训练样本的数据稀疏问题,因此,判别器的具体构建过程如下:

s2-1、获取建模训练样本,其中,建模训练样本中至少标注有第三训练特征信息和第四训练特征信息,第三训练特征信息用于表征过往云展会的用户浏览行为数据信息,第四训练特征信息用于表征含有人工标记的过往云展会的用户浏览行为数据信息;

s2-2、规则建模,利用lstm深度学习模型进行建模训练,即:建立时间序列模型,以用于保留过往云展会的用户浏览行为的时序信息,以及在时间序列模型下的各个时刻所对应的用户特征信息以及内容特征信息,需要说明的是,此时的用户特征信息以及内容特征信息为过往云展会的用户浏览行为数据信息,具体为:

s2-21、采用第三训练特征信息和第四训练特征信息输入至深度学习模型lstm,并同时进行建模训练;

s2-22、基于经训练后的深度学习模型lstm,且以时间值为单位将获取的建模训练样本的训练特征信息建模为用户浏览行为的行为序列,其中,建模训练样本的特征信息包括过往云展会的用户浏览行为数据信息以及含有人工标记的过往云展会的用户浏览行为数据信息;

作为对本发明上述构思的理解,以时间值为单位将获取的建模训练样本的训练特征信息建模为用户浏览行为的行为序列,目的在于,采用基于序列建模的深度学习模型lstm作为判别器,有效保留用户浏览行为的时序信息、每个时刻的用户、内容特征信息,从而达到分类结果更为准确,其具体实施方式以举例说明:

以两分钟为时间单位将用户的浏览行为,即,过往云展会的用户浏览行为,建模成用户浏览行为的行为序列,而低于两分钟的浏览行为按两分钟计算,同时,高于两分钟的浏览行为按两分钟拆分成多个时间步,按照向上取整函数进行计算。

如图6所示,示出了,本发明利用判别器对模拟用户行为进行真实性判断的流程示意图,具体实施方式如下:

s2-23、将score得分计算模型输出的用户浏览行为数据score得分序列与深度学习模型lstm输出的行为序列进行对比,其中,此时的用户浏览行为数据score得分序列为转化为判别器输入形式的用户浏览行为序列;

需要说明的是,为有效解决了现有技术中训练样本的数据稀疏问题,因此在依据对比结果对score得分计算模型中的训练样本重新划分之前,还包括

首先,将深度学习模型lstm输出行为序列中所包含的lstm隐层向量连接softmax分类器,以得到过往云展会的用户浏览行为数据信息的分类结果以及含有人工标记的过往云展会的用户浏览行为数据信息的人工标注结果,其中,

lstm隐层向量为深度学习模型lstm进行时间序列建模时的末端时间值处t-end的隐层向量;

其次,预设交叉熵损失函数分别对分类结果和人工标注结果进行损失值计算,并同时进行深度学习模型lstm的训练,以用于衡量深度学习模型lstm的预测值与实际值;

s2-24、根据对比结果对训练样本重新划分,解决训练样本特征信息稀疏问题的目的,与此同时,依据对比结果对score得分序列进行真实性判断,得到有效用户浏览行为数据,反之,对比结果若为无效用户浏览行为数据时,则直接丢弃。

第三步,推荐唯一有效用户浏览行为数据以作为确定输出的目标结果。

需要说明的是,第三步中,在推荐唯一有效用户浏览行为数据以作为确定输出的目标结果的过程中:

需要对有效用户浏览行为数据进行测试,若达到测试目标结果,则直接输出;

反之,则返回步骤s1-2、将此有效用户浏览行为数据作为新的训练样本的训练特征信息,并代入至回归模型进行训练,得到新的推荐系统,循环利用生成器、判别器生产出有效的用户浏览行为数据,并顺序执行后续步骤,直至达到测试目标结果后,直接输出。

作为本发明的第二方面,提出执行基于生成对抗网络的云展会内容推荐方法的推荐系统,包括生成器模块、判别器模块、目标结果测试输出模块,

生成器模块包括数据获取模块、数据推荐模块以及序列转化模块,其中,

数据获取模块,用于通过浏览行为模拟器获取用户浏览行为数据,用户浏览行为数据包括用户特征数据以及内容特征数据;

数据推荐模块,用于建立针对用户特征数据与内容特征数据组合的score得分计算模型,以得到用户浏览行为数据score得分序列;

序列转化模块,用于将score得分序列转化为判别器输入形式的用户浏览行为序列,

判别器模块,用于对score得分序列进行真实性判断以得到有效用户浏览行为数据;

目标结果测试输出模块,用于推荐唯一有效用户浏览行为数据以作为确定输出的目标结果。

在本发明第二方面的实施例中,判别器模块包括训练样本采集模块、训练模块、数据对比模块以及score得分序列真实性判断模块,其中,

训练样本采集模块,用于获取建模训练样本的特征信息;

训练模块,通过采用特征信息对经序列建模的深度学习模型lstm进行训练,以得到时间序列模型,输出过往云展会的用户浏览行为序列;

数据对比模块,用于将经转化的用户浏览行为数据score得分序列与过往云展会的用户浏览行为序列进行对比,得到对比结果,其中,此时经转化的用户浏览行为数据score得分序列为符合判别器输入形式的用户浏览行为序列;

score得分序列真实性判断模块,用于根据对比结果对建模训练样本重新划分,并得到有效用户浏览行为数据。

基于上述构思,本发明还提出一种执行基于生成对抗网络的云展会内容推荐方法以及作为基于生成对抗网络的云展会内容推荐系统执行载体的设备:

包括至少一个处理器以及与至少一个处理器建立信息交互通道的存储器,其中,

每个存储器存储有可被至少一个处理器执行的计算机程序;

计算机程序被至少一个处理器执行,以使至少一个处理器执行基于生成对抗网络的云展会内容推荐方法和/或基于生成对抗网络的云展会内容推荐系统。

作为本发明的另一实施例,本发明在第一实施例中提到的深度学习模型lstm可通过循环神经网络rnn以及隐马尔科夫模型hmm进行替换;

与此同时,可通过分类算法得到用户浏览行为数据score得分序列,其中,所涉及的分类算法包括单一的分类方法,如决策树、贝叶斯、人工神经网络、k-近邻、支持向量机和基于关联规则的分类等;以及用于组合单一分类方法的集成学习算法,如bagging和boosting等。

本发明的技术范围不仅仅局限于上述说明中的内容,本领域技术人员可以在不脱离本发明技术思想的前提下,对上述实施例进行多种变形和修改,而这些变形和修改均应当属于本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1