跨平台主题关联方法、装置及其设备与流程

文档序号:12906158阅读:210来源:国知局
跨平台主题关联方法、装置及其设备与流程

本发明涉及互联网技术领域,尤其涉及一种跨平台主题关联方法、装置及其设备。



背景技术:

通常,为了方便用户使用需要进行跨平台主题关联。相关技术中,基于用户的跨平台主题关联方法主要有:1)学习不同平台用户特征之间的直接线性映射函数,实现跨平台关联;2)将不同平台的用户特征线性映射到共同的隐空间,基于此实现跨平台关联。

然而,上述方法认为用户在不同平台上表现出的主题兴趣是一致的,从而基于用户实现跨平台关联。但是实际上,用户在不同平台上的兴趣存在差异,这一点它们没有考虑。另外它们采用线性映射函数,模型拟合能力有限。



技术实现要素:

本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的一个目的在于提出一种跨平台主题关联方法,该方法能够考虑到用户在不同平台上表现出的兴趣差异性,解决跨平台数据不一致问题,更好地实现了基于用户的跨平台关联。

本发明第二个目的提出一种跨平台主题关联装置。

本发明第三个目的提出一种计算机设备。

本发明第四个目的提出一种非临时性计算机可读存储介质。

本发明第五个目的提出一种计算机程序产品。

为达上述目的,本发明第一方面实施例提出了一种跨平台主题关联方法,该方法包括获取用户在第一平台上的历史信息;将所述历史信息输入所述第一平台的主题模型,得到所述用户的第一兴趣特征信息;将所述第一兴趣特征信息输入跨平台关联模型,得到所述第二兴趣特征信息,以便基于所述第二兴趣特征信息在所述第二平台上为所述用户推荐信息。

本发明实施例的跨平台主题关联方法,通过获取用户在第一平台上的历史信息,并将历史信息输入第一平台的主题模型得到用户的第一兴趣特征信息,然后将第一兴趣特征信息输入跨平台关联模型得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。由此,能够考虑到用户在不同平台上表现出的兴趣差异性,解决跨平台数据不一致问题,更好地实现了基于用户的跨平台关联。

另外,根据本发明上述实施例的跨平台主题关联方法还可以具有如下附加的技术特征:

可选地,在将所述第一兴趣特征信息输入跨平台关联模型,得到所述第二兴趣特征信息之前,还包括:应用多模态自编码器将用户在不同平台上通过主题模型得到的特征信息作为输入,以重构误差为损失函数迭代地训练网络参数得到跨平台关联模型。

可选地,所述的方法,还包括:将所述多模态自编码器的网络结构中的中间隐层分为公共和差异部分;保留输入层、输出层到中间隐层公共部分和对应平台差异部分的连接。

为达上述目的,本发明第二方面实施例提出了一种跨平台主题关联装置,包括:获取模块,用于获取用户在第一平台上的历史信息;第一处理模块,用于将所述历史信息输入所述第一平台的主题模型,得到所述用户的第一兴趣特征信息;第二处理模块,用于将所述第一兴趣特征信息输入跨平台关联模型,得到所述第二兴趣特征信息,以便基于所述第二兴趣特征信息在所述第二平台上为所述用户推荐信息。

本发明实施例的跨平台主题关联装置,通过获取用户在第一平台上的历史信息,并将历史信息输入第一平台的主题模型得到用户的第一兴趣特征信息,然后将第一兴趣特征信息输入跨平台关联模型得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。由此,能够考虑到用户在不同平台上表现出的兴趣差异性,解决跨平台数据不一致问题,更好地实现了基于用户的跨平台关联。

另外,根据本发明上述实施例的跨平台主题关联装置还可以具有如下附加的技术特征:

可选地,所述的装置,其特征在于,还包括:训练模块,用于应用多模态自编码器将用户在不同平台上通过主题模型得到的特征信息作为输入,以重构误差为损失函数迭代地训练网络参数得到跨平台关联模型。

可选地,所述的装置,还包括:分层模块,用于将所述多模态自编码器的网络结构中的中间隐层分为公共和差异部分;保留模块,用于保留输入层、输出层到中间隐层公共部分和差异部分的连接。

为达到上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现第一方面实施例所述的方法,所述方法包括:获取用户在第一平台上的历史信息;将所述历史信息输入所述第一平台的主题模型,得到所述用户的第一兴趣特征信息;将所述第一兴趣特征信息输入跨平台关联模型,得到所述第二兴趣特征信息,以便基于所述第二兴趣特征信息在所述第二平台上为所述用户推荐信息。

为达到上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面实施例所述的方法,所述方法包括:获取用户在第一平台上的历史信息;将所述历史信息输入所述第一平台的主题模型,得到所述用户的第一兴趣特征信息;将所述第一兴趣特征信息输入跨平台关联模型,得到所述第二兴趣特征信息,以便基于所述第二兴趣特征信息在所述第二平台上为所述用户推荐信息。

为达到上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如第一方面实施例所述的方法,所述方法包括:获取用户在第一平台上的历史信息;将所述历史信息输入所述第一平台的主题模型,得到所述用户的第一兴趣特征信息;将所述第一兴趣特征信息输入跨平台关联模型,得到所述第二兴趣特征信息,以便基于所述第二兴趣特征信息在所述第二平台上为所述用户推荐信息。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

图1是根据本发明一个实施例的跨平台主题关联方法的流程示意图;

图2是根据本发明一个实施例的跨平台关联模型的结构示意图;

图3是根据本发明一个实施例的跨平台主题关联装置的结构示意图;

图4是根据本发明另一个实施例的跨平台主题关联装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面结合附图来描述本发明实施例的跨平台主题关联方法、装置及其设备。

图1是根据本发明一个实施例的跨平台主题关联方法的流程示意图。如图1所示,该跨平台主题关联方法包括以下步骤:

步骤101,获取用户在第一平台上的历史信息。

具体地,在实际应用当中,用户可以活跃于不同的平台上,比如微博、微信、爱奇艺、优酷等等中的一种或者多种。可以理解的是,不同的平台可能具有差异性,也就是说用户在不同平台上表现出的主题兴趣可能一致也可能不一致。

本发明实施例主要解决用户在不同平台上兴趣不一致时如何实现跨平台关联。

首先,获取用户在第一平台(可以微博、微信等中的一种)上的历史信息。作为一种示例,获取用户在微博上观看的视频信息为历史信息等等。可以根据实际应用需要进行选择设置。

需要说明的是,在不同的平台上每个用户都具有其对应的标识以确定用户的唯一性,比如用户的账号密码作为识别该用户。

步骤102,将历史信息输入第一平台的主题模型,得到用户的第一兴趣特征信息。

具体地,在获取用户的历史信息之后,将历史信息输入第一平台的主题模型得到用户的第一兴趣特征信息。可以理解的是,历史信息有很多且多样化,通过输入主题模型对历史信息进行处理可以得到用户的第一兴趣特征信息。也就是说在第一平台上预先具有其主题模型,比如“搞笑”、“美食”“新闻”和“美妆”等等。将用户的历史输入进去后,可以得到用户在第一平台上的第一兴趣特征信息,比如喜欢美食视频、吃货等等作为第一兴趣特征信息。

步骤103,将第一兴趣特征信息输入跨平台关联模型,得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。

需要说明的是,这里的第二平台是用户之前没有登录过的,也可以理解为新用户。在获取第一兴趣特征信息输入预先跨平台关联模型,通过处理可以得到用户在第二平台上的第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。

其中,跨平台关联模型是预先训练好的,作为一种示例,应用多模态自编码器将用户在不同平台上通过主题模型得到的特征信息作为输入,以重构误差为损失函数迭代地训练网络参数得到跨平台关联模型。即把表达能力换成了拟合能力。

可以理解的是,应用多模态自编码器,将不同平台用户兴趣特征作为输入,学习联合表征的非线性映射函数,模型拟合能力更强。

可以理解的是,为了,能够保留差异性而且更准确地为他推荐感兴趣的信息,将多模态自编码器的网络结构中的中间隐层分为公共和差异部分,保留输入层、输出层到中间隐层公共部分和对应平台差异部分的连接。即将网络结构中其他连接的权值固定为零,从而在中间隐层联合表征中明确保留各平台差异部分,更好地实现跨平台关联。

为了本领域人员更加清楚上述过程,下面结合图2具体描述说明。图2是根据本发明一个实施例的跨平台关联模型的结构示意图。

具体地,作为一种示例,对于视频平台(如youtube)上的冷启动用户(新注册无历史信息),首先根据他在社交平台(如twitter)上的历史信息通过主题建模得到他的兴趣特征,以此作为本发明跨平台关联模型的已知输入,未知视频平台的重构输出即是模型推断出他的兴趣特征,据此可以给出冷启动推荐结果。

如图2所示,ut和uγ是同一用户在twitter和youtube平台上通过主题模型得到的特征;中间隐层ut和uγ是保留两个平台差异的部分,hc是跨平台公共部分;输出由公共部分和差异两部分共同推断得到。原模型中ut到uγ,uγ到ut有连接,本发明实施例去掉后在中间层区分出差异部分hc和ht

由此,通过将输入输出到中间隐层的全连接网络结构改进为部分连接,在联合表征中明确区分共有和差异部分,考虑用户在不同平台的差异性,更好地实现跨平台关联。

为了本领域人员更加清楚上述过程,下面结合具体场景进行说明。以twitter社交平台和youtube视频平台为例,说明跨平台关联模型的训练过程:

首先,抓取在twitter和youtube上都活跃,并且已知id对应关系的跨平台用户的历史信息。

进一步地,在twitter和youtube上分别通过主题模型(如lda)得到用户兴趣特征,不同平台可以应用不同的主题模型。

进一步地,以同一用户在两个平台上的一对特征作为训练集的一个样本,对训练集数据进行增补:保留其中一个平台特征而将另一特征全部置为零,这样训练集样本量扩展为原来的3倍。

进一步地,以扩展后的训练集作为输入,以多模态自编码器重构出的两个特征与真实数据的平均绝对误差为损失函数,通过经典的反向传播算法迭代地训练模型参数。

举例而言,以视频平台为例的冷启动推荐问题。具体地,视频内容的观看成本高,尤其是对新用户来说推荐系统更加重要。对于冷启动用户,根据他在其他平台的历史信息,基于本方案的跨平台关联模型,能够保留差异性而且更准确地为他推荐感兴趣的视频内容。

下面以twitter社交平台和youtube视频平台为例,接续上文训练过程,说明youtube冷启动视频推荐应用过程:

首先,对于youtube上的新用户,抓取用户在twitter上的历史信息。

进一步地,通过twitter上的主题模型,得到他在twitter上的特征。

进一步地,以用户的已知twitter特征和零向量(youtube特征未知)为一对样本输入上文训练好的网络,输出的youtube重构特征即为模型推断出的youtube特征,最后根据推断出的youtube兴趣特征,为用户推荐视频内容。通过视频平台冷启动用户与社交平台的交互历史,推断他在本平台的兴趣并做出推荐。

综上所述,本发明实施例的跨平台主题关联方法,通过获取用户在第一平台上的历史信息,并将历史信息输入第一平台的主题模型得到用户的第一兴趣特征信息,然后将第一兴趣特征信息输入跨平台关联模型得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。由此,能够考虑到用户在不同平台上表现出的兴趣差异性,解决跨平台数据不一致问题,更好地实现了基于用户的跨平台关联。

与上述几种实施例提供的跨平台主题关联方法相对应,本发明的一种实施例还提供一种跨平台主题关联装置,由于本发明实施例提供的跨平台主题关联装置与上述几种实施例提供的跨平台主题关联方法相对应,因此在前述跨平台主题关联方法的实施方式也适用于本实施例提供的跨平台主题关联装置,在本实施例中不再详细描述。

图3是根据本发明一个实施例的跨平台主题关联装置的结构示意图。如图3所示,该跨平台主题关联装置包括:获取模块11、第一处理模块12和第二处理模块13。

其中,获取模块11,用于获取用户在第一平台上的历史信息。

第一处理模块12,用于将历史信息输入所述第一平台的主题模型,得到用户的第一兴趣特征信息。

第二处理模块13,用于将第一兴趣特征信息输入跨平台关联模型,得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为所述用户推荐信息。

进一步地,在本发明的一个实施例中,如图4所示,在图3的基础上,该装置还包括:训练模块14、分层模块15和保留模块16。

训练模块14,用于应用多模态自编码器将用户在不同平台上通过主题模型得到的特征信息作为输入,以重构误差为损失函数迭代地训练网络参数得到跨平台关联模型。

分层模块15,用于将多模态自编码器的网络结构中的中间隐层分为公共和差异部分。

保留模块16,用于保留输入层、输出层到中间隐层公共部分和差异部分的连接。

综上所述,本发明实施例的跨平台主题关联装置,通过获取用户在第一平台上的历史信息,并将历史信息输入第一平台的主题模型得到用户的第一兴趣特征信息,然后将第一兴趣特征信息输入跨平台关联模型得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。由此,能够考虑到用户在不同平台上表现出的兴趣差异性,解决跨平台数据不一致问题,更好地实现了基于用户的跨平台关联。

为了实现上述实施例,本发明还提出计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,使得能够执行一种跨平台主题关联方法,所述方法包括:获取用户在第一平台上的历史信息;将历史信息输入第一平台的主题模型,得到用户的第一兴趣特征信息;将第一兴趣特征信息输入跨平台关联模型,得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。

为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行一种跨平台主题关联方法,所述方法包括:获取用户在第一平台上的历史信息;将历史信息输入第一平台的主题模型,得到用户的第一兴趣特征信息;将第一兴趣特征信息输入跨平台关联模型,得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。

为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,使得能够执行一种跨平台主题关联方法,所述方法包括:获取用户在第一平台上的历史信息;将历史信息输入第一平台的主题模型,得到用户的第一兴趣特征信息;将第一兴趣特征信息输入跨平台关联模型,得到第二兴趣特征信息,以便基于第二兴趣特征信息在第二平台上为用户推荐信息。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1