基于人工智能的信息推送方法和装置与流程

文档序号:14554948阅读:214来源:国知局
基于人工智能的信息推送方法和装置与流程

本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及基于人工智能的信息推送方法和装置。



背景技术:

人工智能(artificialintelligence,ai)技术的快速发展为人们的日常工作和生活提供了便利。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能越来越多地融入到应用中,结合人工智能的应用可以准确地分析出用户所需的信息,并将用户所需的信息推送给用户。

信息推送,又称为“网络广播”,通常是通过一定的技术标准或协议,在互联网上通过推送用户需要的信息来减少信息过载的一项技术。信息推送技术通过主动推送信息给用户,可以减少用户在网络上搜索所花的时间。

现有的信息推送方式仅仅可以为曾经浏览过信息的用户主动推送信息,即根据用户的历史信息浏览记录确定用户感兴趣的信息类别,并将属于用户感兴趣的信息类别的信息推送给用户。



技术实现要素:

本申请实施例提出了基于人工智能的信息推送方法和装置。

第一方面,本申请实施例提供了一种基于人工智能的信息推送方法,该方法包括:获取待推送用户的用户画像和/或搜索记录;提取待推送用户的用户画像和/或搜索记录的特征向量;将所提取的特征向量输入至预先训练的类别推荐模型中,得到待推送用户的推荐类别,其中,类别推荐模型用于表征特征向量与推荐类别之间的对应关系;获取至少一条属于待推送用户的推荐类别的信息,并推送给待推送用户。

在一些实施例中,类别推荐模型通过如下步骤训练得到:获取多个样本用户的用户画像和/或搜索记录;提取多个样本用户的用户画像和/或搜索记录的特征向量;获取多个样本用户的信息浏览记录集合确定多个样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别;对于多个样本用户中的每个样本用户,将该样本用户的用户画像和/或搜索记录的特征向量作为输入,将该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别作为输出,训练得到类别推荐模型。

在一些实施例中,将该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别作为输出,包括:对该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息进行统计分析,得到该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率;基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,确定该样本用户的推荐类别集合和非推荐类别集合;将该样本用户的推荐类别集合和非推荐类别集合中的类别两两进行组合,得到多个类别对;将多个类别对作为输出。

在一些实施例中,基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,确定该样本用户的推荐类别集合和非推荐类别集合,包括:基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,计算该样本用户的每种类别的推荐分数;将该样本用户的每种类别的推荐分数与每种类别所对应的第一预设分数阈值和第二预设分数阈值进行比较,其中,每种类别所对应的第一预设分数阈值不小于每种类别所对应的第二预设分数阈值;获取大于每种类别所对应的第一预设分数阈值的类别,生成该样本用户的推荐类别集合;获取小于每种类别所对应的第二预设分数阈值的类别,生成该样本用户的非推荐类别集合。

在一些实施例中,每种类别所对应的第一预设分数阈值和第二预设分数阈值通过如下步骤计算得到:对于每种类别,按照推荐分数的大小顺序对多个样本用户的该种类别的推荐分数进行排序;从推荐分数大的一侧开始,选取出第一预设数目的样本用户的该种类别的推荐分数,计算第一预设数目的样本用户的该种类别的推荐分数的平均值,并作为该种类别所对应的第一预设分数阈值;从推荐分数小的一侧开始,选取出第二预设数目的样本用户的该种类别的推荐分数,计算第二预设数目的样本用户的该种类别的推荐分数的平均值,并作为该种类别所对应的第二预设分数阈值。

第二方面,本申请实施例提供了一种基于人工智能的信息推送装置,该装置包括:获取单元,配置用于获取待推送用户的用户画像和/或搜索记录;提取单元,配置用于提取待推送用户的用户画像和/或搜索记录的特征向量;推荐单元,配置用于将所提取的特征向量输入至预先训练的类别推荐模型中,得到待推送用户的推荐类别,其中,类别推荐模型用于表征特征向量与推荐类别之间的对应关系;推送单元,配置用于获取至少一条属于待推送用户的推荐类别的信息,并推送给待推送用户。

在一些实施例中,该装置还包括训练单元,训练单元包括:第一获取子单元,配置用于获取多个样本用户的用户画像和/或搜索记录;提取子单元,配置用于提取多个样本用户的用户画像和/或搜索记录的特征向量;第二获取子单元,配置用于获取多个样本用户的信息浏览记录集合;确定子单元,配置用于确定多个样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别;训练子单元,配置用于对于多个样本用户中的每个样本用户,将该样本用户的用户画像和/或搜索记录的特征向量作为输入,将该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别作为输出,训练得到类别推荐模型。

在一些实施例中,训练子单元,包括:统计模块,配置用于对该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息进行统计分析,得到该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率;确定模块,配置用于基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,确定该样本用户的推荐类别集合和非推荐类别集合;组合模块,配置用于将该样本用户的推荐类别集合和非推荐类别集合中的类别两两进行组合,得到多个类别对;作为模块,配置用于将多个类别对作为输出。

在一些实施例中,确定模块进一步配置用于:基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,计算该样本用户的每种类别的推荐分数;将该样本用户的每种类别的推荐分数与每种类别所对应的第一预设分数阈值和第二预设分数阈值进行比较,其中,每种类别所对应的第一预设分数阈值不小于每种类别所对应的第二预设分数阈值;获取大于每种类别所对应的第一预设分数阈值的类别,生成该样本用户的推荐类别集合;获取小于每种类别所对应的第二预设分数阈值的类别,生成该样本用户的非推荐类别集合。

在一些实施例中,该装置还包括计算单元,计算单元包括:排序子单元,配置用于对于每种类别,按照推荐分数的大小顺序对多个样本用户的该种类别的推荐分数进行排序;第一计算子单元,配置用于从推荐分数大的一侧开始,选取出第一预设数目的样本用户的该种类别的推荐分数,计算第一预设数目的样本用户的该种类别的推荐分数的平均值,并作为该种类别所对应的第一预设分数阈值;第二计算子单元,配置用于从推荐分数小的一侧开始,选取出第二预设数目的样本用户的该种类别的推荐分数,计算第二预设数目的样本用户的该种类别的推荐分数的平均值,并作为该种类别所对应的第二预设分数阈值。

第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。

本申请实施例提供的基于人工智能的信息推送方法和装置,通过获取待推送用户的用户画像和/或搜索记录,以便于提取待推送用户的用户画像和/或搜索记录的特征向量;然后将所提取的特征向量输入至预先训练的、表征特征向量与推荐类别之间的对应关系的类别推荐模型中,从而得到待推送用户的推荐类别;最后获取至少一条属于待推送用户的推荐类别的信息,并推送给待推送用户。不论用户是否曾经浏览过信息,均可以通过能够表征特征向量与推荐类别之间的对应关系的类别推荐模型预测出待推送用户的推荐类别,从而将属于待推送用户的推荐类别的信息推送给用户,实现了富于针对性地信息推送。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是本申请实施例可以应用于其中的示例性系统架构图;

图2是根据本申请的基于人工智能的信息推送方法的一个实施例的流程图;

图3是根据本申请的类别推荐模型训练方法的一个实施例的流程图;

图4是根据本申请的基于人工智能的信息推送装置的一个实施例的结构示意图;

图5是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的基于人工智能的信息推送方法或基于人工智能的信息推送装置的实施例的示例性系统架构100.

如图1所示,系统架构100可以包括终端设备101、网络102、第一数据库服务器103、第二数据库服务器104和服务器105。网络102用以在终端设备101、第一数据库服务器103、第二数据库服务器104和服务器105之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤光缆等等。

用户可以使用终端设备101通过网络102与服务器105交互,以接受或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如信息浏览类应用、搜索类应用等等。

终端设备101可以是具有显示屏且支持信息浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上便携计算机和台式计算机等等。

第一数据库服务器103可以是用于存储用户画像的数据库服务器。

第二数据库服务器104可以是搜索类应用或信息浏览类应用的后台数据库服务器,用于存储用户的搜索记录。

服务器105可以提供各种服务,例如,服务器105可以对从第一数据库服务器103获取的待推送用户的用户画像和/或从第二数据库服务器104获取的待推送用户的搜索记录进行分析等处理,并将处理结果(例如属于待推送用户的推荐类别的信息)推送给终端设备101。

需要说明的是,本申请实施例所提供的基于人工智能的信息推送方法一般由服务器105执行,相应地,基于人工智能的信息推送装置一般设置在服务器105中。

应该理解,图1中的终端设备、网络、第一数据库服务器、第二数据库服务器和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络、第一数据库服务器、第二数据库服务器和服务器。

继续参考图2,其示出了根据本申请的基于人工智能的信息推送方法的一个实施例的流程200。该基于人工智能的信息推送方法,包括以下步骤:

步骤201,获取待推送用户的用户画像和/或搜索记录。

在本实施例中,基于人工智能的信息推送方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式从用于存储用户画像的数据库服务器(例如图1所示的第一数据库服务器103)获取待推送用户的用户画像和/或从用于存储搜索记录的数据库服务器(例如图1所示的第二数据库服务器104)获取待推送用户的搜索记录。其中,待推送用户可以是曾经浏览过信息的用户,也可以是曾经未浏览过信息的用户。

在本实施例中,用户画像可以是根据预先积累的用户数据所建立的包括至少一种类别的描述性标签的用户信息。描述性标签可以用于描述用户的性别、年龄、婚姻状况、职业、收入状况、教育水平等等。作为示例,一个用户画像所包含的用户信息可以是“性别:男,年龄:30-35岁,婚姻状况:已婚,职业:银行职员,收入状况:大于8000,教育水平:大学毕业”。这里,用于存储用户画像的数据库服务器可以将用户标识和用户画像一一对应存储,电子设备可以将待推送用户的用户标识与数据库服务器中存储的用户标识逐一进行匹配,若存在用户标识与待推送用户的用户标识相同,则匹配成功,匹配成功的用户标识所对应的用户画像即为待推送用户的用户画像。其中,用户标识可以由字母、数字、符号等组成,用于唯一标识用户。

在本实施例中,搜索记录可以是用户在多种搜索类应用或者多种信息浏览类应用中进行搜索所产生的搜索记录。搜索记录中通常可以包括用户的搜索行为数据,用户的搜索行为数据可以包括但不限于用户进行搜索时所输入的搜索式、用户针对本次搜索所得到的信息、用户针对本次搜索所浏览的信息等等。这里,用于存储搜索记录的数据库服务器可以将用户标识和搜索记录一一对应存储,电子设备可以将待推送用户的用户标识与数据库服务器中存储的用户标识逐一进行匹配,若存在用户标识与待推送用户的用户标识相同,则匹配成功,匹配成功的用户标识所对应的搜索记录即为待推送用户的搜索记录。

步骤202,提取待推送用户的用户画像和/或搜索记录的特征向量。

在本实施例中,基于步骤201所获取的待推送用户的用户画像和/或搜索记录,电子设备可以提取待推送用户的用户画像和/或搜索记录的特征向量。其中,待推送用户的用户画像和/或搜索记录的特征向量可以用于描述待推送用户的用户画像和/或搜索记录的属性。具体地,对于用户画像,电子设备可以对用户画像中的各种类别的描述性标签进行编码,以得到各种类别的描述性标签的特征值,若用户画像不完整,即缺少某种类别的描述性标签,则将该类别的描述性标签的特征值设置为0,0代表该类别的描述性标签缺失。对于搜索记录,电子设备可以对搜索记录中的搜索式进行切词,以得到搜索记录的关键词集合,然后将关键词集合中的关键词与预先生成的词典中词逐一进行匹配,以得到各个关键词的特征值。若一个关键词与词典中的一个词匹配成功,则匹配成功的词所对应的特征值即为该关键词的特征值,其中,词典中的词与词的特征值一一对应;若一个关键词在词典中匹配不成功,则将该关键词的特征值设置为0,0代表该关键词不在词典中。

步骤203,将所提取的特征向量输入至预先训练的类别推荐模型中,得到待推送用户的推荐类别。

在本实施例中,基于步骤202所提取的待推送用户的用户画像和/或搜索记录的特征向量,电子设备可以将所提取的特征向量输入至预先训练的类别推荐模型中,从而得到待推送用户的推荐类别。其中,信息可以被预先划分为各种类别的信息,例如体育类信息、时政类信息、经济类信息、娱乐类信息等等。待推送用户的推荐类别可以是利用类别推荐模型所预测的待推送用户感兴趣的类别。这里,电子设备可以将特征向量从类别推荐模型的输入侧输入,经过类别推荐模型的处理,并从类别推荐模型的输出侧输出,输出侧输出的信息即为待推送用户的推荐类别。

在本实施例中,类别推荐模型可以用于表征特征向量与推荐类别之间的对应关系,电子设备可以多种方式训练可以表征特征向量与推荐类别之间的对应关系的类别推荐模型。作为示例,电子设备可以基于对大量用户的用户画像和/或搜索记录的特征向量和用户的推荐类别进行统计而生成存储有多个用户的用户画像和/或搜索记录的特征向量和用户的推荐类别的对应关系的对应关系表,并将对应关系表作为类别推荐模型。这样,电子设备可以计算待推送用户的用户画像和/或搜索记录的特征向量与该对应关系表中的多个用户的用户画像和/或搜索记录的特征向量的相似度,若该对应关系表中的一个用户的用户画像和/或搜索记录的特征向量与待推送用户的用户画像和/或搜索记录的特征向量的相似度大于预设相似度阈值,则将该用户的推荐类别作为待推送用户的推荐类别。

步骤204,获取至少一条属于待推送用户的推荐类别的信息,并推送给待推送用户。

在本实施例中,基于步骤203所得到的待推送用户的推荐类别,电子设备可以获取至少一条属于待推送用户的推荐类别的信息,并将其推送给待推送用户。作为示例,电子设备可以将待推送用户的推荐类别与信息集合组中的各个信息集合所属的类别进行匹配,若存在信息集合所属的类别与待推送用户的推荐类别相同,则匹配成功,电子设备可以从匹配成功的信息集合中选取出至少一条信息,并将其推送给待推送用户。其中,信息集合组中的一个信息集合属于一种类别。

本申请实施例提供的基于人工智能的信息推送方法,通过获取待推送用户的用户画像和/或搜索记录,以便于提取待推送用户的用户画像和/或搜索记录的特征向量;然后将所提取的特征向量输入至预先训练的、表征特征向量与推荐类别之间的对应关系的类别推荐模型中,从而得到待推送用户的推荐类别;最后获取至少一条属于待推送用户的推荐类别的信息,并推送给待推送用户。不论用户是否曾经浏览过信息,均可以通过能够表征特征向量与推荐类别之间的对应关系的类别推荐模型输出待推送用户的推荐类别,从而将属于待推送用户的推荐类别的信息推送给用户,实现了富于针对性地信息推送。

进一步参考图3,其示出了根据本申请的类别推荐模型训练方法的一个实施例的流程300。该类别推荐模型训练方法的流程300,包括以下步骤:

步骤301,获取多个样本用户的用户画像和/或搜索记录。

在本实施例中,类别推荐模型训练方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式从用于存储用户画像的数据库服务器(例如图1所示的第一数据库服务器103)获取多个样本用户的用户画像和/或从用于存储搜索记录的数据库服务器(例如图1所示的第二数据库服务器104)获取多个样本用户的搜索记录。其中,样本用户可以是曾经浏览过信息的用户。

在本实施例中,用于存储用户画像的数据库服务器可以将用户标识和用户画像一一对应存储,电子设备可以将样本用户的用户标识与数据库服务器中存储的用户标识逐一进行匹配,若存在用户标识与样本户的用户标识相同,则匹配成功,匹配成功的用户标识所对应的用户画像即为样本用户的用户画像。

在本实施例中,用于存储搜索记录的数据库服务器可以将用户标识和搜索记录一一对应存储,电子设备可以将样本用户的用户标识与数据库服务器中存储的用户标识逐一进行匹配,若存在用户标识与样本用户的用户标识相同,则匹配成功,匹配成功的用户标识所对应的搜索记录即为样本用户的搜索记录。

步骤302,提取多个样本用户的用户画像和/或搜索记录的特征向量。

在本实施例中,基于步骤301所获取的多个样本用户的用户画像和/或搜索记录,电子设备可以提取多个样本用户的用户画像和/或搜索记录的特征向量。其中,样本用户的用户画像和/或搜索记录的特征向量可以用于描述样本用户的用户画像和/或搜索记录的属性。

步骤303,获取多个样本用户的信息浏览记录集合。

在本实施例中,类别推荐模型训练方法运行于其上的电子设备可以通过有线连接方式或者无线连接方式从用于存储信息浏览记录的数据库服务器(例如图1所示的第二数据库服务器104)获取多个样本用户的信息浏览记录集合。

在本实施例中,信息浏览记录可以是用户在搜索类应用或者信息浏览类应用中浏览信息所产生的信息浏览记录。信息浏览记录通常可以包括所浏览信息的信息标识,信息标识可以是信息的标题、网址等。这里,用于存储信息浏览记录的数据库服务器可以将用户标识和信息浏览记录集合一一对应存储,电子设备可以将样本用户的用户标识与数据库服务器中存储的用户标识逐一进行匹配,若存在用户标识与样本用户的用户标识相同,则匹配成功,匹配成功的用户标识所对应的信息浏览记录集合即为样本用户的信息浏览记录集合。

步骤304,确定多个样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别。

在本实施例中,基于步骤303所获取的多个样本用户的信息浏览记录集合,电子设备可以确定多个样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别。具体地,若信息浏览记录中包括信息浏览记录所指示的信息的类别,则电子设备可以直接从信息浏览记录中提取信息浏览记录所指示的信息的类别;若信息浏览记录中不包括信息浏览记录所指示的信息的类别,则电子设备可以首先根据信息浏览记录中的信息标识获取信息浏览记录所指示的信息,然后对信息浏览记录所指示的信息的内容进行分析,从而得到信息浏览记录所指示的信息的类别。

步骤305,对于多个样本用户中的每个样本用户,将该样本用户的用户画像和/或搜索记录的特征向量作为输入,将该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别作为输出,训练得到类别推荐模型。

在本实施例中,基于步骤302所提取的多个样本用户的用户画像和/或搜索记录的特征向量和步骤304所确定的多个样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别,电子设备可以将多个样本用户的用户画像和/或搜索记录的特征向量作为输入,将多个样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别作为输出,训练出能够表征特征向量与推荐类别之间对应关系的类别推荐模型。

在本实施例中,类别推荐模型可以是各种类型的人工神经网络或者对多种类型的人工神经网络进行组合所得到的模型。它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。通常由大量的节点(或称神经元)之间相互联接构成,每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,网络的输出则依网络的连接方式、权重值和激励函数的不同而不同。这里,电子设备训练的可以是初始化类别推荐模型,初始化类别推荐模型可以是未经训练的类别推荐模型或未训练完成的类别推荐模型,初始化类别推荐模型可以设置有初始参数,参数在类别推荐模型的训练过程中可以被不断地调整,直至训练出能够表征特征向量与推荐类别之间对应关系的类别推荐模型为止。

在本实施例中,电子设备可以将样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别全部作为推荐类别,并将推荐类别作为输出;也可以从样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别中选取出部分类别作为推荐类别,并将推荐类别作为输出;还可以从样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别中选取出部分类别作为推荐类别,选取出另一部分类别作为非推荐类别,并将推荐类别和非推荐类别作为输出,其中,推荐类别可以是样本用户感兴趣的类别,非推荐类别可以是样本用户不感兴趣的类别。

在本实施例的一些可选的实现方式中,电子设备可以通过如下步骤从样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别中选取出输出:

首先,对该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息进行统计分析,得到该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率。

这里,点击通过率(click-through-rate,ctr)又被称为点展比,指信息的点击到达率,即该信息的实际点击次数除以该信息的展现量。

之后,基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,确定该样本用户的推荐类别集合和非推荐类别集合。

这里,该样本用户对一种类别的信息的点击数越大,点击通过率越高,则该种类别是推荐类别的概率越高;该样本用户对一种类别的信息的点击数越小,点击通过率越低,则该种类别是非推荐类别的概率越高。

然后,将该样本用户的推荐类别集合和非推荐类别集合中的类别两两进行组合,得到多个类别对。

这里,若该样本用户的推荐类别集合中包括3个推荐类别,非推荐类别集合中包括2个非推荐类别,则电子设备可以对着推荐集合和非推荐集合中的类别两两进行组合,从而得到6个类别对。其中,一个类别对中包括一个推荐类别和一个非推荐类别。

最后,将多个类别对作为输出。

这里,利用包括一个推荐类别和一个非推荐类别的类别对作为输出,在训练过程中,类别推荐模型可以将类别对中的推荐类别和非推荐类别分别转化为与样本用户的用户画像和/或搜索记录的特征向量在同一个空间中的向量,并且使推荐类别的向量与特征向量的相似度高,非推荐类别的向量与特征向量的相似度低。

在本实施例的一些可选的实现方式中,电子设备可以通过如下步骤确定该样本用户的推荐类别集合和非推荐类别集合:

首先,基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,计算该样本用户的每种类别的推荐分数。

可选地,电子设备可以通过如下公式计算该样本用户的c类别的推荐分数scorec:

其中,c为一种类别,clickc为该样本用户对c类别的信息的点击数,avg_slickc为多个样本用户对c类别的信息的点击数,ctrc为该样本用户对c类别的信息的点击通过率,avg_ctrc为多个样本用户对c类别的信息的点击通过率,a为预设超参数,可以根据需求进行调整。

可选地,电子设备还可以对该样本用户的c类别的推荐分数scorec进行归一化处理。具体地,电子设备可以利用该样本用户的c类别的推荐分数scorec除以该用户的各种类别的推荐分数中的最大值,并将所得到的商作为该样本用户的c类别的归一化推荐分数。

然后,将该样本用户的每种类别的推荐分数与每种类别所对应的第一预设分数阈值和第二预设分数阈值进行比较。

其中,每种类别所对应的第一预设分数阈值不小于每种类别所对应的第二预设分数阈值。

最后,获取大于每种类别所对应的第一预设分数阈值的类别,生成该样本用户的推荐类别集合;获取小于每种类别所对应的第二预设分数阈值的类别,生成该样本用户的非推荐类别集合。

在本实施例的一些可选的实现方式中,每种类别所对应的第一预设分数阈值和第二预设分数阈值通过如下步骤计算得到:

首先,对于每种类别,按照推荐分数的大小顺序对多个样本用户的该种类别的推荐分数进行排序。

这里,可以按照推荐分数从大到小的顺序对多个样本用户的该种类别的推荐分数进行排序,也可以按照推荐分数从小到大的顺序对多个样本用户的该种类别的推荐分数进行排序。

然后,从推荐分数大的一侧开始,选取出第一预设数目的样本用户的该种类别的推荐分数,计算第一预设数目的样本用户的该种类别的推荐分数的平均值,并作为该种类别所对应的第一预设分数阈值;从推荐分数小的一侧开始,选取出第二预设数目的样本用户的该种类别的推荐分数,计算第二预设数目的样本用户的该种类别的推荐分数的平均值,并作为该种类别所对应的第二预设分数阈值。

作为示例,电子设备可以从推荐分数大的一侧开始选取出15%的样本用户的该种类别的推荐分数,以计算第一预设分数阈值;还可以从推荐分数小的一侧开始选取出15%的样本用户的该种类别的推荐分数,以计算第二预设分数阈值。

进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种基于人工智能的信息推送装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图4所示,本实施例的基于人工智能的信息推送装置400可以包括:获取单元401、提取单元402、推荐单元403和推送单元404。其中,获取单元401,配置用于获取待推送用户的用户画像和/或搜索记录;提取单元402,配置用于提取待推送用户的用户画像和/或搜索记录的特征向量;推荐单元403,配置用于将所提取的特征向量输入至预先训练的类别推荐模型中,得到待推送用户的推荐类别,其中,类别推荐模型用于表征特征向量与推荐类别之间的对应关系;推送单元404,配置用于获取至少一条属于待推送用户的推荐类别的信息,并推送给待推送用户。

在本实施例中,基于人工智能的信息推送装置400中:获取单元401、提取单元402、推荐单元403和推送单元404的具体处理及其所带来的技术效果可分别参考图2对应的实施例中步骤201、步骤202、步骤203和步骤204的相关说明,在此不再赘述。

在本实施例的一些可选的实现方式中,基于人工智能的信息推送装置400还可以包括训练单元(图中未示出),训练单元可以包括:第一获取子单元(图中未示出),配置用于获取多个样本用户的用户画像和/或搜索记录;提取子单元(图中未示出),配置用于提取多个样本用户的用户画像和/或搜索记录的特征向量;第二获取子单元(图中未示出),配置用于获取多个样本用户的信息浏览记录集合;确定子单元(图中未示出),配置用于确定多个样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别;训练子单元(图中未示出),配置用于对于多个样本用户中的每个样本用户,将该样本用户的用户画像和/或搜索记录的特征向量作为输入,将该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息的类别作为输出,训练得到类别推荐模型。

在本实施例的一些可选的实现方式中,训练子单元可以包括:统计模块(图中未示出),配置用于对该样本用户的信息浏览记录集合中的信息浏览记录所指示的信息进行统计分析,得到该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率;确定模块(图中未示出),配置用于基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,确定该样本用户的推荐类别集合和非推荐类别集合;组合模块(图中未示出),配置用于将该样本用户的推荐类别集合和非推荐类别集合中的类别两两进行组合,得到多个类别对;作为模块(图中未示出),配置用于将多个类别对作为输出。

在本实施例的一些可选的实现方式中,确定模块可以进一步配置用于:基于该样本用户对每种类别的信息的点击数和每种类别的信息的点击通过率,计算该样本用户的每种类别的推荐分数;将该样本用户的每种类别的推荐分数与每种类别所对应的第一预设分数阈值和第二预设分数阈值进行比较,其中,每种类别所对应的第一预设分数阈值不小于每种类别所对应的第二预设分数阈值;获取大于每种类别所对应的第一预设分数阈值的类别,生成该样本用户的推荐类别集合;获取小于每种类别所对应的第二预设分数阈值的类别,生成该样本用户的非推荐类别集合。

在本实施例的一些可选的实现方式中,基于人工智能的信息推送装置400还可以包括计算单元(图中未示出),计算单元包括:排序子单元(图中未示出),配置用于对于每种类别,按照推荐分数的大小顺序对多个样本用户的该种类别的推荐分数进行排序;第一计算子单元(图中未示出),配置用于从推荐分数大的一侧开始,选取出第一预设数目的样本用户的该种类别的推荐分数,计算第一预设数目的样本用户的该种类别的推荐分数的平均值,并作为该种类别所对应的第一预设分数阈值;第二计算子单元(图中未示出),配置用于从推荐分数小的一侧开始,选取出第二预设数目的样本用户的该种类别的推荐分数,计算第二预设数目的样本用户的该种类别的推荐分数的平均值,并作为该种类别所对应的第二预设分数阈值。

下面参考图5,其示出了适于用来实现本申请实施例的电子设备的计算机系统500的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示,计算机系统500包括中央处理单元(cpu)501,其可以根据存储在只读存储器(rom)502中的程序或者从存储部分608加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。在ram503中,还存储有系统500操作所需的各种程序和数据。cpu501、rom502以及ram503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。

以下部件连接至i/o接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至i/o接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(cpu)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、提取单元、推荐单元和推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取待推送用户的用户画像和/或搜索记录的单元”。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取待推送用户的用户画像和/或搜索记录;提取待推送用户的用户画像和/或搜索记录的特征向量;将所提取的特征向量输入至预先训练的类别推荐模型中,得到待推送用户的推荐类别,其中,类别推荐模型用于表征特征向量与推荐类别之间的对应关系;获取至少一条属于待推送用户的推荐类别的信息,并推送给待推送用户。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1