一种确定用户的偏好模式的方法及装置的制造方法

文档序号：8361436阅读：262来源：国知局

一种确定用户的偏好模式的方法及装置的制造方法
【技术领域】
[0001] 本申请涉及网络信息处理技术，尤其涉及一种确定用户的偏好模式的方法及装置。
【背景技术】
[0002] 随着互联网技术的快速普及，当今社会的信息资源呈爆炸性的增长，信息需求也日益猛增，如何使用户在庞乱繁杂的信息海洋中及时准确地获得所需要的信息，又如何满足不同用户对不同层次的信息需求，已成为互联网信息服务中亟待解决的问题。互联网个性化信息服务无疑是一条很好的解决途径，它可以为用户提供有针对性的信息服务。
[0003] 互联网个性化信息服务，是能够满足用户个性化信息需求的一种服务，通过对用户信息需求、兴趣爱好、使用习惯和访问历史的收集分析、建立用户模型，并将用户模型应用于网上信息的过滤和排序，从而指导用户浏览、检索信息或向用户主动推送信息。
[0004] 具体而言，目前现有技术对于实现互联网个性化信息服务主要有两方面，一方面是按用户分类提供互联网个性化信息服务，它是基于对用户的性别、年龄、所在地级别、职业等，将用户划分为多个类目之后，按类目实现个性化信息推送。另一方面是根据用户历史行为提供互联网个性化信息服务，它是基于模式识别的方法，通过用户网络行为日志分析挖掘出用户的喜好实现搜索或推送个性化信息。
[0005] 然而，上述现有技术所提出的方法都存在一定的缺陷。例如，按用户分类提供互联网个性化信息服务。此种技术是对应用的用户人群的简单划分，从划分比例来看，划分粒度相对较粗，划分到同一类的用户会出现不同的偏好。此时，个性化服务相对就显得在搜索或推送信息时定位就不够准确，也就不能实现符合用户需求的最优搜索或推送信息的排序显示。而另一种根据用户历史行为提供互联网个性化信息服务。尽管相对于第一种方法有所改进，使之更加贴近用户的行为偏好，但是将一个用户完全通过他的历史日志划分到某一类从而影响他未来的偏好，这是很有风险的。因此，此种方法不能实时捕获以及修正用户在当前环境所表现出来的偏好。所以，也不能达到准确的搜索或推送信息的最优排序显示给用户。

【发明内容】

[0006] 本申请的主要目的在于提供一种确定用户的偏好模式的方法及装置，以解决现有技术存在的问题，其中：
[0007] 根据本申请的一个方面的实施例，提出一种确定用户的偏好模式的方法包括：从用户的历史行为信息中提取用户的历史行为特征以形成用户的历史行为特征向量，其中所述历史行为信息为预定历史时段的行为信息；利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式；从当前用户的在预设实时时段内的行为信息中提取指定用户的实时行为特征以形成指定用户的实时行为特征向量；基于指定用户的历史行为特征向量和实时行为特征向量，确定指定用户的当前行为特征向量；以及基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。
[0008] 根据本申请的另一方面的实施例，提出一种确定用户的偏好模式的装置，包括：第一提取模块，用于从用户的历史行为信息中提取个用户的历史行为特征以形成用户的历史行为特征向量，其中历史行为信息为预定历史时段的行为信息；训练模块，用于利用机器学习模型对用户的历史行为特征向量进行训练以得到一个或多个历史偏好模式；第二提取模块，用于从当前用户的在预设实时时段内的行为信息中提取指定用户的实时行为特征以形成指定用户的实时行为特征向量；第一确定模块，用于基于指定用户的历史行为特征向量和实时行为特征向量，确定指定用户的当前行为特征向量；以及第二确定模块，用于基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。
[0009] 与现有技术相比，根据本申请的技术方案，利用机器学习模型训练获取的用户的历史行为特征以形成用户的历史行为特征向量，得到一个或多个历史偏好模式。再基于指定用户的历史行为特征向量和实时行为特征向量确定指定用户的当前行为特征向量，结合预先得到的历史偏好模式，确定指定用户当前的偏好模式。从而可以实现线下实时确定出每位用户的当前偏好，也即是说，确定每个用户当前所具有的偏好模式。该方法不仅预测准确率高，且复杂度低。通过预测出的当前偏好模式，以实现向用户展示更精确的对象排序。
[0010] 另外，通过利用对对象产生了最大点击率的偏好用户群以及所述偏好用户群中用户共同具有的历史偏好模式对对象进行标记，并且对应其进行实时更新，从而实现每次用户线上搜索时，快速检索出用户当前偏好及其最优偏好对象，检测准确率高。
【附图说明】
[0011] 此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：
[0012] 图1是本申请实施例的一种确定用户当前偏好模式的方法流程图；
[0013] 图2是本申请实施例的计算各个用户的历史行为特征向量的方法流程图；
[0014] 图3是本申请实施例的确定指定用户针对指定类别的当前偏好模式的方法流程图；
[0015] 图4是本申请实施例的更新对象的方法流程图；以及
[0016] 图5本申请实施例的一种确定用户当前偏好模式的装置结构图。
【具体实施方式】
[0017] 本申请的主要思想在于，提供一种确定用户的偏好模式的方法及装置，通过LDA模型得到一个或多个历史偏好模式，再通过获取指定用户的实时行为特征及其实时行为特征向量，然后，结合其用户的历史行为特征向量，进而得到指定用户的当前行为特征向量。然后，基于指定用户的当前行为特征向量和历史偏好模式，确定指定用户当前的偏好模式。因此，可以实现实时预测出用户当前偏好模式。从而为后续排序或打下良好的基础。此外，进一步实现在每次用户线上搜索时，线下快速检索出用户当前偏好，并且检测准确率高。
[0018] 为使本申请的目的、技术方案和优点更加清楚，以下结合附图及具体实施例，对本申请作进一步地详细说明。
[0019] 根据本申请的实施例，提供了一种确定用户的偏好模式的方法。
[0020] 参考图1，图1是本申请实施例的确定用户的偏好模式的方法流程图。如图1所示，在步骤SlOl处，从用户的历史行为信息中，提取用户的历史行为特征，以形成该用户的历史行为特征向量。
[0021] 根据本申请的实施例，可以对用户进行分组，分别统计不同分组内的用户的历史行为特征向量。对用户的分组可以是基于人口统计学的人群粗划分，例如，采取用户的年龄、性别、所在地区进行分组等。而历史行为信息是预定历史时段的行为信息，其中历史行为信息可以包括以下信息中的一个或多个：用户针对对象的点击信息、收藏信息、交互成功信息。
[0022] 具体而言，从用户针对预定的某一类别在预定历史时间段内的历史行为信息中，提取历史行为信息所涉及到的操作对象的标题和/或关键属性，并对其标题和/或关键属性进行分词处理，以得到用户历史行为所涉及的分词。用户的历史行为特征即包括用户历史行为所涉及的分词。
[0023] 将用户在预定历史时间段内所有历史行为进行统计，可以得到用户历史行为所涉及的所有分词及每一分词对应的用户历史行为次数。用户的历史行为涉及的分词及每一分词对应的用户历史行为次数形成用户的历史行为特征向量。
[0024] 可以理解的，用户的历史行为信息随着时间的变化，对用户行为偏好的影响也是不同的。因此，用户涉及某一分词的历史行为在计入到用户的历史行为特征向量时可以根据该历史行为发生时间的远近进行衰减。在一些实施例中，可以给将根据时间衰减后的用户的各次历史行为所涉及的分词及该分词分别对应用户的行为次数合并统计，形成用户的历史行为特征向量。从而，为预测用户历史偏好模式建立有效基础信息。
[0025] 下面结合图2描述根据本申请一个实施例的根据各个用户历史行为特征形成各个用户的历史行为特征向量的示例性过程。
[0026] 参照图2,在步骤S201处，获取每个用户的历史行为信息以提取历史行为信息中包含的对象的标题与关键属性。
[0027] 具体而言，例如，在一个预定历史时间段360天内，提取每个用户对对象的点击信息、收藏信息、交互成功信息，得到其相关操作对象的标题和/或关键属性。对象的关键属性可以是该对象的类别、名称

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王波;
技术所有人：阿里巴巴集团控股有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。