一种基于个性化的用户信息推荐方法及系统与流程

文档序号:17774002发布日期:2019-05-28 19:48阅读:462来源:国知局
一种基于个性化的用户信息推荐方法及系统与流程

本发明涉及信息处理技术领域,更具体地,涉及一种基于个性化的用户信息推荐方法及系统。



背景技术:

档案信息化是在国家档案行政管理部门的统一规划和系统组织之下,采用现代信息技术改造传统档案业务,不断适应数字环境下档案活动的发展变化,最大限度地满足社会档案信息需求的建设过程,它是国家信息化体系的有机组成部分,是国家信息化战略在档案领域的具体实现,其建设内容十分丰富并不断变化,具时代性和社会性。

随着互联网技术的迅猛发展,数据的爆发式增长,档案数据信息建设迎来了大数据时代,我国档案信息化建设明显加快,各级档案馆数字档案资源的比例均有大幅提高,全国数字化档案资源达2243万gb,全国档案数字化进程明显加快。近年来,随着网络和信息技术快速发展,档案工作也在面临一场深刻变革。面对海量档案数据,虽然国内档案信息化水平逐步提升,但当今国内市场档案类管理软件参差不齐,且大多数停留在传统的管理、浏览、查询功能,而随着信息技术普及,用户对档案管理及使用服务的需求越来越多样化、智能化,标准也逐步提高,传统档案服务以及传统搜索引擎已经不足以满足用户的需求。实现档案用户个性化服务,是大数据时代档案馆必然的发展方向,而实现档案个性化服务,最关键的是用户所获得信息内容的个性化。因此,建设个性化推荐引擎的数字档案管理系统是构建个性化档案数据服务的核心和趋势。

档案工作仍然处于手工管理档案实体为主的状况,信息化建设迟缓,地区之间发展极不均衡。加强电子文件归档和电子档案管理工作等作为广西档案信息化建设工作的起步,逐步开展档案信息化建设工作。

因此,档案数字化、信息化、智能化的建设研究迫在眉睫,开展个性化推荐引擎的数字档案管理系统研究,建立满足用户对档案数据个性化需求的技术系统和服务机制,将冲破传统档案服务的种种局限,最大限度地提供档案资源的价值,促进档案部门向主动型服务转变,利用现代技术对用户进行准确的分类和定位,对其需求有全方位、准确的把握,最大限度的吸引用户,为社会提供高效优质的服务,促进档案事业的发展,同时对于推动档案数字化进程、加快档案工作转型以及档案科研工作研究具有重要的意义。

因此,需要一种技术,以实现基于个性化的用户信息推荐技术。



技术实现要素:

本发明技术方案提供了一种基于个性化的用户信息推荐方法及系统,以解决如何基于个性化,对用户信息进行推荐的问题。

为了解决上述问题,本发明提供了一种基于个性化的用户信息推荐方法,所述方法包括:

获取用户已关注的信息,以及用户对所关注的信息的评分,构建用户所关注过的所述多条信息和多个评分的序列数据;

将所述序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法;

抽取信息档案中的信息,利用神经网络推荐算法对所述信息进行计算,将概率最高的信息作为用户推荐信息;

根据用户对所述用户推荐信息的反馈,对所述神经网络推荐算法的参数进行调整,获取优化后的神经网络推荐算法。

优选地,所述神经网络算法为循环神经网络算法。

优选地,所述将所述序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法,包括:

将所述序列数据输入到所述循环神经网络算法的输入层;

对所述循环神经网络算法的隐藏层进行设计,将所述循环神经网络算法的隐藏层后一层数的输入值加入到所述循环神经网络算法的隐藏层前一层的输出值中;

将所述序列数据分为正向数据和负向数据,所述正向数据用于增强推荐策略;所述负向数据用于减弱推荐策略。

优选地,所述将所述序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法,包括:

在所述循环神经网络算法的隐藏层中设置遗忘门和输入门,所述遗忘门用于根据用户对已关注的信息的评分,将所述评分高于第一阈值的信息进行保留;所述输入门通过阈值函数sigmoid函数层计算,根据用户对信息的评分,确定加入信息的数量;

采用层次化指数函数softmax函数构建输出层,所述循环神经网络算法进行层次化指数函数softmax函数。

优选地,所述构建用户所关注过的所述多条信息和多个评分的序列数据,所述序列数据包括:

信息文件编号,用户评分,档案类别。

基于本发明的另一方面,提供一种基于个性化的用户信息推荐系统,所述系统包括:

获取单元,用于获取用户已关注的信息,以及用户对所关注的信息的评分,构建用户所关注过的所述多条信息和多个评分的序列数据;

构建单元,用于将所述序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法;

计算单元,用于抽取信息档案中的信息,利用神经网络推荐算法对所述信息进行计算,将概率最高的信息作为用户推荐信息;

优化单元,用于根据用户对所述用户推荐信息的反馈,对所述神经网络推荐算法的参数进行调整,获取优化后的神经网络推荐算法。

优选地,所述神经网络算法为循环神经网络算法。

优选地,所述构建单元用于:将所述序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法,包括:

将所述序列数据输入到所述循环神经网络算法的输入层;

对所述循环神经网络算法的隐藏层进行设计,将所述循环神经网络算法的隐藏层后一层数的输入值加入到所述循环神经网络算法的隐藏层前一层的输出值中;

将所述序列数据分为正向数据和负向数据,所述正向数据用于增强推荐策略;所述负向数据用于减弱推荐策略。

优选地,所述构建单元用于:将所述序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法,包括:

在所述循环神经网络算法的隐藏层中设置遗忘门和输入门,所述遗忘门用于根据用户对已关注的信息的评分,将所述评分高于第一阈值的信息进行保留;所述输入门通过阈值函数sigmoid函数层计算,根据用户对信息的评分,确定加入信息的数量;

采用层次化指数函数softmax函数构建输出层,所述循环神经网络算法进行层次化指数函数softmax函数。

优选地,所述获取单元用于:构建用户所关注过的所述多条信息和多个评分的序列数据,所述序列数据包括:信息文件编号,用户评分,档案类别。

本发明技术方案提供一种基于个性化的用户信息推荐方法及系统,其中方法包括:获取用户已关注的信息,以及用户对所关注的信息的评分,构建用户所关注过的多条信息和多个评分的序列数据;将序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法;抽取信息档案中的信息,利用神经网络推荐算法对信息进行计算,将概率最高的信息作为用户推荐信息;根据用户对用户推荐信息的反馈,对神经网络推荐算法的参数进行调整,获取优化后的神经网络推荐算法。本发明技术方案旨在充分利用云计算、大数据、人工智能等新一代信息技术工具,结合公司原有档案管理系统以及各类档案数据资源,研究适合数字化档案系统的ai个性化推荐算法,开发ai个性化推荐系统平台,从档案大数据中抽取符合用户个性化需求的信息,实现人工智能技术与档案数据信息管理相结合,将其应用领域扩展至各行各业,推动档案科研工作以及档案管理系统转型。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为根据本发明优选实施方式的一种基于个性化的用户信息推荐方法流程图;

图2为根据本发明优选实施方式的循环神经网络算法流程图;

图3为根据本发明优选实施方式的循环神经网络算法隐藏层结构图;

图4为根据本发明优选实施方式的循环神经网络算法隐藏层算法流程图;以及

图5为根据本发明优选实施方式的一种基于个性化的用户信息推荐系统结构图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

图1为根据本发明优选实施方式的一种基于个性化的用户信息推荐方法流程图。对行业内档案检索难以智能化到达目的用户的问题,本申请实施方式充分利用云计算、大数据、人工智能等新一代信息技术工具,结合原有档案管理系统以及各类档案数据资源,研究适合数字化档案系统的ai个性化推荐算法,开发ai个性化推荐系统平台,从档案大数据中抽取符合用户个性化需求的信息,实现人工智能技术与档案数据信息管理相结合,将其应用领域扩展至各行各业,推动档案科研工作以及档案管理系统转型。在产品智能化的时代,不仅意味着产品具有非常高的“数据”和“信息”特征,更要求企业需要站在用户的角度,将用户的需求作为智能制造的最高标准,为用户提供更个性化的服务。本申请基于用户本身的ai个性化推荐算法,构建ai个性化推荐系统,分析用户数据及其对档案数据信息的个性化需求,实现档案数据智能化地到达目标用户,为用户提供满足需求、快速响应的信息,既满足了客户个性化服务,也实现了资源的效益最大化。

如图1所示,本发明实施方式提供一种基于个性化的用户信息推荐方法,方法包括:

优选地,在步骤101:获取用户已关注的信息,以及用户对所关注的信息的评分,构建用户所关注过的多条信息和多个评分的序列数据。优选地,构建用户所关注过的多条信息和多个评分的序列数据,序列数据包括:信息文件编号,用户评分,档案类别。

优选地,在步骤102:将序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法。优选地,神经网络算法为循环神经网络算法。优选地,将序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法,包括:

将序列数据输入到循环神经网络算法的输入层;

对循环神经网络算法的隐藏层进行设计,将循环神经网络算法的隐藏层后一层数的输入值加入到循环神经网络算法的隐藏层前一层的输出值中;

将序列数据分为正向数据和负向数据,正向数据用于增强推荐策略;负向数据用于减弱推荐策略。

优选地,将序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法,包括:

在循环神经网络算法的隐藏层中设置遗忘门和输入门,遗忘门用于根据用户对已关注的信息的评分,将评分高于第一阈值的信息进行保留;输入门通过阈值函数sigmoid函数层计算,根据用户对信息的评分,确定加入信息的数量;

采用层次化指数函数softmax函数构建输出层,循环神经网络算法进行层次化指数函数softmax函数。

优选地,在步骤103:抽取信息档案中的信息,利用神经网络推荐算法对信息进行计算,将概率最高的信息作为用户推荐信息。

本申请实施方式是基于档案数据信息的rnn(循环神经网络)推荐算法,面对大数据时代的信息爆发增长,为解决信息过载以及档案数据检索领域遇到的问题,针对用户本身个性化需求,研究基于rnn(循环神经网络)的个性化推荐算法,根据用户属性信息与对档案数据信息评价推荐个性化档案推荐信息,其算法基本结构如2图所示。

本申请提出的循环神经网络算法不同于其他神经网络算法,rnn(循环神经网络)中引入了定向循环的结构,解决了输入信息相互关联的问题,用户对档案数据的评分甚至用户曾经感兴趣的档案文件都与当前用户推荐档案数据相关,可以更好的结合时间更长的历史信息来对用户感兴趣档案数据信息进行预测,rnn算法模型设计和说明如下:

1.1数据输入层

档案数据信息经过预处理后进入到数据输入层,推荐算法的数据输入层是由用户浏览过的档案记录信息、用户对档案数据的评分信息以及档案数据的类别信息组成,将这些信息进行量化并按照评分时间进行排序,进而抽象为一段序列数据,即用户的数据={(档案文件编号,用户评分,档案类别),…,(档案文件编号,用户评分,档案类别)},此序列数据为rnn输入层的输入数据。通过以上对数据的预处理和将用户档案数据信息转化为序列数据的步骤,实现对档案数据信息的初步分类和挑选,是后面每一步计算的基础。

1.2rnn隐藏层设计

传统rnn(循环神经网络)算法设计用来处理序列数据,其区别于其他神经网络算法的地方在于rnn中一个序列的当前输出与前面的输出有关,将后面层数的输入值加入到前面层的输出值中。rnn隐藏层之间是有连接的,其网络结构图3所示。

根据上述的rnn循环神经网络结构图,其中(w,u,v)表示一组模型参数,用户数据信息输入集记为xt={x0,x1,x2,...,xt-1,xt,xt+1,...},档案推荐数据输出集则记为yt={y0,y1,y2,...,yt-1,yt,yt+1,...},隐藏单元的输出集合也就是t时刻的记忆表示为集合st={s0,s1,s2,...,st-1,st,st+1,...}。如图3所示,单一方向的信息从隐藏单位传递到输出单元,当前时刻的输出是由过去记忆与当前时刻的输出相互作用得到的结果,rnn算法记录过去用户感兴趣的档案信息并预测未来用户可能会感兴趣的档案文件信息。这是基础的rnn算法结构,但是由于rnn对于过去信息与当前信息的处理一致,使得对于不同评分的档案数据信息都对模型的计算产生相同的影响,明显该算法不够贴合用户的个性化需求,为了进一步改进算法,提高算法精确度并且更符合个性化推荐的要求,我们对传统rnn加以改进以便于更好的应用于推荐系统。

在输入层用户的序列数据可以分为正向数据和负向数据,分别用来表示评分较高的档案数据信息和评分较低的档案数据信息,每一个时刻的输出数据应该有区别,因此为了增强正向数据对于后面的推荐策略产生影响并减弱负向数据的影响,对rnn算法加入并行化设计。

(3)rnn(循环神经网络)并行化设计。

通过对基础rnn算法的研究,对一部分操作实现并行化设计,在rnn隐藏层中增加两类门控的概念和算法设计:遗忘门和输入门,达到对一部分记忆进行筛选、以提高神经网络的效率、更快地计算出符合用户需求的个性化推荐档案数据信息的目的。

遗忘门是在每一个t时刻的神经网络训练过程中,利用用户属性信息的同时利用用户对档案数据的评分信息,由评分信息来决定当前档案数据对后面推荐策略的影响,将用户之前曾经感兴趣的某个档案文件或者某种档案类别保留下来,通过sigmoid函数计算得到一个介于0与1(包括0和1)的输出结果,保留其中经过sigmoid计算为1的记忆丢弃。一部分结果介于0和1之间的记忆,输出结果为0的则之前记忆全部丢弃。

增加输入门,进一步决定哪些记忆可以保留,通过sigmoid函数层计算,根据用户对该推荐档案评分来决定,如果评分较高则加入更多信息,反之则加入少量信息。最后,将旧的记忆与遗忘门结合,舍弃通过计算后反映出无价值的信息,把当前时刻用户浏览档案信息与输入门层结果相结合,得以将最新用户浏览档案信息添加到神经网络中。

基于之前的计算,将记忆更新输出,通过sigmoid层和tanh层函数计算决定数据哪部分记忆,确定适合向后传播的记忆。其设计流程如图4。

1.4档案数据输出层

对于档案数据输出层,可以采用softmax函数建模输出预测结果,但随着用户的增多,档案数据信息也在不断增长,当输出数据量过于庞大的时候,无疑给个性化推荐系统增加了很大的计算压力,为此可以采用层次化softman函数来解决这一问题。基于哈夫曼树的思想,建立关于档案数据的哈夫曼树,数据集中每一份档案数据文件都有对应的哈夫曼编码,基于这一思想实现层次化softman函数计算。

根据哈夫曼树的特性,对于任意输出的推荐信息,在哈夫曼树中都存在且仅存在唯一路径,每一个分支点都相当于一个二分类,将每一个二分类产生的概率值相乘便得到所需每个档案数据信息的预测概率值,推荐系统的最终输出概率最高的档案数据信息即为用户最有可能感兴趣的档案文件。

层次化softmax与softmax相比,层次化softmax使得模型计算复杂度得以下降,尤其对于庞大的档案数据信息来说,训练效率得以大大提升无疑是非常重要和关键的,更有利于应对当前不断增长的档案数据量,在大数据时代为用户提供更为精确、高效的个性化推荐服务。

2.构建ai以“三库两模块”为核心的档案数据ai个性化推荐系统

个性化推荐系统的设计应该在面向用户的同时面向管理人员,因此充分考虑两者的需求进行设计,既有用户数据信息的采集也包括管理人员对模型修正或者历史信息的添加。由此设计ai个性化推荐系统以“三库两模块”为基本结构,整合档案数据、用户信息与ai个性化推荐策略及算法,该设计框架明确了各部分模块数据库的划分与功能。

(1)“三库”功能划分与设计

①用户数据库是最为基础的一部分,关于用户的信息输入都存储在该数据库中,因此该数据库存储用户属性信息、用户浏览过的档案记录、用户对档案数据的评分以及档案数据的类别以及对相应用户档案数据信息的隐私保护机制,不仅存储海量档案数据信息,增加了隐私保护以防止信息泄露,保障数据安全可靠。

②推荐策略数据库主要存储基于rnn(循环神经网络)的ai个性化推荐算法及相关需要的档案数据信息,推荐策略数据库从用户数据库和档案数据库中调取用户历史浏览过的档案文件以及用户对所浏览档案文件的评分,然后在该数据库内通过rnn算法分析计算得到概率最高的用户推荐信息并加以存储,开放数据接口便于数据从该数据库中输出。可以根据实际情况需要输入历史数据信息以及调整方案信息。

③档案数据库存储档案数据和档案元数据。所有档案数据信息输入都存储在该数据库,推荐策略数据库可以从中调取档案信息。

(2)“两模块”功能划分与设计

在档案数据ai个性化推荐系统中,推荐生成模块从三个数据库中抽取档案数据信息,通过推荐策略数据库中的ai个性化推荐策略和基于rnn(循环神经网络)的个性化推荐算法生成推荐信息。该模块数据处理步骤大致为:从用户数据库和档案数据库中抽取用户数据和档案数据,在推荐策略数据库中将用户数据和档案数据合并分类并抽象为序列数据,经过数据预处理,通过rnn隐藏层计算,由输出层提供概率向量,分析用户可能感兴趣的档案数据信息并做出预测,最终向目标用户生成符合用户需求的推荐结果并存储在推荐策略数据库中。

优选地,在步骤104:根据用户对用户推荐信息的反馈,对神经网络推荐算法的参数进行调整,获取优化后的神经网络推荐算法。

本申请的效果评估模块负责根据用户对推荐系统提供的推荐档案数据信息进行反馈来对模型进行调整优化,管理人员可以从中输入需要修正的参数信息,也可以增加更多档案信息来对模型的精确度进行调整,力求更为贴合用户对档案数据信息的个性化需求。

本申请实施方式基于rnn(循环神经网络)的推荐算法,由于传统档案服务已不能满足当前用户对档案数据信息个性化的需求,为满足用户对档案数据信息资源利用要求,以用户需求为导向,研究基于数字档案的rnn(循环神经网络)推荐算法。rnn(循环神经网络)是一种深度学习的模型结构,不同于常规的神经网络模型,循环神经网络(rnn)中引入了定向循环的结构,可以解决那些输入信息之间相互关联的相关问题,也就是说针对每一位用户需求,每一时刻计算得到的推荐信息都和过去该用户的浏览记录、档案评分以及上一时刻得到的推荐信息有关。该算法通过收集用户信息,对档案数据信息分析处理,计算得到用户对档案数据的偏好与需求,向目标用户提供ai个性化推荐信息,满足用户对档案数据信息多元化与多层次需求。

本申请构建以“三库两模块”为基本结构的个性化推荐引擎,主要包括“三库”即用户数据库、推荐策略数据库和档案数据库,分别用以存储用户属性信息、基于rnn(循环神经网络)的个性化推荐算法以及档案数据及元数据。推荐策略数据库从用户数据库和档案数据库中调取用户基本信息和档案数据信息并推荐策略数据库中进行rnn算法分析计算,得到ai个性化推荐结果,存储在该推荐策略数据库中;“两模块”即推荐生成模块和效果评估模块,前者从“三库”中读取信息生成推荐结果,后者收集用户反馈并根据反馈信息对推荐策略数据库中的ai个性化算法进行参数调整。“三库两模块”为基本结构的个性化推荐引擎技术实现ai个性化推荐算法与数字化档案系统的结合,实现个性化推荐引擎技术与用户信息与个性化推荐算法的信息资源整合,最终实现海量用户信息与档案数据信息的存储、档案数据ai个性化与智能化推荐的目标,建立起符合档案数据个性化需求的服务机制。

本申请提出的ai个性化推荐引擎的数字档案管理系统,将满足用户对档案个性化服务的需求,对推动档案信息化进程、拓展ai行业应用、促进产业结构转型升级等带来显著效益。档案数据个性化服务引擎是建立在数字化的档案应用环境基础上的,本申请不仅在现有档案管理上进行了服务质量的提升,更融入了新一代技术,为科学研究和知识普及等提供智能化服务,提高档案信息利用的效率,使信息发挥最大的效益。同时,可一次投入,多次产出,推动档案数字化建设的创新与发展。

图5为根据本发明优选实施方式的一种基于个性化的用户信息推荐系统结构图。如图5所示,本申请提供一种基于个性化的用户信息推荐系统,系统包括:

获取单元501,用于获取用户已关注的信息,以及用户对所关注的信息的评分,构建用户所关注过的多条信息和多个评分的序列数据。优选地,获取单元501用于:构建用户所关注过的多条信息和多个评分的序列数据,序列数据包括:信息文件编号,用户评分,档案类别。

构建单元502,用于将序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法。优选地,神经网络算法为循环神经网络算法。优选地,构建单元502用于:将序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法,包括:

将序列数据输入到循环神经网络算法的输入层;

对循环神经网络算法的隐藏层进行设计,将循环神经网络算法的隐藏层后一层数的输入值加入到循环神经网络算法的隐藏层前一层的输出值中;

将序列数据分为正向数据和负向数据,正向数据用于增强推荐策略;负向数据用于减弱推荐策略。

优选地,构建单元502用于:将序列数据通过神经网络算法进行计算分析,构建用户信息的神经网络推荐算法,包括:

在循环神经网络算法的隐藏层中设置遗忘门和输入门,遗忘门用于根据用户对已关注的信息的评分,将评分高于第一阈值的信息进行保留;输入门通过阈值函数sigmoid函数层计算,根据用户对信息的评分,确定加入信息的数量;

采用层次化指数函数softmax函数构建输出层,循环神经网络算法进行层次化指数函数softmax函数。

计算单元503,用于抽取信息档案中的信息,利用神经网络推荐算法对信息进行计算,将概率最高的信息作为用户推荐信息;

优化单元504,用于根据用户对用户推荐信息的反馈,对神经网络推荐算法的参数进行调整,获取优化后的神经网络推荐算法。

本发明优选实施方式的一种基于个性化的用户信息推荐系统500与本发明另一优选实施方式的一种基于个性化的用户信息推荐方法100相对应,在此不再进行赘述。

已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个//该[装置、组件等]”都被开放地解释为装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1