一种基于用户数据推荐信息的方法及系统与流程

文档序号:25734026发布日期:2021-07-06 18:42阅读:46来源:国知局
一种基于用户数据推荐信息的方法及系统与流程

本发明涉及大数据技术领域,特别是涉及一种基于用户数据推荐信息的方法及系统。



背景技术:

承载用户数据的文本往往蕴藏着深层次的特征信息,通过将特征信息进行汇总和融合,能够形成区别化、差异化和个性化的用户画像,通过用户画像能够预测用户潜在的需求,并进行信息推荐。

而目前,用户数据的离散性和耦合性不便于对用户数据进行精确地识别和分析,也不能准确地提取出关键信息,造成推荐信息的精确度低的问题。



技术实现要素:

鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于用户数据推荐信息的方法及系统,用于解决现有技术中的推荐信息的精确度低问题。

为实现上述目的及其他相关目的,本发明提供一种基于用户数据推荐信息的方法,包括:

获取承载有用户数据的文本,通过预设的关键词对所述文本进行分析,获取预算特征向量和性状特征向量;

对所述预算特征向量和所述性状特征向量进行融合处理,获取融合向量;

将多个用户所对应的融合向量分别载入到特征矩阵中;

将所述特征矩阵输入到第一神经网络中进行训练,获取推荐模型;

通过所述推荐模型预测待处理的文本,获取推荐信息。

可选的,通过预设的关键词对所述文本进行分析的步骤包括:

预设的关键词包括第一关键词和第二关键词,其中,所述第一关键词与用户的预算信息关联,所述第二关键词与用户的性状信息关联;

通过所述第一关键词确定所述文本中与预算信息关联的第一语句,并通过所述第二关键词确定所述文本中与性状信息关联的第二语句;

分别对所述第一语句和所述第二语句进行向量化,获取所述预算特征向量和所述性状特征向量。

可选的,分别对所述第一语句和所述第二语句进行向量化,获取所述预算特征向量和所述性状特征向量的步骤包括:

通过语料库获取所述第一语句和所述第二语句的单词的编码;

通过所述第一语句和所述第二语句的单词的编码分别获取第一语句矩阵和第二语句矩阵;

将所述第一语句矩阵和所述第二语句矩阵分别输入第二神经网络中;

将所述第一语句矩阵和所述第二语句矩阵分别通过一个或者多个尺寸的卷积核进行卷积,获取一个或者多个尺寸的特征图;

对一个或者多个尺寸的所述特征图分别进行池化处理并进行拼接,获取所述预算特征向量和所述性状特征向量。

可选的,所述第二神经网络包括:用于处理所述第一语句矩阵的第二一子神经网络和用于处理所述第二语句矩阵的第二二子神经网络;

所述第二一子神经网络和所述第二二子神经网络都包括:输入层、卷积层、池化层和输出层。

可选的,所述第一神经网络包括输入层、全连接层和输出层,且所述输出层的激活函数包括sigmoid函数。

可选的,将所述特征矩阵输入到第一神经网络中进行训练,获取推荐模型的步骤包括:

获取所述特征矩阵以及预设的推荐信息模版;

将所述特征矩阵输入到所述第一神经网络中获取预测值,将所述预测值和所述推荐信息模版对应;

通过迭代训练所述第一神经网络,当所述预测值与所述推荐信息模版的对应的准确率或者召回率达到或者超过设定值时,获取推荐模型。

可选的,所述推荐信息模版包括消费等级子模版和干预效果子模版,其中,所述消费等级子模版的种类有m种,所述干预效果子模版的种类有n种,所述推荐信息模版的种类有m×n种,其中,m和n均为正整数。

一种基于用户数据推荐信息的系统,包括:

预处理模块,用于获取承载有用户数据的文本,通过预设的关键词对所述文本进行分析,获取预算特征向量和性状特征向量,对所述预算特征向量和所述性状特征向量进行融合处理,获取融合向量;

模型模块,用于将多个用户所对应的融合向量分别载入到特征矩阵中,将所述特征矩阵输入到第一神经网络中进行训练,获取推荐模型;

处理模块,用于通过所述推荐模型预测待处理的文本,获取推荐信息;

所述预处理模块、所述模型模块以及所述处理模块信号连接。

一种电子设备,包括:

一个或多个处理器;和

其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述电子设备执行任一所述的方法。

一个种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行任一所述的方法。

如上所述,本发明的基于用户数据推荐信息的方法及系统,具有以下有益效果:

通过利用关键字来确定与关键字相关联的文本中的语句,过滤掉冗余的文本的语句,不仅降低文本的语句的数据处理量、提升处理效率,而且避免相关度较低的文本的语句对推荐信息的干扰,通过对预算特征向量和性状特征向量进行二维度的融合和分析,能够结合该用户的预算情况和性状特点进行综合的权重考虑,提升推荐信息的精度和个性化水平。

附图说明

图1显示为本发明实施例的基于用户数据推荐信息的方法的示意图。

图2显示为本发明实施例的融合处理的流程示意图。

图3显示为本发明实施例的第二一子神经网络的结构示意图。

图4显示为本发明实施例的第一神经网络的结构示意图。

图5显示为本发明实施例的第二一子神经网络的网络结构的示意图。

图6显示为本发明实施例的基于用户数据推荐信息的系统的示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。

需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、性状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”及“一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。

发现信息推荐技术能够降低用户获取有用信息的机会成本,但是精确的信息推荐往往建立在较为精确的用户分析和用户特征识别的基础上,目前,对于用户数据的处理和分析不能获取较为深层次的信息,导致推荐信息的精确度不佳。

请参阅图1,本发明提供一种基于用户数据推荐信息的方法,包括:

s1:获取承载有用户数据的文本,通过预设的关键词对所述文本进行分析,获取预算特征向量和性状特征向量,所述文本可以通过用户与系统的交互问答过程中获取,也可以在用户进行系统注册时进行填写,还可以在申请进行用户数据推荐信息的过程预先填写相关信息的文本,所述文本可以与各个用户相对应,进而每个所述文本都能承载属于该用户的特征信息,该特征信息传达的语义中包括与用户预算相关联的信息以及与用户性状特征相关联的信息,所述预算特征包括但不限于收入、学历、社保、医保、保险等信息,所述性状特征包括但不限于:身体健康情况、体检数据、精神状态等性状;

s2:对所述预算特征向量和所述性状特征向量进行融合处理,获取融合向量,通过对预算特征向量和性状特征向量进行二维度的融合和分析,能够结合该用户的预算情况和性状特点进行综合的权重考虑,提升推荐信息的精度和个性化水平;

s3:将多个用户所对应的融合向量分别载入到特征矩阵中,通过对多个用户的融合向量进行矩阵化,达到获取基本数据集的目的;

s4:将所述特征矩阵输入到第一神经网络中进行训练,获取推荐模型,通过第一神经网络处理所述特征矩阵,并在迭代训练中获取优选的训练模型作为推荐模型;

s5:通过所述推荐模型预测待处理的文本,获取推荐信息。本实施例通过利用关键字来确定与关键字相关联的文本中的语句,过滤掉冗余的文本的语句,不仅降低需要处理的文本的语句的数据处理量,还能提升处理效率,而且避免相关度较低的文本的语句对推荐信息产生的噪声信息的干扰,通过对预算特征向量和性状特征向量进行二维度的融合和分析,能够结合该用户的预算情况和性状特点进行综合的权重考虑,提升推荐信息的精度和个性化水平。

在一些实施过程中,将预算特征向量21和性状特征向量22进行融合处理,例如,将预算特征向量21和性状特征向量22进行融合和升维,进而获取融合向量,并通过融合向量获取特征矩阵3,并将特征矩阵3输入到第一神经网络10中训练,通过设置学习率和迭代数量,获取第一神经网络10的预测值,观测该预测值的准确率和召回率,当该准确率或者召回率达到设定值时,获取推荐模型,请参阅图2。所述第一神经网络包括输入层110、全连接层120和输出层130,且所述输出层130的激活函数包括sigmoid函数,通过多次迭代训练,能够调整全连接层120中各个神经单元的权值,获取能够逼近优选训练模型的训练参数,请参阅图4。

为了提高对文本的处理效率,可以通过设置关键字的集合,并通过关键字的集合确定与预算或者性状相关联的文本中的语句,针对与预算信息或者性状信息关联度较高的语句进行处理,降低冗余的语句的处理数量,提高处理效率,具体的,通过预设的关键词对所述文本进行分析的步骤包括:

预设的关键词包括第一关键词和第二关键词,其中,所述第一关键词与用户的预算信息关联,所述第二关键词与用户的性状信息关联;

通过所述第一关键词确定所述文本中与预算信息关联的第一语句,并通过所述第二关键词确定所述文本中与性状信息关联的第二语句;

分别对所述第一语句和所述第二语句进行向量化,获取所述预算特征向量和所述性状特征向量。

进一步的,分别对所述第一语句和所述第二语句进行向量化,获取所述预算特征向量和所述性状特征向量的步骤包括:

通过语料库获取所述第一语句和所述第二语句的单词的编码,示例性地说明,该语料库可以依赖现有的语料库,通过语料库获取第一语句和第二语句中各个单词的编码,将语句和单词进行编码化,例如,将每个单词转化为5位的编码,又例如,将第一语句和第二语句分别转化为w×5的矩阵,w为正整数,即为第一语句矩阵和第二语句矩阵;

将所述第一语句矩阵和所述第二语句矩阵分别输入第二神经网络中,例如,第二神经网络包括:用于处理所述第一语句矩阵的第二一子神经网络和用于处理所述第二语句矩阵的第二二子神经网络,请参阅图3,第二一子神经网络的网络结构包括输入层210、卷积层220、池化层230和输出层240,输出层240也可以包括全连接神经网络结构,第二二子神经网络的网络结构与第二一子神经网络的结构相同,但是,第二一子神经网络的输入量为第一语句矩阵,第二二子神经网络的输入量为第二语句矩阵;

将所述第一语句矩阵和所述第二语句矩阵分别通过一个或者多个尺寸的卷积核进行卷积,获取一个或者多个尺寸的特征图,请参阅图5,在第二一子神经网络中,输入第一语句矩阵200,第一语句矩阵200为5×7的矩阵,在输入层210将第一语句矩阵200分别进行窗口化,获取两个5×4的片段语句矩阵、两个5×3的片段语句矩阵和两个5×2的片段语句矩阵201,在卷积层220,分别利用尺寸为2、3和4的卷积核对片段语句矩阵进行卷积,获取两个1×4、两个1×5和两个1×6的特征图202,在池化层230,分别对1×4、1×5和1×6的特征图202进行池化处理并进行拼接,池化处理可以采用最大池化的方式进行,获取1×2的特征向量,并对3组1×2的特征向量进行拼接,获取所述预算特征向量203,然后再经过输出层240的处理,获取处理后的预算特征向量204,同理,第二二子神经网络也依照第二一子神经网络的工作方式处理第二语句矩阵,将处理后的预算特征向量和形状特征向量进行融合处理,获取融合向量,可以将多个不同的文本对应的融合向量按照行或者列的形式排列,获取特征矩阵,特征矩阵中包括多个用户对应的文本,例如,通过t个用户的文本对应的融合向量获取t维特征矩阵,再将特征矩阵输入到第一神经网络中进行训练,经过第一神经网络进行处理后,获取预测值,该预测值为一个t维的向量,可将t维的向量与预设的推荐信息模版进行对应,然后通过迭代训练所述第一神经网络,当所述预测值与所述推荐信息模版的对应的准确率或者召回率达到或者超过设定值时,获取推荐模型。

为了提高推荐信息模版的数量和种类,所述推荐信息模版包括消费等级子模版和干预效果子模版,其中,所述消费等级子模版的种类有m种,所述干预效果子模版的种类有n种,所述推荐信息模版的种类有m×n种,其中,m和n均为正整数,还可将预测值设置为t×2的向量,分别对应消费等级子模版和干预效果子模版。

综上所述,本实施例提供的基于用户数据推荐信息的方法还可以应用在医疗问答、保险推荐的过程中,通过获取用户自述其自身状态,获取用户预算能力以及性状特征,为用户提供精确的推荐信息。

请参阅图6,本发明还提供一种基于用户数据推荐信息的系统,包括:

预处理模块,用于获取承载有用户数据的文本,通过预设的关键词对所述文本进行分析,获取预算特征向量和性状特征向量,对所述预算特征向量和所述性状特征向量进行融合处理,获取融合向量;

模型模块,用于将多个用户所对应的融合向量分别载入到特征矩阵中,将所述特征矩阵输入到第一神经网络中进行训练,获取推荐模型;

处理模块,用于通过所述推荐模型预测待处理的文本,获取推荐信息;

所述预处理模块、所述模型模块以及所述处理模块信号连接。通过利用关键字来确定与关键字相关联的文本中的语句,过滤掉冗余的文本的语句,不仅降低需要处理的文本的语句的数据处理量,还能提升处理效率,而且避免相关度较低的文本的语句对推荐信息产生的噪声信息的干扰,通过对预算特征向量和性状特征向量进行二维度的融合和分析,能够结合该用户的预算情况和性状特点进行综合的权重考虑,提升推荐信息的精度和个性化水平。

可选的,通过预设的关键词对所述文本进行分析的步骤包括:

预设的关键词包括第一关键词和第二关键词,其中,所述第一关键词与用户的预算信息关联,所述第二关键词与用户的性状信息关联;

通过所述第一关键词确定所述文本中与预算信息关联的第一语句,并通过所述第二关键词确定所述文本中与性状信息关联的第二语句;

分别对所述第一语句和所述第二语句进行向量化,获取所述预算特征向量和所述性状特征向量。

可选的,分别对所述第一语句和所述第二语句进行向量化,获取所述预算特征向量和所述性状特征向量的步骤包括:

通过语料库获取所述第一语句和所述第二语句的单词的编码;

通过所述第一语句和所述第二语句的单词的编码分别获取第一语句矩阵和第二语句矩阵;

将所述第一语句矩阵和所述第二语句矩阵分别输入第二神经网络中;

将所述第一语句矩阵和所述第二语句矩阵分别通过一个或者多个尺寸的卷积核进行卷积,获取一个或者多个尺寸的特征图;

对一个或者多个尺寸的所述特征图分别进行池化处理并进行拼接,获取所述预算特征向量和所述性状特征向量。

可选的,所述第二神经网络包括:用于处理所述第一语句矩阵的第二一子神经网络和用于处理所述第二语句矩阵的第二二子神经网络;

所述第二一子神经网络和所述第二二子神经网络都包括:输入层、卷积层、池化层和输出层。

可选的,所述第一神经网络包括输入层、全连接层和输出层,且所述输出层的激活函数包括sigmoid函数。

可选的,将所述特征矩阵输入到第一神经网络中进行训练,获取推荐模型的步骤包括:

获取所述特征矩阵以及预设的推荐信息模版;

将所述特征矩阵输入到所述第一神经网络中获取预测值,将所述预测值和所述推荐信息模版对应;

通过迭代训练所述第一神经网络,当所述预测值与所述推荐信息模版的对应的准确率或者召回率达到或者超过设定值时,获取推荐模型。

可选的,所述推荐信息模版包括消费等级子模版和干预效果子模版,其中,所述消费等级子模版的种类有m种,所述干预效果子模版的种类有n种,所述推荐信息模版的种类有m×n种,其中,m和n均为正整数。

本发明实施例提供一种电子设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述电子设备执行一个或多个所述的方法。本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本发明实施例还提供一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行中一个或多个所述的方法。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1