目标相似度识别方法、装置、计算机设备及可读存储介质与流程

文档序号:22131515发布日期:2020-09-08 12:58阅读:149来源:国知局
目标相似度识别方法、装置、计算机设备及可读存储介质与流程

本发明涉及人工智能的大数据技术领域,尤其涉及一种目标相似度识别方法、装置、计算机设备及可读存储介质。



背景技术:

在信息时代,所有的智能都需要为业务服务,在这个服务的过程中,各个系统平台都会积累很多数据,为了更好的进行业务上的进一步的探索以及新客户的拓展,同时为了更好的服务客户,我们都会对积累下的数据进行进一步的分析,简单的如过滤,统计,展示一些热点新闻等。我们需要更详细系统的技术去更准确全面的描述客户,这就需要采用目标相似度识别方案,将目标用户与其他用户进行相似度匹配,获得对应的标签并构建标签体系。

当前的目标相似度的识别方案通常是将目标用户的属性数据与其他用户的属性数据进行比对,再通过统计模型或聚类模型判断目标用户属于哪一类用户,应该加载何种标签;但是,当前的目标相似度识别方案无法获知各用户之间的关联关系,那么将无法确定静态属性填写不全和/或动态属性识别不全用户的标签。



技术实现要素:

本发明的目的是提供一种目标相似度识别方法、装置、计算机设备及可读存储介质,用于解决现有技术存在的无法获知各用户之间的关联关系,导致无法确定静态属性填写不全和/或动态属性识别不全用户的标签的问题,本方案可应用于智慧城市场景中,进一步推进智慧城市的发展。

为实现上述目的,本发明提供一种目标相似度识别方法,包括:

接收目标信息,获取与所述目标信息匹配的用户并将其设为目标用户;

根据所述目标用户及与其具有关联关系的邻近用户,绘制所述目标用户的拓扑结构;

识别所述拓扑结构的邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量;其中,所述静态交叉向量表征了可用于制定静态属性标签的属性特征值,及可用于制定静态特征标签的拓扑特征值;

通过预设的卷积网络模型结合所述静态交叉向量,计算目标用户和相邻用户的动态属性向量获得综合向量;其中,所述相邻用户是指与目标用户具有强关联关系的邻近用户,所述综合向量是一种用于表征属性特征值、拓扑特征值及动态特征值的特征向量,所述动态特征值是一种用于在动态维度上制定动态标签的特征编码。

上述方案中,接收目标信息之前包括:

创建用于储存用户的基本信息及属性向量的数据库,其中,所述属性向量包括静态属性向量和动态属性向量。

上述方案中,根据所述目标用户及与其具有关联关系的邻近用户之前包括:

从所述数据库中获取与所述目标用户具有关联关系的邻近用户。

上述方案中,识别所述拓扑结构的邻近用户中与所述目标用户相同的特征之前,包括:

获取所述拓扑结构中各节点的静态特征向量;

识别所述拓扑结构的邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量,包括:

根据所述静态属性向量和静态特征向量在所述拓扑结构中识别与目标用户相同或相近的邻近用户,从所述邻近用户中提取与所述目标用户相同的特征向量,并将其赋以所述目标用户的静态属性向量和静态特征向量获得静态交叉向量。

上述方案中,通过预设的卷积网络模型结合所述静态交叉向量之前,包括:

通过预设的贡献模型计算目标用户和邻近用户的动态属性特征,以获得所述拓扑结构中各邻近用户对所述目标用户的贡献度,将贡献度超过预设的贡献阈值的邻近用户认定为与所述目标用户具有强关联关系,并将其设为相邻用户。

上述方案中,通过预设的卷积网络模型结合所述静态交叉向量,计算所述目标用户和相邻用户的动态属性向量获得综合向量的步骤,包括:

将所述目标用户依次与各相邻用户匹配形成关联对,通过所述卷积神经网络的第一卷积层依次计算各关联对中的动态属性向量获得动态计算向量;

将所述动态计算向量和静态交叉向量录入所述卷积神经网络的第二卷积层,以获得动静交叉向量;

通过所述卷积神经网络的池化层计算所述动静交叉向量获得综合向量。

上述方案中,计算所述目标用户和相邻用户的动态属性向量获得综合向量之后,还可包括:根据所述综合向量制定用户画像,其包括:

对综合向量中的属性特征值进行解码获得静态属性标签,根据所述静态属性标签构建用户信息;

对综合向量中的拓扑特征值进行解码获得静态特征标签,提取数量超过预设画像阈值的静态特征标签,并将其设为关联标签;

对综合向量中的动态特征值进行解码获得动态标签,合并所述关联标签和动态标签形成关联信息;

通过所述用户信息和关联信息构建用户画像;

将所述用户画像上传至区块链中。

为实现上述目的,本发明还提供一种目标相似度识别装置,包括:

用户识别模块,用于接收目标信息,获取与所述目标信息匹配的用户并将其设为目标用户;

拓扑绘制模块,用于根据所述目标用户及与其具有关联关系的邻近用户,绘制所述目标用户的拓扑结构;

静态交叉模块,用于识别所述拓扑结构的邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量;其中,所述静态交叉向量表征了可用于制定静态属性标签的属性特征值,及可用于制定静态特征标签的拓扑特征值;

综合计算模块,用于通过预设的卷积网络模型结合所述静态交叉向量,计算目标用户和相邻用户的动态属性向量获得综合向量;其中,所述相邻用户是指与目标用户具有强关联关系的邻近用户,所述综合向量是一种用于表征属性特征值、拓扑特征值及动态特征值的特征向量,所述动态特征值是一种用于在动态维度上制定动态标签的特征编码。

为实现上述目的,本发明还提供一种计算机设备,其包括存储器和处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述计算机设备的处理器执行所述计算机程序时实现所述目标相似度识别方法的步骤。

为实现上述目的,本发明还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现所述目标相似度识别方法的步骤。本发明提供的目标相似度识别方法、装置、计算机设备及可读存储介质,通过结合静态交叉向量(用于制定静态属性标签的属性特征值)和动态属性向量(在单位时间内或空间内描述用户行为的数据)进行计算,实现了从状态维度上(静态维度和动态维度)对目标用户的信息进行挖掘,识别出了与目标用户具有关联关系,但静态属性填写不全和/或动态属性识别不全用户的标签,实现了最大限度挖掘目标用户特征标签的技术效果。

附图说明

图1为本发明目标相似度识别方法实施例一的流程图;

图2为本发明目标相似度识别方法实施例二中目标相似度识别方法的环境应用示意图;

图3为本发明目标相似度识别方法实施例二中目标相似度识别方法的具体方法流程图;

图4为本发明目标相似度识别方法实施例二中获得综合向量的流程图;

图5为本发明目标相似度识别装置实施例三的程序模块示意图;

图6为本发明计算机设备实施例四中计算机设备的硬件结构示意图。

附图标记:

1、目标相似度识别装置2、服务器3、网络4、控制端

5、计算机设备11、创建模块12、用户识别模块

13、关联获取模块14、拓扑绘制模块15、向量获取模块

16、静态交叉模块17、贡献度计算模块18、综合计算模块

19、画像制作模块51、存储器52、处理器

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供的目标相似度识别方法、装置、计算机设备及可读存储介质,适用于大数据的数据分析领域,为提供一种基于用户识别模块、拓扑绘制模块、静态交叉模块、综合计算模块的目标相似度识别方法。本发明通过接收目标信息,获取与所述目标信息匹配的用户并将其设为目标用户;根据所述目标用户及与其具有关联关系的邻近用户,绘制所述目标用户的拓扑结构;根据所述拓扑结构识别所述邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量;通过预设的卷积网络模型结合所述静态交叉向量,计算目标用户和相邻用户的动态属性向量获得综合向量。

实施例一

请参阅图1,本实施例的一种目标相似度识别方法,包括:

s102:接收目标信息,获取与所述目标信息匹配的用户并将其设为目标用户;

s104:根据所述目标用户及与其具有关联关系的邻近用户,绘制所述目标用户的拓扑结构;

s106:识别所述拓扑结构的邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量;其中,所述静态交叉向量表征了可用于制定静态属性标签的属性特征值,及可用于制定静态特征标签的拓扑特征值;

s108:通过预设的卷积网络模型结合所述静态交叉向量,计算目标用户和相邻用户的动态属性向量获得综合向量;其中,所述相邻用户是指与目标用户具有强关联关系的邻近用户,所述综合向量是一种用于表征属性特征值、拓扑特征值及动态特征值的特征向量,所述动态特征值是一种用于在动态维度上制定动态标签的特征编码。

本申请根据所述目标用户及与其具有关联关系的邻近用户,绘制所述目标用户的拓扑结构;解决了如何明晰目标用户在数据库中与哪些用户之间具有关联关系,以助于进一步的获得目标用户的特征。

根据所述拓扑结构识别所述邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量;通过融合基于拓扑结构的静态特征向量,以及基于非拓扑结构的静态属性向量,更客观准确的反映了用户的静态特征之间的一些没法直接得到的关系,同时也把拓扑结构下的静态属性的关系融合在内,获得了用于表征了可用于制定静态属性标签的属性特征值,及可用于制定静态特征标签的拓扑特征值的静态交叉向量;解决了如何获得邻近用户对目标用户的影响的技术问题,以及解决了因无法从拓扑结构角度上对目标用户与其他用户的相似度进行分析,导致无法识别在静态属性上没有很强的相似度,但是在拓扑结构上具有较强相似度的其他用户,极大的扩大了相似度识别范围和准确度。

通过预设的卷积网络模型结合所述静态交叉向量,计算目标用户和相邻用户的动态属性向量获得综合向量;其中,所述相邻用户是指与目标用户具有强关联关系的邻近用户,所述综合向量是一种用于表征属性特征值、拓扑特征值及动态特征值的特征向量,所述动态特征值是一种用于在动态维度上制定动态标签的特征编码。由于通过结合静态交叉向量和动态属性向量进行计算,实现了从状态维度上(静态维度和动态维度)对目标用户的信息进行挖掘,进而实现最大限度挖掘目标用户特征标签,及真实准确的对目标相似度进行识别的技术效果。

示例性地,目标用户a的静态属性向量所对应的标签包括:男、律师、本科、户籍江苏省;获取与所述目标用户a之间具有关联关系的邻近用户,并绘制目标用户a的拓扑结构(如:辐射状结构的拓扑结构);将邻近用户中与目标用户a相同的特征赋以所述目标用户形成静态交叉向量,例如,邻近用户有10个,其中,男性为8名、律师为7名、本科为9名,户籍江苏省为1名,那么,获得的静态交叉向量所对应的标签将表示为(男、律师、本科、户籍江苏省;8名男性、7名律师、9名本科、1名江苏省人),其中,男、律师、本科、户籍江苏省所对应的特征编码为属性特征值,其表征了所述目标用户的静态属性标签;8名男性、7名律师、9名本科、1名江苏省人所对应的特征编码为拓扑特征值,其表征了所述目标用户的静态特征标签。

获得目标用户的动态属性向量,例如,爱好网购、经常浏览新闻、旅游达人所对应的特征编码;获得相邻用户的动态属性向量,例如,爱好网购、经常浏览新闻、喜欢赛车所对应的特征编码;卷积网络模型结合所述静态交叉向量(男、律师、本科、户籍江苏省;8名男性、7名律师、9名本科、1名江苏省人)计算目标用户和相邻用户的动态属性向量获得综合向量,例如:(男、律师、本科、户籍江苏省;8名男性、7名律师、9名本科、1名江苏省人;爱好网购、经常浏览新闻),其中,男、律师、本科、户籍江苏省所对应的特征编码为属性特征值,其表征了所述目标用户的静态属性标签;8名男性、7名律师、9名本科、1名江苏省人所对应的特征编码为拓扑特征值,其表征了所述目标用户的静态特征标签;爱好网购、经常浏览新闻所对应的特征编码为动态特征值,其表征了用户的动态标签。

因此,通过所述综合向量将获得如下标签:

用户标签:男性、律师、本科、江苏省人。

他的圈子标签:男性、律师、本科、爱好网购、经常浏览新闻。

其中,由于在目标用户a的邻近用户中,与其具有相同籍贯“江苏省人”的邻近用户仅为1人,小于预设的代表阈值7,因此不具有代表性;故,在“他的圈子标签”中仅保留“男性、律师、本科”这三个标签。

如果与目标用户之间建立关联关系的邻近用户中,具有静态属性填写不全和/或动态属性识别不全的用户,则可将“他的圈子标签”赋以所述目标用户,以通过所述关联关系确定静态属性填写不全和/或动态属性识别不全用户的标签,健全了数据库中各用户的标签,以便于机构对用户制定用户画像。本方案可应用于智慧城市场景中,进一步推进智慧城市的发展。

实施例二:

本实施例为上述实施例一的一种具体应用场景,通过本实施例,能够更加清楚、具体地阐述本发明所提供的方法。

下面,以在运行有目标相似度识别方法的服务器对用户进行目标相似度识别为例,来对本实施例提供的方法进行具体说明。需要说明的是,本实施例只是示例性的,并不限制本发明实施例所保护的范围。

图2示意性示出了根据本申请实施例二的目标相似度识别方法的环境应用示意图。

在示例性的实施例中,目标相似度识别方法所在的服务器2通过网络3连接控制端4;所述服务器2可以通过一个或多个网络3提供服务,网络3可以包括各种网络设备,例如路由器,交换机,多路复用器,集线器,调制解调器,网桥,中继器,防火墙,代理设备和/或等等。网络3可以包括物理链路,例如同轴电缆链路,双绞线电缆链路,光纤链路,它们的组合和/或类似物。网络3可以包括无线链路,例如蜂窝链路,卫星链路,wi-fi链路和/或类似物;所述控制端4可为安装有人脸识别算法程序的服务器。

图3是本发明一个实施例提供的一种目标相似度识别方法的具体方法流程图,该方法具体包括步骤s201至s209。

s201:创建用于储存用户的基本信息及属性向量的数据库,其中,所述属性向量包括静态属性向量和动态属性向量。

本步骤中,基本信息是用于对用户进行唯一性标记的数据,如:用户名称、用户编号等。

所述静态属性向量是对静态属性信息进行特征编码所获得的向量数据,所述静态属性信息是一种描述用户相对固定的属性的数据,例如:年龄、性别、籍贯性别,职业等,年龄段,收入水平,活跃城市,教育程度,购买偏好等。

所述动态属性向量是对动态属性信息进行特征编码所获得的向量数据,所述动态属性信息是一种在单位时间内或空间内描述用户行为的数据,比如空间维度或时间维度下交易行为,消费行为,社交行为等,例如:分别按时间维度年,月,日,周,节假日,把用户购买,搜索,收藏,浏览,贷款,交易的行为进行进一步划分,同时分析得到用户的动态标签,兴趣偏好,距离偏好等,比如土著,旅游达人,并且通过动态行为数据分析出用户的消费水平分级,消费声明周期,用户对优惠的敏感度,对上面得到的数据进行编码,每个维度可以进行类别统计,统计比如用户对产品的频分,评价次数,购买次数,以及购买价格的统计量,如均值,中位数,标准差,最大值和最小值,将这些特征进行交叉组成特征向量。

需要说明的是,静态属性信息是由用户的客户端输入的信息数据,动态属性信息是指通过埋点收集用户的动态行为,例如:用户各种浏览、交易、登录等行为;由于对静态属性信息和动态属性信息的划分与识别属于商业活动的范畴,而将静态属性信息和动态属性信息进行特征编码获得静态属性向量和动态属性向量属于现有技术,因此,静态属性信息和动态属性信息的划分与识别,以及静态属性向量和动态属性向量的获得在本申请中不做赘述。

于本实施例中,所述静态属性向量记为s(i),动态属性向量记为d(i)。

s202:接收控制端发送的目标信息,获取与所述目标信息匹配的用户并将其设为目标用户。

本步骤中,接收控制端发送的目标信息,其中所述目标信息中包括有用户名称和/或用户编号;从数据库中提取基本信息与所述用户名称和/或用户编号一致的用户,并将其设为目标用户。

s203:从所述数据库中获取与所述目标用户具有关联关系的邻近用户。

其中,所述关联关系是指具有信息一致性或行为一致性的用户关系;所述信息一致性是指两个用户之间具有相同或相似的静态属性向量,如:至少包括相同的性别、和/或年龄段、和/或职业、和/或籍贯、和/或当前区域等;所述行为一致性是指两个用户之间具有相同或相似的动态属性向量,如:至少包括在空间维度或时间维度下的同一交易行为、和/或消费行为、和/或社交行为。

s204:根据所述目标用户及与其具有关联关系的邻近用户,绘制所述目标用户的拓扑结构。

为明晰目标用户在数据库中与哪些用户之间具有关联关系,以进一步的获得目标用户的特征,本步骤中通过获取与目标用户之间具有关联关系的邻近用户,再根据所述关联关系创建以目标用户和邻近用户为节点的拓扑结构。于本实施例中,所述拓扑结构是以所述目标用户为根节点,以所述邻近用户为分支节点或叶子节点的网络节点连接形式。

s205:获取所述拓扑结构中各节点的静态特征向量。

本步骤中,所述静态特征向量用于指示所述每个节点与其他n-1个节点之间的拓扑关系,所述拓扑结构反应了目标用户和邻近用户所组成的节点网络的关联关系。

示例性地,所述静态特征向量可包括:在拓扑结构下,拥有与所述目标用户的一样的静态属性向量的邻近用户的数量(如,相同性别的邻近用户的数量,相同职业的邻近用户数量,相同学历的邻近用户数量,及相同籍贯的邻近用户数量),拥有与该目标用户的静态属性向量相似度90%的邻近用户的数量(如:与目标用户的年龄差距不超过目标用户年龄10%的邻近用户数量),和/或位于目标用户的当前区域附近5公里内的所有邻近用户的数量,因此将获取更多的信息量,并更深入的挖掘了数据。

s206:识别所述拓扑结构的邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量;其中,所述静态交叉向量表征了可用于制定静态属性标签的属性特征值,及可用于制定静态特征标签的拓扑特征值。

根据拓扑结构强化目标用户的静态属性向量在拓扑结构中占比较高的特征值,及弱化所述静态属性向量在拓扑结构中占比较低的特征值,获得了用于表征可用于制定静态属性标签的属性特征值,以及根据拓扑结构识别与目标用户具有相同或相似拓扑关系的邻近用户,并将所述邻近用户的拓扑关系中与目标用户一致的部分赋以所述目标用户,获得了用于表征可用户制定静态特征标签的拓扑特征值。

具体的,识别所述拓扑结构的邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量,包括:

根据所述静态属性向量和静态特征向量在所述拓扑结构中识别与目标用户相同或相近的邻近用户,从所述邻近用户中提取与所述目标用户相同的特征向量,并将其赋以所述目标用户的静态属性向量和静态特征向量获得静态交叉向量。

其中,所述静态特征向量是指在拓扑结构中每个节点与其他n-1个节点之间的拓扑关系。

为获知邻近用户对目标用户有何影响,本步骤通过预设的交叉模型计算所述目标用户和邻近用户的静态属性向量和静态特征向量获得静态交叉特征,所述静态交叉特征表征了邻近用户的对目标用户的影响,融合了两种结构的特征向量。

于本实施例中,通过预设的交叉模型计算所述目标用户和邻近用户的静态属性向量和静态特征向量获得静态交叉向量,所述交叉模型具有交叉公式,所述交叉公式如下所示:

其中,f(i,j),为静态交叉向量;s(i)为目标用户的静态属性向量,gs(i)为目标用户的静态特征向量,s(j)为邻近用户的静态属性向量,gs(j)为邻近用户的静态特征向量;v(i),v(j),w(i),w(j)分别为预设的权重矩阵,权重矩阵中元素记为x,x所对应的特征维度为t,根据所述拓扑结构将与用户i(即目标用户)在特征维度t上相似性大于85%的邻近用户的数目作为x的值,若所述邻近用户的数目为0,那么将x取值为0.01;按照这种方法完成v(i),v(j),w(i),w(j)的权重矩阵设置。

此处为静态属性计算部分,是目标用户的静态属性向量与邻近用户静态属性向量的加权乘积,以消除静态属性向量中与邻近用户之间相似度较低的特征值,并加强静态属性向量中与邻近用户之间相似度较高的特征值,其目的在于识别出静态属性向量与目标用户相同或相近的邻近用户,并将强化相同或相似的部分以提高其识别度,以便于制作标签。

此处为静态特征计算部分,是目标用户的静态特征向量与邻近用户静态特征向量的加权乘积,以消除静态特征向量中与邻近用户之间相似度较低的特征值,并加强静态特征向量中与邻近用户之间相似度较高的特征值,以便于制作标签。

<s(i),gs(i)>

这部分是指目标用户的静态属性向量和静态特征向量,结合上述公式,将静态属性向量与静态属性计算部分的结果相加,获得具有属性特征值的静态属性向量,将静态特征向量与静态特征计算部分的结果相加,获得具有拓扑特征值的拓扑特征向量,将所述拓扑属性向量与拓扑特征向量结合获得静态交叉向量。

需要说明的是,所述相似性是指在两个节点的特征值中,将绝对值较小的特征值与绝对值较大的特征值相除获得比值,并将大于贡献阈值的比值所对应的两个节点认定为具有相似性。

s207:通过预设的贡献模型计算目标用户和邻近用户的动态属性特征,以获得所述拓扑结构中各邻近用户对所述目标用户的贡献度,将贡献度超过预设的贡献阈值的邻近用户认定为与所述目标用户具有强关联关系,并将其设为相邻用户。

为保证准确分析邻近用户对目标用户影响,且,减少卷积网络模型在动态属性向量上的计算强度,本步骤通过贡献模型计算目标用户和邻近用户的动态属性特征,以获得所述拓扑结构中各邻近用户对所述目标用户的贡献度,将贡献度超过预设的贡献阈值的邻近用户认定为与所述目标用户具有强关联关系,并将其设为相邻用户;使得本申请仅需计算与目标用户具有强关联关系的相邻用户的动态属性向量,对目标用户的影响,即可实现准确分析目标用户且减少卷积神经网络的计算强度的效果。

于本实施例中,所述贡献模型的目标公式如下所示,

其中,为邻近用户的动态属性向量,为目标用户的动态属性向量,n(v,k)是u的所有k阶邻近节点区间,h为拓扑结构中作为目标用户的节点,m(u,v,k)是指邻近用户对目标用户的贡献率;

通过上述目标公式,计算获得贡献率大于贡献阈值的邻近用户,并将其记为u(i,0),u(i,1),u(i,2),…u(i,n),将记录的所述邻近用户设为相邻用户。

s208:通过预设的卷积网络模型结合所述静态交叉向量,计算目标用户和相邻用户的动态属性向量获得综合向量;其中,所述相邻用户是指与目标用户具有强关联关系的邻近用户,所述综合向量是一种用于表征属性特征值、拓扑特征值及动态特征值的特征向量,所述动态特征值是一种用于在动态维度上制定动态标签的特征编码。

为从静态属性信息和动态属性信息两个角度对目标用户进行分析,以最大程度上挖掘目标用户的特征,本步骤通过卷积网络模型结合静态交叉向量,计算拓扑结构中目标用户及其相邻用户的动态属性向量,以获得用于表征目标用户在静态和动态两个维度上特征标签的综合向量。通过结合静态交叉向量和动态属性向量进行计算,实现了从状态维度上(静态维度和动态维度)对目标用户的信息进行挖掘,进而实现最大限度挖掘目标用户特征标签的技术效果。

需要说明的是,所述卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络(feedforwardneuralnetworks),是深度学习(deeplearning)的代表算法之一。卷积神经网络具有表征学习(representationlearning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariantclassification),于本实施例中,所述卷积神经网络包括池化层和至少一个卷积层,由于卷积神经网络属于现有技术范畴,故在本申请中不做赘述。

在一个优选的实施例中,请参阅图4,通过预设的卷积网络模型结合所述静态交叉向量,计算所述目标用户和相邻用户的动态属性向量获得综合向量的步骤,包括:

s208-1:将所述目标用户依次与各相邻用户匹配形成关联对,通过所述卷积神经网络的第一卷积层依次计算各关联对中的动态属性向量获得动态计算向量。

为获得目标用户与各相邻用户之间具有较高相似度的行为信息,将所述目标用户依次与各相邻用户匹配形成关联对,通过第一卷积层卷积计算关联对中的动态属性向量以获得两个用户之间相同或相近的动态特征值,依次计算各关联对并最终形成动态计算向量;其中,所述动态特征值为动态属性向量中的特征值,其可用于在动态维度上制定动态标签,故动态计算向量表征了可制定至少一个标签的向量矩阵。

需要说明的是,所述第一卷积层是由若干卷积单元组成的,每个卷积单元的参数都是通过反向传播算法最佳化得到的,其目的是用于通过卷积运算提取输入向量的不同特征。由于卷积神经网络中第一卷积层通常用于提取一些低级的特征,因此,于本实施例中,通过所述第一卷积层依次对各关联对的动态属性向量进行卷积运算,以提取各关联对中两个用户之间相同或相近的动态特征值。

s208-2:将所述动态计算向量和静态交叉向量录入所述卷积神经网络的第二卷积层,以获得动静交叉向量。

为便于从动态维度和静态维度上对目标用户进行识别,本步骤通过将用于制定动态标签的动态计算向量,以及用于制定静态属性标签的和静态特征标签的静态交叉向量录入第二卷积层,使所述第二卷积层从动态维度和静态维度上识别出最能体现出目标用户特征的特征值,并形成动静交叉向量。

本步骤中,所述第二卷积层是由若干卷积单元组成的,每个卷积单元的参数都是通过反向传播算法最佳化得到的,其目的是通过卷积运算提取输入向量的不同特征。于本实施例中,第二卷积层分别对动态计算向量和静态交叉向量进行卷积运算,以提取各动态计算向量中出现和静态交叉向量中相似度较高的向量所对应的特征。

s208-3:通过所述卷积神经网络的池化层计算所述动静交叉向量获得综合向量。

为提高动静交叉向量的准确度并降低过拟合的影响,本步骤采用池化层对动静交叉向量进行数据压缩并减小过拟合,由于第二卷积层输出的动静交叉向量中的元素值的精确位置远不及它和其他特征的相对位置的关系重要,故通过池化层不断地减小数据的空间大小,因此参数的数量和计算量也会下降,这在一定程度上也控制了过拟合。

s209:根据所述综合向量制定用户画像,其包括:

对综合向量中的属性特征值进行解码获得静态属性标签,根据所述静态属性标签构建用户信息;

对综合向量中的拓扑特征值进行解码获得静态特征标签,提取数量超过预设画像阈值的静态特征标签,并将其设为关联标签;

对综合向量中的动态特征值进行解码获得动态标签,合并所述关联标签和动态标签形成关联信息;

通过所述用户信息和关联信息构建用户画像;

将所述用户画像上传至区块链中。

本步骤中,可通过解码器对综合向量中的属性特征值、拓扑特征值和动态特征值进行解码,以获得静态属性标签、静态特征标签和动态标签。由于综合向量表征了目标用户在静态和动态两个状态维度上特征标签的特征编码,以及在拓扑和非拓扑结构的两个层次维度上的特征编码,因此,通过对所述综合向量进行解码,将获得对目标用户进行两个状态维度上的特征标签,以及两个层次维度上的特征标签,因此,利用该结果所对应的特征标签制定用户画像将极大的提高了用户画像的准确度。

示例性地,获得的综合向量如:(男、律师、本科、户籍江苏省;8名男性、7名律师、9名本科、1名江苏省人;爱好网购、经常浏览新闻),其中,男、律师、本科、户籍江苏省所对应的特征编码为属性特征值,其表达了用户的静态属性标签;8名男性、7名律师、9名本科、1名江苏省人所对应的特征编码为拓扑特征值,其表达了用户的静态特征标签;爱好网购、经常浏览新闻所对应的特征编码为动态特征值,其表达了用户的动态标签。

因此,通过所述综合向量将获得如下信息:

用户信息:男性、律师、本科、江苏省人;其反映了用户的属性;

关联信息:男性、律师、本科、爱好网购、经常浏览新闻;其反映了用户的圈子;其中,由于江苏省人这个静态特征标签仅具有1人,小于预设的画像阈值7,因此不具有代表性,故关联信息中仅保留了静态特征标签中“男性、律师、本科”,通过所述用户信息和关联信息得到用户画像。

需要说明的是:基于用户画像得到对应的摘要信息(如所述通过综合向量获得的用户信息和关联信息),具体来说,摘要信息由用户画像进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息,以便查证用户画像是否被篡改。

本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

实施例三:

请参阅图5,本实施例的一种目标相似度识别装置1,包括:

用户识别模块12,用于接收目标信息,获取与所述目标信息匹配的用户并将其设为目标用户;

拓扑绘制模块14,用于根据所述目标用户及与其具有关联关系的邻近用户,绘制所述目标用户的拓扑结构;

静态交叉模块16,用于识别所述拓扑结构的邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量;其中,所述静态交叉向量表征了可用于制定静态属性标签的属性特征值,及可用于制定静态特征标签的拓扑特征值;

综合计算模块18,用于通过预设的卷积网络模型结合所述静态交叉向量,计算目标用户和相邻用户的动态属性向量获得综合向量;其中,所述相邻用户是指与目标用户具有强关联关系的邻近用户,所述综合向量是一种用于表征属性特征值、拓扑特征值及动态特征值的特征向量,所述动态特征值是一种用于在动态维度上制定动态标签的特征编码。

可选的,目标相似度识别装置1还包括:

创建模块11,用于创建用于储存用户的属性向量的数据库,其中,所述属性向量包括静态属性向量和动态属性向量。

可选的,目标相似度识别装置1还包括:

关联获取模块13,用于从所述数据库中获取与所述目标用户具有关联关系的邻近用户。

可选的,目标相似度识别装置1还包括:

向量获取模块15,用于获取所述拓扑结构中各节点的静态特征向量。

可选的,目标相似度识别装置1还包括:

贡献度计算模块17,用于通过预设的贡献模型计算目标用户和邻近用户的动态属性特征,以获得所述拓扑结构中各邻近用户对所述目标用户的贡献度,将贡献度超过预设的贡献阈值的邻近用户认定为与所述目标用户具有强关联关系,并将其设为相邻用户。

可选的,目标相似度识别装置1还包括:

画像制作模块19,用于根据所述综合向量制定用户画像,其包括:对综合向量中的属性特征值进行解码获得静态属性标签,根据所述静态属性标签构建用户信息;对综合向量中的拓扑特征值进行解码获得静态特征标签,提取数量超过预设画像阈值的静态特征标签,并将其设为关联标签;对综合向量中的动态特征值进行解码获得动态标签,合并所述关联标签和动态标签形成关联信息;通过所述用户信息和关联信息构建用户画像;将所述用户画像上传至区块链中。

本技术方案基于大数据的数据分析领域,接收目标信息,获取与所述目标信息匹配的用户并将其设为目标用户;根据所述目标用户及与其具有关联关系的邻近用户,绘制所述目标用户的拓扑结构;根据所述拓扑结构识别所述邻近用户中与所述目标用户相同的特征,并将其赋以所述目标用户形成静态交叉向量;通过预设的卷积网络模型结合所述静态交叉向量,计算目标用户和相邻用户的动态属性向量获得综合向量;以通过所述关联关系确定静态属性填写不全和/或动态属性识别不全用户的标签,健全了数据库中各用户的标签,以便于机构对用户制定用户画像,尤其是用户兴趣画像。

实施例四:

为实现上述目的,本发明还提供一种计算机设备5,实施例三的目标相似度识别装置1的组成部分可分散于不同的计算机设备中,计算机设备可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于:可通过系统总线相互通信连接的存储器51、处理器52,如图6所示。需要指出的是,图6仅示出了具有组件-的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

本实施例中,存储器51(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器51可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,存储器51也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,存储器51还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器51通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例一的目标相似度识别装置的程序代码等。此外,存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器52在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器52通常用于控制计算机设备的总体操作。本实施例中,处理器52用于运行存储器51中存储的程序代码或者处理数据,例如运行目标相似度识别装置,以实现实施例一的目标相似度识别方法。

实施例五:

为实现上述目的,本发明还提供一种计算机可读存储介质,其包括存储数据区和存储程序区,存储数据区存储根据区块链节点的使用所创建的数据,存储程序区存储有计算机程序;所述存储程序区包括存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务器、app应用商城等等,其上存储有计算机程序,程序被处理器52执行时实现相应功能。本实施例的计算机可读存储介质用于存储目标相似度识别装置,被处理器52执行时实现实施例一的目标相似度识别方法。

进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1