基于数字金融的区块链大数据处理方法及大数据服务器与流程

文档序号:24528810发布日期:2021-04-02 10:06阅读:76来源:国知局
基于数字金融的区块链大数据处理方法及大数据服务器与流程

本申请涉及区块链及大数据分析技术领域,具体而言,涉及一种基于数字金融的区块链大数据处理方法及大数据服务器。



背景技术:

部分去中心化的联盟区块链网络包括预先指定的对象,例如特定领域的权威机构,如数字金融领域的大银行和金融监管机构等,可以成为联盟区块链网络中的节点,成为节点对象。其他对象没有资格成为节点,成为非节点对象。如此,联盟区块链网络中的各节点对象可以为非节点对象提供服务,非节点对象可以与联盟区块链网络对接,请求联盟区块链网络中的各节点对象提供相应的服务。现有的非节点对象在使用各节点对象提供的服务的过程中,会产生海量的用户数据。现有的联盟区块链网络大多采用特定的服务模式对各非节点对象提供相应的服务,没有有效的机制对非节点对象产生海量的用户行为数据进行挖掘分析,而难以提供针对不同的非节点对象的个性提供个性化服务模式。



技术实现要素:

基于现有设计的不足,本申请实施例提供一种基于数字金融的区块链大数据处理方法,应用于大数据服务器,所述大数据服务器与位于联盟区块链网络中的节点对象以及非节点对象通信连接。所述方法包括:

对多个非节点对象在使用节点对象提供的服务所产生的多个历史操作数据片段进行操作行为标签分析,以确定每个所述历史操作数据片段中的用户行为特征数据以及对应的操作行为标签;

根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,从所述多个历史操作数据片段中确定满足预设数据筛选规则的多个用户行为特征数据以作为目标筛选数据;

基于多个所述目标筛选数据,对所述多个历史操作数据片段中目标非节点对象产生的历史操作数据片段进行目标识别,以确定包括任意一个所述目标筛选数据的目标历史操作数据片段;

确定每个所述目标历史操作数据片段中的目标筛选数据的被选概率分值,并根据每个所述被选概率分值确定所述目标非节点对象对所述目标筛选数据的兴趣程度值,并确定所述目标历史操作数据片段中满足兴趣程度值条件的目标筛选数据;

根据所述目标历史操作数据片段中满足预设兴趣程度值条件的目标筛选数据,确定所述目标非节点对象的服务推荐画像。

进一步地,所述根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,从所述多个历史操作数据片段中确定满足预设数据筛选规则的多个用户行为特征数据以作为目标筛选数据,包括:

根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,确定每个所述历史操作数据片段中的用户行为特征数据的被选概率分值;

根据每个所述历史操作数据片段中的用户行为特征数据的被选概率分值,确定大于预设概率分值阈值的用户行为特征数据作为目标筛选数据。

进一步地,所述用户行为特征数据的操作行为标签包括服务类型使用占比、行为特征出现频率、服务类型人次占比;其中,所述服务类型使用占比表示所述用户行为特征数据对应的服务类型在所述历史操作数据片段中的使用次数与该历史操作数据片段中的所有服务类型的使用次数之比值、所述行为特征出现频率表示所述用户行为特征数据在所述历史操作数据片段中出现的次数与该历史操作数据片段中的所有用户行为特征数据的出现次数之比值、所述服务类型人次占比表示所述对应的服务类型在所述历史用户操作数据片段中的使用人数与所述历史用户操作数据片段中的所有服务类型的使用人数之比值;

所述根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,确定每个所述历史操作数据片段中的用户行为特征数据的被选概率分值,包括:

针对每个所述历史操作数据片段中的用户行为特征数据中的任一目标用户行为特征数据:

确定所述目标用户行为特征数据的在所述历史操作数据片段中对应的服务类型使用占比、行为特征出现频率、以及服务类型人次占比分别对应的第一权重系数,第二权重系数以及第三权重系数;

根据所述对应的服务类型使用占比、行为特征出现频率、以及服务类型人次占比和所述第一权重系数,第二权重系数、以及第三权重系数计算得到所述目标用户行为特征数据对应的被选概率分值。

进一步地,所述目标用户行为特征数据对应的被选概率分值,通过以下公式计算得到:

score(i)=α1×β1+α2×β2+α3×β3;

其中,score(i)代表所述目标用户行为特征数据对应的被选概率分值,α1、α2、α3分别代表所述目标用户行为特征数据对应的服务类型使用占比、行为特征出现频率、以及服务类型人次占比,β1、β2、β3分别代表所述第一权重系数、第二权重系数以及第三权重系数,β1、β2、β3之和为1。

进一步地,上述对被操作的多个历史操作数据片段进行操作行为标签分析,以确定每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,包括:

针对每个所述历史操作数据片段中的任一用户行为特征数据:

确定所述用户行为特征数据对应的服务类型;对每个所述历史操作数据片段进行第一服务类型关键词遍历搜索,确定所述服务类型的第一出现次数;对每个所述历史操作数据片段,进行第二服务类型关键词遍历搜索,确定所述多个历史操作数据片段中包含的所有服务类型,并确定所有服务类型的第二出现次数;根据所述第一出现次数和所述第二出现次数确定得到所述服务类型使用占比;

确定所述用户行为特征数据对应的用户行为特征;对每个所述历史操作数据片段进行第一行为特征关键词遍历搜索,确定所述用户行为特征的第三出现次数;对每个所述历史操作数据片段,进行第二行为特征关键词遍历搜索,确定所述多个历史操作数据片段中包含的所有用户行为特征,并确定所有用户行为特征的第四出现次数;根据所述第三出现次数和所述第四出现次数确定得到所述行为特征出现频率;

确定所述用户行为特征数据对应的服务类型;对每个所述历史操作数据片段进行第一用户id遍历搜索,确定使用所述服务类型的第一用户id数量;对每个所述历史操作数据片段,进行所述第二服务类型关键词遍历搜索,确定所述多个历史操作数据片段中包含的所有服务类型,并对每个所述历史操作数据片段进行第二用户id遍历搜索,确定所有服务类型对应第二用户id数量;根据所述第一用户id数量和所述第二用户id数量确定得到所述服务类型人次占比。

进一步地,上述根据每个所述历史操作数据片段中的用户行为特征数据的被选概率分值,确定满足预设数据筛选规则的多个用户行为特征数据以作为目标筛选数据,包括:

针对所述多个历史操作数据片段中的任一历史操作数据片段:

将所述历史操作数据片段中的用户行为特征数据进行数据去噪处理,并对数据去噪处理后剩余的用户行为特征数据的被选概率分值按照从大到小的顺序进行排列,将按照从大到小的顺序进行排列后的前第一预设数量个用户行为特征数据确定为满足被选概率分值预设数据筛选规则的目标筛选数据;

所述根据每个目标历史操作数据片段中的目标筛选数据的被选概率分值,确定所述目标非节点对象对所述目标筛选数据的兴趣程度值,并根据所述目标历史操作数据片段中满足兴趣程度值条件的目标筛选数据,确定所述目标非节点对象的服务推荐画像,包括:

针对所述第一预设数量个目标筛选数据中的任一目标筛选数据:

将所述目标筛选数据在每个所述目标历史操作数据片段中的被选概率分值进行加权求和,以确定所述目标非节点对象对所述目标筛选数据的兴趣程度值;

对所述目标非节点对象对每个所述目标筛选数据的兴趣程度值按照从大到小的顺序进行排列;

根据按照从大到小的顺序进行排列后的前第二预设数量个目标筛选数据,确定所述目标非节点对象的服务推荐画像。

进一步地,上述对被操作的多个历史操作数据片段进行操作行为标签分析,以确定每个所述历史操作数据片段中的用户行为特征数据,包括:

将所述被操作的多个历史操作数据片段分别输入预先训练得到的行为特征识别模型,以计算得到所述多个历史操作数据片段中包括用户行为标签的多个用户行为特征数据。

进一步地,所述方法还包括:将所述目标非节点对象的服务推荐画像发送至联盟区块链网络中的所有节点对象,以使所述联盟区块链网络中部署节点对象根据所述目标非节点对象的服务推荐画像,为所述目标非节点对象进行节点服务推荐。

本申请实施例还提供一种大数据服务器,包括处理器、机器可读存储介质,所述机器可读存储介质和所述处理器连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以实现权利要求1-9任意一项所述的基于数字金融的区块链大数据处理方法。

相较于现有技术,本申请实施例具有以下有益效果:

通过对非节点对象产生的大量用户历史操作数据片段进行有效分析,结合所述用户历史操作数据片段中对应的目标非节点对象的历史操作相关数据,对目标非节点对象的进行兴趣特征分析,得到目标非节点对象的服务推荐画像,可利于联盟区块链网络中的节点对象有针对性为非节点对象进行服务推荐。同时,本申请实施例参考了用户历史操作数据片段中其他用户的操作数据,综合其他用户对相应服务类型的使用情况,得到目标非节点对象的服务推荐画像,能够实现服务的更精准推送,提升用户的服务体验的同时,还可以提升推送效果。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,针对本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1是本申请实施例提供的联盟区块链网络的运行环境示意图。

图2是本申请实施例提供的区块链大数据处理方法的流程交互示意图。

图3是图2所示的步骤s13中确定服务类型使用占比的子步骤流程示意图。

图4图2所示的步骤s13中确定服务类型出现频率的子步骤流程示意图。

图5是图2所示的步骤s13中确定服务类型人次占比的子步骤流程示意图。

图6是图2所示的步骤s14的子步骤流程示意图。

图7是图2所示的步骤s15的子步骤流程示意图。

图8是本申请实施例提供的大数据服务器的示意图。

具体实施方式

联盟区块链网络又名共同体区块链、区块链联盟链、或联盟链,通过联合(行业)区块链预选的节点能够控制干预共识过程的区块链。比如,由15个金融机构组成的团队,一个机构运行一个节点,而交易过程的验证区块的生成需要10个以上机构的认可。联盟区块链网络在去中心化和开放程度有所限制,会提前选择参与者。一般来说,联盟区块链网络介于公有链与私有链之间。联盟区块网络链兼具了公有链的开放、低信任和私有区块链的保护隐私、单一高度信任特性。

此外,联盟区块链网络和公有区块链网络的区别在于,公有区块链网络是完全去中心化和对外公开透明的,任何主体或对象(例如个人或单位)都可以成为公有区块链网络中的一个节点或一个对象。而联盟区块链网络是部分去中心化和对外不公开的,只有预先指定的主体或对象(某一领域的权威机构,如金融领域的大银行和金融监管机构等)才可以成为联盟区块链网络中的节点,成为节点对象。其他主体没有资格成为节点,成为非节点对象,联盟区块链网络可以为非节点对象提供服务,非节点对象可以与联盟区块链网络对接,请求联盟区块链网络针对产生的业务达成合法性共识。

基于前述背景技术中所描述的问题,目前的联盟区块链网络大多都只是基于既有的服务方式为非节点对象提供相应的服务,没有有效的机制对非节点对象所产生的大数据进行分析和筛选,难以针对个性化的用户提供个性的服务。在其他的大数据领域中,存在一些用户画像的大数据分析方法,可以对用户的历史数据进行画像分析,从而为用户提供感兴趣的服务推送等。然而,这些画像分析方法,大多只是基于某个单一用户自身的操作数据进行兴趣画像。在联盟区块链网络的特定服务场景下,大多是由类似于金融机构、证券、保险银行等较为权威的节点主体为非节点主体提供服务,若只针对某一个特定的用户(或特定的非节点对象)本身进行大数据分析,无法考虑到这些节点主体的主要服务业务以及各服务业务在广大用户群体中的受欢迎程度,进而导致针对单一用户的大数据分析形成的分析结果,在后续的应用中不利于主要服务业务的推广,且服务业务的推送精准度性也难以得到保证。

基于前述问题的发现,本申请发明人创新性地提供以下技术方案来实现区块链网络的大数据分析和处理,参考了用户历史操作数据片段中其他用户的操作数据,综合其他用户对相应服务类型的使用情况,得到目标非节点对象的服务推荐画像,如此,兼顾了目标非节点对象自身的历史数据,同时参考了其它用户针对不同服务类型业务的相关历史数据,得到目标非节点对象的服务推荐画像,如此,不仅考虑到了目标节点对象的使用兴趣及习惯等数据还结合了节点对象不同服务类型的业务被不同用户的被选则概率等因素,可能够实现服务的更精准推送,提升用户的服务体验。

详细地,本申请实施例提供一种区块链大数据处理方法,应用于大数据服务器,所述大数据服务器与位于联盟区块链网络中的节点对象以及非节点对象通信连接。所述方法包括:

对多个非节点对象使用节点对象提供的服务产生的多个历史操作数据片段进行操作行为标签分析,以确定每个所述历史操作数据片段中的用户行为特征数据以及对应的操作行为标签;

根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,从所述多个历史操作数据片段中确定满足预设数据筛选规则的多个用户行为特征数据以作为目标筛选数据;

基于多个所述目标筛选数据,对所述多个历史操作数据片段中目标非节点对象产生的历史操作数据片段进行目标识别,以确定包括任意一个所述目标筛选数据的目标历史操作数据片段;

确定每个所述目标历史操作数据片段中的目标筛选数据的被选概率分值,并根据每个所述被选概率分值确定所述目标非节点对象对所述目标筛选数据的兴趣程度值,并确定所述目标历史操作数据片段中满足兴趣程度值条件的目标筛选数据;

根据所述目标历史操作数据片段中满足预设兴趣程度值条件的目标筛选数据,确定所述目标非节点对象的服务推荐画像。

下面将结合附图以及实施例对上述方法的各步骤的具体实现方式进行详细的说明。

请参照图1,图1是本申请实施例的运行环境示意图,该运行环境涉及一种联盟区块链网络10,联盟区块链网络10包括大数据服务器100以及与大数据服务器100通信连接的多个非节点对象200以及多个节点对象100。该联盟区块链网络10内的节点对象可以为非节点对象300提供服务。所述大数据服务器100可以是该联盟区块链网络10内的节点对象300达成安全共识建立的大数据分析服务器,其他实施例中也可以是有其中某一个节点对象300担任该大数据服务器100的角色,此处不做限制。本申请实施例中,所述大数据服务器100可以对大量的非节点对象200所产生的大量历史用户操作数据片段进行大数据处理、分析及数据挖掘等工作,用于提供给所述节点对象300针对不同的非节点对象200提供有针对性的个性化服务或推荐等。详细的方法在下面进行具体的示例性描述。

请参照图2,本申请实施例提供的区块链大数据处理方法的流程交互示意图,所述区块链大数据处理方法主要由上述的区块链网络10中的大数据服务器100执行,具体描述如下。

步骤s01,发送历史操作数据片段。具体地,所述非节点对象200将在使用节点对象300提供的服务时会产生的大量的历史操作数据片段,然后将这些历史操作数据片段发送给大数据服务器100,以待分析处理。

步骤s11,操作行为标签分析。

具体地,所述大数据服务器100对多个非节点对象200发送的在使用节点对象300提供的服务时所产生的多个历史操作数据片段进行操作行为标签分析,以确定每个所述历史操作数据片段中的用户行为特征数据以及对应的操作行为标签。

本实施例中,对被操作的多个历史操作数据片段进行操作行为标签分析,以确定每个所述历史操作数据片段中的用户行为特征数据的具体方式可以是:将所述被操作的多个历史操作数据片段分别输入预先训练得到的行为特征识别模型,以计算得到所述多个历史操作数据片段中包括用户行为标签的多个用户行为特征数据。

本实施例中,所述历史操作数据片段可以是指预设时间段内,比如上一周内或上一月内所产生的数据并以数据片段的形式存储在大数据服务器100中,也可以是非节点对象200的用户每一次业务操作时产生的数据形成一个或多个历史操作数据片段。所述用户行为特征数据可以是用于表征用户在使用节点对象300提供的服务时可以表征用户具体操作的特征数据,具体操作例如可以是,购买理财产品、咨询保险业务、转账、贷款、还款、提起融资请求等等。用户行为特征数据例如可以是,包括操作属性为true的业务行为类别以及对应的业务数据信息,例如用于表示“用户a成功购买基金产品c”的数据字段。所述操作行为标签可用于表示所述历史操作数据片段中用户的具体操作信息,例如可以是包括针对某业务类型的“操作方式”,“操作频次”,“产生金额”等内容的数据标签,数据标签可以任何机器可识别的形式存在,例如可以是数据索引标签、数据表、数据字段等。

步骤s12,筛选用户行为特征数据。

详细地,所述大数据服务器100根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,从所述多个历史操作数据片段中确定满足预设数据筛选规则的多个用户行为特征数据以作为目标筛选数据。本实施例中,从大量的历史操作数据片段中确定满足预设数据筛选规则的多个用户行为特征数据作为目标筛选数据,有利于后续针对性的对具有较明显特征的数据(有效特征数据)进行针对性的识别,可提升数据的处理效率。

具体地,在步骤s12中,根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,从所述多个历史操作数据片段中确定满足预设数据筛选规则的多个用户行为特征数据以作为目标筛选数据,具体的实现方式可以是:

首先,根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,确定每个所述历史操作数据片段中的用户行为特征数据的被选概率分值;

然后,根据每个所述历史操作数据片段中的用户行为特征数据的被选概率分值,确定大于预设概率分值阈值的用户行为特征数据作为目标筛选数据。

如此,可以根据用户行为特征数据的操作行为标签的类别,根据大数据分析结果确定被选概率分值,例如一万人的操作数据中,某个操作行为标签被操作的次数与总次数的比值为35%,则被选概率分值可以为35分。在最后的筛选过程中,可以选择被选概率分值超过60分的用户行为特征数据作为目标筛选数据。如此,目标筛选数据不仅考虑了某特定用户的操作特征,还考虑大数据中其他用户对某一项服务的操作特征,对于后续根据数据分析再执行的服务推送,可以使得推送效果更好,所推送的服务别用户选择使用的概率会更大。

步骤s13,对历史操作数据片段进行目标识别。

详细地,本申请实施例中,所述大数据服务器100基于多个所述目标筛选数据,对所述多个历史操作数据片段中的目标非节点对象产生的历史操作数据片段进行目标识别,以确定包括任意一个所述目标筛选数据的目标历史操作数据片段。具体的方法可以是依次将所述目标筛选数据分别与每一个所述历史操作数据片段进行特征识别或数据比对,当任意一个历史操作数据片段中包括对应的目标筛选数据时,则将该历史操作数据片段确定为一个目标历史操作数据片段。若某一个历史操作数据片段中未包括任意一个目标筛选数据,该历史操作数据片段则不是一个目标历史操作数据片段。

步骤s14,确定满足兴趣程度条件的目标筛选数据。

详细地,本申请实施例中,所述大数据服务器100在上述目标筛选数据确定之后,进一步确定每个所述目标历史操作数据片段中的目标筛选数据的被选概率分值,并根据每个所述被选概率分值确定所述目标非节点对象对所述目标筛选数据的兴趣程度值,然后确定所述目标历史操作数据片段中满足兴趣程度值条件的目标筛选数据。具体的方法可以是将所述兴趣程度值与预先设定的兴趣程度值区间进行比对,若所述兴趣程度值位于所述兴趣程度值区间内,则可以认为具有所述兴趣程度值的目标筛选数据满足兴趣程度值条件。又或者,可以将所有目标筛选数据的兴趣程度值进行排序,将排序在前预设数量位的目标筛选数据确定为满足兴趣程度值条件。

步骤s15,确定目标非节点对象的服务推荐画像。

详细地,本申请实施例中,所述大数据服务器100根据所述目标历史操作数据片段中满足预设兴趣程度值条件的目标筛选数据,确定所述目标非节点对象的服务推荐画像。举例而言,可以将所述目标非节点对象所产生的历史操作数据片段与所述满足兴趣程度值条件的所有目标筛选数据进行数据比对,查找出所述历史操作数据片段中所包括的任意一个或多个满足兴趣程度值条件的目标筛选数据,并根据该查找出的任意一个或多个目标筛选数据确定所述目标非节点对象的服务推荐画像。例如,若查找出的目标筛选数据包括“购买基金产品c”、“咨询贷款服务”、“购买重疾保险”等有关的数据,则可以将确定所述目标非节点对象的服务推荐画像为:“基金产品、贷款服务、重疾保险”,但不以此为限制。

步骤s16,服务推荐画像推送。

详细地,本实施例中,在确定任意目标非节点对象的服务推荐画像之后,所述大数据服务器100可以将所述目标非节点对象的服务推荐画像推送给所述节点对象300,使所述节点对象300可以根据所述目标非节点对象的服务推荐画像,为所述目标非节点对象进行节点服务推荐。

步骤s21,为目标非节点对象进行节点服务推荐。

详细地,本实施例中,所述节点对象300在接收到任意目标非节点对象的服务推荐画像之后,在目标非节点对象向该节点对象300发起服务连接的时候,可以向该目标非节点对象进行节点服务推荐。举例而言,可以在为该目标非节点对象提供的服务界面上,在设定的显著位置优先展示所述服务推荐画像对应的相应服务的操作项,但不以此为限制。

进一步地,在本实施例中,所述用户行为特征数据的操作行为标签可以包括服务类型使用占比、行为特征出现频率、服务类型人次占比。其中,所述服务类型使用占比表示所述用户行为特征数据对应的服务类型在所述历史操作数据片段中的使用次数与该历史操作数据片段中的所有服务类型的使用次数之比值、所述行为特征出现频率表示所述用户行为特征数据在所述历史操作数据片段中出现的次数与该历史操作数据片段中的所有用户行为特征数据的出现次数之比值、所述服务类型人次占比表示所述对应的服务类型在所述历史用户操作数据片段中的使用人数与所述历史用户操作数据片段中的所有服务类型的使用人数之比值。

进一步地,在步骤s13中,对被操作的多个历史操作数据片段进行操作行为标签分析,以确定每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,分别包括确定得到所述服务类型使用占比的步骤、确定所述行为特征出现频率的步骤、以及确定所述服务类型人次占比的步骤。详细地,请参阅图3,确定所述服务类型使用占比的步骤具体包括以下子步骤。

子步骤s1301,针对每个所述历史操作数据片段中的任一用户行为特征数据,确定所述用户行为特征数据对应的服务类型。

子步骤s1302,对每个所述历史操作数据片段进行第一服务类型关键词遍历搜索,确定所述服务类型的第一出现次数。

子步骤s1303,对每个所述历史操作数据片段,进行第二服务类型关键词遍历搜索,确定所述多个历史操作数据片段中包含的所有服务类型,并确定所有服务类型的第二出现次数。

子步骤s1304,根据所述第一出现次数和所述第二出现次数确定得到所述服务类型使用占比。

进一步第,请参阅图4,确定所述服务类型出现频率的步骤具体包括以下子步骤。

子步骤s1311,确定所述用户行为特征数据对应的用户行为特征。

子步骤s1312,对每个所述历史操作数据片段进行第一行为特征关键词遍历搜索,确定所述用户行为特征的第三出现次数。

步骤s1313,对每个所述历史操作数据片段,进行第二行为特征关键词遍历搜索,确定所述多个历史操作数据片段中包含的所有用户行为特征,并确定所有用户行为特征的第四出现次数。

步骤s1314,根据所述第三出现次数和所述第四出现次数确定得到所述行为特征出现频率。所述行为特征出现频率可以是所述第三出现次数与所述第四出现次数之比值。

进一步第,请参阅图5,确定所述服务类型人次占比的步骤具体包括以下子步骤。

子步骤s1321,确定所述用户行为特征数据对应的服务类型。

子步骤s1322,对每个所述历史操作数据片段进行第一用户id遍历搜索,确定使用所述服务类型的第一用户id数量。

子步骤s1323,对每个所述历史操作数据片段,进行所述第二服务类型关键词遍历搜索,确定所述多个历史操作数据片段中包含的所有服务类型,并对每个所述历史操作数据片段进行第二用户id遍历搜索,确定所有服务类型对应第二用户id数量。举例而言,可根据预设的所有服务类型关键词,在所述历史操作数据片段中进行遍历搜索,找出所有的服务类型,然后针对每个服务类型,依次遍历所述历史操作数据片段,得到每个服务类型对应的用户id数量,然后进行加总即得到所述第二用户id数量。

子步骤s1324,根据所述第一用户id数量和所述第二用户id数量确定得到所述服务类型人次占比。

进一步地,在所述步骤s14中,根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,确定每个所述历史操作数据片段中的用户行为特征数据的被选概率分值,可以通过一下描述的方式实现。

首先,针对每个所述历史操作数据片段中的用户行为特征数据中的任一目标用户行为特征数据,确定所述目标用户行为特征数据的在所述历史操作数据片段中对应的服务类型使用占比、行为特征出现频率、以及服务类型人次占比分别对应的第一权重系数,第二权重系数以及第三权重系数;

然后,根据所述对应的服务类型使用占比、行为特征出现频率、以及服务类型人次占比和所述第一权重系数,第二权重系数、以及第三权重系数计算得到所述目标用户行为特征数据对应的被选概率分值。

示例性地,所述目标用户行为特征数据对应的被选概率分值,通过以下公式计算得到:

score(i)=α1×β1+α2×β2+α3×β3;

其中,score(i)代表所述目标用户行为特征数据对应的被选概率分值,α1、α2、α3分别代表所述目标用户行为特征数据对应的服务类型使用占比、行为特征出现频率、以及服务类型人次占比,β1、β2、β3分别代表所述第一权重系数、第二权重系数以及第三权重系数,β1、β2、β3之和为1。

进一步地,在上述步骤s14中,根据每个所述历史操作数据片段中的用户行为特征数据的被选概率分值,确定满足预设数据筛选规则的多个用户行为特征数据以作为目标筛选数据的方式,具体可以参照图6所示的方式实现,具体描述如下。

子步骤s141,针对所述多个历史操作数据片段中的任一历史操作数据片段,将所述历史操作数据片段中的用户行为特征数据进行数据去噪处理。

子步骤s142,对数据去噪处理后剩余的用户行为特征数据的被选概率分值按照从大到小的顺序进行排列。

子步骤s143,将按照从大到小的顺序进行排列后的前第一预设数量个用户行为特征数据确定为满足被选概率分值预设数据筛选规则的目标筛选数据。

进一步地,在上述步骤s15中,根据每个目标历史操作数据片段中的目标筛选数据的被选概率分值,确定所述目标非节点对象对所述目标筛选数据的兴趣程度值,并根据所述目标历史操作数据片段中满足兴趣程度值条件的目标筛选数据,确定所述目标非节点对象的服务推荐画像,具体可以参照图7所示的方法实现,具体描述如下。

子步骤s151,针对所述第一预设数量个目标筛选数据中的任一目标筛选数据,将所述目标筛选数据在每个所述目标历史操作数据片段中的被选概率分值进行加权求和,以确定所述目标非节点对象对所述目标筛选数据的兴趣程度值。

子步骤s152,对所述目标非节点对象对每个所述目标筛选数据的兴趣程度值按照从大到小的顺序进行排列。

子步骤s153,根据按照从大到小的顺序进行排列后的前第二预设数量个目标筛选数据,确定所述目标非节点对象的服务推荐画像。举例而言,可以将所述前第二预设数量个目标筛选数据分别对应的服务类型作为所述服务推荐画像,在非节点对象200使用节点对象300提供的服务时,可在服务的主页面上优先显示该服务推荐画像对应的服务类型的操作项。

进一步地,本申请实施例中,在确定所述目标非节点对象的服务推荐画像之后,还可以由所述大数据服务器100本身作为一种节点对象为所述目标非节点对象推送匹配的服务推荐信息。推荐的方法可以如下所述:

根据所述目标非节点对象的服务推荐画像获取待规则配置的目标数据源配置信息,对所述目标数据源配置信息进行链接对象索引,得到目标链接对象索引表示,所述目标链接对象索引表示包括所述目标数据源配置信息对应的目标链接对象分布;

获取所述目标数据源配置信息中的目标主题分布,确定所述目标主题分布对应的第一扩展主题分布;

根据所述第一扩展主题分布的主题分布嵌入特征以及对应的主题所属关系参数,确定所述目标主题分布对应的目标兴趣热点词嵌入特征,其中,所述主题所属关系参数根据所述目标链接对象分布与扩展关系嵌入特征之间的关联度得到,所述扩展关系嵌入特征为表示主题分布扩展关系的嵌入特征向量;

将所述目标链接对象索引表示与所述目标主题分布对应的目标兴趣热点词嵌入特征进行聚类处理,得到目标聚类特征;

根据所述目标聚类特征确定所述目标数据源配置信息对应的数据源配置信息处理结果。

综上所述,数据推送模型可以包括数据源配置信息的链接对象索引模型、兴趣热点词向量提取网络以及聚类模型,兴趣热点词向量提取网络可以根据主题分布嵌入特征以及对应的主题所属关系参数,确定训练主题分布对应的标注兴趣热点词嵌入特征,主题所属关系参数根据训练链接对象分布与扩展关系嵌入特征之间的关联度得到,扩展关系嵌入特征为表示主题分布扩展关系的嵌入特征向量。此外,主题所属关系参数根据训练链接对象分布与扩展关系嵌入特征之间的关联度得到,因此可以根据样本数据源配置信息的主题分布特征,确定扩展主题分布的主题分布嵌入特征对训练主题分布的嵌入特征的重要程度,根据重要程度确定主题所属关系参数,从而可以使得得到的标注兴趣热点词向量能够更好的促进对样本数据源配置信息的主题分布特征的理解,故提高了得到的数据推送模型以及预设网络模型的数据源配置信息理解能力,提高了数据源配置信息处理结果的准确度。

进一步地,所述根据所述第一扩展主题分布的主题分布嵌入特征以及对应的主题所属关系参数,确定所述目标主题分布对应的目标兴趣热点词嵌入特征,具体可以通过以下步骤实现:

获取所述第一扩展主题分布与所述目标主题分布组成的关系主题标签模型;

对于所述关系主题标签模型中的主题标签模型的主题分布,获取表示所述主题标签模型的主题分布与继承主题分布的扩展关系的扩展关系嵌入特征;

根据所述扩展关系嵌入特征与所述目标链接对象分布得到主题联系度,根据所述主题联系度确定所述继承主题分布对应的主题所属关系参数;

根据所述继承主题分布对应的主题所属关系参数以及所述继承主题分布的主题分布嵌入特征,确定所述主题标签模型的主题分布对应的目标兴趣热点词嵌入特征;

从所述关系主题标签模型的各个主题标签模型的主题分布对应的目标兴趣热点词嵌入特征中,提取所述目标主题分布对应的目标兴趣热点词嵌入特征。

另外,所述主题标签模型的主题分布对应的目标兴趣热点词嵌入特征是兴趣热点词向量提取网络输出的,所述兴趣热点词向量提取网络包括至少一个目标嵌入式提取单元,所述根据所述继承主题分布对应的主题所属关系参数以及所述继承主题分布的主题分布嵌入特征,确定所述主题标签模型的主题分布对应的目标兴趣热点词嵌入特征,可以通过以下步骤实现:

将所述继承主题分布的主题分布嵌入特征以及所述扩展关系嵌入特征输入到所述目标嵌入式提取单元中进行处理,得到所述主题标签模型的主题分布对应的第一兴趣热点词嵌入特征;

根据所述主题标签模型的主题分布对应的第一兴趣热点词嵌入特征以及对应的所述继承主题分布对应的主题所属关系参数,确定所述主题标签模型的主题分布对应的目标兴趣热点词嵌入特征。

同时,所述将所述继承主题分布的主题分布嵌入特征以及所述扩展关系嵌入特征输入到所述目标嵌入式提取单元中进行处理,得到所述主题标签模型的主题分布对应的第一兴趣热点词嵌入特征,可以通过以下方式实现:

根据所述主题标签模型的主题分布与所述继承主题分布之间的主题分布扩展关系确定目标主题扩展趋势,所述目标主题扩展趋势为扩展增强或者扩展减弱;

根据所述目标主题扩展趋势对所述继承主题分布的主题分布嵌入特征以及所述扩展关系嵌入特征进行计算,得到所述主题标签模型的主题分布对应的计算嵌入特征;

利用所述目标嵌入式提取单元中的嵌入式提取单元参数对所述计算嵌入特征进行处理,得到所述主题标签模型的主题分布对应的第一兴趣热点词嵌入特征。

此外,所述利用所述目标嵌入式提取单元中的嵌入式提取单元参数对所述计算嵌入特征进行处理,得到所述主题标签模型的主题分布对应的第一兴趣热点词嵌入特征,可以通过以下步骤实现:

获取所述兴趣热点词向量提取网络中,所述目标嵌入式提取单元对应的上一嵌入式提取单元输出的,所述继承主题分布对应的输出嵌入特征;所述目标嵌入式提取单元利用第一嵌入式提取单元参数对所述计算嵌入特征以及所述输出嵌入特征进行处理,得到所述主题标签模型的主题分布对应的第一兴趣热点词嵌入特征。

本实施例中,所述主题标签模型的主题分布对应的目标兴趣热点词嵌入特征是兴趣热点词向量提取网络输出的,所述兴趣热点词向量提取网络包括至少一个目标嵌入式提取单元。基于此,所述根据所述扩展关系嵌入特征与所述目标链接对象分布得到主题联系度,根据所述主题联系度确定所述继承主题分布对应的主题所属关系参数,可以通过以下方式实现:

利用所述目标嵌入式提取单元中的第二嵌入式提取单元参数对所述扩展关系嵌入特征进行处理,得到主题维度特征;

利用所述目标嵌入式提取单元中的第三嵌入式提取单元参数对所述目标链接对象分布进行处理,得到主题量化特征;

根据所述主题维度特征与所述主题量化特征计算得到主题联系度;

根据所述主题联系度确定所述继承主题分布对应的主题所属关系参数,所述主题联系度与所述继承主题分布对应的主题所属关系参数成正相关关系。

此外,本实施例中,所述目标数据源配置信息包括多个配置业务服务,所述目标链接对象索引表示包括配置业务服务的链接对象索引表示序列,所述配置业务服务的链接对象索引表示序列包括各个配置业务服务对应的配置业务服务的链接对象索引表示序列。基于此,所述将所述目标链接对象索引表示与所述目标主题分布对应的目标兴趣热点词嵌入特征进行聚类处理,得到目标聚类特征,可以通过以下步骤实现:

根据所述目标主题分布对应的目标兴趣热点词嵌入特征对目标配置业务服务对应的配置业务服务的链接对象索引表示序列进行兴趣热点词映射处理,得到所述目标配置业务服务对应的兴趣热点词映射的链接对象索引表示;

利用所述目标配置业务服务对应的兴趣热点词映射的链接对象索引表示,更新所述配置业务服务的链接对象索引表示序列中,所述目标配置业务服务对应的配置业务服务的链接对象索引表示序列,得到更新后的配置业务服务的链接对象索引表示序列;

利用聚类模型对所述更新后的配置业务服务的链接对象索引表示序列以及所述目标链接对象分布进行聚类处理,得到聚类处理后的配置业务服务的链接对象索引表示序列以及聚类处理后的目标链接对象分布。

进一步地,本实施例中,所述根据所述目标聚类特征确定所述目标数据源配置信息对应的数据源配置信息处理结果,具体可以是将聚类处理后的目标链接对象分布输入到已训练的更新模型中,得到所述目标数据源配置信息对应的数据源配置信息更新结果。

本实施例中,所述根据所述目标主题分布对应的目标兴趣热点词嵌入特征对目标配置业务服务对应的配置业务服务的链接对象索引表示序列进行兴趣热点词映射处理,得到所述目标配置业务服务对应的兴趣热点词映射的链接对象索引表示,具体可以是:根据所述目标主题分布对应的目标兴趣热点词嵌入特征与目标配置业务服务对应的配置业务服务的链接对象索引表示序列进行融合,得到所述目标配置业务服务对应的兴趣热点词映射的链接对象索引表示。

在上述内容的基础上,本申请实施例中,在进行服务画像推荐的同时,还可以通过以下步骤对所使用的相关数据推送模型的网络参数进行调整以进一步提升推荐的准确些。相应的调整方法具体描述如下:

获取样本数据源配置信息以及所述样本数据源配置信息对应的标准数据源配置信息处理结果;

将所述样本数据源配置信息输入到数据源配置信息的链接对象索引模型中,得到样本数据源配置信息链接对象索引表示,所述样本数据源配置信息链接对象索引表示包括所述样本数据源配置信息对应的训练链接对象分布;

获取所述样本数据源配置信息对应的训练主题分布,确定所述训练主题分布对应的第二扩展主题分布;

将所述第二扩展主题分布对应的主题分布嵌入特征输入到兴趣热点词向量提取网络中,根据所述主题分布嵌入特征以及对应的主题所属关系参数,确定所述训练主题分布对应的标注兴趣热点词嵌入特征,所述主题所属关系参数根据所述训练链接对象分布与扩展关系嵌入特征之间的关联度得到,所述扩展关系嵌入特征为表示主题分布扩展关系的嵌入特征向量;

将所述样本数据源配置信息链接对象索引表示与所述训练主题分布对应的标注兴趣热点词嵌入特征输入到聚类模型中进行聚类处理,得到训练聚类结果;

根据预设网络模型对所述训练聚类结果进行处理,得到训练处理结果;

根据所述训练处理结果与所述标准数据源配置信息处理结果调整所述预设网络模型的参数,或者调整所述预设网络模型以及数据推送模型的参数,所述数据推送模型包括所述数据源配置信息的链接对象索引模型、所述兴趣热点词向量提取网络以及所述聚类模型。

基于同一发明构思,请参阅图8,示出了本申请实施例提供的用于执行上述区块链大数据处理方法的大数据服务器100的结构示意框图,该大数据服务器100可以包括区块链大数据处理系统110、机器可读存储介质120和处理器130。

本实施例中,机器可读存储介质120与处理器130可以位于大数据服务器100中且二者分离设置。机器可读存储介质120也可以是独立于大数据服务器100之外,且可以由处理器130通过总线接口来访问。可替换地,机器可读存储介质120也可以集成到处理器130中,例如,可以是高速缓存和/或通用寄存器。

区块链大数据处理系统110可以包括存储在机器可读存储介质120的软件功能模块(例如所述区块链大数据处理系统110包括的各软件功能模块。当处理器130执行区块链大数据处理系统110中的软件功能模块时,以实现前述方法实施例提供的区块链大数据处理方法。

详细地,所述区块链大数据处理系统110包括行为标签分析模块111、特征数据筛选模块112、目标数据识别模块113、兴趣数据确定模块114、服务推荐画像模块115等多个软件功能模块。

所述行为标签分析模块111,用于对多个非节点对象使用节点对象提供的服务产生的多个历史操作数据片段进行操作行为标签分析,以确定每个所述历史操作数据片段中的用户行为特征数据以及对应的操作行为标签。可以理解,该行为标签分析模块111可以用于执行上述步骤s11,关于该行为标签分析模块111的详细实现方式可以等同参照上述对步骤s11有关的内容,此处不再重复赘述。

所述特征数据筛选模块112,用于根据每个所述历史操作数据片段中的用户行为特征数据的操作行为标签,从所述多个历史操作数据片段中确定满足预设数据筛选规则的多个用户行为特征数据以作为目标筛选数据。可以理解,该特征数据筛选模块112可以用于执行上述步骤s12,关于该特征数据筛选模块112的详细实现方式可以等同参照上述对步骤s12有关的内容,此处不再重复赘述。

所述目标数据识别模块113,用于基于多个所述目标筛选数据,对所述多个历史操作数据片段中目标非节点对象产生的历史操作数据片段进行目标识别,以确定包括任意一个所述目标筛选数据的目标历史操作数据片段。可以理解,该目标数据识别模块113可以用于执行上述步骤s13,关于该目标数据筛选模块113的详细实现方式可以等同参照上述对步骤s13有关的内容,此处不再重复赘述。

所述兴趣数据确定模块114,用于确定每个所述目标历史操作数据片段中的目标筛选数据的被选概率分值,并根据每个所述被选概率分值确定所述目标非节点对象对所述目标筛选数据的兴趣程度值,并确定所述目标历史操作数据片段中满足兴趣程度值条件的目标筛选数据。可以理解,该兴趣数据确定模块114可以用于执行上述步骤s14,关于该兴趣数据确定模块114的详细实现方式可以等同参照上述对步骤s14有关的内容,此处不再重复赘述。

所述服务推荐画像模块115,用于根据所述目标历史操作数据片段中满足预设兴趣程度值条件的目标筛选数据,确定所述目标非节点对象的服务推荐画像。可以理解,该服务推荐画像模块115可以用于执行上述步骤s15,关于该服务推荐画像模块115的详细实现方式可以等同参照上述对步骤s15有关的内容,此处不再重复赘述。

综上所述,本申请实施例提供的区块链的大数据处理方法及大数据服务器,通过对非节点对象产生的大量用户历史操作数据片段进行有效分析,结合所述用户历史操作数据片段中对应的目标非节点对象的历史操作相关数据,对目标非节点对象的进行兴趣特征分析,得到目标非节点对象的服务推荐画像,可利于联盟区块链网络中的节点对象有针对性为非节点对象进行服务推荐。同时,本申请实施例参考了用户历史操作数据片段中其他用户的操作数据,综合其他用户对相应服务类型的使用情况,得到目标非节点对象的服务推荐画像,能够实现节点对象对非节点对象服务的更精准推送,提升用户的服务体验的同时,还可以提升推送效果。

以上所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。通常在附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,在附图中提供的本申请的实施例的详细描述并非旨在限制本申请的保护范围,而仅仅是表示本申请的选定实施例。因此,本申请的保护范围应以权利要求的保护范围为准。此外,基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下可获得的所有其它实施例,都应属于本申请保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1