数据的处理方法及装置、非易失性存储介质、处理器与流程

文档序号:31698897发布日期:2022-10-01 07:03阅读:90来源:国知局
数据的处理方法及装置、非易失性存储介质、处理器与流程

1.本技术涉及数据处理领域,具体而言,涉及一种数据的处理方法及装置、非易失性存储介质、处理器。


背景技术:

2.目前,通过数据模型指导业务增长已经广泛应用,但是如何找到更为高效的数据处理方法是行业发展面临的挑战。近年来,数据的获取与使用更加地规范,模型产生的效果受到了限制。在此背景下,多方联合建模是一个既符合数据安全法又能满足业务长远发展的努力方向。
3.当下电商行业的建模方式,多数是基于一个资源方数据的聚类、回归分析,数据本身具备一定的局限性。而基于用户属性、关键事件、负向体验的用户、业务粘性、活跃度等角度,了解用户的基本属性,间接地能够区分用户的行为偏好,已经不能精准捕捉用户线上的偏好,也不能获取用户更为丰富的标签信息。不能满足日异变化的精细化运营工作,难以实现用户的精准营销。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本技术实施例提供了一种数据的处理方法及装置、非易失性存储介质、处理器,以至少解决由于目前电商行业的数据模型无法整合多方数据资源造成的难以实现精准的用户营销活动的技术问题。
6.根据本技术实施例的一个方面,提供了一种数据的处理方法,包括:接收品牌方、平台方以及资源方的原始数据;对原始数据进行数据转换,得到转换后的目标数据;根据目标数据训练神经网络模型;将品牌方、平台方以及资源方的待处理数据输入至训练好的神经网络模型进行预测,得到与品牌方的业务需求对应的应用方案。
7.可选地,对原始数据进行数据转换,包括如下至少之一:对原始数据进行脱敏操作;对原始数据进行取交集运算、取并集运算以及求差运算。
8.可选地,对资源方的原始数据进行脱敏操作,包括如下至少之一:将资源方的原始数据中包含业务含义的字符信息转换为不包含业务含义的目标符号;将资源方的原始数据中数值信息进行去量纲处理,得到目标数值信息。
9.可选地,将品牌方、平台方以及资源方的待处理数据输入至训练好的神经网络模型进行预测,包括:将待处理数据进行数据转换,得到转换后的待处理数据;将转换后的待处理数据输入至训练好的神经网络模型进行预测,得到与品牌方的业务需求对应的应用方案。
10.可选地,资源方的原始数据与品牌方的原始数据包含相同的目标对象的身份识别信息;资源方的原始数据包括如下至少之一:目标对象的移动通信设备号码、应用程序的标识信息以及目标对象的终端设备号标号。
11.可选地,对原始数据进行数据转换之前,方法还包括:根据品牌方的业务需求从资源方的原始数据中提取不同领域的特征信息,其中,特征信息包括:目标对象的基础属性、行为属性以及交互属性。
12.可选地,目标对象的基础属性包括如下至少之一:年龄、性别以及地域;目标对象的行为属性包括如下至少之一:在预设时间段内针对品牌方的消费行为、在预设时间段内针对品牌方所在行业的消费行为、在预设时间段内参加的品牌方的活动、在设时间段内参加的品牌方所在行业的活动;目标对象的交互属性包括如下至少之一:预设时间段内针对品牌方的网站的浏览、收藏、点击及评论行为。
13.可选地,目标对象的基础属性包括以下至少一种:从资源方的原始数据中提取不同领域的特征信息之后,方法还包括:在品牌方包含的目标对象的身份识别信息与资源方包含的目标对象的身份识别信息匹配的情况下,将资源方的目标对象的特征信息作为品牌方的目标对象的特征信息;在品牌方包含的目标对象的身份识别信息与资源方包含的目标对象的身份识别信息无法匹配的情况下,将品牌方的目标对象的特征信息以默认属性进行填充。
14.根据本技术实施例的另一方面,还提供了一种数据的处理装置,包括:接收模块,用于接收品牌方、平台方以及资源方的原始数据;处理模块,用于对原始数据进行数据转换,得到转换后的目标数据;训练模块,用于根据目标数据训练神经网络模型;确定模块,用于将原始数据输入至训练好的神经网络模型,得到与品牌方的业务需求对应的应用方案。
15.根据本技术实施例的再一方面,还提供了一种非易失性存储介质,存储介质包括存储的程序,其中,程序运行时控制存储介质所在的设备执行以上的数据的处理方法。
16.根据本技术实施例的再一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行以上的数据的处理方法。
17.在本技术实施例中,采用接收品牌方、平台方以及资源方的原始数据;对原始数据进行数据转换,得到转换后的目标数据;根据目标数据训练神经网络模型;将品牌方、平台方以及资源方的待处理数据输入至训练好的神经网络模型进行预测,得到与品牌方的业务需求对应的应用方案的方式,通过由品牌方、平台方以及资源方的数据组成的神经网络模型,达到了打破数据孤岛的目的,从而实现了满足精准营销的技术效果,进而解决了由于目前电商行业的数据模型无法整合多方数据资源造成的难以实现精准的用户营销活动技术问题。
附图说明
18.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
19.图1是根据本技术实施例的一种数据的处理方法的流程图;
20.图2是根据本技术实施例的另一种数据的处理方法的流程图;
21.图3是根据本技术实施例的一种数据的处理装置的结构图。
具体实施方式
22.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的
附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
23.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
24.根据本技术实施例,提供了一种数据的处理的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
25.图1是根据本技术实施例的一种数据的处理方法的流程图,如图1所示,该方法包括如下步骤:
26.步骤s102,接收品牌方、平台方以及资源方的原始数据。
27.根据本技术的一个可选的实施例,品牌方指有营销需求,需要在电子商务平台中通过客户特征找到潜在客户的一方。平台方指电子商务平台,电子商务平台是一个为企业或个人提供网上交易以及洽谈的平台。资源方指具有客户数据标签的平台,本技术中,资源方一般是多个。
28.可以理解的是,在执行步骤s102时,分别从品牌方、平台方以及资源方的服务器获取上述原始数据。
29.步骤s104,对原始数据进行数据转换,得到转换后的目标数据。
30.根据本技术的另一个可选的实施例,利用沙箱环境,可以对原始数据不出域进行脱敏操作,在沙箱环境中也可以通过取交集运算、取并集运算以及求差运算等一系列数据变换的逻辑匹配,保证数据隔离、执行隔离、调试环境隔离、网络区域隔离以及交互使用隔离五大维度,完成数据所有权与使用权的安全隔离,确保数据安全。沙箱环境是能力开放平台为开发者提供的测试环境,沙箱环境与生产环境完全隔离,通过不同域名进行区分,具有与生产环境几乎完全相同的功能。沙箱环境没有数据库,它通过配置虚拟数据模板产生虚拟数据。在网络安全中,沙箱指在隔离环境中,用以测试不受信任文件或应用程序等行为的工具。
31.步骤s106,根据目标数据训练神经网络模型。
32.在本技术的一些可选的实施例,转换后的目标数据可作为反馈给模型直接用于训练的特征。引入多个资源方的数据,借助沙箱环境能够丰富训练神经网络模型所需的特征维度,提高神经网络模型训练的精度。
33.步骤s108,将品牌方、平台方以及资源方的待处理数据输入至训练好的神经网络模型进行预测,得到与品牌方的业务需求对应的应用方案。
34.在本技术的一些可选的实施例中,品牌方基于业务需求,提出业务痛点,依托平台方数据优势,整合多个资源方的数据资源,利用训练好的神经网络模型,可以解决当前的业务痛点,实现更精准的用户营销以及品牌方业务的增长。
35.通过上述方法,通过由品牌方、平台方以及资源方的数据组成的神经网络模型,达到了打破数据孤岛的目的,从而实现了满足精准营销的技术效果。
36.根据本技术的一个可选的实施例,对原始数据进行数据转换,包括如下至少之一:对原始数据进行脱敏操作;对原始数据进行取交集运算、取并集运算以及求差运算。
37.根据本技术的另一个可选的实施例,对原始数据进行脱敏操作可以利用沙箱环境,沙箱环境可以存储品牌方当前业务所有用户的身份识别信息,通过符合国际标准的加密方式对用户身份识别信息进行脱敏并存储至沙箱环境。数据形式不限于数据库、文件等形式,确保能够进行数据包对数据包的逻辑运算即可。数据包是指分块的传输数据。对原始数据进行取交集运算、取并集运算以及求差运算可以从大量的、杂乱无序的数据中抽取并推导出对于品牌方有价值、有意义的数据。
38.根据本技术的一个可选的实施例,对资源方的原始数据进行脱敏操作,通过以下方法实现:将资源方的原始数据中包含业务含义的字符信息转换为不包含业务含义的目标符号;将资源方的原始数据中数值信息进行去量纲处理,得到目标数值信息。
39.作为本技术的一个可选的实施例,为了保护资源方的数据安全,对原始数据进行脱敏操作之前,可提前完成字符或数值特征信息的转换。针对字符信息,通过构建字典映射关系,将带有业务含义的具体信息转化为类似字母或数字这种不具备业务含义的符号。针对数值信息,可通过去量纲的方式,改变其上下限,也可以采取标准化方式进行操作。使得资源方的特征信息进行特殊处理之后,无法直接推断其业务含义,起到保护用户信息安全的作用。最后将特征的名称进行脱敏,使得进入沙箱环境之前将资源方的信息转换为符号。
40.映射是指事物之间的对应关系,除了一对一映射关系外,映射也有一对多关系。字典是python语言中唯一的映射类型。字典有两个属性,一个属性是键,一个属性是值,键和值统称为键值对,一个键可以对应一个值,也可以对应多个值。通过键可以获取到值。例如,可以把学生编号和姓名以字典方式存储起来,学生编号存储到键中,学生姓名存储到值中,这样就可以通过学生编号找到特定学生。在本技术中,可以把带有业务含义的具体信息存储到值中,把类似字母或数字这种不具备业务含义的符号存储到键中,隐藏带有业务含义的具体信息。去量纲是指去除数据单位之间的不统一,将数据统一变换为无单位或统一单位的数据集,也可以作为指标的权重,进行加权计算。
41.在本技术的一些可选的实施例中,对原始数据进行数据转换应采用独立于平台方与资源方的前置机。从网络安全角度来看,前置机有隔离主机的作用,保证外部的应用不能直接访问核心服务,比如银行的各类外部接口;从业务角度来看,前置机提供了业务渠道与核心服务的主机交流的一个桥梁,前置机一般起到管理和调度业务渠道发起的交易的作用,经过前置机的调用可以减轻核心后台服务器的负担。前置机是位于应用系统服务器端与客户端职之间的独立处理机,担负数据格式转换、连接管理、业务流管理外围调度、外围处理以及把业务数据交后台应用服务系统处理等任务。
42.在本技术的一些可选的实施例,将品牌方、平台方以及资源方的待处理数据输入至训练好的神经网络模型进行预测,包括:将待处理数据进行数据转换,得到转换后的待处
理数据;将转换后的待处理数据输入至训练好的神经网络模型进行预测,得到与品牌方的业务需求对应的应用方案。
43.根据本技术的另一个可选的实施例,品牌方、平台方以及资源方的待处理数据无法直接被神经网络模型识别,需要进行数据转换,得到转换后的待处理数据,才能输入至训练好的神经网络模型进行预测。神经网络模型具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。神经网络模型是以神经元的数学模型为基础来描述的,神经元是以生物神经系统的神经细胞为基础的生物模型,将神经元数学化从而产生了神经元数学模型。
44.通过上述步骤,可以实现共同发挥数据的优势,增加模型训练学习的特征维度,进一步提高模型训练的精度。
45.在本技术的一些可选的实施例中,资源方的原始数据与品牌方的原始数据包含相同的目标对象的身份识别信息;资源方的原始数据包括如下至少之一:目标对象的移动通信设备号码、应用程序的标识信息以及目标对象的终端设备号标号。
46.作为本技术的另一个可选的实施例,外部资源方进行联合建模的前提是具有相同用户身份识别信息,即必须拥有与品牌方相同的用户身份识别信息,才具备联合建模发挥更大神经网络模型优势的可能性。满足上述条件才具备资源方数据与品牌方数据打通,提供给神经网络模型更多资源方特征的可能性。
47.根据本技术的一个可选的实施例,对原始数据进行数据转换之前,方法还包括:根据品牌方的业务需求从资源方的原始数据中提取不同领域的特征信息,其中,特征信息包括:目标对象的基础属性、行为属性以及交互属性。
48.作为本技术的一个可选的实施例,在资源方满足与品牌方具有相同用户身份识别信息的基础上,在资源方取得用户数据授权的前提下,还需要结合品牌方当前的业务提炼出不同领域的特征信息。一般来说,品牌方不同的业务很有可能需要不同的特征信息。
49.在本技术的一些可选的实施例,目标对象的基础属性包括如下至少之一:年龄、性别以及地域;目标对象的行为属性包括如下至少之一:在预设时间段内针对品牌方的消费行为、在预设时间段内针对品牌方所在行业的消费行为、在预设时间段内参加的品牌方的活动、在设时间段内参加的品牌方所在行业的活动;目标对象的交互属性包括如下至少之一:预设时间段内针对品牌方的网站的浏览、收藏、点击及评论行为。
50.根据本技术的另一个可选的实施例,利用目标对象的基础属性、行为属性以及交互属性,品牌方可以将产品广告或者营销活动触达至潜在用户,以实现精准营销的目的。
51.在本技术的一些可选的实施例中目标对象的基础属性包括以下至少一种:从资源方的原始数据中提取不同领域的特征信息之后,方法还包括:在品牌方包含的目标对象的身份识别信息与资源方包含的目标对象的身份识别信息匹配的情况下,将资源方的目标对象的特征信息作为品牌方的目标对象的特征信息;在品牌方包含的目标对象的身份识别信息与资源方包含的目标对象的身份识别信息无法匹配的情况下,将品牌方的目标对象的特征信息以默认属性进行填充。
52.根据本技术的另一个可选的实施例,沙箱环境中含有品牌方的用户身份识别信息,资源方的用户识别信息以及用户特征信息,可以直接通过对信息取交集计算的方式给相同的用户识别信息赋予资源方的用户特征信息,对于品牌方无法匹配资源方的用户身份
识别信息,对应的特征维度信息以默认的属性进行填充。
53.图2是根据本技术实施例的另一种数据的处理方法的流程图,如图2所示,该方法包括如下步骤:
54.根据本技术的一个可选的实施例,品牌方基于业务需求,提出业务痛点,依托平台方数据优势,整合多个资源方的数据资源,利用一种基于人工智能的解决方案,满足当前业务发展,解决当前的业务痛点,实现更精准的用户营销,实现业务增长。
55.在本技术的一些可选的实施例,例如某电商品牌想要在11月11日购物节或者6月18日年中购物节寻找该电商品牌的潜在新用户,可以借助淘宝、京东或者拼多多等电子商务平台的用户数据与外部资源方的用户数据进行联合建模。依靠该品牌方的产品定位、业务特征、目标用户对象属性等数据,结合电子商务平台上用户的年龄、性别、地域、购物偏好、最近浏览商品等数据以及外部资源平台上用户的年龄、性别、地域、浏览内容、浏览偏好、浏览时长等数据,实现品牌方信息对目标客户的精准触达,提高潜在用户的转化率。用户触达指基于特定目的在特定场景给特定的用户通过特定的渠道发送特定的消息。
56.通过上述步骤,通过对多方资源的数据资源进行整合,实现了高精准地触达潜在新客,提高潜在新客的转化效果。
57.根据本技术的另一个可选的实施例,品牌方提出一个具体的业务需求给到平台方,平台方利用现有的底层数据逻辑,可以实现完整的建模过程,但是一方数据仅能满足用户订单以及在平台方行为的数据研究,很难捕捉到用户线上的偏好,用户更丰富的标签信息,使得平台方建模具备一定的局限性,难以实现更精准的营销活动。借助当前多方联合建模装置,可以通过外部寻求更多的资源方,用于用户的偏好、标签的补充,这样的数据信息也是当前平台方极度缺乏的数据资产。由于当前数据安全法的环境下,直接打通平台方与资源方的底层数据是不合法的。但是可以借助沙箱环境,保证数据隔离、执行隔离、调试环境隔离、网络区域隔离、交互使用隔离五大维度完成数据所有权与使用权的安全隔离,确保符合数据安全法。同时能够给模型学习过程极大的丰富了特征维度,大概率上提升了模型的精度。
58.作为本技术的一个可选的实施例,沙箱是一个虚拟系统程序,允许用户在沙箱环境中运行浏览器或其他程序,因此运行所产生的变化可以随后删除,沙箱环境是一个独立作业环境,在其内部运行的程序并不能对硬盘产生永久性的影响。借助沙箱环境能够实现建模过程特征维度的丰富,提高模型训练的精度,同时可以避免平台方与资源方的数据直接交互,确保数据所有权与使用权的安全隔离。
59.图3是根据本技术实施例的一种数据的处理装置的结构图,如图3所示,该装置包括:
60.接收模块30,用于接收品牌方、平台方以及资源方的原始数据;
61.处理模块32,用于对所述原始数据进行数据转换,得到转换后的目标数据;
62.训练模块34,用于根据所述目标数据训练神经网络模型;
63.确定模块36,用于将所述原始数据输入至训练好的所述神经网络模型,得到与所述品牌方的业务需求对应的应用方案。
64.需要说明的是,图3所示实施例的优选实施方式可以参加图1所示实施例的相关描述,此处不再赘述。
65.本技术实施例还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,程序运行时控制存储介质所在的设备执行以上的数据的处理方法。
66.非易失性存储介质执行以下功能的程序:接收品牌方、平台方以及资源方的原始数据;对原始数据进行数据转换,得到转换后的目标数据;根据目标数据训练神经网络模型;将品牌方、平台方以及资源方的待处理数据输入至训练好的神经网络模型进行预测,得到与品牌方的业务需求对应的应用方案。
67.本技术实施例还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行以上的数据的处理方法。
68.处理器用于运行执行以下功能的程序:接收品牌方、平台方以及资源方的原始数据;对原始数据进行数据转换,得到转换后的目标数据;根据目标数据训练神经网络模型;将品牌方、平台方以及资源方的待处理数据输入至训练好的神经网络模型进行预测,得到与品牌方的业务需求对应的应用方案。
69.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
70.在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
71.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
72.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
73.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
74.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
75.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1