数据处理方法、装置、电子设备及计算机可读存储介质与流程

文档序号:18063918发布日期:2019-07-03 03:15阅读:146来源:国知局
数据处理方法、装置、电子设备及计算机可读存储介质与流程

本公开涉及数据处理技术领域,具体涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。



背景技术:

随着互联网技术的发展,越来越多的商家或者服务提供商通过互联网平台来为用户提供服务,洞察用户行为的特点能够有利于为用户提供更好的服务,增加为用户服务的机会,提高互联网的服务效率,提升互联网的服务质量。但现有技术中对于用户行为特点的研究准确性低,无法满足商家或者服务提供商提高工作效率、提升服务质量的要求。



技术实现要素:

本公开实施例提供一种数据处理方法、装置、电子设备及计算机可读存储介质。

第一方面,本公开实施例中提供了一种数据处理方法。

具体的,所述数据处理方法,包括:

获取用户历史行为数据,其中,所述用户历史行为数据包括第一历史行为数据和第二历史行为数据;

根据所述用户历史行为数据计算得到基于时间累积的用户行为得分,其中,所述用户行为得分包括第一行为得分和第二行为得分,所述第一行为得分根据所述第一历史行为数据计算得到,所述第二行为得分根据所述第二历史行为数据计算得到;

对于所述第一行为得分和第二行为得分进行预处理后进行组合处理,得到用户行为得分。

结合第一方面,本公开在第一方面的第一种实现方式中,所述第一历史行为数据为显性数据,包括以下数据中的一种或多种:用户交易数据、用户收藏数据、用户加标数据;和/或,

所述第二历史行为数据为隐性数据,包括以下数据中的一种或多种:用户点击数据、用户搜索数据、用户浏览数据。

结合第一方面和第一方面的第一种实现方式,本发明实施例在第一方面的第二种实现方式中,所述根据所述用户历史行为数据计算得到基于时间累积的用户行为得分,包括:

确定分值初值和分值递增因子;

根据所述用户历史行为数据计算行为对象出现的频率;

将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到基于时间累积的用户行为得分。

结合第一方面、第一方面的第一种实现方式和第一方面的第二种实现方式,本发明实施例在第一方面的第三种实现方式中,当所述行为对象包括一个或多个行为因素时,所述根据所述用户历史行为数据计算得到基于时间累积的用户行为得分,包括:

确定一个或多个行为因素、行为因素对应的分值初值和分值递增因子;

根据所述用户历史行为数据计算所述行为因素出现的频率;

将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到与所述行为因素对应的分值;

组合与所述行为因素对应的分值,得到面向行为对象或行为因素的基于时间累积的用户行为得分。

结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式和第一方面的第三种实现方式,本发明实施例在第一方面的第四种实现方式中,所述对于所述第一行为得分和第二行为得分进行预处理后进行组合处理,得到用户行为得分,包括:

对于所述第一行为得分和第二行为得分进行预处理;

确定第一行为得分的第一组合权重和第二行为得分的第二组合权重;

根据所述第一组合权重和第二组合权重,对于所述第一行为得分和第二行为得分进行加权平均,得到用户行为得分。

结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式和第一方面的第四种实现方式,本发明实施例在第一方面的第五种实现方式中,所述对于所述第一行为得分和第二行为得分进行预处理,实施为:

获取所述第一行为得分中行为因素对应分值的第一最小得分和第一最大得分,获取所述第二行为得分中行为因素对应分值的第二最小得分和第二最大得分;

计算所述第一行为得分中行为因素对应分值与所述第一最小得分之间的第一差值和所述第一最大得分与第一最小得分之间的第二差值,计算所述第二行为得分中行为因素对应分值与所述第二最小得分之间的第三差值和所述第二最大得分与第二最小得分之间的第四差值;

计算所述第一差值与所述第二差值之间的第一商值,确定为预处理后的第一行为得分,计算所述第三差值与所述第四差值之间的第二商值,确定为预处理后的第二行为得分。

结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式和第一方面的第五种实现方式,本发明实施例在第一方面的第六种实现方式中,还包括:

根据所述用户行为得分执行预设操作。

第二方面,本公开实施例中提供了一种数据处理装置。

具体的,所述数据处理装置,包括:

获取模块,被配置为获取用户历史行为数据,其中,所述用户历史行为数据包括第一历史行为数据和第二历史行为数据;

计算模块,被配置为根据所述用户历史行为数据计算得到基于时间累积的用户行为得分,其中,所述用户行为得分包括第一行为得分和第二行为得分,所述第一行为得分根据所述第一历史行为数据计算得到,所述第二行为得分根据所述第二历史行为数据计算得到;

处理模块,被配置为对于所述第一行为得分和第二行为得分进行预处理后进行组合处理,得到用户行为得分。

结合第二方面,本公开在第二方面的第一种实现方式中,所述第一历史行为数据为显性数据,包括以下数据中的一种或多种:用户交易数据、用户收藏数据、用户加标数据;和/或,

所述第二历史行为数据为隐性数据,包括以下数据中的一种或多种:用户点击数据、用户搜索数据、用户浏览数据。

结合第二方面和第二方面的第一种实现方式,本发明实施例在第二方面的第二种实现方式中,所述计算模块包括:

第一确定子模块,被配置为确定分值初值和分值递增因子;

第一计算子模块,被配置为根据所述用户历史行为数据计算行为对象出现的频率;

第二计算子模块,被配置为将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到基于时间累积的用户行为得分。

结合第二方面、第二方面的第一种实现方式和第二方面的第二种实现方式,本发明实施例在第二方面的第三种实现方式中,当所述行为对象包括一个或多个行为因素时,所述计算模块包括:

第二确定子模块,被配置为确定一个或多个行为因素、行为因素对应的分值初值和分值递增因子;

第三计算子模块,被配置为根据所述用户历史行为数据计算所述行为因素出现的频率;

第四计算子模块,被配置为将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到与所述行为因素对应的分值;

组合子模块,被配置为组合与所述行为因素对应的分值,得到面向行为对象或行为因素的基于时间累积的用户行为得分。

结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式和第二方面的第三种实现方式,本发明实施例在第二方面的第四种实现方式中,所述处理模块包括:

预处理子模块,被配置为对于所述第一行为得分和第二行为得分进行预处理;

第三确定子模块,被配置为确定第一行为得分的第一组合权重和第二行为得分的第二组合权重;

加权平均子模块,被配置为根据所述第一组合权重和第二组合权重,对于所述第一行为得分和第二行为得分进行加权平均,得到用户行为得分。

结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式和第二方面的第四种实现方式,本发明实施例在第二方面的第五种实现方式中,所述预处理子模块被配置为:

获取所述第一行为得分中行为因素对应分值的第一最小得分和第一最大得分,获取所述第二行为得分中行为因素对应分值的第二最小得分和第二最大得分;

计算所述第一行为得分中行为因素对应分值与所述第一最小得分之间的第一差值和所述第一最大得分与第一最小得分之间的第二差值,计算所述第二行为得分中行为因素对应分值与所述第二最小得分之间的第三差值和所述第二最大得分与第二最小得分之间的第四差值;

计算所述第一差值与所述第二差值之间的第一商值,确定为预处理后的第一行为得分,计算所述第三差值与所述第四差值之间的第二商值,确定为预处理后的第二行为得分。

结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式和第二方面的第五种实现方式,本发明实施例在第二方面的第六种实现方式中,还包括:

执行模块,被配置为根据所述用户行为得分执行预设操作。

第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现上述第一方面中数据处理方法的方法步骤。

第四方面,本公开实施例提供了一种计算机可读存储介质,用于存储数据处理装置所用的计算机指令,其包含用于执行上述第一方面中数据处理方法为数据处理装置所涉及的计算机指令。

本公开实施例提供的技术方案可以包括以下有益效果:

上述技术方案通过获取不同类别的用户历史行为数据,计算得到对应的用户行为得分,对于得到的用户行为得分进行预设组合处理,即可得到准确的用户行为评价值。该技术方案能够有效提高用户行为特点数据的准确性,从而能够为用户提供更好的服务,增加为用户服务的机会,提高互联网的服务效率,提升互联网的服务质量。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:

图1示出根据本公开一实施方式的数据处理方法的流程图;

图2示出根据图1所示实施方式的数据处理方法的步骤s102的流程图;

图3示出根据图1所示另一实施方式的数据处理方法的步骤s102的流程图;

图4示出根据图1所示实施方式的数据处理方法的步骤s103的流程图;

图5示出根据本公开了另一实施方式的数据处理方法的流程图;

图6示出根据本公开一实施方式的数据处理装置的结构框图;

图7示出根据图6所示实施方式的数据处理装置的计算模块602的结构框图;

图8示出根据图6所示另一实施方式的数据处理装置的计算模块602的结构框图;

图9示出根据图6所示实施方式的数据处理装置的处理模块603的结构框图;

图10示出根据本公开另一实施方式的数据处理装置的结构框图;

图11示出根据本公开一实施方式的电子设备的结构框图;

图12是适于用来实现根据本公开一实施方式的数据处理方法的计算机系统的结构示意图。

具体实施方式

下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。

在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。

另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

本公开实施例提供的技术方案通过获取不同类别的用户历史行为数据,计算得到对应的用户行为得分,对于得到的用户行为得分进行预设组合处理,即可得到准确的用户行为评价值。该技术方案能够有效提高用户行为特点数据的准确性,从而能够为用户提供更好的服务,增加为用户服务的机会,提高互联网的服务效率,提升互联网的服务质量。

图1示出根据本公开一实施方式的数据处理方法的流程图。如图1所示,所述数据处理方法包括以下步骤s101-s103:

在步骤s101中,获取用户历史行为数据,其中,所述用户历史行为数据包括第一历史行为数据和第二历史行为数据;

在步骤s102中,根据所述用户历史行为数据计算得到基于时间累积的用户行为得分,其中,所述用户行为得分包括第一行为得分和第二行为得分,所述第一行为得分根据所述第一历史行为数据计算得到,所述第二行为得分根据所述第二历史行为数据计算得到;

在步骤s103中,对于所述第一行为得分和第二行为得分进行预处理后进行组合处理,得到用户行为得分。

上文提及,随着互联网技术的发展,越来越多的商家或者服务提供商通过互联网平台来为用户提供服务,洞察用户行为的特点能够有利于为用户提供更好的服务,增加为用户服务的机会,提高互联网的服务效率,提升互联网的服务质量。但现有技术中对于用户行为特点的研究准确性低,无法满足商家或者服务提供商提高工作效率、提升服务质量的要求。

考虑到上述缺陷,在该实施方式中,提出一种数据处理方法,该方法通过获取不同类别的用户历史行为数据,计算得到对应的用户行为得分,对于得到的用户行为得分进行预设组合处理,即可得到准确的用户行为评价值。该技术方案能够有效提高用户行为特点数据的准确性,从而能够为用户提供更好的服务,增加为用户服务的机会,提高互联网的服务效率,提升互联网的服务质量。

在本实施例的一个可选实现方式中,所述用户历史行为数据指的是在预设历史时间内能够获取的某一用户的行为数据,所述行为数据可包括用户交易数据、用户收藏数据、用户加标数据、用户点击数据、用户搜索数据、用户浏览数据等等,其中,所述用户交易数据指的是用户执行下单、购买等操作产生的数据,类似地,所述用户收藏数据指的是用户执行收藏等操作产生的数据,所述用户加标数据指的是用户点击喜欢、执行加星等操作产生的数据,所述用户点击数据指的是用户执行点击等操作产生的数据,所述用户搜索数据指的是用户执行搜索、检索等操作产生的数据,所述用户浏览数据指的是用户执行浏览等操作产生的数据。

其中,所述行为数据可包括用于对于用户身份进行唯一标识的用户标识信息(比如用户id)、行为操作类别信息、行为操作对象信息(比如商户id)、行为操作子对象信息(比如商品id)、行为操作价格信息、行为发生时间等信息,所述行为数据的具体内容可根据用户行为的不同而有所差异,比如,若用户a于2019.1.1在商户a购买了一件价格为100元的商品,那么对应的行为数据可以表示为{用户id,购买,商户id,商品id,100元,2019.1.1},若用户a于2019.1.1收藏或加标了商户a,那么对应的行为数据可以表示为{用户id,收藏/加标,商户id,2019.1.1},若用户a于2019.1.1点击或浏览了商户a或商户a中的商品a,那么对应的行为数据可以表示为{用户id,点击/浏览,商品id,商户id,2019.1.1},若用户a于2019.1.1执行了搜索操作,那么对应的行为数据可以表示为{用户id,搜索,搜索内容,2019.1.1}。

其中,所述预设历史时间可根据实际应用的需要以及用户行为数据的特点进行设置,对其具体取值本发明不作特别限定。

考虑到不同的用户行为对于行为特点的获取的作用是不同的,比如,用户a对商户a执行的下单操作比对商户a执行的点击操作更能体现出用户a对商户a的偏好。因此,为了获得更为准确的用户行为特点信息,需要将所述用户历史行为数据分为两种不同类别的数据进行处理,在本实施例的一个可选实现方式中,将所述用户历史行为数据分为体现为显性数据的第一历史行为数据和体现为隐性数据的第二历史行为数据,其中,所述显性数据,即所述第一历史行为数据可以包括能够明确表示用户行为特点的数据,比如:用户交易数据、用户收藏数据和用户加标数据等等;所述隐性数据,即所述第二历史行为数据为可以包括隐含表示用户行为特点的数据,比如:用户点击数据、用户搜索数据和用户浏览数据等等。后续可根据不同类别的行为数据分别计算相应的行为得分,再将行为得分组合起来得到最终的用户行为评价分值。

在本实施例的一个可选实现方式中,所述用户行为得分用于表征用户行为的特征信息,所述特征信息的具体内容与计算用户行为得分时考虑的行为因素有关,比如,若所述行为因素设置为交易、收藏、加标、点击、搜索、浏览等用户操作类别,那么相应的行为得分就可以表征该用户的操作行为特点,若所述行为因素设置为不同商户的商品特征,那么相应的行为得分就可以表征该用户的选择喜好特点等等。

考虑到用户行为数据与时间的变化存在一定的关系,随着时间的推移,用户行为数据就越丰富,在行为次数维度上的数值就越大。因此,在本实施例的一个可选实现方式中,在计算用户行为得分时,加入时间累积性因素,也就是说,所述基于时间累积的用户行为得分指的是考虑了时间的累积性而得到的用户行为得分,而所述时间累积性指的是计算结果或者中间计算结果的值随着时间的推移而增加的特性。

在本实施例的一个可选实现方式中,如图2所示,所述步骤s102,即根据所述用户历史行为数据计算得到基于时间累积的用户行为得分的步骤,包括步骤s201-s203:

在步骤s201中,确定分值初值和分值递增因子;

在步骤s202中,根据所述用户历史行为数据计算行为对象出现的频率;

在步骤s203中,将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到基于时间累积的用户行为得分。

上文提及,用户行为数据与时间的变化存在一定的关系,随着时间的推移,用户行为数据就越丰富,在行为次数维度上的数值就越大,因此考虑到同一用户会产生多次行为,为了充分体现用户行为的特点,在该实施方式中,对于用户行为进行累计统计,以得到用户行为得分。具体地,首先确定分值初值和分值递增因子,其中,所述分值递增因子用于表征用户行为累计增长速度,即递增步进,所述分值初值和分值递增因子可根据实际应用的需要灵活设置,比如可将所述分值初值设置为0,将所述分值递增因子设置为1;然后根据所述用户历史行为数据计算行为对象出现的频率,出现的频率越高说明该用户对于该行为对象的偏好程度就越高,其中,所述行为对象可以为商户、服务或者商品等对象;最后将所述分值递增因子与频率的乘积与所述分值初值相加,即可计算得到基于时间累积的用户行为得分。

举例来说,若商户a和商户b为两个不同的商户,分值初值设置为0,分值递增因子设置为1,那么对于用户行为数据:{用户a,购买,商户a,2019.2.1}、{用户a,购买,商户a,2019.2.8}和{用户a,购买,商户b,2018.10.3},可计算得到行为对象商户a的出现频率为2,行为对象商户b的出现频率为1,因此,用户a基于时间累积的行为得分可以表示为:{“商户a”:2,”商户b”:1}。

其中,利用上一实施方式提供的用户行为得分计算方法计算得到的是某一用户对于某一商户的行为得分,考虑到用户行为操作对象还有可能包括多个子对象,比如某一商户下存在多个商品,或者用户行为操作对象存在多种行为因素,比如某一商户提供的服务具有多种类别,某一商户提供的菜品具有多种口味等等,在本实施例的一个可选实现方式中,当所述行为对象包括一个或多个行为因素时,可认为上述行为对象的得分即为其所包括的行为因素得分,此时,即可将同一行为对象的不同行为因素对应的得分组合起来得到面向行为对象的基于时间累积的用户行为得分,也可以将不同行为对象的同一行为因素对应的得分组合起来得到面向行为因素的基于时间累积的用户行为得分。

举例来说,若商户a和商户b为提供不同口味餐食的两个不同的商户,并且已知商户a能够提供的口味,即其对应的行为因素包括:[“口味z”,”口味x”],商户b能够提供的口味,即其对应的行为因素包括:[“口味m”,”口味x”],各行为因素分值初值均设置为0,分值递增因子均设置为1,那么对于用户行为数据:{用户a,购买,商户a,2019.2.1}、{用户a,购买,商户a,2019.2.8}和{用户a,购买,商户b,2018.10.3},根据上一实施方式提供的用户行为得分计算方法,可计算得到行为对象商户a的出现频率为2,行为对象商户b的出现频率为1,用户a面向行为对象的基于时间累积的行为得分可以表示为:{“商户a”:2,”商户b”:1},那么用户a面向行为因素的基于时间累积的用户行为得分可以初步表示为:{“口味z”:2,”口味x”:2,”口味m”:1,”口味x”:1},对于不同行为对象的同一行为因素对应的得分组合起来,即可得到面向行为因素的基于时间累积的用户行为得分的最终表示为:{“口味z”:2,”口味x”:3,”口味m”:1}。

在本实施例的另一个可选实现方式中,如图3所示,当所述行为对象包括一个或多个行为因素时,所述步骤s102,即根据所述用户历史行为数据计算得到基于时间累积的用户行为得分的步骤,包括步骤s301-s304:

在步骤s301中,确定一个或多个行为因素、行为因素对应的分值初值和分值递增因子;

在步骤s302中,根据所述用户历史行为数据计算所述行为因素出现的频率;

在步骤s303中,将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到与所述行为因素对应的分值;

在步骤s304中,组合与所述行为因素对应的分值,得到面向行为对象或行为因素的基于时间累积的用户行为得分。

在该实现方式中,当所述行为对象包括一个或多个行为因素时,在根据所述用户历史行为数据计算基于时间累积的用户行为得分时,首先确定一个或多个行为因素、行为因素对应的分值初值和分值递增因子;然后根据所述用户历史行为数据计算所述行为因素出现的频率;然后将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到与所述行为因素对应的分值;最后组合与所述行为因素对应的分值,得到面向行为对象或行为因素的基于时间累积的用户行为得分。即分别计算不同行为因素对应的分值,再组合成面向所述商户或行为因素的行为得分向量。

举例来说,若商户a和商户b为提供不同口味餐食的两个不同的商户,并且已知商户a能够提供的口味,即其对应的行为因素包括:[“口味z”,”口味x”],商户b能够提供的口味,即其对应的行为因素包括:[“口味m”,”口味x”],各行为因素分值初值均设置为0,分值递增因子均设置为1,那么对于用户行为数据:{用户a,购买,商户a,口味z,2019.2.1}、{用户a,购买,商户a,口味x,2019.2.8}和{用户a,购买,商户b,口味x,2018.10.3},可计算得到口味z的出现频率为1,口味x的出现频率为2,那么面向行为因素的用户行为得分可表示为:{“口味z”:1,”口味x”:2},当然也可根据实际应用的需要,得到商户a所提供口味的出现频率总数为2,商户b所提供口味的出现频率总数为1,那么面向行为对象的用户行为得分就可表示为:{“商户a”:2,”商户b”:1}。

在本实施例的一个可选实现方式中,如图4所示,所述步骤s103,即对于所述第一行为得分和第二行为得分进行预处理后进行组合处理,得到用户行为得分的步骤,包括步骤s401-s403:

在步骤s401中,对于所述第一行为得分和第二行为得分进行预处理;

在步骤s402中,确定第一行为得分的第一组合权重和第二行为得分的第二组合权重;

在步骤s403中,根据所述第一组合权重和第二组合权重,对于所述第一行为得分和第二行为得分进行加权平均,得到用户行为得分。

在本实施例的一个可选实现方式中,可将所述第一组合权重和第二组合权重设置地相同,比如各为0.5。当然,若考虑显性数据和隐性数据对于用户行为特点的获取的作用不同,为了提高用户行为特点数据的准确性,在本实施例的另一个可选实现方式中,还可以将所述第一组合权重设置为高于所述第二组合权重。

为了避免用户行为数据中异常值的影响,使得分数据更为标准化,在本实施例的一个可选实现方式中,在对于所述第一行为得分和第二行为得分进行组合之前,对其先进行预处理操作,其中,所述预处理可包括以下操作中的一种或多种:去噪、标准化、归一化等等。

在本实施例的一个可选实现方式中,所述预处理为归一化,具体地,在该实现方式中,所述步骤s401可被实施为:

获取所述第一行为得分中行为因素对应分值的第一最小得分和第一最大得分,获取所述第二行为得分中行为因素对应分值的第二最小得分和第二最大得分;

计算所述第一行为得分中行为因素对应分值与所述第一最小得分之间的第一差值和所述第一最大得分与第一最小得分之间的第二差值,计算所述第二行为得分中行为因素对应分值与所述第二最小得分之间的第三差值和所述第二最大得分与第二最小得分之间的第四差值;

计算所述第一差值与所述第二差值之间的第一商值,确定为预处理后的第一行为得分,计算所述第三差值与所述第四差值之间的第二商值,确定为预处理后的第二行为得分。

上述实现方式可借助以下公式来表示:

(x-x.min)/(x.max-x.min)*100,

其中,x表示行为得分中与行为因素对应的分值,x.min表示行为得分中行为因素对应分值的最小分值,x.max表示行为得分中行为因素对应分值的最大分值。

考虑到用户行为数据中异常值的存在或者由于部分用户操作异常,导致最大分值或最小分值失真的情况,在本实施例的一个可选实现方式中,将所述最大分值x.max取为与行为因素对应的分值中位于第一预设位置处的分值,将所述最小分值x.min取为与行为因素对应的分值中位于第二预设位置处的分值。比如,可对与行为因素对应的分值进行降序排序,将位于95%占位处的值作为所述最大分值x.max,即,在降序队列中,所述最大分值之前的数值在整个队列中的占比为5%,将位于5%占位处的值作为所述最小分值x.min,即,在降序队列中,所述最小分值之前的数值在整个队列中的占比为95%。

在本实施例的一个可选实现方式中,所述方法还包括根据所述用户行为得分执行预设操作的步骤,即如图5所示,所述方法包括以下步骤s501-s504:

在步骤s501中,获取用户历史行为数据,其中,所述用户历史行为数据包括第一历史行为数据和第二历史行为数据;

在步骤s502中,根据所述用户历史行为数据计算得到基于时间累积的用户行为得分,其中,所述用户行为得分包括第一行为得分和第二行为得分,所述第一行为得分根据所述第一历史行为数据计算得到,所述第二行为得分根据所述第二历史行为数据计算得到;

在步骤s503中,对于所述第一行为得分和第二行为得分进行预处理后进行组合处理,得到用户行为得分;

在步骤s504中,根据所述用户行为得分执行预设操作。

在本实施例的一个可选实现方式中,所述预设操作可以包括以下操作中的一种或多种:商户、服务、口味等推荐操作、统计操作等等。

当所述预设操作为推荐操作时,所述步骤s504,即根据所述用户行为得分执行预设操作的步骤可实施为:

对于所述用户行为得分进行排序;

根据排序结果执行推荐操作。

在本实施例的一个可选实现方式中,对于所述用户行为得分进行排序时,当所述用户行为得分为单一数值时,对于所述用户行为得分直接进行排序;当所述用户行为得分包括对应不同行为因素的分值时,可对于不同行为因素对应的分值进行排序,也可对于不同行为对象的行为因素分值总和进行排序。

其中,在进行排序时,可按照分值由大到小的顺序,也可按照分值由小到大的顺序进行排序。

在本实施例的一个可选实现方式中,根据排序结果执行推荐操作时,可根据排序结果向用户推荐分值最高的行为因素的子对象,也可推荐与分值最高的行为因素相关的行为对象,还可推荐行为因素分值总和最高的行为对象。以上文示例为例,假设商户a能够提供的口味,即其对应的行为因素包括:[“口味z”,”口味x”],商户b能够提供的口味,即其对应的行为因素包括:[“口味m”,”口味x”],用户a基于行为因素的行为得分为:{“口味z”:2,”口味x”:3,”口味m”:1},那么若对于不同行为因素对应的分值进行排序,可得到不同行为因素的排序结果:口味x>口味z>口味m,此时,可向用户a推荐口味为x的菜品,也可向用户a推荐能够提供口味为x的产品的商户;若对于不同行为对象的行为因素分值总和进行排序,则得到行为对象的排序结果:商户a>商户b,此时,可向用户a推荐总分值较高的商户a。

下述为本公开装置实施例,可以用于执行本公开方法实施例。

图6示出根据本公开一实施方式的数据处理装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图6所示,所述数据处理装置包括:

获取模块601,被配置为获取用户历史行为数据,其中,所述用户历史行为数据包括第一历史行为数据和第二历史行为数据;

计算模块602,被配置为根据所述用户历史行为数据计算得到基于时间累积的用户行为得分,其中,所述用户行为得分包括第一行为得分和第二行为得分,所述第一行为得分根据所述第一历史行为数据计算得到,所述第二行为得分根据所述第二历史行为数据计算得到;

处理模块603,被配置为对于所述第一行为得分和第二行为得分进行预处理后进行组合处理,得到用户行为得分。

上文提及,随着互联网技术的发展,越来越多的商家或者服务提供商通过互联网平台来为用户提供服务,洞察用户行为的特点能够有利于为用户提供更好的服务,增加为用户服务的机会,提高互联网的服务效率,提升互联网的服务质量。但现有技术中对于用户行为特点的研究准确性低,无法满足商家或者服务提供商提高工作效率、提升服务质量的要求。

考虑到上述缺陷,在该实施方式中,提出一种数据处理装置,该装置通过获取不同类别的用户历史行为数据,计算得到对应的用户行为得分,对于得到的用户行为得分进行预设组合处理,即可得到准确的用户行为评价值。该技术方案能够有效提高用户行为特点数据的准确性,从而能够为用户提供更好的服务,增加为用户服务的机会,提高互联网的服务效率,提升互联网的服务质量。

在本实施例的一个可选实现方式中,所述用户历史行为数据指的是在预设历史时间内能够获取的某一用户的行为数据,所述行为数据可包括用户交易数据、用户收藏数据、用户加标数据、用户点击数据、用户搜索数据、用户浏览数据等等,其中,所述用户交易数据指的是用户执行下单、购买等操作产生的数据,类似地,所述用户收藏数据指的是用户执行收藏等操作产生的数据,所述用户加标数据指的是用户点击喜欢、执行加星等操作产生的数据,所述用户点击数据指的是用户执行点击等操作产生的数据,所述用户搜索数据指的是用户执行搜索、检索等操作产生的数据,所述用户浏览数据指的是用户执行浏览等操作产生的数据。

其中,所述行为数据可包括用于对于用户身份进行唯一标识的用户标识信息(比如用户id)、行为操作类别信息、行为操作对象信息(比如商户id)、行为操作子对象信息(比如商品id)、行为操作价格信息、行为发生时间等信息,所述行为数据的具体内容可根据用户行为的不同而有所差异,比如,若用户a于2019.1.1在商户a购买了一件价格为100元的商品,那么对应的行为数据可以表示为{用户id,购买,商户id,商品id,100元,2019.1.1},若用户a于2019.1.1收藏或加标了商户a,那么对应的行为数据可以表示为{用户id,收藏/加标,商户id,2019.1.1},若用户a于2019.1.1点击或浏览了商户a或商户a中的商品a,那么对应的行为数据可以表示为{用户id,点击/浏览,商品id,商户id,2019.1.1},若用户a于2019.1.1执行了搜索操作,那么对应的行为数据可以表示为{用户id,搜索,搜索内容,2019.1.1}。

其中,所述预设历史时间可根据实际应用的需要以及用户行为数据的特点进行设置,对其具体取值本发明不作特别限定。

考虑到不同的用户行为对于行为特点的获取的作用是不同的,比如,用户a对商户a执行的下单操作比对商户a执行的点击操作更能体现出用户a对商户a的偏好。因此,为了获得更为准确的用户行为特点信息,需要将所述用户历史行为数据分为两种不同类别的数据进行处理,在本实施例的一个可选实现方式中,将所述用户历史行为数据分为体现为显性数据的第一历史行为数据和体现为隐性数据的第二历史行为数据,其中,所述显性数据,即所述第一历史行为数据可以包括能够明确表示用户行为特点的数据,比如:用户交易数据、用户收藏数据和用户加标数据等等;所述隐性数据,即所述第二历史行为数据为可以包括隐含表示用户行为特点的数据,比如:用户点击数据、用户搜索数据和用户浏览数据等等。后续可根据不同类别的行为数据分别计算相应的行为得分,再将行为得分组合起来得到最终的用户行为评价分值。

在本实施例的一个可选实现方式中,所述用户行为得分用于表征用户行为的特征信息,所述特征信息的具体内容与计算用户行为得分时考虑的行为因素有关,比如,若所述行为因素设置为交易、收藏、加标、点击、搜索、浏览等用户操作类别,那么相应的行为得分就可以表征该用户的操作行为特点,若所述行为因素设置为不同商户的商品特征,那么相应的行为得分就可以表征该用户的选择喜好特点等等。

考虑到用户行为数据与时间的变化存在一定的关系,随着时间的推移,用户行为数据就越丰富,在行为次数维度上的数值就越大。因此,在本实施例的一个可选实现方式中,在计算用户行为得分时,加入时间累积性因素,也就是说,所述基于时间累积的用户行为得分指的是考虑了时间的累积性而得到的用户行为得分,而所述时间累积性指的是计算结果或者中间计算结果的值随着时间的推移而增加的特性。

在本实施例的一个可选实现方式中,如图7所示,所述计算模块602包括:

第一确定子模块701,被配置为确定分值初值和分值递增因子;

第一计算子模块702,被配置为根据所述用户历史行为数据计算行为对象出现的频率;

第二计算子模块703,被配置为将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到基于时间累积的用户行为得分。

上文提及,用户行为数据与时间的变化存在一定的关系,随着时间的推移,用户行为数据就越丰富,在行为次数维度上的数值就越大,因此考虑到同一用户会产生多次行为,为了充分体现用户行为的特点,在该实施方式中,所述计算模块602对于用户行为进行累计统计,以得到用户行为得分。具体地,第一确定子模块701确定分值初值和分值递增因子,其中,所述分值递增因子用于表征用户行为累计增长速度,即递增步进,所述分值初值和分值递增因子可根据实际应用的需要灵活设置,比如可将所述分值初值设置为0,将所述分值递增因子设置为1;第一计算子模块702根据所述用户历史行为数据计算行为对象出现的频率,出现的频率越高说明该用户对于该行为对象的偏好程度就越高,其中,所述行为对象可以为商户、服务或者商品等对象;第二计算子模块703将所述分值递增因子与频率的乘积与所述分值初值相加,即可计算得到基于时间累积的用户行为得分。

举例来说,若商户a和商户b为两个不同的商户,分值初值设置为0,分值递增因子设置为1,那么对于用户行为数据:{用户a,购买,商户a,2019.2.1}、{用户a,购买,商户a,2019.2.8}和{用户a,购买,商户b,2018.10.3},可计算得到行为对象商户a的出现频率为2,行为对象商户b的出现频率为1,因此,用户a基于时间累积的行为得分可以表示为:{“商户a”:2,”商户b”:1}。

其中,利用上一实施方式提供的用户行为得分计算方法计算得到的是某一用户对于某一商户的行为得分,考虑到用户行为操作对象还有可能包括多个子对象,比如某一商户下存在多个商品,或者用户行为操作对象存在多种行为因素,比如某一商户提供的服务具有多种类别,某一商户提供的菜品具有多种口味等等,在本实施例的一个可选实现方式中,当所述行为对象包括一个或多个行为因素时,可认为上述行为对象的得分即为其所包括的行为因素得分,此时,即可将同一行为对象的不同行为因素对应的得分组合起来得到面向行为对象的基于时间累积的用户行为得分,也可以将不同行为对象的同一行为因素对应的得分组合起来得到面向行为因素的基于时间累积的用户行为得分。

举例来说,若商户a和商户b为提供不同口味餐食的两个不同的商户,并且已知商户a能够提供的口味,即其对应的行为因素包括:[“口味z”,”口味x”],商户b能够提供的口味,即其对应的行为因素包括:[“口味m”,”口味x”],各行为因素分值初值均设置为0,分值递增因子均设置为1,那么对于用户行为数据:{用户a,购买,商户a,2019.2.1}、{用户a,购买,商户a,2019.2.8}和{用户a,购买,商户b,2018.10.3},根据上一实施方式提供的用户行为得分计算方法,可计算得到行为对象商户a的出现频率为2,行为对象商户b的出现频率为1,用户a面向行为对象的基于时间累积的行为得分可以表示为:{“商户a”:2,”商户b”:1},那么用户a面向行为因素的基于时间累积的用户行为得分可以初步表示为:{“口味z”:2,”口味x”:2,”口味m”:1,”口味x”:1},对于不同行为对象的同一行为因素对应的得分组合起来,即可得到面向行为因素的基于时间累积的用户行为得分的最终表示为:{“口味z”:2,”口味x”:3,”口味m”:1}。

在本实施例的另一个可选实现方式中,如图8所示,当所述行为对象包括一个或多个行为因素时,所述计算模块602包括:

第二确定子模块801,被配置为确定一个或多个行为因素、行为因素对应的分值初值和分值递增因子;

第三计算子模块802,被配置为根据所述用户历史行为数据计算所述行为因素出现的频率;

第四计算子模块803,被配置为将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到与所述行为因素对应的分值;

组合子模块804,被配置为组合与所述行为因素对应的分值,得到面向行为对象或行为因素的基于时间累积的用户行为得分。

在该实现方式中,当所述行为对象包括一个或多个行为因素时,在根据所述用户历史行为数据计算基于时间累积的用户行为得分时,第二确定子模块801首先确定一个或多个行为因素、行为因素对应的分值初值和分值递增因子;第三计算子模块802根据所述用户历史行为数据计算所述行为因素出现的频率;第四计算子模块803将所述分值递增因子与频率的乘积与所述分值初值相加,计算得到与所述行为因素对应的分值;组合子模块804组合与所述行为因素对应的分值,得到面向行为对象或行为因素的基于时间累积的用户行为得分。即分别计算不同行为因素对应的分值,再组合成面向所述商户或行为因素的行为得分向量。

举例来说,若商户a和商户b为提供不同口味餐食的两个不同的商户,并且已知商户a能够提供的口味,即其对应的行为因素包括:[“口味z”,”口味x”],商户b能够提供的口味,即其对应的行为因素包括:[“口味m”,”口味x”],各行为因素分值初值均设置为0,分值递增因子均设置为1,那么对于用户行为数据:{用户a,购买,商户a,口味z,2019.2.1}、{用户a,购买,商户a,口味x,2019.2.8}和{用户a,购买,商户b,口味x,2018.10.3},可计算得到口味z的出现频率为1,口味x的出现频率为2,那么面向行为因素的用户行为得分可表示为:{“口味z”:1,”口味x”:2},当然也可根据实际应用的需要,得到商户a所提供口味的出现频率总数为2,商户b所提供口味的出现频率总数为1,那么面向行为对象的用户行为得分就可表示为:{“商户a”:2,”商户b”:1}。

在本实施例的一个可选实现方式中,如图9所示,所述处理模块603包括:

预处理子模块901,被配置为对于所述第一行为得分和第二行为得分进行预处理;

第三确定子模块902,被配置为确定第一行为得分的第一组合权重和第二行为得分的第二组合权重;

加权平均子模块903,被配置为根据所述第一组合权重和第二组合权重,对于所述第一行为得分和第二行为得分进行加权平均,得到用户行为得分。

在本实施例的一个可选实现方式中,可将所述第一组合权重和第二组合权重设置地相同,比如各为0.5。当然,若考虑显性数据和隐性数据对于用户行为特点的获取的作用不同,为了提高用户行为特点数据的准确性,在本实施例的另一个可选实现方式中,还可以将所述第一组合权重设置为高于所述第二组合权重。

为了避免用户行为数据中异常值的影响,使得分数据更为标准化,在本实施例的一个可选实现方式中,在对于所述第一行为得分和第二行为得分进行组合之前,设置预处理子模块901对其先进行预处理操作,其中,所述预处理可包括以下操作中的一种或多种:去噪、标准化、归一化等等。

在本实施例的一个可选实现方式中,所述预处理为归一化,具体地,在该实现方式中,所述预处理子模块901可被配置为:

获取所述第一行为得分中行为因素对应分值的第一最小得分和第一最大得分,获取所述第二行为得分中行为因素对应分值的第二最小得分和第二最大得分;

计算所述第一行为得分中行为因素对应分值与所述第一最小得分之间的第一差值和所述第一最大得分与第一最小得分之间的第二差值,计算所述第二行为得分中行为因素对应分值与所述第二最小得分之间的第三差值和所述第二最大得分与第二最小得分之间的第四差值;

计算所述第一差值与所述第二差值之间的第一商值,确定为预处理后的第一行为得分,计算所述第三差值与所述第四差值之间的第二商值,确定为预处理后的第二行为得分。

上述实现方式可借助以下公式来表示:

(x-x.min)/(x.max-x.min)*100,

其中,x表示行为得分中与行为因素对应的分值,x.min表示行为得分中行为因素对应分值的最小分值,x.max表示行为得分中行为因素对应分值的最大分值。

考虑到用户行为数据中异常值的存在或者由于部分用户操作异常,导致最大分值或最小分值失真的情况,在本实施例的一个可选实现方式中,将所述最大分值x.max取为与行为因素对应的分值中位于第一预设位置处的分值,将所述最小分值x.min取为与行为因素对应的分值中位于第二预设位置处的分值。比如,可对与行为因素对应的分值进行降序排序,将位于95%占位处的值作为所述最大分值x.max,即,在降序队列中,所述最大分值之前的数值在整个队列中的占比为5%,将位于5%占位处的值作为所述最小分值x.min,即,在降序队列中,所述最小分值之前的数值在整个队列中的占比为95%。

在本实施例的一个可选实现方式中,所述装置还包括根据所述用户行为得分执行预设操作的部分,即如图10所示,所述装置包括:

获取模块1001,被配置为获取用户历史行为数据,其中,所述用户历史行为数据包括第一历史行为数据和第二历史行为数据;

计算模块1002,被配置为根据所述用户历史行为数据计算得到基于时间累积的用户行为得分,其中,所述用户行为得分包括第一行为得分和第二行为得分,所述第一行为得分根据所述第一历史行为数据计算得到,所述第二行为得分根据所述第二历史行为数据计算得到;

处理模块1003,被配置为对于所述第一行为得分和第二行为得分进行预处理后进行组合处理,得到用户行为得分;

执行模块1004,被配置为根据所述用户行为得分执行预设操作。

在本实施例的一个可选实现方式中,所述预设操作可以包括以下操作中的一种或多种:商户、服务、口味等推荐操作、统计操作等等。

当所述预设操作为推荐操作时,所述执行模块1004可被配置为:

对于所述用户行为得分进行排序;

根据排序结果执行推荐操作。

在本实施例的一个可选实现方式中,所述执行模块1004对于所述用户行为得分进行排序时,当所述用户行为得分为单一数值时,对于所述用户行为得分直接进行排序;当所述用户行为得分包括对应不同行为因素的分值时,可对于不同行为因素对应的分值进行排序,也可对于不同行为对象的行为因素分值总和进行排序。

其中,所述执行模块1004在进行排序时,可按照分值由大到小的顺序,也可按照分值由小到大的顺序进行排序。

在本实施例的一个可选实现方式中,所述执行模块1004根据排序结果执行推荐操作时,可根据排序结果向用户推荐分值最高的行为因素的子对象,也可推荐与分值最高的行为因素相关的行为对象,还可推荐行为因素分值总和最高的行为对象。以上文示例为例,假设商户a能够提供的口味,即其对应的行为因素包括:[“口味z”,”口味x”],商户b能够提供的口味,即其对应的行为因素包括:[“口味m”,”口味x”],用户a基于行为因素的行为得分为:{“口味z”:2,”口味x”:3,”口味m”:1},那么若对于不同行为因素对应的分值进行排序,可得到不同行为因素的排序结果:口味x>口味z>口味m,此时,可向用户a推荐口味为x的菜品,也可向用户a推荐能够提供口味为x的产品的商户;若对于不同行为对象的行为因素分值总和进行排序,则得到行为对象的排序结果:商户a>商户b,此时,可向用户a推荐总分值较高的商户a。

本公开还公开了一种电子设备,图11示出根据本公开一实施方式的电子设备的结构框图,如图11所示,所述电子设备1100包括存储器1101和处理器1102;其中,

所述存储器1101用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器1102执行以实现上述方法步骤。

图12适于用来实现根据本公开实施方式的数据处理方法的计算机系统的结构示意图。

如图12所示,计算机系统1200包括中央处理单元(cpu)1201,其可以根据存储在只读存储器(rom)1202中的程序或者从存储部分1208加载到随机访问存储器(ram)1203中的程序而执行上述实施方式中的各种处理。在ram1203中,还存储有系统1200操作所需的各种程序和数据。cpu1201、rom1202以及ram1203通过总线1204彼此相连。输入/输出(i/o)接口1205也连接至总线1204。

以下部件连接至i/o接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至i/o接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。

特别地,根据本公开的实施方式,上文描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行上述数据处理方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。

附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1