筛选目标对象的方法和装置与流程

文档序号:18409670发布日期:2019-08-10 00:52阅读:199来源:国知局
筛选目标对象的方法和装置与流程

本发明涉及计算机技术领域,尤其涉及一种筛选目标对象的方法和装置。



背景技术:

近年来,随着信息技术的不断创新和进步,用户的购销商品、提供或接受服务以及从事其他经营活动方式也逐渐全面互联网化,如何从用户行为数据中寻找规律,预测用户未来的需求,从而把产品推荐给需要的用户,是大数据应用在精准营销中的关键问题。其中,把产品推荐给需要的用户可以认为是根据目标产品筛选目标对象。

现有技术筛选目标对象的方法中,根据工作人员历史经验人为定义筛选目标对象的条件,比如,把产品推荐给所有购买或者浏览过该产品的对象。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术中筛选目标对象的方式是主观的,通过对象的基本属性和行为确认目标对象,准确性低,不能达到很好的筛选效果,效率较低,容易错过最佳时间。



技术实现要素:

有鉴于此,本发明实施例提供一种筛选目标对象的方法和装置,对生成的特征数据进行特征处理,然后计算对象与产品的关联度,进而筛选符合要求的目标对象,能够提高筛选目标对象的准确性。

为实现上述目的,根据本发明实施例的一个方面,提供了一种筛选目标对象的方法。

本发明实施例的一种筛选目标对象的方法包括:对初始数据进行分析生成特征数据,并对所述特征数据进行特征处理,所述初始数据包括对象信息数据和产品信息数据;利用特征处理后的特征数据计算对象与产品的关联度;根据所述关联度,筛选符合预设条件的目标对象。

可选地,在对初始数据进行分析生成特征数据之前,所述方法还包括:获取初始数据,其中所述对象信息数据包括:对象行为数据和对象基础数据,所述产品信息数据包括产品评价数据和产品基础数据;对所述初始数据进行清洗,以剔除初始数据中的异常数据。

可选地,对初始数据进行分析生成特征数据包括:按照维度的不同,对所述初始数据进行组合建立所述特征数据。

可选地,对所述特征数据进行特征处理包括:基于时间累计属性对特征数据进行衰减处理;和/或,基于与关联度负相关属性对特征数据进行平滑化处理;和/或,基于周期性属性对特征数据进行离散化处理,将离散化处理之后属于同一周期的特征数据进行合并。

可选地,所述特征处理后的特征数据包括:第一特征数据和第二特征数据,其中所述第一特征数据和所述第二特征数据为相同结构的数据,但所述第一特征数据的数据时间早于所述第二特征数据的数据时间。

可选地,利用特征处理后的特征数据计算对象与产品的关联度包括:利用所述第一特征数据训练计算模型,其中所述计算模型的输入的是特征数据,输出的是对象与产品的关联度;利用所述计算模型,计算第二特征数据中对象与产品的关联度。

可选地,根据所述关联度,筛选符合预设条件的目标对象包括:根据目标产品的筛选需求,筛选与所述目标产品的关联度大于预设阈值的目标对象,其中,所述目标产品为第二特征数据中有筛选需求的产品。

为实现上述目的,根据本发明实施例的另一方面,提供了一种筛选目标对象的装置。

本发明实施例的一种筛选目标对象的装置包括:处理模块,用于对初始数据进行分析生成特征数据,并对所述特征数据进行特征处理,所述初始数据包括对象信息数据和产品信息数据;计算模块,用于利用特征处理后的特征数据计算对象与产品的关联度;筛选模块,用于根据所述关联度,筛选符合预设条件的目标对象。

可选地,所述装置还包括:获取模块,用于获取初始数据,其中所述对象信息数据包括:对象行为数据、对象基础数据,所述产品信息数据包括产品评价数据、产品基础数据;对所述初始数据进行清洗,以剔除初始数据中的异常数据。

可选地,所述处理模块还用于:按照维度的不同,对所述初始数据进行组合建立所述特征数据。

可选地,所述处理模块还用于:基于时间累计属性对特征数据进行衰减处理;和/或,基于与关联度负相关属性对特征数据进行平滑化处理;和/或,基于周期性属性对特征数据进行离散化处理,将离散化处理之后属于同一周期的特征数据进行合并。

可选地,所述特征处理后的特征数据包括:第一特征数据和第二特征数据,其中所述第一特征数据和所述第二特征数据为相同结构的数据,但所述第一特征数据的数据时间早于所述第二特征数据的数据时间。

可选地,所述计算模块还用于:利用所述第一特征数据训练计算模型,其中所述计算模型的输入的是特征数据,输出的是对象与产品的关联度;利用所述计算模型,计算第二特征数据中对象与产品的关联度。

可选地,所述筛选模块还用于:根据目标产品的筛选需求,筛选与所述目标产品的关联度大于预设阈值的目标对象,其中,所述目标产品为第二特征数据中有筛选需求的产品。

为实现上述目的,根据本发明实施例的再一方面,提供了一种电子设备。

本发明实施例的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明实施例的筛选目标对象的方法。

为实现上述目的,根据本发明实施例的又一方面,提供了一种计算机可读介质。

本发明实施例的一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例的筛选目标对象的方法。

上述发明中的一个实施例具有如下优点或有益效果:对生成的特征数据进行特征处理,然后计算对象与产品的关联度,进而根据关联度筛选出符合要求的目标对象,从而可以提高筛选目标对象的准确性;本发明实施例中对获取的初始数据进行清洗,从而可以将异常数据剔除,提高算法模型的准确性;本发明实施例中按照维度的不同,对初始数据进行组合构建特征数据,从而可以确保特征数据的多元化;本发明实施例中从特征数据的时间累计属性、与关联度负相关属性以及周期性属性等多个角度对特征数据进行特征处理,从而可以进一步提高用于训练计算模型的特征数据的准确性;本发明实施例中特征处理后的特征数据包括第一特征数据和第二特征数据,它们的结构相同、时间不同,从而可以利用第一特征数据训练计算模型,利用训练的计算模型,计算第二特征数据中对象与产品的关联度;本发明实施例中根据目标产品的筛选需求,利用关联度筛选符合预设条件的目标对象,从而可以根据具体业务需求设置预设条件,选择符合的目标对象。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是根据本发明实施例的筛选目标对象的方法的主要步骤的示意图;

图2是适于实现本发明实施例的筛选目标对象的方法的系统的主要架构的示意图;

图3是根据本发明实施例的筛选目标对象的方法的衰减函数曲线示意图;

图4和图5是根据本发明实施例的筛选目标对象的方法的示意图;

图6是根据本发明实施例的筛选目标对象的方法的主要流程的示意图;

图7是根据本发明实施例的筛选目标对象的装置的主要模块的示意图;

图8是本发明实施例可以应用于其中的示例性系统架构图;

图9是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1是根据本发明实施例的筛选目标对象的方法的主要步骤的示意图,如图1所示,本发明实施例的筛选目标对象的方法主要包括以下步骤:

步骤s101:对初始数据进行分析生成特征数据,并对特征数据进行特征处理。其中,初始数据可以包括对象信息数据和产品信息数据。本发明的目的是根据目标产品,筛选出符合要求的目标对象。因此,采用的初始数据中包括对象信息数据和产品信息数据。本发明中为了提高筛选的目标对象的准确率,对生成的特征数据进行了特征处理。

步骤s102:利用特征处理后的特征数据计算对象与产品的关联度。本发明中,对象与产品的关联度可以根据实际场景调整,比如,在电商平台预测用户的购买行为的场景下,对象与产品的关联度可以是用户购买某个产品的可能性。

步骤s103:根据关联度,筛选符合预设条件的目标对象。本发明实施例中利用步骤s102中计算的关联度,筛选符合预设条件的目标对象,从而可以根据具体业务需求设置预设条件,选择符合的目标对象。

本发明实施例中,在对初始数据进行分析生成特征数据之前,筛选目标对象的方法还可以包括:获取初始数据;对初始数据进行清洗,以剔除初始数据中的异常数据。其中,对象信息数据可以包括:对象行为数据和对象基础数据,产品信息数据可以包括产品评价数据和产品基础数据。对象行为数据包括行为时间数据和行为分类数据。行为分类包含对象点击、浏览、关注和购买等行为。对象基础数据是对象的基础属性信息数据,如名称、类别、注册日期和等级等信息。产品评价数据是指对象对产品的评价信息,如差评率、好评率和累计评论数等。产品基础数据是产品的基础信息数据,如品类、品牌、价格和属性等信息。本发明实施例中对获取的初始数据进行清洗,将异常数据去除,其中异常数据可以包括:冗余记录的数据、爬虫用户产生的数据和属性信息异常的数据等。冗余记录是利用技术手段获取数据的时候产生的冗余记录。爬虫用户是指“网络机器人”,是一种通过编写程序自动完成对网站的操作的行为。属性信息异常是指产品的信息异常或者对象的信息异常,如产品价格过高,对象的注册日期是公元前100年等。本发明实施例中对获取的初始数据进行清洗,从而可以将异常数据剔除,提高算法模型的准确性。

本发明实施例中,对初始数据进行分析生成特征数据可以包括:按照维度的不同,对初始数据进行组合建立特征数据。本发明实施例中按照维度的不同,对初始数据进行组合构建特征数据,从而可以确保特征数据的多元化。

本发明实施例中,对特征数据进行特征处理可以包括:基于时间累计属性对特征数据进行衰减处理;和/或,基于与关联度负相关属性对特征数据进行平滑化处理;和/或,基于周期性属性对特征数据进行离散化处理,将离散化处理之后属于同一周期的特征数据进行合并。本发明中,基于时间累计属性,可以将特征数据分为时间累计特征数据和非时间累计特征数据,时间累计特征数据与对象的多天累计数有关系,时间累计特征数据会因为距离当前时间的长短不同而导致权重不同,因此对此类特征作衰减处理。与关联度负相关属性是指某些特征数据在累加值过高时,会对关联度产生负相关影响,因此需要对此类特征数据的峰值部分进行平滑化处理,消除峰值。本发明中离散化处理便于解释和勾画实际的对象行为数据。周期性属性是指对象周期性的行为,把一段时间内进行的操作,叫做一次行为,将属于同一时间的特征数据进行合并处理。本发明实施例中从特征数据的时间累计属性、与关联度负相关属性以及周期性属性等多个角度对特征数据进行特征处理,从而可以进一步提高用于训练计算模型的特征数据的准确性。

本发明实施例中,特征处理后的特征数据可以包括:第一特征数据和第二特征数据。利用特征处理后的特征数据计算对象与产品的关联度可以包括:利用第一特征数据训练计算模型,其中,训练的计算模型的输入的是特征数据,输出的是对象与产品的关联度;利用计算模型,计算第二特征数据中对象与产品的关联度。本发明中,第一特征数据和第二特征数据为相同结构的数据,第一特征数据用于训练计算模型,而第二特征数据用于预测对象的行为,因此第二特征数据的数据时间更接近于预测日期,也就是说,第一特征数据的数据时间早于第二特征数据的数据时间。

本发明实施例中,根据关联度,筛选符合预设条件的目标对象可以包括:根据目标产品的筛选需求,筛选与目标产品的关联度大于预设阈值的目标对象。其中,目标产品为第二特征数据中有筛选需求的产品。本发明中,预设条件可以是筛选预设数量的目标对象,也可以是筛选与目标产品的关联度大于某阈值的目标对象,当然,本发明对此无需过多限定,此处的预设条件可以根据实际需求灵活定义。

为了方便理解,本发明的后续描述中,以电商平台预测用户的购买行为为例,将“产品”取为“商品”,“对象”取为“用户”,“产品信息数据”取为“商品信息数据”,“对象信息数据”取为“用户信息数据”,“产品评价数据”取为“商品评价数据”,“产品基本数据”取为“商品基本数据”,“对象行为数据”取为“用户行为数据”,“对象基础数据”取为“用户基础数据”,“第一特征数据”取为“构建模型的特征数据表”,“第二特征数据”取为“预测购买意向的特征表”,“对象与产品的关联度”取为“用户购买商品的意向值”进行详细说明,当然“商品”、“用户”、“商品信息数据”、“用户信息数据”、“商品评价数据”、“商品基本数据”、“用户行为数据”、“用户基础数据”、“构建模型的特征表”、“预测购买的特征表”以及“用户购买商品的意向值”并不用来对本发明技术方案的保护范围进行限定,本发明中“产品”、“对象”、“产品信息数据”、“对象信息数据”、“产品评价数据”、“产品基本数据”、“对象行为数据”、“对象基础数据”、“第一特征数据”、“第二特征数据”以及“对象与产品的关联度”可以根据具体业务场景进行适应性调整。用户购买商品的意向值是指用户购买商品的可能性,用户购买某个商品的可能性越大则意向值越高。

本发明实施例中,可以通过设计一个筛选目标对象的系统来具体实现筛选目标对象的方法。图2是适于实现本发明实施例的筛选目标对象的方法的系统的主要架构的示意图。如图2所示,适于实现本发明实施例的筛选目标对象的方法的系统可以包括:数据接入单元、行为分析单元、购买预测单元和数据输出单元。数据接入单元用于从大数据仓库中获取数据,并对获取的数据进行清洗。行为分析单元用于根据用户行为数据和基础数据组合建立多维度的构建模型的特征表,并根据特征数据构建算法模型。购买预测单元用于根据构建的算法模型计算用户购买商品的可能值。数据输出单元用于根据选定的商品集合,输出可能购买该集合内商品的用户。

在数据接入单元,获取的数据可以包括:用户基础数据、商品基础数据、商品评价数据和用户行为数据。用户基础数据主要来自电商平台网站的用户注册和消费统计数据,可以包括:年龄、性别、用户等级、注册日期等。商品基础数据主要来自电商平台的商品采销数据,可以包括:商品的属性、品类、品牌等。商品评价数据主要来自用户对已购买的商品的评论和打分汇总数据,可以包括:是否有差评、差评率、累计评论数等。用户行为数据可以包括:用户点击、浏览、关注、加入购物车、删除购物车、购买等行为分类以及执行这些行为花费的时间,即行为时间。用户点击和浏览数据来自电商平台网站的前端埋点(埋点是指使用技术手段采集用户行为)后产生的流量数据,采集流量数据的来源可以包括:web(worldwideweb,全球广域网)网站、手机app(application,应用程序)、手机wap(wirelessapplicationprotocol,无线应用通讯协议)网站或第三方入口等。其他用户行为数据来自用户在电商平台网站中对商品的操作数据。

本发明实施例中可以通过大数据仓库的任务调度获取数据。其中用于构建计算模型的数据和用于预测购买意向的数据取自不同时间段的数据,并且用于预测购买意向的数据的时间段更接近用于推销的时间,比如,商品推销的日期是第11天,则可以选择第1天至第5天的数据用于构建计算模型,选择第6天到第10天的数据用于预测购买意向。

在数据接入单元从大数据仓库获取到数据之后,对获取的数据进行清洗。其中,对数据的清洗可以包括:去除重复的点击、浏览数据;移除爬虫用户的行为对数据的影响;清洗数据的异常值,例如,用户年龄为1000岁,商品价格过高等。

在行为分析单元,按照维度的不同,对用户行为数据和基础数据进行组合,生成特征数据。然后用pearson相关系数(pearsoncorrelationcoefficient,是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系)衡量生成的特征数据和购买行为的线性关系,选取正相关的、和购买行为有关的特征数据作为构建模型的特征表。

本发明以电商平台预测用户购买行为为例,可以用于构建模型的特征表中的特征可以包括:用户平均行为周期(用户平均行为周期是指用户行为操作的时间周期)、用户点击商品用时、用户浏览商品用时、商品被购买总用时、用户对品类的最近时间间隔(品类是指商品所属的分类)、用户浏览商品用时排行、用户对商品的行为用时(行为用时是指用户执行点击、浏览、关注、加入购物车、删除购物车、购买等行为用的时间)在用户对该商品所在品类的用时排行、用户七日内行为数(行为数是指用户执行点击、浏览、关注、加入购物车、删除购物车、购买等行为的次数)、用户最近一次行为周期内行为数、用户活跃天数(用户当天对商品的行为超过一定时间时,认为用户这一天是活跃的)、用户商品点击平均用时排行、用户购买商品的购买数浏览数购买率等。

除了上述重要特征数据外,以下次要特征也是构建计算模型的重要指标:特征日区间内行为天数(特征日区间可以是促销时间区间、节假日时间区间等等)、用户最初/最后行为距离预测日的小时数、用户该品类每个商品行为的平均值、用户活跃历史总天数、用户连续登陆天数、用户平均每天操作的商品数、首次交互时间相同的用户活跃天数排序(交互时间是指在某个时间有不只一个用户执行行为操作,这个时间认为是交互时间)、最近三次活跃期时长、交互时间段个数,交互时间间隔最大最小均值中位数加和、用户登录行为中,看了当前品类商品的比重、用户平均每天活跃分钟数、用户活跃时间重心、用户最后一次浏览时间与第一次浏览时间差、用户等级成长速度等。

在行为分析单元,对用于构建计算模型的特征表进行了特征处理。其中,特征处理可以包括:基于时间累计属性对构建计算模型的特征表进行衰减处理。本发明中,衰减处理可以是对时间累计特征数据加入衰减函数。其中,衰减函数的公式可以为:,d为距离统计预测日的时间差,γ为衰减系数(通过经验得到,衰减系数γ的取值在0.3到0.95之间)。图3是根据本发明实施例的筛选目标对象的方法的衰减函数曲线示意图。图3示出了γ为0.7时,每日衰减函数的参数分布情况曲线图。以用户点击数据为例,将用户点击数据加入衰减函数后的统计方式如下:

sum=d1*1.0+d2*0.78+d3*0.562+d4*0.438+…

其中,di是距离商品推销日期第i天的用户点击量,sum是用户统计时间内的点击量汇总值,即最终的用户点击特征数据。本发明实施例中,加入衰减函数后的单特征与购买行为的pearson相关系数可以提升30%以上。

在行为分析单元,特征处理可以包括:基于与关联度负相关属性对构建计算模型的特征表进行平滑化处理。例如,在本发明实施例中,用户点击、浏览等行为汇总值中有通过机器人点击、浏览却不购买的行为的数据值,因此对此类行为做平滑化处理,降低它们的影响。

在行为分析单元,特征处理可以包括:基于周期性属性对构建计算模型的特征表进行离散化处理,将离散化处理之后属于同一周期的特征数据进行合并。本发明中离散化处理便于解释和勾画实际的用户行为数据。周期性属性是指用户周期性的行为,把一段时间内进行的操作,叫做一次行为,比如某用户在昨日晚18-20点间浏览了一些的商品,今天8-11点浏览了一些商品,因此被称为两个行为周期。本发明中,可以将用户前后两次操作的操作时间差少于45分钟(一般情况下认为45分钟为网站登录失效时间,也可以是其他时间,本发明对此不作限定)的操作合并到一起,超过45分钟的行为被认为一次新的用户行为周期。图4和图5是根据本发明实施例的筛选目标对象的方法的示意图。图4示出了某用户一天内的点击行为,将图4所示的用户的行为合并为两个行为周期,每个周期内包含一定数量的用户行为,得到图5所示的合并处理后的示意图。本发明实施例中,统计用户行为周期的次数、近期行为周期内的行为次数、行为周期活跃度等特征数据能有效提升算法模型的准确率。

在行为分析单元,对构建计算模型的特征表进行特征处理之后,可以采用xgboost(一个用户机器学习的算法工具)的二分类算法训练计算模型。根据经验,xgboost参数如下:

'learning_rate':0.1,'n_estimators':1000,

'max_depth':8,'min_child_weight':3,

'subsample':1.0,'colsample_bytree':0.8,

'eta':0.1,'objective':'binary:logistic',

'gamma':0.1,'lambda':550.

训练计算模型的时候,可以先建立用户是否购买的模型,再建立用户是否购买指定商品的模型,本发明中分拆构建计算模型可以提升预测的准确性。当然,本发中也可以使用其他二分类的机器学习算法,如svm(supportvectormachine,一种可以训练的机器学习方法)等,构建计算模型。将构建模型的特征表进行模型训练,训练后的结果保存在模型文件中。

在购买预测单元,采用的预测数据与行为分析单元构建算法模型的数据的结构相同,但时间不同。将预测数据调用相同的特征处理方法生成预测购买意向的特征表,将预测购买意向的特征表输入行为分析单元中生成的模型文件进行计算,输出用户对商品的购买意向值以及排名。

在数据输出单元,可以通过运营人员提供的商品集合,选出在推测时间内可能购买该商品集合的用户群,购买该商品集合的用户群是指只要该集合中的商品可能被用户群中的某个用户购买就可以。本发明中选择用户群的方法可以通过阈值判断,比如将商品推荐给对于该商品的意向值大于预设阈值的用户,也可以通过选择预设数量的用户,比如预设将商品集合中的某个商品推荐给100个用户,则将商品推荐给意向值排名前100的用户。

图6是根据本发明实施例的筛选目标对象的方法的主要流程的示意图。以电商平台为例,基础数据是稳定,选取预测购买日前6-10天的用户行为数据用于构建算法模型,选取预测购买日前1-5天的用户行为数据用于预测购买意向,当然,本发明也可以选择其他时间段的数据,只是要确保用于构建算法模型的数据和用于预测购买意向的数据必须是时间不交叉的数据。

如图6所示,筛选目标对象的方法的主要流程可以包括:步骤s601,获取基础数据和用户行为数据,并对获取的数据进行清洗,去除异常数据;步骤s602,按照维度不同,对基础数据和预测购买日前6-10天的用户行为数据进行组合建立多维度的用于构建模型的特征表;步骤s603,对特征表中的与用户的多天累计数有关的特征进行衰减处理;步骤s604,对特征表中的与用户点击、浏览行为有关的特征进行平滑化处理;步骤s605,对特征表中的与用户行为周期有关的特征进行合并处理;步骤s606,根据xgboost的二分类算法,利用处理后的特征表训练计算模型;步骤s607,按照维度不同,对基础数据和预测购买日前1-5天的用户行为数据进行组合建立多维度的用于预测购买意向的特征表,并调用相同的特征处理方法对其进行特征处理;步骤s608,将用于预测购买意向的特征表输入到计算模型中,得到用户对应产品的购买意向值以及排名;步骤s609,根据运营人员提供的商品集合,选出在预测购买日内可能购买该商品集合的用户。

本发明中,步骤s603、步骤s604和步骤s605均是对特征表进行特征处理,它们的执行顺序可以根据实际情况调整,本发明对此不作限定。

根据本发明实施例的筛选目标对象的技术方案可以看出,对生成的特征数据进行特征处理,然后计算对象与产品的关联度,进而筛选符合要求的目标对象,从而可以提高筛选目标对象的准确性;本发明实施例中对获取的初始数据进行清洗,从而可以将异常数据剔除,提高算法模型的准确性;本发明实施例中按照维度的不同,对初始数据进行组合构建特征数据,从而可以确保特征数据的多元化;本发明实施例中从特征数据的时间累计属性、与关联度负相关属性以及周期性属性等多个角度对特征数据进行特征处理,从而可以进一步提高用于训练计算模型的特征数据的准确性;本发明实施例中特征处理后的特征数据包括第一特征数据和第二特征数据,它们的结构相同、时间不同,从而可以利用第一特征数据训练计算模型,利用训练的计算模型,计算第二特征数据中对象与产品的关联度;本发明实施例中根据目标产品的筛选需求,利用关联度筛选符合预设条件的目标对象,从而可以根据具体业务需求设置预设条件,选择符合的目标对象。

图7是根据本发明实施例的筛选目标对象的装置的主要模块的示意图。如图7所示,本发明实施例的筛选目标对象的装置700主要包括以下模块:处理模块701、计算模块702和筛选模块703。

其中,处理模块701可用于对初始数据进行分析生成特征数据,并对特征数据进行特征处理。初始数据可以包括:对象信息数据和产品信息数据。计算模块702可用于利用特征处理后的特征数据计算对象与产品的关联度。筛选模块703可用于根据关联度,筛选符合预设条件的目标对象。

本发明实施例中,筛选目标对象的装置700还可以包括:获取模块(图中为示出)。获取模块可用于获取初始数据;对初始数据进行清洗,以剔除初始数据中的异常数据。其中,对象信息数据可以包括:对象行为数据和对象基础数据,产品信息数据可以包括:产品评价数据和产品基础数据。

本发明实施例中,处理模块701还可用于:按照维度的不同,对初始数据进行组合建立特征数据。

本发明实施例中,处理模块701还可用于:基于时间累计属性对特征数据进行衰减处理;和/或,基于与关联度负相关属性对特征数据进行平滑化处理;和/或,基于周期性属性对特征数据进行离散化处理,将离散化处理之后属于同一周期的特征数据进行合并。

本发明实施例中,特征处理后的特征数据可以包括:第一特征数据和第二特征数据。其中,第一特征数据和第二特征数据为相同结构的数据,但第一特征数据的数据时间早于第二特征数据的数据时间。

本发明实施例中,计算模块702还可用于:利用第一特征数据训练计算模型;利用计算模型,计算第二特征数据中对象与产品的关联度。其中,计算模型的输入的是特征数据,输出的是对象与产品的关联度。

本发明实施例中,筛选模块703还可用于:根据目标产品的筛选需求,筛选与所述目标产品的关联度大于预设阈值的目标对象。其中,目标产品为第二特征数据中有筛选需求的产品。

从以上描述可以看出,对生成的特征数据进行特征处理,然后计算对象与产品的关联度,进而筛选符合要求的目标对象,从而可以提高筛选目标对象的准确性;本发明实施例中对获取的初始数据进行清洗,从而可以将异常数据剔除,提高算法模型的准确性;本发明实施例中按照维度的不同,对初始数据进行组合构建特征数据,从而可以确保特征数据的多元化;本发明实施例中从特征数据的时间累计属性、与关联度负相关属性以及周期性属性等多个角度对特征数据进行特征处理,从而可以进一步提高用于训练计算模型的特征数据的准确性;本发明实施例中特征处理后的特征数据包括第一特征数据和第二特征数据,它们的结构相同、时间不同,从而可以利用第一特征数据训练计算模型,利用训练的计算模型,计算第二特征数据中对象与产品的关联度;本发明实施例中根据目标产品的筛选需求,利用关联度筛选符合预设条件的目标对象,从而可以根据具体业务需求设置预设条件,选择符合的目标对象。

图8示出了可以应用本发明实施例的筛选目标对象的方法或筛选目标对象的装置的示例性系统架构800。

如图8所示,系统架构800可以包括终端设备801、802、803,网络804和服务器805。网络804用以在终端设备801、802、803和服务器805之间提供通信链路的介质。网络804可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备801、802、803通过网络804与服务器805交互,以接收或发送消息等。终端设备801、802、803上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备801、802、803可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器805可以是提供各种服务的服务器,例如对用户利用终端设备801、802、803所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是,本发明实施例所提供的筛选目标对象的方法一般由服务器805执行,相应地,筛选目标对象的装置一般设置于服务器805中。

应该理解,图8中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

下面参考图9,其示出了适于用来实现本发明实施例的终端设备的计算机系统900的结构示意图。图9示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图9所示,计算机系统900包括中央处理单元(cpu)901,其可以根据存储在只读存储器(rom)902中的程序或者从存储部分908加载到随机访问存储器(ram)903中的程序而执行各种适当的动作和处理。在ram903中,还存储有系统900操作所需的各种程序和数据。cpu901、rom902以及ram903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。

以下部件连接至i/o接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至i/o接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(cpu)901执行时,执行本发明的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括处理模块、计算模块和筛选模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,处理模块还可以被描述为“对初始数据进行分析生成特征数据,并对特征数据进行特征处理的模块”。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:对初始数据进行分析生成特征数据,并对特征数据进行特征处理,其中初始数据包括对象信息数据和产品信息数据;利用特征处理后的特征数据计算对象与产品的关联度;根据关联度,筛选符合预设条件的目标对象。

根据本发明实施例的技术方案,对生成的特征数据进行特征处理,然后计算对象与产品的关联度,进而筛选符合要求的目标对象,从而可以提高筛选目标对象的准确性;本发明实施例中对获取的初始数据进行清洗,从而可以将异常数据剔除,提高算法模型的准确性;本发明实施例中按照维度的不同,对初始数据进行组合构建特征数据,从而可以确保特征数据的多元化;本发明实施例中从特征数据的时间累计属性、与关联度负相关属性以及周期性属性等多个角度对特征数据进行特征处理,从而可以进一步提高用于训练计算模型的特征数据的准确性;本发明实施例中特征处理后的特征数据包括第一特征数据和第二特征数据,它们的结构相同、时间不同,从而可以利用第一特征数据训练计算模型,利用训练的计算模型,计算第二特征数据中对象与产品的关联度;本发明实施例中根据目标产品的筛选需求,利用关联度筛选符合预设条件的目标对象,从而可以根据具体业务需求设置预设条件,选择符合的目标对象。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1