业务对象分类方法和系统与流程

文档序号:12721416阅读:1030来源:国知局
业务对象分类方法和系统与流程

本发明涉及互联网技术领域中业务对象信息处理技术,特别是涉及一种业务对象分类方法和系统。



背景技术:

业务对象分类是一种非常重要的用户信息分析方法,通过对业务对象分类,可以掌握用户的不同特性,便于对用户进行管理。

目前,常用的一种业务对象分类方法是通过特定规则定义多个用户类型,如根据业务对象历史记录预先设置业务对象分类的不同规则。根据业务对象的历史使用记录数据判断其与特定规则的匹配情况,根据匹配结果将其划分到对应的分类类型。另一种业务对象分类方法是建立线性评估模型,综合考虑业务对象的多种历史使用记录计算活跃度参数,通过将业务对象历史使用记录设置多个维度,每个维度设置对应的线性系数,从而可计算每个业务对象的活跃度参数,根据计算结果将其划分到对应的分类类型。

然而,以上业务对象分类方法仍然存在问题:

针对第一种业务对象分类方法,在对业务对象进行分类之前需要对用户类型事先进行定义,且对每个业务对象类型的定义设置好分类规则,从而会受限于个人对现有业务对象的了解程度,业务对象分类粒度太粗,分类结果的识别精度低、可应用性较弱。

针对第二种业务对象分类方法,分类所使用的线性模型中,各维度的权重即各维度对应的线性系数的设置的合理性直接影响到分类结果的准确性,各维度权重的设置并无操作性强的指导规则;且难以将业务对象细分,适用领域有限,分类后所得出的分类结果可能并非是可用于指导实际的结果。

相关技术中,对于上述问题,尚无有效解决方案。



技术实现要素:

基于此,有必要提供一种识别精度高、适应领域广的业务对象分类方法和系统。

一种业务对象分类方法,包括:

获取分析周期内多个业务对象的目标属性特征参数;

将所述分析周期分为通过多个分析时间点划分的分析时间段;

获取所述多个业务对象在所述分析时间点对应的目标属性特征参数的特征参数值,根据所述特征参数值形成分别与所述多个业务对象对应的轨迹特征曲线;

对所述轨迹特征曲线进行聚类分析,将所述轨迹特征曲线中相似度小于设定值的曲线进行聚类得到聚类结果;

根据所述聚类结果对所述业务对象进行分类。

一种业务对象分类系统,包括:

参数获取模块,用于获取分析周期内多个业务对象的目标属性特征参数;

时间划分模块,用于将所述分析周期分为通过多个分析时间点划分的分析时间段;

曲线形成模块,用于获取所述多个业务对象在所述分析时间点对应的目标属性特征参数的特征参数值,根据所述特征参数值形成分别与所述多个业务对象对应的轨迹特征曲线;

聚类分析模块,用于对所述轨迹特征曲线进行聚类分析,将所述轨迹特征曲线中相似度小于设定值的曲线进行聚类得到聚类结果;

分类模块,用于根据所述聚类结果对所述业务对象进行分类。

上述业务对象分类方法和系统,通过获取业务对象的目标属性特征参数,根据业务对象在分析时间点的目标属性特征参数的特征参数值形成业务对象的特征轨迹曲线,再通过对特征轨迹曲线进行聚类分析,从而可通过对相同时间段内具有相似目标属性特征参数的特征参数值得业务对象进行自动组合划分为同一类,再通过对划分为同一类的业务对象所包含的目标属性特征参数的特征参数值进行分析找出该类业务对象的共性,定义其业务对象类别。因此,业务对象分类结果的准确性不依赖于分类之前对业务对象类型进行定义的准确性,分类粒度的粗细可通过调整分析周期的长短、分析时间点数量与间隔、及与曲线相似度的设定值的大小进行调整;其次可针对不同应用程序的功能和使用特点可选取该应用程序的业务对象群对应的不同目标属性特征参数进行分析,从而可得到准确且具有可操作性的分类结果,针对同一应用程序也可以选取不同的目标属性特征参数进行分析,得到从不同维度的实际行为数据而获得业务对象分类结果,从而该业务对象分类方法适应领域广,业务对象分类结果也更具有价值。

附图说明

图1为一实施例中业务对象分类方法的系统架构图;

图2为一实施例中服务器的内部结构示意图;

图3为一实施例中业务对象分类方法的流程图;

图4为另一实施例中业务对象分类方法的流程图;

图5为又一实施例中业务对象分类方法的流程图;

图6为业务对象分类轨迹曲线的示意图;

图7为再一实施例中业务对象分类方法的流程图;

图8为一实施例中计算轨迹距离的示意图;

图9为又一实施例中业务对象分类方法的流程图;

图10为再一实施例中业务对象分类方法的流程图;

图11为另一实施例中业务对象分类系统的结构示意图;

图12为又一实施例中业务对象分类系统的结构示意图;

图13为再一实施例中业务对象分类系统的结构示意图;

图14为另一实施例中业务对象分类系统的结构示意图;

图15为又一实施例中业务对象分类系统的结构示意图;

图16为再一实施例中业务对象分类系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

本发明实施例提供的业务对象分类方法可应用于图1所示的系统中,如图1所示,终端100通过网络与服务器200进行通信,终端100为业务对象分类方法提供业务对象的属性特征参数并发送给服务器200。具体的,终端100获取使用应用程序的业务对象的属性特征参数,并通过网络发送给服务器200进行存储以为业务对象分类提供数据来源。其中,应用程序可以为互联网技术领域中针对不同使用者应用目的的应用软件,如金融应用、游戏应用、教育应用、即时通讯应用等,业务对象则是指使用这些应用程序的对象,具体地,与金融应用对应的业务对象为使用该金融应用的金融用户、与游戏应用对应的业务对象为使用该游戏应用的游戏用户、与教育应用对应的业务对象为使用该教育应用的用户、与即时通讯应用对应的业务对象为使用该即时通讯应用的用户。业务对象的属性特征参数包括流水类数据和状态类数据,以金融应用、游戏应用、教育应用、即时通讯应用等为例,业务对象对金融应用游戏应用、教育应用、即时通讯应用等的登陆访问为流水类数据,不同业务对象所属归属地区为状态类数据。终端100可以为智能手机、平板电脑、个人数字助理(PDA)及个人计算机。服务器200可以为独立的物理服务器或者物理服务器集群。

图1中的服务器200的内部结构如图2所示,该服务器200包括通过系统总线链接的处理器、存储介质、内存和网络接口。其中,该服务器200的存储介质存储有操作系统、数据库和一种业务对象分类系统。数据库用于存储数据,如用于业务对象分类的业务对象的属性特征参数。该服务器200的处理器用于供计算和控制能力,支撑整个接入服务器200的运行。该服务器200的内存为存储介质中的业务对象分类系统的运行提供环境。该服务器200的网络接口用于与外部的终端100通过网络连接通信,比如接收终端100发送的属性特征参数等。

如图3所示,为本申请一实施例提供的一种业务对象分类方法,该方法可应用于图2所示的服务器中,具体包括如下步骤。

步骤101,获取分析周期内多个业务对象的目标属性特征参数。

分析周期根据需分析的目标时间段确定,当需要对某个历史时间段内的业务对象的属性特征参数进行分析得到业务对象类型的分类结果,则可相应将该历史时间段作为分析周期。优选的,还可以通过分析周期的选取,实现对应用程序在不同生命周期时段内的业务对象分类。业务对象的属性特征参数主要包括与业务对象的身份相关的状态类数据以及与业务对象使用应用程序行为相关的流水类数据,其中,状态类数据通常包括业务对象名、业务对象等级、性别、所在地域等,流水类数据包括业务对象访问时间、访问对象、操作内容等。目标属性特征参数是指能够通过对其进行统计分析后对业务对象使用特定应用程序的生命周期进行判断的属性特征参数,从而目标属性特征参数为与业务对象使用应用程序行为相关的属性特征数据。为了能够直接体现业务对象使用相应应用程序的生命周期的特性,本实施例中,目标属性特征参数为流水类数据。以金融应用为例,目标属性特征参数包括表征业务对象活跃度的登陆数据、理财交易数据等。

步骤102,将分析周期分为通过多个分析时间点划分的分析时间段。

分析时间点的数量及相邻分析时间点之间的间隔可根据需分析的目标精度确定,当需要得到更为符合实际情况的轨迹特征曲线时,则可以设置更多数量以及间隔更小的分析时间点,从而相同分析周期内相应得到更多数量的分析时间段,当需要减小针对某分析周期的计算量时,则可增加该分析周期内相邻分析时间点的间隔以减少分析时间点的数量,从而减少分析周期内的分析时间段的数量。

步骤103,获取多个业务对象在分析时间点对应的目标属性特征参数的特征参数值,根据所述特征参数值形成分别与多个业务对象对应的轨迹特征曲线。

分析时间点对应的目标属性特征参数的特征参数值可以是单一目标属性特征参数在相应分析时间点时对应的数据,也可以是多个目标属性特征参数的组合在相应分析时间点时对应的数据。仍以金融应用为例,如预分析的目标属性特征参数为登陆数据,分析时间点为天,则分析时间点对应的目标属性特征参数的特征参数值为业务对象相应每天的登陆次数;如预分析的目标属性特征参数为登陆数据、理财交易数据的组合,则分析时间点对应的目标属性特征参数的特征参数值为业务对象每天登陆次数与每天理财交易金额。轨迹特征曲线则是以分析时间点对应的目标属性特征参数的特征参数值连接形成的曲线。

步骤105,对轨迹特征曲线进行聚类分析,将轨迹特征曲线中相似度小于设定值的曲线进行聚类得到聚类结果。

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。其中对轨迹特征曲线的聚类分析,是指将相似度高的曲线聚类成为同一类,从而可根据目标属性特征参数所形成的轨迹特征曲线的实际情况而自动将具有相似特征的业务对象组合形成同一类。相似度高的曲线是指相似度小于设定值的曲线,其中,相似度为1时表示两条曲线完全相同。可以理解的,通过改变设定值的大小,可以相应调节聚类为同一类的曲线的数量,从而可以调整业务对象的分类类别的数量,具体而言,设定值越大,则业务对象的分类类别的数量减少;设定值越小,则分类类别的数量越多。聚类结果是指包含不同业务对象的轨迹特征曲线中根据相似度进行聚类所形成的曲线组合的集合。

步骤107,根据聚类结果对业务对象进行分类。

根据聚类结果中将相似度大的曲线进行聚类所形成的曲线组合的情况,其中划分至同一曲线组合的业务对象表示为同一类业务对象,根据同一曲线组合中包含的轨迹特征曲线的特征参数值所反映出来业务对象使用应用程序行为的特点,可以对相应类别的业务对象的行为特征进行分析,以实现对业务对象进行分类,并可进一步定义业务对象类别。

以上业务对象分类方法,通过获取业务对象的目标属性特征参数,根据业务对象在分析时间点的目标属性特征参数的特征参数值形成业务对象的特征轨迹曲线,再通过对特征轨迹曲线进行聚类分析,从而可通过对相同时间段内具有相似目标属性特征参数的特征参数值得业务对象进行自动组合划分为同一类,再通过对划分为同一类的业务对象所包含的目标属性特征参数的特征参数值进行分析找出该类业务对象的共性,定义其业务对象类别。因此,业务对象分类结果的准确性不依赖于分类之前对业务对象类型进行定义的准确性,分类粒度的粗细可通过调整分析周期的长短、分析时间点数量与间隔、及与曲线相似度的设定值的大小进行调整;其次,针对不同应用程序的功能和使用特点可选取不同的目标属性特征参数进行分析,从而可得到准确且具有可操作性的分类结果,针对同一应用程序也可以选取不同的目标属性特征参数进行分析,得到从不同维度的实际行为数据而获得业务对象分类结果,从而该业务对象分类方法适应领域广,业务对象分类结果也更具有价值。

如图4所示,在另一个实施例中,步骤103,获取多个业务对象在分析时间点对应的目标属性特征参数的特征参数值,根据特征参数值形成分别与多个业务对象对应的轨迹特征曲线的步骤,包括:

步骤1031,获取多个业务对象在分析时间点对应的目标属性特征参数的特征参数值。

分析时间点之间的间隔通常以天、周或者月为单位。可以理解的,根据待分析应用程序的使用周期与使用特点,分析周期的长度的设定不同,相应分析时间点之间的间隔也可能是以年或者小时为单位。每个业务对象对应分析时间点有目标属性特征参数,本实施例中,分析时间点对应的目标属性特征参数的特征参数值为单一目标属性特征参数在相应分析时间点时对应的原始数据。获取业务对象在分析时间点对应的目标属性特征参数的原始数据作为该业务对象在分析时间点对应的目标属性特征参数的特征参数值。

步骤1032,以分析时间点为横坐标,以多个业务对象在分析时间点所对应时刻的目标属性特征参数的参数特征值为纵坐标,形成分别与多个业务对象对应的轨迹特征曲线。

目标属性特征参数的特征参数值可以为原始数据,也可以是通过原始数据经过计算处理之后得到。本实施例中,目标属性特征参数为原始数据。以金融应用程序为例,业务对象每日理财交易金额为原始数据并存储在原始数据库中,当选取待分析的目标属性特征参数为每日理财交易金额时,则可以直接从原始数据库中获取。通过获取分析周期内的各分析时间点对应的目标属性特征参数的特征参数值,以分析时间点为横坐标,以多个业务对象在分析时间点对应的参数特征值为纵坐标,得到分别与各个业务对象对应的轨迹特征曲线。通过从轨迹特征曲线的趋势走向,可以获知业务对象在分析周期内与该目标属性特征参数对应行为的动态变化情况,实现对能够反映业务对象生命周期的使用相应应用程序的的相关数据的精准记录以供分析。

优选的,请参阅图5,为另一实施例所提供的业务对象分类方法,其中,步骤103,获取多个业务对象在分析时间点对应的目标属性特征参数的特征参数值,根据所述特征参数值形成分别与多个业务对象对应的轨迹特征曲线的步骤,包括:

步骤1033,根据目标属性特征参数,分别以分析时间点为基准时间计算预设时间周期内的目标属性特征参数的特征参数值。

本实施例中,目标属性特征参数的特征参数值是通过原始数据计算处理之后得到的,具体为,以分析时间点为基准时间获取预设时间周期内的原始数据进行计算处理后得到,如预设时间周期内的平均理财交易金额。其中,以分析时间点为基准时间确定的预设时间周期包括以分析时间点为起算日的预设时间周期、以分析时间点为终止日的预设时间周期或者以分析时间点之前与之后各设定期限内的预设时间周期。以分析时间点为起算日确定的预设时间周期的具体示例如:以每个月30号为分析时间点之前30天的时间周期;以分析时间点为终止日的预设时间周期的具体示例如:以每月1号为分析时间点之后30天的时间周期;以分析时间点之前与之后各设定期限内的预设时间周期的具体示例如:以每个月5号之前5天及之后10天的时间周期。以金融应用程序为例,当目标属性特征参数为日均理财交易金额,分析时间点为每月1号,预设时间周期为各月对应的天数,则以分析时间点为基准时间对应的目标属性特征参数的特征参数值为月度日均理财交易金额,通过以月为单位对相应月份内对应业务对象的每天理财交易金额进行统计,将计算后得到的各月的日均理财交易金额存储在数据库中,其中计算后得到的各月的日均理财交易金额分别为与各分析时间点对应的特征参数值。

步骤1035,以分析时间点为横坐标,以多个业务对象在分析时间点对应的参数特征值为纵坐标,形成分别与多个业务对象对应的轨迹特征曲线。

通过获取分析周期内的各分析时间点对应的目标属性特征参数的特征参数值,以分析时间点为横坐标,以多个业务对象在分析时间点对应的参数特征值为纵坐标,得到分别与各个业务对象对应的轨迹特征曲线。通过从轨迹特征曲线的趋势走向,可以获知业务对象在分析周期内与该目标属性特征参数对应行为的动态变化情况,,实现对能够反映业务对象生命周期的使用相应应用程序的的相关数据的精准记录以供分析。

请参阅图6,为三个业务对象u1、u2、u3在分析周期t内对应的轨迹特征曲线的示意图,其中u1、u2、u3均为某应用程序的业务对象的业务对象名,以历史时间周期t作为分析周期,其中t0、t1、t2、t3、t4、t5分别表示分析周期t内的分析时间点并通过t0、t1、t2、t3、t4、t5这6个分析时间点将分析周期t划分为五个分析时间段,v0、v1、v2、v3、v4分别表示业务对象的目标属性特征参数的特征参数值得纵轴坐标值,通过获取三个u1、u2、u3分别在分析时间点t0、t1、t2、t3、t4、t5所对应的目标属性特征参数的特征参数值确定出相应的纵坐标值,其中该分析时间点t0、t1、t2、t3、t4、t5所对应的目标属性特征参数的特征参数值可以为通过以上图4所示实施例确定或者通过以上图5所示实施例确定,从而得到该三个业务对象u1、u2、u3的轨迹特征曲线。

优选的,请参阅图7,在另一实施例中,步骤105,对轨迹特征曲线进行聚类分析,将轨迹特征曲线中相似度小于设定值的曲线进行聚类得到聚类结果的步骤包括:

步骤1051,计算每一业务对象任意两个分析时间点之间的轨迹特征曲线与其它业务对象在两个分析时间点之间的轨迹特征曲线的轨迹距离,将轨迹距离小于阈值的曲线进行聚类,分别形成每一业务对象与两个分析时间点对应的聚类集合。

通过比较不同业务对象之间的轨迹特征曲线的距离,以得出业务对象之间的相似度而对业务对象进行聚类。其中每个业务对象对应的轨迹特征曲线包含了该业务对象对应整个分析周期内的目标特征属性特征参数的特征参数值,分析时间点将分析周期切分为多个时间段而相应将轨迹特征曲线切分为多个曲线段,通过分别计算不同业务对象的相同时间段内的曲线段之间的轨迹距离而判断曲线段之间的相似度,将轨迹距离小于阈值的曲线进行聚类,从而根据各个业务对象对应相同两个分析时间点的曲线段之间的相似度而对应分析所述业务对象之间的相似度,实现对业务对象进行分类。

以任意两个分析时间点为ti、tj为例,业务对象ua在分析时间点ti、tj之间的轨迹特征曲线为traaij(a=1,2,3...n),通过计算其它业务对象ub在分析时间点ti、tj对应的轨迹特征曲线trabij(b=1,2,3...n,b≠a)与traaij的轨迹距离,将轨迹距离小于或者等于阈值δ的其它业务对象ub在分析时间点ti、tj对应的轨迹特征曲线trabij增加到业务对象ua的聚类集合中,用表示。其中,任意两个分析时间点ti、tj的设置方式可以为任意相邻的两个分析时间点,也可以为不相邻的两个分析时间点。以每一业务对象ua(a=1,2,3...n)任意两个分析时间点ti、tj的轨迹特征曲线traaij为基础,将其它业务对象对应该两个分析时间点ti、tj的轨迹特征曲线中与traaij的轨迹距离小于或者等于阈值δ的曲线进行聚类形成与该业务对象ua的两个分析时间点ti、tj对应的聚类集合为

步骤1053,重复以上步骤1051,获取每一业务对象在分析周期内预设数量的两个分析时间点分别对应的聚类集合得到聚类结果。

以两个分析时间点为一组,每一业务对象的聚类结果包括预设数量组数的两个分析时间点所分别对应的聚类集合。以业务对象ua的任意两个分析时间点为ti、tj为例,当ti=t1、tj=t2时,通过步骤1051可得到业务对象ua在分析时间点t1、t2之间的聚类集合当ti=t3、tj=t5时,通过步骤1051可得到业务对象ua在分析时间点t3、t5之间的聚类集合得到其中,分析时间点的组数可以根据实际分析需求进行设置,可以选择每一业务对象在分析周期内一组或者多组分析时间点所对应的曲线段分别得到对应的聚类集合形成该业务对象的聚类结果。如,分析周期内的分析时间点的数量为m,分析时间点的集合T={t1,t2,t3,...,tm},可以选取业务对象ua分别在分析时间点t1、t2之间的轨迹特征曲线的聚类集合以及在分析时间点t2、t5之间的轨迹特征曲线的聚类结合作为对应业务对象ua的聚类结果也可以再进一步选取业务对象ua在分析时间点t5、tm之间的轨迹特征曲线的聚类集合形成业务对象ua的聚类结果因此,每一业务对象的聚类结果包括由预设数量组数的两个分析时间点所分别对应的聚类集合,其中每一聚类集合对应为该业务对象在两个分析时间点的轨迹特征曲线与其它业务对象在该两个分析时间点之间的曲线段的聚类。

优选的,通过预设数量组数的两个分析时间点的选取,可以得到所述分析时间点对应时间段内业务对象的目标属性特征参数的特征参数值所反映出来的业务对象使用该应用程序行为的特点,得到每个业务对象在不同时间段内使用该应用程序行为的活跃度情况,确定对应业务对象及同一类型的业务对象群使用该应用程序的生命周期状况。

优选的,请参阅图9,步骤1051,计算每一业务对象任意两个分析时间点之间的轨迹特征曲线与其它业务对象在两个分析时间点之间的轨迹特征曲线的轨迹距离,将轨迹距离小于阈值的曲线进行聚类,分别形成每一业务对象与两个分析时间点对应的聚类集合,包括:

步骤1055,以第一业务对象在任意两个分析时间点之间的轨迹特征曲线为参考曲线。

步骤1056,以第二业务对象在对应两个分析时间点之间的轨迹特征曲线为对比曲线,计算参考曲线与对比曲线之间的轨迹距离,所述第二业务对象为不同于所述第一业务对象的任一业务对象。

步骤1057,当轨迹距离小于或者等于阈值时,将第二业务对象的对比曲线与第一业务对象的参考曲线进行聚类。

步骤1059,将聚类的曲线形成该第一业务对象与两个分析时间点对应的聚类集合。

通过分别以每一业务对象任意两个分析时间点之间的轨迹特征曲线为参考曲线,计算其它业务对象在相同两个分析时间点之间的轨迹特征曲线与该参考曲线之间的轨迹距离,判断轨迹距离的大小而获得与该参考曲线对应的聚类集合。其中,以每一业务对象作为第一业务对象的轨迹特征曲线作为参考曲线,将不同于第一业务对象的其它对象分别作为第二业务对象,将第二业务对象的轨迹特征曲线作为对比曲线,获得每一第一业务对象的聚类集合时可以考虑所有其它用户而得到。通过分别取分析周期内不同两个分析时间点的轨迹特征曲线为参考曲线,从而可获取每一业务对象对应整个分析周期的轨迹特征曲线与其它业务对象的轨迹特征曲线的聚类集合。

在一具体的实施例中,采用基于密度的DBSCAN(Density-Based Spatial Clustering of Applications with Noise)方法业务对象轨迹特征曲线进行聚类分析,定义分析时间点ti对应的目标属性特征参数的特征参数值vi到分析时间点tj对应的目标属性特征参数的特征参数值vj之间的轨迹特征曲线为trai,j,定义业务对象uk在分析时间点ti、tj之间的轨迹特征曲线为请结合参阅图8,以第一业务对象ua在分析时间点ti、tj之间的轨迹特征曲线traaij为参考曲线,以第二业务对象ub在分析时间点ti、tj之间的轨迹特征曲线trabij为对比曲线,定义参考曲线与对比曲线之间的轨迹距离为d,轨迹距离d的计算方式如下:

d(traaij,trabij)=wd+wθθ;

其中,d为垂直距离,θ为轨迹特征曲线traaij与轨迹特征曲线traaij之间的夹角,w、wθ分别为垂直距离和角度距离的权重;

其中,垂直距离d的计算公式为:l⊥1为业务对象ua在分析时间点ti对应的目标属性特征参数的特征参数值vi与在分析时间点tj对应的目标属性特征参数的特征参数值vj的差值;l⊥2为业务对象ub在分析时间点ti对应的目标属性特征参数的特征参数值vi与在分析时间点tj对应的目标属性特征参数的特征参数值vj的差值。

通过计算业务对象ua在分析时间点ti、tj之间的轨迹特征曲线traaij与业务对象ub在分析时间点ti、tj之间的轨迹特征曲线trabij的轨迹距离d(traaij,trabij),将轨迹距离d(traaij,trabij)的计算结果与阈值δ进行比较,当轨迹距离d(traaij,trabij)小于或者等于阈值δ时,则将业务对象ub对应分析时间点ti、tj之间的对比曲线与业务对象ua对应分析时间点ti、tj之间的参考曲线进行聚类形成同一聚类集合,以表示。当轨迹距离d(traaij,trabij)大于阈值δ时,则业务对象ua、业务对象ub对应分析时间点ti、tj之间的曲线不进行聚类。分别以剩余的其它业务对象作为新的第二业务对象ub,分别计算新的第二业务对象ub在分析时间点ti、tj之间的轨迹特征曲线trabij(b=1,2,3...n,b≠a)与第一业务对象分析时间点ti、tj之间的参考曲线traaij之间的轨迹距离d(traaij,trabij),其中,n表述业务对象的数量,通过判断该轨迹距离d(traaij,trabij)与阈值δ的大小,当trabij小于或者等于阈值δ时,将新的第二业务对象对应的曲线trabij增加到第一业务对象在分析时间点ti、tj之间的参考曲线traaij的聚类集合中,直至完成所有业务对象在两个分析时间点ti、tj之间的曲线与第一业务对象ua在两个分析时间点ti、tj之间的参考曲线的聚类,得到业务对象ua对应该两个分析时间点ti、tj的聚类集合

以任意两个分析时间点为一组,根据所选取的待分析组数的分析时间点的选择情况,每一业务对象的聚类结果包括预设数量组数的两个分析时间点所分别对应的聚类集合。如,当业务对象ua的任意两个分析时间点为ti=t1、tj=t2时,可得到业务对象ua在分析时间点t1、t2之间的聚类集合当任意两个分析时间点为ti=t3、tj=t5时,可得到业务对象ua在分析时间点t3、t5之间的聚类集合其中,分析时间点的组数可以根据实际分析需求进行设置,可以选择每一业务对象与分析周期内一组或者多组分析时间点所对应的曲线段为参考曲线而得到的聚类集合形成该业务对象的聚类结果。如,分析周期内的分析时间点的数量为m,分析时间点的集合T={t1,t2,t3,...,tm},可以选取业务对象ua分别在分析时间点t1、t2之间的轨迹特征曲线的聚类集合以及在分析时间点t2、t5之间的轨迹特征曲线的聚类结合作为对应业务对象ua的聚类结果也可以再进一步选取业务对象ua在分析时间点t5、tm之间的轨迹特征曲线的聚类集合形成业务对象ua的聚类结果假设业务对象的数量为n,则相应业务对象集合为U={u1,u2,u3,...,un},通过以上业务对象ua的聚类结果的计算方式,可以得到每一业务对象uk(k=1,2,…n)的轨迹特征曲线的聚类集合trak

优选的,步骤1055,以第一业务对象在任意两个分析时间点之间的轨迹特征曲线为参考曲线的步骤中,以分析周期内每相邻两个分析时间点依次作为任意两个分析时间点。

以业务对象ua在分析周期内每相邻两个分析时间点依次作为任意两个分析时间点,即依次以业务对象ua分别在相邻两个分析时间点(t1、t2)(t2、t3)、(t3、t4)、…(tm-1、tm)之间的轨迹特征曲线为参考曲线,可以分别得到业务对象ua在相邻两个分析时间点(t1、t2)(t2、t3)、(t3、t4)、…(tm-1、tm)之间的曲线的聚类集合从而得到业务对象ua对应整个分析周期T的轨迹特征曲线的聚类集合其中表示业务对象ua在第一个相邻两个分析时间点t1、t2之间的轨迹特征曲线traa12的聚类集合,表示业务对象ua在第二个相邻两个分析时间点t2、t3之间的轨迹特征曲线traa23的聚类集合,表示业务对象ua在第三个相邻两个分析时间点t3、t4之间的轨迹特征曲线traa34的聚类集合,依次类推,表示业务对象ua在第m-1个相邻两个分析时间点tm-1、tm之间的轨迹特征曲线traam-1,m的聚类集合。相应的,通过以上业务对象ua的聚类结果的计算方式,可以得到每一业务对象uk(k=1,2,…n)的轨迹特征曲线的聚类集合trak

优选的,步骤107,根据所述聚类结果对所述业务对象进行分类的步骤之前,还包括:

对聚类结果中的聚类集合的数量进行合并。

通过获取每个业务对象在分析时间周期内任意两个分析时间点对应的聚类集合,以该任意两个分析时间点分别确定一对应时间段,得到每个业务对象在相应时间段上的聚类集合以业务对象数量为n为例,每个时间段包含的聚类集合的数量为n个。以分析周期所包含的分析时间点的数量为m表示,以每相邻两个分析时间点所对应曲线确定聚类集合则每个业务对象包括的聚类集合的数量为m-1个,对应整个分析周期内所包含的聚类集合的数量为K,其中因此当分析周期内的分析时间点过多时,会导致聚类结果中的聚类集合的数量过多,可以通过将两个业务对象在相同时间段上所包含的相同聚类集合的情况对同一分析时间段内的聚类集合进行合并。其中,对于任意ui,uj,如果在任意时间段的聚类集合均相同,可以认为ui,uj是完全相同类型的业务对象。

优选的,请参阅图10,在另一实施例中,步骤107,根据所述聚类结果对所述业务对象进行分类的步骤包括:

步骤1071,获取聚类结果中任意两个业务对象包含相同聚类集合的数量;

步骤1073,当至少两个业务对象包含所相同聚类集合的数量大于设定比例时,将该至少两个业务对象分类至同一类型。

每一业务对象的聚类结果包含该业务对象在分析周期内的不同时间段内的聚类集合,通过每一业务对象的每一聚类集合中包含的曲线段可以得知其它业务对象在该曲线段所对应的时间段内与该业务对象的相似度情况,即当两个业务对象包括相同的聚类集合时,表示该两个业务对象对应该相同聚类集合的时间段内的曲线之间的轨迹距离小于或者等于阈值,从而该两个业务对象在该时间段内使用该应用程序的行为相似度较高。当两个业务对象包含相同的聚类集合的数量大于设定比例时,则表示该两个业务对象对应这些相同的聚类集合的时间段内的曲线之间的轨迹距离都小于或者等于阈值,这些时间段内两业务对象的行为相似度均较高,从而可以找出整体相似度较高的业务对象并将其分类至同一类型。

在一具体的实施例中,每一业务对象对应分析周期内的轨迹特征曲线以表示,其中t=t1,t2,t3,....tm,表示将分析周期t切分为m个分析时间点,f=f1,f2,f3,....fm,表示对应不同分析时间点的曲线段,将分析时间点ti对应的目标属性特征参数的特征参数值用vi表示,通过目标属性特征参数的特征参数值所形成的曲线段的表达式为fi=(vi,ti)。聚类结果中任意两个业务对象包含相同聚类集合的数量表示两个业务对象包含相似度较高的曲线段的数量,当两个业务对象包含相同聚类集合的数量大于设定比例时,表示两个业务对象在分析周期内包含相似度较高的曲线段的数量较多,两个业务对象在分析周期内在不同分析时间点的目标属性特征参数的特征参数值的差值越小,两个业务对象对应分析周期内的轨迹特征曲线整体越相似,用h(f)表示业务对象的分类函数,将业务对象的分类类型用c表示,相应的业务对象分类结果的表达式为c=h(f)。

以两个业务对象的聚类结果中均包含与相同分析时间点ti、tj所对应的聚类集合为例,该两个业务对象的轨迹特征曲线对应分析时间点ti、tj之间的曲线之间的轨迹距离小于阈值,则两业务对象分别对应分析时间点ti、tj的目标属性特征参数的特征参数值fi、fj之间的差值较小,该两业务对象对应该分析时间点ti、tj的时间段内对应该目标属性特征参数基本相同,表示该两业务对象对应该分析时间点ti、tj的时间段具有基本相同行为数据,从而将其划分为同一类型。然后,可进一步根据该同一类型的业务对象在各分析时间点的目标属性特征参数的特征参数值所反映出来的业务对象使用该应用程序的行为特点,确定该类型业务对象的类型,如tj>ti,vj>vi,则相应h(fj)=C1,用C1表示为增长型业务对象,包含该相同聚类集合的业务对象则同为增长型业务对象。

以上实施例所提供的业务对象分类方法,获得业务对象分类结果的过程中,不需要对业务对象类型的定义设置分类规则,也无需对业务对象类型事先进行定义,可根据各业务对象在分析周期内不同分析时间点之间的曲线的聚类情况而对相似度高的业务对象进行自动聚类,按照聚类结果所反映出的业务对象行为属性的相似情况而完成对业务对象的分类以及根据分类后的业务对象共同特征参数值而确定业务对象类型,分类结果更精确,适用于各种不同应用目的的应用程序的业务对象群的分类,得到具有实际指导意义的业务对象分类结果。其中,可以选取不同的目标属性特征参数而快速、准确的得到以该相应目标属性特征参数为分类维度获得的业务对象分类结果,方便从不同维度对业务对象进行分类,分类粒度可以通过改变分析周期、将分析周期切分为分析时间点的数量、及形成每一业务对象的聚类结果时所依据的预设数量的两个分析时间点的数量等进行调节,方便迅速、准确的获取不同粗细分类粒度的业务对象分类结果。

请参阅图11,在另一实施例中,提供了一种业务对象分类系统,包括参数获取模块11、时间划分模块12、曲线形成模块13、聚类分析模块15及分类模块17。参数获取模块11用于获取分析周期内多个业务对象的目标属性特征参数。时间划分模块12用于将分析周期分为通过多个分析时间点划分的分析时间段,曲线形成模块13用于获取多个业务对象在分析时间点对应的目标属性特征参数的特征参数值,根据特征参数值形成分别与多个业务对象对应的轨迹特征曲线。聚类分析模块15用于对轨迹特征曲线进行聚类分析,将轨迹特征曲线中相似度小于设定值的曲线进行聚类得到聚类结果。分类模块17用于根据聚类结果对业务对象进行分类。

优选的,请参阅图12,曲线形成模块模块13包括特征值获取单元131及曲线形成单元132。特征值获取单元131用于获取多个业务对象在分析时间点对应的目标属性特征参数的特征参数值。曲线形成单元132用于以分析时间点为横坐标,以多个业务对象在分析时间点所对应时刻的目标属性特征参数的参数特征值为纵坐标,形成分别与多个业务对象对应的轨迹特征曲线。

请参阅图13,在另一个实施例中,曲线形成模块13包括参数值计算单元133及曲线形成单元135。参数值计算单元133用于根据目标属性特征参数,分别以分析时间点为基准时间计算预设时间周期内的目标属性特征参数的特征参数值。曲线形成单元135用于以分析时间点为横坐标,以多个业务对象在分析时间点对应的参数特征值为纵坐标,形成分别与多个业务对象对应的轨迹特征曲线。

优选的,请参阅图14,聚类分析模块15包括聚类集合单元151及聚类分析单元153。聚类集合单元151用于计算每一业务对象任意两个分析时间点之间的轨迹特征曲线与其它业务对象在该对应两个分析时间点之间的轨迹特征曲线的轨迹距离,将轨迹距离小于阈值的曲线进行聚类,分别形成每一业务对象与该对应两个分析时间点对应的聚类集合。聚类分析单元153用于通过集合形成单元重复以上步骤,获取每一业务对象在分析周期内预设数量的两个分析时间点分别对应的聚类集合得到聚类结果。

优选的,请参阅图15,聚类集合单元151包括参考曲线确定单元155、距离计算单元156、聚类单元157及集合形成单元159。参考曲线确定单元155用于以第一业务对象在任意两个分析时间点之间的轨迹特征曲线为参考曲线。距离计算单元156用于以第二业务对象在该对应两个分析时间点之间的轨迹特征曲线为对比曲线,计算参考曲线与对比曲线之间的轨迹距离,所述第二业务对象为不同于所述第一业务对象的任一业务对象。聚类单元157用于当轨迹距离小于或者等于阈值时,将第二业务对象的对比曲线与第一业务对象的参考曲线进行聚类。集合形成单元159用于将聚类的曲线形成第一业务对象与该对应两个分析时间点对应的聚类集合。

优选的,请参阅图16,分类模块17包括聚类数量获取单元171及分类单元173。聚类数量获取单元171用于获取聚类结果中任意两个业务对象包含相同聚类集合的数量。分类单元173用于当至少两个业务对象包含相同聚类集合的数量大于设定比例时,将该至少两个业务对象分类至同一类型。

上述业务对象分类系统,获得业务对象分类结果的过程中,不需要对业务对象类型的定义设置分类规则,也无需对业务对象类型事先进行定义,可根据各业务对象在分析周期内不同分析时间点之间的曲线的聚类情况而对相似度高的业务对象进行自动聚类,按照聚类结果所反映出的业务对象行为属性的相似情况而完成对业务对象的分类以及根据分类后的业务对象共同特征参数值而确定业务对象类型,分类结果更精确,适用于各种不同应用目的的应用程序的业务对象群的分类,得到具有实际指导意义的业务对象分类结果。其中,可以选取不同的目标属性特征参数而快速、准确的得到以该相应目标属性特征参数为分类维度获得的业务对象分类结果,方便从不同维度对业务对象进行分类,分类粒度可以通过改变分析周期、将分析周期切分为分析时间点的数量、及形成每一业务对象的聚类结果时所依据的预设数量的两个分析时间点的数量等进行调节,方便迅速、准确的获取不同粗细分类粒度的业务对象分类结果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

以上所述实施例仅库达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1