业务分类方法、装置、服务器及可读存储介质与流程

文档序号:15749360发布日期:2018-10-26 17:18阅读:131来源:国知局
业务分类方法、装置、服务器及可读存储介质与流程

本说明书实施例涉及互联网技术领域,尤其涉及一种业务分类方法、装置、服务器及可读存储介质。



背景技术:

随着经济全球化进程的加快以及信息网络技术的迅猛发展,互联网金融公司的的底盘核心承载能力正面临前所未有的挑战。众所周知,金融行业领域专业性强,业务发展格局开阔,消费类、贷款类、基金理财类等都有其领域显著的独特属性,并且同类别中不同产品也差异化明显,从发展趋势来看,各类产品都表现出了丰富的多样性和创新性。在竞争激烈的互联网金融大背景下,能否快速支撑业务定制化诉求、匹配业务个性化差异将成为提升企业核心竞争力的重要指标。

从系统层面看,一个成熟的互金架构通常包含业务产品层与核心平台层,业务层包装了丰富的产品种类对外部客户提供金融服务,核心层抽象了通用的原子能力并向上层业务输出底盘支撑。不同架构层都面临根据业务特性制定后续处理流程的问题,这就要求系统设计上能灵活识别业务种类以及同类业务中小范围的个性化需求。



技术实现要素:

本说明书实施例提供及一种业务分类方法、装置、服务器及可读存储介质。

第一方面,本说明书实施例提供一种业务分类方法,包括:

获取并解析待识别业务报文,得到业务对象;

将所述业务对象输入至预先构造的全要素分类决策树,确定业务对象对应的各个要素节点;

根据当前要素节点对业务对象进行规则匹配:若匹配成功则迁移至下一要素节点继续匹配;若匹配失败则将当前要素节点以下的子树进行剪裁,由剪裁后的要素子集构造出子要素分类决策树,并基于所述子要素分类决策树对业务对象进行规则匹配;

若匹配到叶子节点,则确定叶子节点对应的业务类别为分类结果。

第二方面,本说明书实施例提供一种业务分类装置,包括:

业务对象获取单元,用于获取并解析待识别业务报文,得到业务对象;

要素节点确定单元,用于将所述业务对象输入至预先构造的全要素分类决策树,确定业务对象对应的各个要素节点;

业务对象匹配单元,用于根据当前要素节点对业务对象进行规则匹配:若匹配成功则迁移至下一要素节点继续匹配;若匹配失败则将当前要素节点以下的子树进行剪裁,由剪裁后的要素子集构造出子要素分类决策树,并基于所述子要素分类决策树对业务对象进行规则匹配;

分类结果获取单元,用于当匹配到叶子节点时,确定叶子节点对应的业务类别为分类结果。

第三方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述业务分类方法的步骤。

第四方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述业务分类方法的步骤。

本说明书实施例有益效果如下:

可见,本发明实施例通过对输入的业务对象优先按照全要素精确匹配,当全要素匹配失败后对要素节点进行剪裁,再使用剪裁后的要素子集进行匹配,直至决策出叶子节点或要素子集个数为0时终止决策流程。由于对要素节点进行了剪裁,因此对于复杂业务,可抽象出可用于分类的最少要素,并根据最少要素构造决策树,去除了冗余分支,解决了决策树深度高的问题;由于采用了剪裁手段,减少无用匹配要素,提升匹配效率;同时可提高业务接入速度,降低人工介入的成本。

附图说明

图1为本说明书实施例业务分类场景示意图;

图2为本说明书实施例第一方面提供的业务分类方法流程图;

图3为本说明书实施例第一方面提供的业务分类方法实例示意图;

图4为本说明书实施例第一方面提供的业务分类方法实例流程图;

图5为本说明书实施例第二方面提供的业务分类装置结构示意图;

图6为本说明书实施例第三方面提供的服务器结构示意图。

具体实施方式

为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。

本说明书实施例(系统框架说明/附图1)。

请参见图1,为本说明书实施例的业务分类的场景示意图。终端100位于用户侧,与网络侧的服务器200通信。终端100中的业务处理客户端101可以是基于互联网实现用户业务的app或网站,为用户提供业务交易的界面并将业务数据(用户相关数据或交易相关数据)提供给网络侧进行处理;服务器200中的业务分类系统201利用预先训练的模型(例如决策树)用于对客户端101中涉及的业务进行分类。

第一方面,本说明书实施例提供一种业务分类方法,请参考图2,包括步骤s201-s204。

s201:获取并解析待识别业务报文,得到业务对象。

待识别业务报文例如是指用户传输业务数据的数据包。通过解析业务报文,可以得到业务对象。业务对象可以理解为用于表示业务属性的信息,其可以是多个业务要素的集合,以金融类业务为例,业务对象包括但不限于由机构名称、币种、借贷方向、产品代码等业务要素构成的集合。

s202:将业务对象输入至预先构造的全要素分类决策树,确定业务对象对应的各个要素节点。

决策树(decisiontree)是在已知各种情况发生概率的基础上,通过构成决策树来求取概率,评价项目风险,判断可行性的决策分析方法,是直观运用概率分析的一种图解法。运用决策树模型,将业务要素抽象为一个直观的树状结构,可以是二叉树或非二叉树。决策树分类法采用监督学习方式,每组样本都已经确定了要素和类别,每个非叶节点标识一个特征要素上的测试,每个分支代表这个特征要素在某个值域上的输出,而每个叶子节点存放一个类别。使用决策树分类的过程从根节点开始,测试分类项中的特征要素,并按照取值选择输出分支,直到达到叶子节点,将叶子节点存放的类别或者方案作为决策结果。使用决策树需要预先定义好业务要素以及要素取值,构建出分类器后利用分类器对新接入的业务对象进行正确分类。

在一种可选方式中,通过如下方式构建全要素分类决策树:

(1)选取用于区分业务类别的要素集合,并为每个要素分配权值;

(2)按照各个要素权值从大至小,构建出从上至下由各个要素节点组成的全要素分类决策树。

用于区分业务类别的各个要素集合,是指用以标记业务属性的各个信息,以金融类业务为例,要素包括但不限于机构名称、币种、借贷方向、产品代码、事件代码,等。根据各个要素的上下级关系(例如,机构名称级别大于币种、币种级别高于借贷方向……),确定各个要素的权值。然后,再依据权值大小,构建出整个决策树。可以理解,根节点的要素权值最大,依次向下,权值减小,最底层的叶子节点的要素权值最小。

将业务对象输入至全要素分类决策树,确定业务对象对应的各个要素节点的一种具体方式是:从全要素分类决策树的根节点依次向下遍历,确定出业务对象对应的具有上下关系的各个要素节点。例如,对于业务对象{当前机构=网商,币种=cny,方向=借,产品码=p001,事件码=e001},输入全要素分类决策树后,则确定出对应的要素节点包括:当前机构、币种、方向、产品码、事件码。

s203:根据当前要素节点对当前业务对象进行规则匹配:若匹配成功则迁移至下一业务对象对应的要素节点继续匹配;若匹配失败则将当前要素节点以下的子树进行剪裁,由剪裁后的要素子集构造出子要素分类决策树,并基于子要素分类决策树对业务对象进行规则匹配。

在一种可选方式中,根据当前要素节点对业务对象进行规则匹配的方式是:从业务对象中获取当前要素节点的要素权值,并述要素权值输入至预先设定的规则表达式进行匹配。仍以上述业务对象{当前机构=网商,币种=cny,方向=借,产品码=p001,事件码=e001}为例,从级别最高的要素节点(要素权值最大)进行匹配,即从“当前机构”这个要素开始,从上述对象可知,该要素值为“网商”,因此将该要素取值输入至预先设定的规则表达式进行匹配,即与决策树该要素节点的权值进行比较,如果满足,则依次对下一个要素“币种”进行匹配,依次类推;如果当前要素匹配失败,则对当前要素节点以下的子树进行剪裁,例如,如果匹配到“方向”失败,则将其下的要素(“产品码”、“事件码”)节点剪裁掉,仅利用剩下的子要素分类决策树对业务对象进行规则匹配。

s204:若匹配到叶子节点,则确定叶子节点对应的业务类别为分类结果。

参见图3,为本说明书实施例第一方面提供的业务分类方法的一个实例示意图。假设原始决策树如图3所示,再假设待识别业务对象对应的要素节点包括d、h、q。那么,如果d、h、q都匹配成功,将采用叶子节点即q节点的分类节点作为结果。如果d匹配成功,h匹配失败了,则h下面的子树要全部剪裁掉(无需再匹配q)。使用剪裁后的树节点进行再次匹配。再次匹配时,匹配到d节点即为成功,d节点的结果即为最终分类结果。

在实际分类过程中,有可能出现分类失败的情况。如果已经对业务对象对应的所有要素节点进行了规则匹配,但却没有匹配到叶子节点,则可确认业务分类失败。此时,可以通过对规则表达式或全要素分类决策树的要素节点构成进行修正的方式,来改善下一次对该类业务的匹配效果。

参见图4,为本说明书实施例第一方面提供的业务分类方法的一个实例的流程图。其实现过程包括:

s401、选取要素:预先按领域知识选取出可区分业务类别的决策要素集合,并为每个要素分配不同权重;

s402、构造决策树:按权重降序的方式对决策要素编排,以最大权重的要素作为根节点,按根节点的要素取值构造分支表达式,再以次大权重要素作为第二层节点,并按取值构造第二层分支表达式,以此类推,最终形成包含全部要素的决策树模型;

s403、输入业务对象:准备上下文环境,将待识别的业务对象输入至分类决策树中;

s404、获取要素取值:从根节点依次向下遍历,获取当前节点要素,并从业务对象中获取该要素对应的取值;

s405、匹配表达式:将业务对象的要素取值作为条件,输入至预先设定的分支表达式进行匹配计算。若要素取值完全满足表达式则匹配成功,成功后迁移至下一要素节点继续匹配;若要素取值不满足表达式,则执行s406、将该要素节点以下的子树全部剪裁,以要素子集构造出新的决策树,重新匹配;

s407、获取决策结果:当流程匹配到叶子节点或要素子集个数为0时终止决策过程,叶子节点即为分类结果,若没匹配到叶子节点则代表业务对象分类失败;对于分类失败的情况通常需要人工介入,修正预先设定的要素或分支表达式。

可见,本发明实施例通过对输入的业务对象优先按照全要素精确匹配,当全要素匹配失败后对要素节点进行剪裁,再使用剪裁后的要素子集进行匹配,直至决策出叶子节点或要素子集个数为0时终止决策流程。由于对要素节点进行了剪裁,因此对于复杂业务,可抽象出可用于分类的最少要素,并根据最少要素构造决策树,去除了冗余分支,解决了决策树深度高的问题;由于采用了剪裁手段,减少无用匹配要素,提升匹配效率;同时可提高业务接入速度,降低人工介入的成本。

第二方面,基于同一发明构思,本说明书实施例提供一种业务分类装置,请参考图5,包括:

业务对象获取单元501,用于获取并解析待识别业务报文,得到业务对象;

要素节点确定单元502,用于将所述业务对象输入至预先构造的全要素分类决策树,确定业务对象对应的各个要素节点;

业务对象匹配单元503,用于根据当前要素节点对业务对象进行规则匹配:若匹配成功则迁移至下一要素节点继续匹配;若匹配失败则将当前要素节点以下的子树进行剪裁,由剪裁后的要素子集构造出子要素分类决策树,并基于所述子要素分类决策树对业务对象进行规则匹配;

分类结果获取单元504,用于当匹配到叶子节点时,确定叶子节点对应的业务类别为分类结果。

在一种可选方式中,所述业务对象匹配单元503具体用于:从所述业务对象中获取所述当前要素节点的要素权值,并将所述要素权值输入至预先设定的规则表达式进行匹配。

在一种可选方式中,所述要素节点确定单元502具体用于:从所述全要素分类决策树的根节点依次向下遍历,确定出业务对象对应的具有上下关系的各个要素节点。

在一种可选方式中,还包括:决策树构建单元505;所述决策树构建单元505包括:

要素处理单元5051,用于选取用于区分业务类别的要素集合,并为每个要素分配权值;

要素节点连接单元5052,用于按照各个要素权值从大至小,构建出从上至下由各个要素节点组成的全要素分类决策树。

在一种可选方式中,还包括:

业务分类失败确认单元506,用于确定是否已对业务对象对应的所有要素进行了规则匹配,若是,且没有匹配到叶子节点,则确认业务分类失败。

在一种可选方式中,还包括:

修正单元507,用于修正用于对业务对象进行规则匹配的规则表达式,或者,修正所述全要素分类决策树的要素节点构成。

第三方面,基于与前述实施例中业务分类方法同样的发明构思,本发明还提供一种服务器,如图6所示,包括存储器604、处理器602及存储在存储器604上并可在处理器602上运行的计算机程序,所述处理器602执行所述程序时实现前文所述业务分类方法的任一方法的步骤。

其中,在图6中,总线架构(用总线600来代表),总线600可以包括任意数量的互联的总线和桥,总线600将包括由处理器602代表的一个或多个处理器和存储器604代表的存储器的各种电路链接在一起。总线600还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口606在总线600和接收器601和发送器603之间提供接口。接收器601和发送器603可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器602负责管理总线600和通常的处理,而存储器604可以被用于存储处理器602在执行操作时所使用的数据。

第四方面,基于与前述实施例中业务分类方法的发明构思,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述业务分类方法的任一方法的步骤。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。

显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1