一种提高商户拓展成功率的筛选系统的制作方法

文档序号:32052664发布日期:2022-11-04 18:51阅读:86来源:国知局
一种提高商户拓展成功率的筛选系统的制作方法

1.本发明涉及一种数据筛选系统,通过该筛选系统能够从海里客户中挑选出目标客户以达到提高商户拓展成功率的目的。


背景技术:

2.商户拓展指的是外勤通过各种方法,将商户发展为公司客户的过程。传统的商户拓展方式是:商户的来源为客户转介绍、日常扫街、电话营销、调研问卷等等。外勤从大量用户群体中,寻找目标客户,时间成本、人力成本巨大,往往还得不到预期的拓展效果。因此,我们目前要做的工作是。
3.近年来,随着移动互联网和移动支付的快速发展,涌现出了大批的商户群体,面对如此繁多,良莠不齐的商户。采用传统的诸如日常扫街、客户转介绍、电话营销等商户拓展方式,外勤人员往往疲于奔走,但对新客拿不准、无从下手,找不到精准客群,往往收效甚微。如何从大量的商户里挑选优质的商户,如何准确的定位到目标客户,如何减少人力、时间成本同时提高商户拓展效果,这都成为当前迫切需要解决的问题。传统的商户拓展方法,需要依托人工和一些规则的方法从海量的商户中提取可拓展商户,严重依赖依托于业务经验和行业经验,往往提取的商户数量仍非常巨大,商户的质量往往也是层次不齐。
4.为了实现数据筛选,目前通常采用以下三种方式:
5.1)人工筛选
6.针对业务方归集的外部商户工商信息:如,商户名称、商户地址、商户经纬度、法人名称、法人手机号和营业执照等信息,业务人员根据行业规则和自身业务经验,对外部商户进行筛选。该方式主要高度依赖业务人员经验判断、核查,不仅效率低下,覆盖场景单一,时间、人力成本较高。
7.2)规则引擎
8.由行业成员组成专家团队,结合行业规则和长期的业务积累,共同制定一系列规则条件,业务人员根据这些规则,在大数据平台可配置任务,定期自动筛选外部商户。该方法,规则明确,可配置定期自动执行,大大节约了人力和时间成本,但规则往往比较局限,筛选后的商户数量仍较大、可拓展商户成功率仍较低。
9.3)机器学习
10.通过商户提供的数据训练模型,从而对商户进行预测。该方法,能够根据训练数据从多维度对商户进行分析和预测,节约了规则制定成本,解决了商户拓展场景单一的问题。但目前外部商户提供的数据有限,只有部分的工商信息,与商户的日常行为习惯息息相关的业务数据、交易数据目前无法获得。并且外部商户没有是否可发展为目标商户的标签信息,这为模型的训练和优化带来了极大挑战。


技术实现要素:

11.本发明要解决的技术问题是:克服商户拓展效率低下,成功率低等问题,满足在大
数据量、多维度信息和准实时场景下的应用需求。
12.为了解决上述技术问题,本发明的技术方案是提供了一种提高商户拓展成功率的筛选系统,其特征在于,包括:
13.外部商户信息归集系统:用于归集外部商户的外部商户数据,外部商户数据至少包括商户名称、商户经纬度坐标、法人手机号和所属区域信息;
14.银商商户管理系统:用于存储银商内部存量商户的内部商户数据,内部商户数据至少包括商户名称、商户所属行业类别、商户经纬度坐标、法人手机号和所属区域信息;
15.银商新清分交易流水系统:用于收集并汇总银商内部存量商户的交易数据;
16.大数据平台:在大数据平台中构建定时工作流,使得大数据平台能够定时拉取外部商户数据文件、内部商户数据文件以及交易数据文件;
17.银商机器学习平台/关联图谱平台:与大数据平台整合,其计算资源和存储资源与大数据平台共享;银商机器学习平台/关联图谱平台通过御风筛选算法系统,从所有外部商户中筛选出价值较高、可能性较大的实体候选商户,并将筛选结果推送、保存至商户拓展系统数据库;
18.商户拓展系统数据库:用于保存银商机器学习平台/关联图谱平台获得的实体候选商户筛选结果,并向上层应用系统提供结果查询服务;上层应用系统向商户拓展系统数据库发送查询请求,商户拓展系统数据库所提供的查询服务响应该查询请求后,向上层应用系统反馈查询到的与当前查询请求相匹配的可拓展的实体候选商户;
19.上层应用系统:相关业务人员在上层应用系统上设置查询条件,上层应用系统基于查询条件生成查询请求,并将该查询请求发送给商户拓展系统数据库,商户拓展系统数据库响应查询请求后,再由上层应用系统接收、显示由商户拓展系统数据库反馈的查询结果,基于查询结做业务拓展。
20.优选地,还包括ftp文件存储系统:用于存储从外部商户信息归集系统推送过来的外部商户数据文件;
21.所述外部商户信息归集系统归集的所述外部商户数据定时向ftp文件存储系统推送,所述大数据平台定时从ftp文件存储系统拉取所述外部商户数据文件。
22.优选地,还包括数据库,所述大数据平台对所述外部商户数据、所述内部商户数据以及所述交易数据进行清洗后,将所有数据导入数据库。
23.优选地,所述御风筛选算法系统包括商户行业评分计算模块、商户价值分析模块以及优质商户推荐模块,其中:
24.商户行业评分计算模块:根据内部商户数据,提取内部存量商户所在行业类别的关键词,依据所属行业类别为每个关键词设定不同的行业词权重;提取每个外部商户的外部商户数据的关键词,计算不同行业类别所对应的同一个外部商户的所有关键词的行业词权重的和作为外部商户属于各个行业的得分,基于得分获得每个外部商户所属的行业,并赋予每个外部商户对应的行业标签;
25.商户价值分析模块通过聚类算法,对外部商户进行商户群划分以及对同类别属性进行预测,最终分别估算待拓展的外部商户的经营状况;
26.优质商户推荐模块利用关联图谱等技术,深度挖掘外部商户与内部存量商户的潜在关联,已识别被行业评分子模块保留的外部商户中的潜在商户;同时,优质商户推荐模块
利用代理手机标识和连锁商户,更进一步从外部商户中筛选符合商户拓展的优质商户。
27.优选地,所述商户行业评分计算模块进一步包括行业词权重计算子模块以及行业评分子模块,其中:
28.行业词权重计算子模块的实现包括以下步骤:
29.步骤101、将内部存量商户划分为不同行业类别;
30.步骤102、对于每个行业类别下的所有内部存量商户,利用结巴分词对每个内部存量商户的商户名称进行分词处理,获得每个行业类别下的所有候选关键词;
31.步骤103、计算各行业类别下每个候选关键词的词比,当前行业类别下当前候选关键词的词比=当前候选关键词的词频/属于当前行业类别的所有内部存量商户的数量;
32.步骤104、过滤各行业类别下词比小于预设阈值的所有候选关键词;
33.步骤105、剔除各行业类别下与非行业高频词匹配的候选关键词,得到最终的关键词,本实施例中,非行业高频词由人工定义,比如可以将商户名称中所包含的省市、公司企业名称等定义为非行业高频词;
34.步骤106、为每个关键词设定与行业类别相对应的行业词权重,当前关键词与当前行业类别相对应的行业词权重越大则当前关键词属于当前行业类别的概率越大;
35.行业评分子模块的实现包括以下步骤:
36.步骤201、获得当前外部商户的商户名称,利用结巴分词对商户名称进行分词处理,获得当前商户名称所对应的候选关键词;
37.步骤202、将候选关键词与非实体商户关键词相匹配,若匹配成功,则将当前外部商户作为非实体商户剔除,若匹配失败,则进入步骤203;
38.步骤203、剔除候选关键词中与非行业高频词匹配的候选关键词,获得最终的关键词;
39.步骤204、将当前外部商户的关键词与行业词权重计算子模块获得的各行业类别下内部存量商户的关键词相匹配,将匹配的内部存量商户的关键词对应于不同行业类别的行业词权重赋予当前外部商户的关键词;
40.步骤205、计算同一行业类别下当前外部商户的所有关键词的行业词权重和,将最大行业词权重和所对应的行业类别作为当前外部商户所属的行业类别,并赋予当前外部商户对应的行业标签;
41.被行业评分子模块保留的外部商户及获得的对应的行业标签作为实体候选商户筛选结果保存在商户拓展系统数据库。
42.优选地,所述商户价值分析模块的实现包括以下步骤:
43.步骤301、提取所有内部存量商户的经纬度坐标以及所属区域信息,本实施例中,所属区域信息为区县编码信息;
44.步骤302、利用聚类算法对同一所属区域下所有内部存量商户的经纬度坐标做聚类,获得每个所属区域所对应的聚类算法模型,聚类算法模型中的不同簇代表不同的商户群;
45.步骤303、基于被行业评分子模块保留的外部商户的所属区域信息获得对应的聚类算法模型,再基于外部商户的经纬度坐标获得聚类算法模型中当前外部商户所属的簇,即预测得到当前外部商户所属的商户群;
46.步骤304、获取当前商户群中与当前外部商户所属同一行业类别的所有内部存量商户的历史交易数据,基于内部存量商户的历史交易数据计算当前外部商户的交易数据预测值作为当前外部商户的经营状况估算值,即当前外部商户的商户价值;
47.商户行业评分计算模块所得到的商户价值与被行业评分子模块保留的外部商户关联后,同样作为筛选结果保存在商户拓展系统数据库。
48.优选地,所述优质商户推荐模块包括基于知识图谱的规则匹配查询子模块、代理手机号标识子模块和连锁商户识别子模块,其中:
49.基于知识图谱的规则匹配查询子模块采用neo4j知识图谱框架,存入内部存量商户的商户信息以及对应的法人信息,构造网络图谱;网络图谱中的节点类型有:商户、法人手机号、营业执照号,边的类型有商户-法人手机号、商户-营业执照;基于知识图谱的规则匹配查询子模块每日将新增的外部商户所对应的外部商户数据新增至网络图谱,再通过规则匹配,查询与目前内部存量商户存在共同法人手机号和营业执照的外部商户,查询的规则是:(外部商户)-[营业执照/法人手机号]-(内部存量商户);
[0050]
代理手机号标识子模块对内部存量商户和外部商户的所有商户的地址和电话号码进行汇总求和,若出现同一地址中的同一号码出现三次及以上时,则代理手机号标识子模块将该号码标记为代理号码;
[0051]
连锁商户识别子模块将商户名称中包含分公司、支公司、分店、分行、支行、集团和连锁的外部商户标记为大型商户;
[0052]
优质商户推荐模块所获得标记结果与被行业评分子模块保留的外部商户关联后,同样作为筛选结果保存在商户拓展系统数据库。
[0053]
本发明提供的一种提高商户拓展成功率的筛选系统采用了自动化的基于银商机器学习平台和关联图谱平台的御风筛选算法。该御风筛选算法通过文本分析法赋予商户权重;通过机器学习中的聚类算法,从空间的角度为商户进行商圈和行业划分,为拓展商户行业和类型提供了依据和保障;根据行业规则和业务人员经验,结合关联图谱技术,可以充分挖掘外部商户与存量商户的潜在关系,大大缩小拓展商户群体数量,发现了更多优质商户。
[0054]
本发明借助人工智能、大数据等技术手段,对海量商户交易数据进行分析和挖掘,提取优质的、符合公司拓展方向的目标群体,作为初步的拓展方向,从而减少推广数量,提高推广质量和准确度,达到降本增效的目的。
[0055]
与现有技术相比,本发明具有如下优点:
[0056]
1、整个商户拓展筛选系统与大数据平台、机器学习学习平台和关联图谱平台完美整合,实现拓展筛选任务的定时执行;
[0057]
2、将机器学习聚类算法和关联图谱技术引入商户的标签计算中,采用画像思维,为实体商户构造多个维度的标签,从多个维度为客户经理提供拓展依据;
[0058]
3、将商户拓展的业务经验与人工智能算法结合,人工智能算法提升了传统业务经验的效率和准确率,传统业务经验为人工智能算法提供科学依据,两者相辅相成,形成良性循环。
附图说明
[0059]
图1为本发明的系统架构图;
[0060]
图2示意了本发明所采用的御风算法主要流程;
[0061]
图3示意了本发明所提供的系统的整体流程;
[0062]
图4示意了行业词权重计算子模块的流程;
[0063]
图5示意了行业评分子模块的流程;
[0064]
图6示意了商户价值分析模块的流程。
具体实施方式
[0065]
下面结合具体实施例进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本技术所附权利要求书所限定的范围。
[0066]
本发明提供了一种提高商户拓展成功率的筛选系统通过科技手段,为外勤在海量的用户数据中,提取优质的、符合公司拓展方向的目标群体,作为初步的拓展方向。并且,通过本发明所提供的技术方案,在移动端、网页端,以列表、地图标记等形式进行位置展示,提高工作效率,节约各类成本。
[0067]
为了达到上述目的,本实施例以如图1所示的提高商户拓展成功率的筛选系统为例对本发明做进一步说明。
[0068]
如图1所示,本实施例公开的一种提高商户拓展成功率的筛选系统包括:
[0069]
外部商户信息归集系统:用于归集外部商户的外部商户数据,本实施例中,外部商户数据为工商信息,主要包括商户名称、商户地址、商户经纬度坐标、法人名称、法人手机号和营业执照等信息。外部商户信息归集系统归集的外部商户的工商信息向ftp文件存储系统推送。本实施例中,外部商户信息归集系统按日推送数据到ftp文件存储系统。
[0070]
ftp文件存储系统:用于存储从外部商户信息归集系统推送过来的外部商户数据文件。
[0071]
银商商户管理系统:用于存储银商内部存量商户的内部商户数据,包括商户名称、商户类别、所属分支机构、经纬度坐标、法人名称、营业执照、法人手机号和商圈等信息。
[0072]
银商新清分交易流水系统:用于收集并汇总银商内部存量商户的交易数据,本实施例中,银商新清分交易流水系统用于收集并汇总银商收单交易明细。
[0073]
大数据平台:在大数据平台中构建定时工作流,使得大数据平台能够从ftp文件存储系统定时拉取外部商户数据文件,能够从银商商户管理系统定时拉取内部商户数据文件,能够从银商新清分交易流水系统定时拉取交易数据文件。大数据平台对外部商户数据、内部商户数据以及交易数据进行清洗后,将所有数据导入数据库。
[0074]
本实施例中,大数据平台将所有数据都导入hive库中。并且,外部商户数据文件、内部商户数据文件以及交易数据文件按日同步到大数据平台。
[0075]
银商机器学习平台/关联图谱平台:用于实现御风筛选算法的建模平台,该御风算法基于传统机器学习算法和图算法实现。银商机器学习平台/关联图谱平台与大数据平台整合,其计算资源和存储资源与大数据平台共享。本实施例中,在当日相关数据都同步到大数据平台之后,银商机器学习平台/关联图谱平台通过御风筛选算法,从所有外部商户中筛选出价值较高、可能性较大的实体候选商户,并将结果推送、保存至商户拓展系统数据库。
[0076]
商户拓展系统数据库:用于保存银商机器学习平台/关联图谱平台获得的实体候选商户筛选结果,并向上层应用系统提供结果查询服务。上层应用系统向商户拓展系统数据库发送查询请求,商户拓展系统数据库所提供的查询服务响应该查询请求后,向上层应用系统反馈查询到的与当前查询请求相匹配的可拓展的实体候选商户。
[0077]
上层应用系统:本实施例中,上层应用系统为已商用的“银商派”,相关业务人员在“银商派”上设置日期等查询条件,“银商派”基于查询条件生成查询请求,并将该查询请求发送给商户拓展系统数据库,商户拓展系统数据库响应查询请求后,再由“银商派”接收、显示由商户拓展系统数据库反馈的查询结果,基于查询结做业务拓展。
[0078]
前述一种提高商户拓展成功率的筛选系统的核心是御风筛选算法,而与之关联的其他系统为银商已有的业务系统或者技术系统,已经成熟,这些系统是商户拓展筛选系统的组成部分,但非核心,下面就御风筛选算法进行介绍。
[0079]
如图2所示,御风筛选算法以机器学习和关联图谱平台为依托,通过大数据平台为纽带连接外部商户信息归集系统以及银商商户管理系统,以天为单位进行数据的更新和优质商户的推送。
[0080]
御风筛选算法主要包括:
[0081]
1)商户行业评分计算模块:根据内部商户数据,提取内部存量商户所在行业的关键词,依据所属行业为每个关键词设定不同的行业词权重;提取每个外部商户的外部商户数据的关键词,计算不同行业所对应的同一个外部商户的所有关键词的行业词权重的和作为外部商户属于各个行业的得分,基于得分获得每个外部商户所属的行业,并赋予每个外部商户对应的行业标签。
[0082]
商户行业评分计算模块进一步包括行业词权重计算子模块以及行业评分子模块。
[0083]
银商商户目前的行业在业务上可以划分为保险、餐饮、大健康、地产、服务、交通出行、金融、零售、批发、汽车、文旅、物流运输、校企和政务公缴这些大类。银商信息数据表里有商户名称和商户的行业类别,由于商户名称一般是短文本,且除去省市等与行业无关的词之后,剩下的一两个词语即可表征行业类别,故此处无需也无法使用机器学习算法,通过统计方法即可判断行业类别。如图4所示,行业词权重计算子模块根据内部存量商户信息计算商户名称中关键词属于不同行业的行业词权重,包括以下步骤:
[0084]
步骤101、将内部存量商户划分为不同行业类别;
[0085]
步骤102、对于每个行业类别下的所有内部存量商户,利用结巴分词对每个内部存量商户的商户名称进行分词处理,获得每个行业类别下的所有候选关键词;
[0086]
步骤103、计算各行业类别下每个候选关键词的词比,当前行业类别下当前候选关键词的词比=当前候选关键词的词频/属于当前行业类别的所有内部存量商户的数量;
[0087]
步骤104、过滤各行业类别下词比小于预设阈值的所有候选关键词;
[0088]
步骤105、剔除各行业类别下与非行业高频词匹配的候选关键词,得到最终的关键词,本实施例中,非行业高频词由人工定义,比如可以将商户名称中所包含的省市、公司企业名称等定义为非行业高频词;
[0089]
步骤106、为每个关键词设定与行业类别相对应的行业词权重,当前关键词与当前行业类别相对应的行业词权重越大则当前关键词属于当前行业类别的概率越大。
[0090]
结合银商商户性质,经营虚拟商品的非实体商户并非银商拓展的主要商户,故本
实施例根据业务经验,定义常规的用于存储非实体商户关键词(比如科技、网络等)的非实体商户关键词库,行业评分子模块删除商户名称中包含非实体商户关键词的外部商户。再根据,行业词权重计算子模块获得的行业词权重计算外部商户的商户名称在不同行业的得分。
[0091]
如图5所示,行业评分子模块的实现流程包括以下步骤:
[0092]
步骤201、获得当前外部商户的商户名称,利用结巴分词对商户名称进行分词处理,获得当前商户名称所对应的候选关键词;
[0093]
步骤202、将候选关键词与非实体商户关键词相匹配,若匹配成功,则将当前外部商户作为非实体商户剔除,若匹配失败,则进入步骤203;
[0094]
步骤203、剔除候选关键词中与非行业高频词匹配的候选关键词,获得最终的关键词;
[0095]
步骤204、将当前外部商户的关键词与行业词权重计算子模块获得的各行业类别下内部存量商户的关键词相匹配,将匹配的内部存量商户的关键词对应于不同行业类别的行业词权重赋予当前外部商户的关键词;
[0096]
步骤205、计算同一行业类别下当前外部商户的所有关键词的行业词权重和,将最大行业词权重和所对应的行业类别作为当前外部商户所属的行业类别,并赋予当前外部商户对应的行业标签。
[0097]
被行业评分子模块保留的外部商户及获得的对应的行业标签作为实体候选商户筛选结果保存在商户拓展系统数据库。
[0098]
经过后期人工测试验证,行业评分子模块对行业划分的准确率为98.2%。
[0099]
2)商户价值分析模块
[0100]
商户价值分析模块通过聚类算法dbscan,对外部商户进行商户群划分(比如同属餐饮行业)以及对同类别属性进行预测(比如同属烧烤类),最终分别估算待拓展的外部商户的经营状况。
[0101]
商户行业评分计算模块所推荐出来的商户符合实体商户的特征,且具有行业划分的结果标签。但是这筛选出来的商户信息对于客户经理来说还较少,在外部商户数量较多的情况下,无法给客户经理提供优先级和价值参考。为了预测商户未来的交易情况,商户价值分析模块采用dbscan算法,将目前银商内部存量商户进行商户群划分,根据商户群内同行业(比如同属餐饮行业)和同类别属性(比如同属烧烤类)分别估算待拓展的外部商户的经营状况,如图6所示,商户价值分析模块的实现流程包括以下步骤:
[0102]
步骤301、提取所有内部存量商户的经纬度坐标以及所属区域信息,本实施例中,所属区域信息为区县编码信息;
[0103]
步骤302、利用dbscan算法对同一所属区域下所有内部存量商户的经纬度坐标做聚类,获得每个所属区域所对应的dbscan模型,dbscan模型中的不同簇代表不同的商户群;
[0104]
步骤303、基于被行业评分子模块保留的外部商户的所属区域信息获得对应的dbscan模型,再基于外部商户的经纬度坐标获得dbscan模型中当前外部商户所属的簇,即预测得到当前外部商户所属的商户群;
[0105]
步骤304、获取当前商户群中与当前外部商户所属同一行业类别的所有内部存量商户的历史交易数据,基于内部存量商户的历史交易数据计算当前外部商户的交易数据预
测值作为当前外部商户的经营状况估算值,即当前外部商户的商户价值。
[0106]
商户行业评分计算模块所得到的商户价值与被行业评分子模块保留的外部商户关联后,同样作为筛选结果保存在商户拓展系统数据库。
[0107]
3)优质商户推荐模块
[0108]
利用关联图谱等技术,深度挖掘外部商户与内部存量商户的潜在关联,已识别被行业评分子模块保留的外部商户中的潜在商户。同时利用代理手机标识和连锁商户等行业知识,更进一步从被行业评分子模块保留的外部商户中筛选符合商户拓展的优质商户。
[0109]
优质商户推荐模块包括基于知识图谱的规则匹配查询子模块、代理手机号标识子模块和连锁商户识别子模块。
[0110]
业务上认为,如果一个商户已经在某银行入网,则当该商户再注册其他分店时,分店成为银行商户的概率较大,根据该业务经验,基于知识图谱的规则匹配查询子模块采用neo4j知识图谱框架,存入内部存量商户以及法人等信息,构造网络图谱。网络图谱中的节点类型有:商户、法人手机号、营业执照号;边的类型有商户-法人手机号、商户-营业执照。基于知识图谱的规则匹配查询子模块每日将新增的外部商户、法人手机号和营业执照以及其关系新增至网络图谱,再通过规则匹配,查询与目前内部存量商户存在共同法人手机号和营业执照的外部商户,查询的规则是:(外部商户)-[营业执照/法人手机号]-(存量商户)。
[0111]
根据客户经理的反馈,外部商户的信息中存在联系人和商户地址为代理的情况,代理手机号标识子模块通过对内部存量商户和外部商户的所有商户的地址和电话号码进行汇总求和,根据业务经验,当出现同一地址中的同一号码出现三次及以上时,代理手机号标识子模块认为该号码为代理号码。
[0112]
由于大型的商户,诸如存在分公司和分店的商户,具有较大的商业价值,故需要识别标记出哪些商户属于这类商户。由业务经验,连锁商户识别子模块将商户名称中包含分公司、支公司、分店、分行、支行、集团和连锁等关键词的外部商户标记为大型商户,客户经理可以优先拓展。
[0113]
优质商户推荐模块所获得标记结果与被行业评分子模块保留的外部商户关联后,同样作为筛选结果保存在商户拓展系统数据库。
[0114]
本发明公开的御风筛选算法涉及到大量的业务经验,并结合人工智能算法,将外部待拓展的实体商户进行筛选,并对该部分的商户加以其他标签,供客户经理参考,以提高商户拓展的成功率和效率,提升商户服务的水平,实现数据赋能。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1