互联网医疗黄牛风险控制的实现方法与流程

文档序号:11234638阅读:633来源:国知局
互联网医疗黄牛风险控制的实现方法与流程

本发明是一种互联网医疗黄牛风险控制,特别涉及一种互联网医疗黄牛风险控制的实现方法。



背景技术:

黄牛党俗称“票贩子”,活跃在各个行业。如商城,其利用商城返利,赠券,购物卡,代金券,代购积分等牟取利益,严重影响商城正常促销效益;如火车票,其利用节假期间火车票的供不应求囤积然后高价卖出,严重影响正常购票出现需要。

医疗挂号领域,因为更加复杂的挂号渠道,极度不平衡的医疗需求,导致部分大医院及专家号源供不应求,为黄牛党的活跃存在创造了条件。特别是越来越多的号源从线下渠道放到线上,为我们提供更便捷的挂号服务之外也为黄牛的蔓延提供了更加适宜的条件。这些线上黄牛往往通过破解软件,批量注册等待手段大量收集号源然后卖给急需就医用户从中谋取暴利。

由于医疗挂号领域的特殊性,专业性的要求,并且目前因为互联网医疗还处在初始探索阶段,暂时还没有比较完善的医疗挂号风控系统解决方案,所以实现互联网医疗挂号领域黄牛风控系统实施方案,为用户能够及时便利挂号就诊有很大的意义。

医疗挂号领域的黄牛主要特点:

第一,职业化,因为医疗资源的紧缺及医疗需求往往比较急迫,从而产生巨大利益吸引黄牛党进入。

第二,分工明确,从软件破解,手机校验,挂号,卖出等一系列流程分工明确。

第三,科技手段,借助网络技术手段使得黄牛隐藏在正常用户中。

医疗挂号领域黄牛风控现状:上去·

第一,通过简单的限制用户挂号次数,提高挂号门槛。

第二,基于这些简单措施一定程度上增加黄牛挂号的难度,但随着黄牛手段越来越多,团伙分工合作,使用现代化网络技术,使得这些简单措施很难起到有效作用。

第三,职业化黄牛反应迅速,经常使得新增加的预防措施很短时间被破解,并作出针对性反击。



技术实现要素:

本发明主要是解决现有技术中存在的不足,对现有黄牛横行的现象得到一种抑制,提升看病现状的一种互联网医疗黄牛风险控制的实现方法。

本发明的上述技术问题主要是通过下述技术方案得以解决的:

一种互联网医疗黄牛风险控制的实现方法,按以下步骤进行:

第一步,获取原始数据:

原始数据包括用户在ios及安卓系统,web端及h5页面的登录,注册,挂号,查询排班,咨询问诊等行为数据,ip库信息,非正常用户手机号码库;

行为数据主要由应用端打点日志,应用数据主要包含用户信息,用户业务信息,用户设备信息;用户信息包括用户登录名,一般是用户手机号,邮箱,以及用户唯一标识,此为系统内部唯一识别码;此用户信息作为风险评估的主要维度,识别黄牛拦截的主要对象;

用户业务数据包括行为标识如登录,注册,查询排班,挂号,针对不同行为事件,有不同业务数据,如查询排班事件的排班信息,下单挂号事件订单信息医院科室等信息;用户设备信息包括用户设备唯一标识,用户ip,用户所用浏览器信息,用户设备信息作为风险评估的重要维度,根据设备及ip等识别大量注册账号等行为;用户行为数据主要由用户操作时,应用系统获取到的用户基本信息,因此具有数据逻辑性强,规范化,标准化,覆盖面广,可信度高相关特点,是非常重要的数据;

ip库信息主要通过购买专业ip库获得,包含ip对应经纬度及地域信息,基站,idc机房ip;此部分信息作为用户行为数据的辅助数据,作为定位用户地理位置,定位用户地域变动,用户是否使用代理,用户ip是否为省统一出口ip相关信息;ip库数据可以更准确的把握用户网络坐标,数据为商业化数据,具有准确,规范,标准,数据变更及时相关特点,可信度较高,是非常重要的辅助数据;

非正常手机号码库是一类在其他平台被标记的有不正常行为的号码,或者出现在一些自动识别验证码的手机号;此部分数据作为用户黄牛风险评估的一个辅助策略,主要通过网络爬虫,商业合作,公共接口相关方法获得;数据相对准确,可以有效降低黄牛生存空间,可以在黄牛未进入医疗平台之前作为预防手段,提前检测出潜在风险用户;

第二步,实时规则引擎:

包括以下步骤:

第2a步,实时数据接入:实时数据为用户行为数据,由应用层将数据发送到分布式消息系统kafka中,风控实时系统消费得实时数据流;

第2b步,数据完善补充:对实时流数据补充ip地域信息,对部分敏感数据加密,对查询排班及下单等行为根据排班号或订单号从业务系统查询订单详细信息,如医院名称,专业名称,科室;

第2c步,导入规则计算规则风险:规则是风控系统风险评估的核心,可以动态更新;规则分为评分规则和拦截规则,评分规则参与风险评分,拦截规则参与风险拦截;评分规则是一系列定义用户某方面行为限制的规定,如我们认为用户在一小时内连续查询排班的次数可以反映出正常用户和非正常用户,那么我们可以把这一约束形成一评分规则;评分规则主要依据线性风险模型设计,主要核心依据为某一行为频次约束,此外是某一行为特征标签约束;

线性风险计算模型:

其中分为五个风险等级,无风险(0)、轻微风险(0,20)、一般风险(20,50)、较大风险(50,80)、高危风险(80,100);风险最高为100,规则定义时需要确定五个参数(a0、a1、a2、a3、a100),分别规定了五个风险等级的频次阈值;通过此模型可以实现人工完全可控,所有规则可解释,可规范;

拦截规则是一系列满足一定频次条件或特征即加入黑名单库的行为限制方面的规定;如用户在一个小时内出现在5个地区以上,加入黑名单库的用户或设备将被拒绝继续访问系统排班查询,挂号,问诊相关行为;

第2d步,规则风险聚合,事件风险计算:对于上一步中此次事件所触发的所有规则及其风险,每触发一种规则则意味着此事件增加一种风险点,意味着此事件风险增加;

事件风险计算公式:score=max(s)(1-q(s))+∑rinrs(s(r)q(s(r))),

其中max(s)为事件触发规则中风险最大的分值,q(s)为风险累加权重因子,s(r)为事件触发规则风险分值;

另外事件风险分值计算遵循风险等级原则及最大风险分值原则,即风控系统中最大风险分值为100;

第2e步,数据入库:落地数据为经过处理的原始数据,规则风险明细数据,事件风险数据,触发拦截黑名单数据;其中触发拦截规则的事件,则其对应的用户及设备加入黑名单库,以此为依据拦截异常行为用户;规则风险明细数据及事件风险数据集成到原始数据中存储;

第三步,用户风险计算引擎:

具体的户风险计算引擎流程,包括以下步骤:

第3a步,用户当天风险点采集:用户当天风险点,是指该用户当天所有行为事件中触发风险评分规则的统计;风险点以规则为基础,统计当天所触发的所有规则,以每种规则对应的最大评分风险分值为此规则该用户的当天风险分值,从而得到该用户当天所有风险点;

第3b步,计算用户当天风险:

用户当天风险计算依据最大风险原则,规则权重模型,风险累计模型计算;

规则权重,是指每种评分规则对此用户维度影响度,如过规则完全反映用户风险大小则权重为1,如果规则和用户风险无关则权重为0,因为规则定义会考虑用户,设备,ip多方面因素,所以可能部分规则并不反映用户风险情况;除此之外,因为规则定义可能偏向某种业务,而对其他业务的参考价值较低;权重为我们手工配置,以此调节此风险分值算法的准确度,计算公式:

ns=s(r)w(r)

其中s为风险分值,w为规则权重,ns为此规则对用户有效风险分值;

风险累计模型,如同事件风险计算策略,用户风险计算采用相同计算模型;计算公式:cs=max(ns)(1-q(ns))+∑rinrs(ns(r)q(ns(r)));

其中max(ns)为用户触发规则中风险最大的分值,q(ns)为风险累加权重因子,cs为当天用户风险分值;

第3c步,历史累计风险:

用户风险按天计算,全量统计,即每天最终得到的风险即为当前用户风险,此风险包含当天的所有风险因子及历史所有风险因子累计结果,历史风险将会随时间衰减,衰减因子f,默认f=0.95,此衰减因子可根据需要确定;我们定义此衰减因子依据是以30天为一周期,30天前产生的用户风险因素将会衰减到最低风险等级:轻微风险(0-20)计算公式是::hs=s*f;

其中s为前一天此用户的最终风险分值,f为经过一天的衰减系数,hs为历史风险在当前的有效风险分值;

第3d步,计算当前用户风险:

用户当前风险包含当天风险,历史有效风险两部分。依据风险累计模型,最大风险分值原则,计算公式:score=max(hs,cs)+min(hs,cs)*q;

其中q为风险累加权重因子,hs为此用户经过衰减计算后的历史风险在当天的风险表征,cs为当天所有风险因子累计后的风险表征,因此我们认为两种风险分值同等程度代表此用户风险状况,取其中最大值,然后累加另一风险分值的累加风险,此计算公式是风险累计模型的简化模型,是在只有两种平等风险因子下的计算模型;

第3e步,数据落地:

用户风险数据将作为实时风险决策中心的风险数据入库,同时作为第二天的用户历史风险数据;

第四步,实时风险决策引擎:

实时风险分为拦截,验证等级,身份验证相关策略;拦截主要依据实时规则引擎中拦截规则生成的黑名单库及用户风险引擎中用户风险分值,综合评定出一部分具有较大风险的事件,向应用系统发出拦截信号,即拒绝用户的查询挂号相关操作;

验证等级是针对一部分风险没有达到拦截的程度,但仍然有一定风险,主要依据用户风险分值按风险大小分等级给出相应难度的验证码,如增加语音及干扰相关条件增大验证难度;

身份验证作为一种辅助策略,对热门专家挂号及有一定风险用户需要用户完善用户信息校验身份;

从以上三个方面出发,封禁一批黄牛账号设备及ip,增加一批疑似黄牛用户的操作难度,同时通过身份信息完善绑定银行卡相关手段达到风控的目的。

与现有医疗领域的黄牛预防的实现方法相比,本申请的医疗黄牛风控实现方法有以下优点:

数据源自用户行为事件数据,可以直观还原用户行为轨迹;

根据用户的历史风险数据,综合用户多种行为数据,综合多种预设规则计算,可以更准确确定用户风险,抓到那些无法直接判断的隐藏黄牛;

系统角度来说:动态添加风控拦截规则,更加便捷快速应对黄牛;风控策略与应用端隔离,减少对应用系统影响。

因此,本发明提供的一种互联网医疗黄牛风险控制的实现方法,拦截规则科学,拦截效果出色。

附图说明

图1是本发明的总流程概况图;

图2是本发明的流程图;

图3是本发明中实时规则引擎流程图;

图4是本发明中线性风险模型;

图5是本发明中用户风险计算引擎的流程图。

具体实施方式

下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。

实施例:如图1、图2、图3、图4和图5所示,一种互联网医疗黄牛风险控制的实现方法,其特征在于按以下步骤进行:

第一步,获取原始数据:

原始数据包括用户在ios及安卓系统,web端及h5页面的登录,注册,挂号,查询排班,咨询问诊等行为数据,ip库信息,非正常用户手机号码库;

行为数据主要由应用端打点日志,应用数据主要包含用户信息,用户业务信息,用户设备信息;用户信息包括用户登录名,一般是用户手机号,邮箱,以及用户唯一标识,此为系统内部唯一识别码;此用户信息作为风险评估的主要维度,识别黄牛拦截的主要对象;

用户业务数据包括行为标识如登录,注册,查询排班,挂号,针对不同行为事件,有不同业务数据,如查询排班事件的排班信息,下单挂号事件订单信息医院科室等信息;用户设备信息包括用户设备唯一标识,用户ip,用户所用浏览器信息,用户设备信息作为风险评估的重要维度,根据设备及ip等识别大量注册账号等行为;用户行为数据主要由用户操作时,应用系统获取到的用户基本信息,因此具有数据逻辑性强,规范化,标准化,覆盖面广,可信度高相关特点,是非常重要的数据;

ip库信息主要通过购买专业ip库获得,包含ip对应经纬度及地域信息,基站,idc机房ip;此部分信息作为用户行为数据的辅助数据,作为定位用户地理位置,定位用户地域变动,用户是否使用代理,用户ip是否为省统一出口ip相关信息;ip库数据可以更准确的把握用户网络坐标,数据为商业化数据,具有准确,规范,标准,数据变更及时相关特点,可信度较高,是非常重要的辅助数据;

非正常手机号码库是一类在其他平台被标记的有不正常行为的号码,或者出现在一些自动识别验证码的手机号;此部分数据作为用户黄牛风险评估的一个辅助策略,主要通过网络爬虫,商业合作,公共接口相关方法获得;数据相对准确,可以有效降低黄牛生存空间,可以在黄牛未进入医疗平台之前作为预防手段,提前检测出潜在风险用户;

第二步,实时规则引擎:

包括以下步骤:

第2a步,实时数据接入:实时数据为用户行为数据,由应用层将数据发送到分布式消息系统kafka中,风控实时系统消费得实时数据流;

第2b步,数据完善补充:对实时流数据补充ip地域信息,对部分敏感数据加密,对查询排班及下单等行为根据排班号或订单号从业务系统查询订单详细信息,如医院名称,专业名称,科室;

第2c步,导入规则计算规则风险:规则是风控系统风险评估的核心,可以动态更新;规则分为评分规则和拦截规则,评分规则参与风险评分,拦截规则参与风险拦截;评分规则是一系列定义用户某方面行为限制的规定,如我们认为用户在一小时内连续查询排班的次数可以反映出正常用户和非正常用户,那么我们可以把这一约束形成一评分规则;评分规则主要依据线性风险模型设计,主要核心依据为某一行为频次约束,此外是某一行为特征标签约束;

线性风险计算模型:

其中分为五个风险等级,无风险(0)、轻微风险(0,20)、一般风险(20,50)、较大风险(50,80)、高危风险(80,100);风险最高为100,规则定义时需要确定五个参数(a0、a1、a2、a3、a100),分别规定了五个风险等级的频次阈值;通过此模型可以实现人工完全可控,所有规则可解释,可规范;

拦截规则是一系列满足一定频次条件或特征即加入黑名单库的行为限制方面的规定;如用户在一个小时内出现在5个地区以上,加入黑名单库的用户或设备将被拒绝继续访问系统排班查询,挂号,问诊相关行为;

第2d步,规则风险聚合,事件风险计算:对于上一步中此次事件所触发的所有规则及其风险,每触发一种规则则意味着此事件增加一种风险点,意味着此事件风险增加;

事件风险计算公式:score=max(s)(1-q(s))+∑rinrs(s(r)q(s(r))),

其中max(s)为事件触发规则中风险最大的分值,q(s)为风险累加权重因子,s(r)为事件触发规则风险分值;

另外事件风险分值计算遵循风险等级原则及最大风险分值原则,即风控系统中最大风险分值为100;

第2e步,数据入库:落地数据为经过处理的原始数据,规则风险明细数据,事件风险数据,触发拦截黑名单数据;其中触发拦截规则的事件,则其对应的用户及设备加入黑名单库,以此为依据拦截异常行为用户;规则风险明细数据及事件风险数据集成到原始数据中存储;

第三步,用户风险计算引擎:

具体的户风险计算引擎流程,包括以下步骤:

第3a步,用户当天风险点采集:用户当天风险点,是指该用户当天所有行为事件中触发风险评分规则的统计;风险点以规则为基础,统计当天所触发的所有规则,以每种规则对应的最大评分风险分值为此规则该用户的当天风险分值,从而得到该用户当天所有风险点;

第3b步,计算用户当天风险:

用户当天风险计算依据最大风险原则,规则权重模型,风险累计模型计算;

规则权重,是指每种评分规则对此用户维度影响度,如过规则完全反映用户风险大小则权重为1,如果规则和用户风险无关则权重为0,因为规则定义会考虑用户,设备,ip多方面因素,所以可能部分规则并不反映用户风险情况;除此之外,因为规则定义可能偏向某种业务,而对其他业务的参考价值较低;权重为我们手工配置,以此调节此风险分值算法的准确度,计算公式:

ns=s(r)w(r)

其中s为风险分值,w为规则权重,ns为此规则对用户有效风险分值;

风险累计模型,如同事件风险计算策略,用户风险计算采用相同计算模型;计算公式:cs=max(ns)(1-q(ns))+∑rinrs(ns(r)q(ns(r)));

其中max(ns)为用户触发规则中风险最大的分值,q(ns)为风险累加权重因子,cs为当天用户风险分值;

第3c步,历史累计风险:

用户风险按天计算,全量统计,即每天最终得到的风险即为当前用户风险,此风险包含当天的所有风险因子及历史所有风险因子累计结果,历史风险将会随时间衰减,衰减因子f,默认f=0.95,此衰减因子可根据需要确定;我们定义此衰减因子依据是以30天为一周期,30天前产生的用户风险因素将会衰减到最低风险等级:轻微风险(0-20)计算公式是::hs=s*f;

其中s为前一天此用户的最终风险分值,f为经过一天的衰减系数,hs为历史风险在当前的有效风险分值;

第3d步,计算当前用户风险:

用户当前风险包含当天风险,历史有效风险两部分。依据风险累计模型,最大风险分值原则,计算公式:score=max(hs,cs)+min(hs,cs)*q;

其中q为风险累加权重因子,hs为此用户经过衰减计算后的历史风险在当天的风险表征,cs为当天所有风险因子累计后的风险表征,因此我们认为两种风险分值同等程度代表此用户风险状况,取其中最大值,然后累加另一风险分值的累加风险,此计算公式是风险累计模型的简化模型,是在只有两种平等风险因子下的计算模型;

第3e步,数据落地:

用户风险数据将作为实时风险决策中心的风险数据入库,同时作为第二天的用户历史风险数据;

第四步,实时风险决策引擎:

实时风险分为拦截,验证等级,身份验证相关策略;拦截主要依据实时规则引擎中拦截规则生成的黑名单库及用户风险引擎中用户风险分值,综合评定出一部分具有较大风险的事件,向应用系统发出拦截信号,即拒绝用户的查询挂号相关操作;

验证等级是针对一部分风险没有达到拦截的程度,但仍然有一定风险,主要依据用户风险分值按风险大小分等级给出相应难度的验证码,如增加语音及干扰相关条件增大验证难度;

身份验证作为一种辅助策略,对热门专家挂号及有一定风险用户需要用户完善用户信息校验身份;

从以上三个方面出发,封禁一批黄牛账号设备及ip,增加一批疑似黄牛用户的操作难度,同时通过身份信息完善绑定银行卡相关手段达到风控的目的。

对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同、替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1