本发明涉及人工智能,具体涉及一种针对场外配资账户的多级分类筛查方法和装置。
背景技术:
1、场外配资是证券市场术语,指的是根据账户现有资产成比例提供资金从事证券交易的行为,属于证券市场的场外非法借贷服务。常见的场外配资行为采用出借个人账户的方法,这些证券账户与普通个人证券账户混杂在一起,仅通过交易所以外的系统进行账户管理,缺乏对参与人员的资格审查及风险承受能力判断,提供杠杆的比例也大幅高于普通投资人的交易及承受能力。结果是场外配资吸引了大量以投机为目的的个人投资者。对投资者而言,过大的交易杠杆在市场上涨时放大了合理的收益,激发了投资者的投机冲动;在市场下行时,杠杆放大损失并最终造成投资人账户强制平仓,最终使得投资人承受了超过其能力的损失。这种风险具有隐匿性的特征。当场外配资增大到一定量时,场外配资将加大股市的波动性。
2、针对场外配资的账户识别方法,现有技术曾经探索过基于机器学习的方式,通过对样本的交易、持仓、资金、终端、行情等类型特征进行学习,形成相应特征阈值。目前有商业产品采用本方法。但关于样本方面,极难获取分类、判断都精准和确凿的场外配资账户样本量,样本量小容易出现过拟合,反而预测结果不一定准确;场外配资账户仅通过案件办理才能精准定性,而从其他渠道获取的样本核查手段欠缺、手段不一、判断尺度不一,仅可以称之为疑似场外配资账户,强行将此类不准确的账户作为训练样本,易导致模型越学越不精准。故对此替代方案予以排除。
技术实现思路
1、本发明的目的在于提供一种针对场外配资账户的多级分类筛查方法和装置,筛查高度疑似用于证券市场场外配资的证券账户。
2、根据本发明第一方面,本发明请求保护一种针对场外配资账户的多级分类筛查方法,其特征在于:
3、确定筛查时间与筛查投资者账户的范围,决策筛查策略;
4、获取所述筛查投资者账户的待筛查参数,依据对应的所述筛查策略执行所述待筛查参数的配资筛查,输出所述筛查投资者账户的配资识别结果与判定类型,并存储账户各复合型指标特征值得分及综合得分;
5、依据所述配资识别结果与判定类型进行综合分析,展示探头分析系统前端图表和支持稽查线索分析。
6、进一步的,所述确定筛查时间与筛查投资者账户的范围,决策筛查策略,还包括:
7、所述筛查投资者账户的范围,包括全市场筛查和特定账户筛查;
8、当所述筛查投资者账户的范围为全市场筛查时,采用第一筛查策略;
9、当述筛查投资者账户的范围为特定账户筛查时,采用第二筛查策略。
10、进一步的,所述第一筛查策略,还包括:
11、将待筛查的全市场账户输入筛查配资模型,对所述全市场账户进行样本缩减、行为识别和模式识别,得到第一筛查结果;
12、依据所述第一筛查结果进行多源综合分析与反查配资平台处理,得到第一配资识别结果。
13、进一步的,所述第二筛查策略,还包括:
14、通过重点关注平台和/或网络舆情获取筛查的特定账户名单;
15、对所述特定账户名单进行平台基本信息核查、网站代码核查、交易软件配置文件核查、手机软件抓包核查、手机软件反编译核查和征信关联账户核查,得到特定核查账户名单;
16、对所述特定核查账户名单进行重点终端、号码信息与反查证券账户信息筛查,得到第二特定账户名单;
17、将所述第二特定账户名单输入筛查配资模型,对所述第二特定账户名单进行样本缩减、行为识别和模式识别,得到第二配资识别结果。
18、进一步的,所述获取所述筛查投资者账户的待筛查参数,依据对应的所述筛查策略执行所述待筛查参数的配资筛查,输出所述筛查投资者账户的配资识别结果与判定类型,并存储账户各复合型指标特征值得分及综合得分,具体包括:
19、依据对应的所述筛查策略将所述筛查投资者账户的待筛查参数输入筛查配资模型进行筛查样本缩减,得到第一候选筛查账户;
20、将所述第一候选筛查账户进行账户行为识别,得到候选配资模式识别结果;
21、依据所述候选配资模式识别结果对所述第一候选筛查账户进行配资模式识别,得到配资模式识别结果。
22、进一步的,所述依据对应的所述筛查策略将所述筛查投资者账户的待筛查参数输入筛查配资模型进行筛查样本缩减,得到第一候选筛查账户,还包括:
23、设置考察起止日期等参数;
24、基于投资者分类信息,获取持股市值符合设定阈值的账户;
25、基于上一步骤结果,匹配全市场程序化账户标识,保留剔除程序化交易账户的普通账户和信用账户;
26、基于上一步骤结果,匹配证券交易信息,提取待筛查账户的逐日成交流水;
27、基于上一步骤结果,保留考察期内交易金额高于设定阈值,且交易天数大于设定阈值,且交易频度高于设定阈值的账户;
28、基于上一步骤结果,剔除考察期内t+0交易天数占比高于设定阈值或t+0交易次数占比高于设定阈值或t+0交易金额占比高于设定阈值的账户;
29、基于上一步骤结果,匹配全市场etf申购赎回信息,获取考察期内参与etf套利天数占总交易天数占比高于设定阈值的账户清单作为第一候选筛查账户。
30、进一步的,所述将所述第一候选筛查账户进行账户行为识别,得到候选配资模式识别结果,还包括:
31、基于所述第一候选筛查账户,匹配证券持仓信息、交易日历信息,计算所述第一候选筛查账户逐日持仓总市值;
32、基于所述第一候选筛查账户,匹配证券交易信息、交易日历信息,计算所述第一候选筛查账户逐日交易总金额、交易次数;
33、基于所述第一候选筛查账户,匹配银证转账信息、证券账户与资金账户对应关系信息、交易日历信息,计算所述第一候选筛查账户的逐日银证转入金额、逐日银证转出金额、资金账户余额;
34、基于所述第一候选筛查账户,匹配银证转账信息、证券账户与资金账户对应关系信息、交易日历信息、普通账户及信用账户资金结算信息,计算所述第一候选筛查账户涉及各类终端设备被不同投资者使用次数明细;
35、基于上一步骤结果,统计所述第一候选筛查账户涉及各类终端设备每一个设备被不同投资者使用次数。
36、进一步的,所述将所述第一候选筛查账户进行账户行为识别,得到候选配资模式识别结果,还包括:
37、对所述第一候选筛查账户进行独立型配资模式识别和分仓型配资模式识别;
38、所述独立型配资模式识别包括:
39、基于所述第一候选筛查账户的逐日持仓总市值和逐日银证转入金额,计算考察期内t日至t+1日发生资金单一方向变动,高于设定阈值计分;
40、基于所述第一候选筛查账户的逐日持仓总市值和逐日银证转出金额,计算考察期内t日、t+1日持仓高于设定阈值,且t日至t+2日发生资金单一方向变动,计分;
41、基于所述第一候选筛查账户的资产快速变动和快速清仓统计有资产快速变动情况的账户清单;
42、基于快速变动的账户信息和所述第一候选筛查账户的账户逐日交易信息,获取有快速变动情况的账户逐日交易信息;
43、基于上一步骤结果统计考察期内最大最小交易金额比例高于设定阈值交易标的数量;
44、基于快速变动的账户的结果统计考察期内交易金额差异高于设定阈值的次数的情况;
45、基于所述第一候选筛查账户的逐日交易信息统计账户逐日成交总金额信息;
46、基于上一步骤结果,计算考察期内日间交易金额差异高于设定阈值的次数;
47、基于所述第一候选筛查账户的逐日银证转入金额,计算考察期内日间交易金额差异高于设定阈值的次数;
48、基于各自高于设定阈值的情况,汇总阶段分数高于设定阈值的账户,作为第一候选配资模式识别结果;
49、所述分仓型配资模式识别,还包括:
50、基于所述第一候选筛查账户的账户清单,匹配交易流水信息,得到所述第一候选筛查账户的的交易流水信息;
51、基于所述第一候选筛查账户的交易金额信息,计算考察期内日内标的交易金额差异高于设定阈值的天数、单日最大日交易频度、单日最大交易标的数量;
52、基于所述第一候选筛查账户的交易流水,计算考察期内日内小额交易频度高于设定阈值的天数;
53、基于所述第一候选筛查账户的交易流水,计算考察期内设定时间切片内交易标的数量高于设定阈值的次数;
54、基于所述第一候选筛查账户,匹配持仓信息,得到所述第一候选筛查账户的持仓信息;
55、基于所述第一候选筛查账户的持仓信息,计算所述第一候选筛查账户各自考察期内日内小额持仓标的数量高于设定阈值的天数;
56、基于所述第一候选筛查账户的持仓信息,计算所述第一候选筛查账户的各自考察期内日内最大最小持仓比例高于设定阈值的天数;
57、基于各自高于设定阈值的情况,汇总阶段分数高于设定阈值的账户,作为第二候选配资模式识别结果。
58、进一步的,所述依据所述候选配资模式识别结果对所述第一候选筛查账户进行配资模式识别,得到配资模式识别结果,还包括:
59、汇总所述第一候选配资模式识别结果和第二候选配资模式识别结果,并添加独立型、分仓型标识;
60、基于上一步骤结果,与证券账户与资金账户对应信息匹配获得各账户相应资金账户;
61、基于上一步骤结果,匹配银证转账信息、交易日历信息、普通账户及信用账户资金结算信息,获得考察期内终端使用信息;
62、基于上一步骤结果,统计考察期内交易和银证划转使用ip、mac终端设备数量,并标记交易、转账标识;
63、基于上一步骤结果,分类获取账户考察期内交易和银证划转使用频度最高的mac终端设备,并对比一致性;
64、基于所述第一候选筛查账户的各类终端使用人数信息,统计考察期内交易和银证划转所用mac为多账户共用的情况;
65、基于所述第一候选筛查账户的各类终端使用信息,获取使用ip终端归属地信息;
66、基于上一步骤结果,分类获取账户考察期内交易和银证划转使用频度最高的ip终端设备,并对比一致性;
67、基于所述第一候选筛查账户的各类终端使用人数信息,统计考察期内交易和银证划转所用ip为多账户共用的情况;
68、基于所述第一候选筛查账户的各类终端使用信息,获取交易频度居前的mac设备占比;
69、基于所述第一候选筛查账户的各类终端使用信息,获取交易频度居前的ip设备占比;
70、基于所述第一候选筛查账户的各类终端使用信息、重点关注ip、mac清单,获取使用过重点关注ip、mac的账户;
71、依据独立型和分仓型配资账户的识别策略计算对应的综合得分,得到配资模式识别结果。
72、根据本发明第二方面,本发明请求保护一种针对场外配资账户的多级分类筛查装置,其特征在于,包括:
73、筛查策略确定模块,确定筛查时间与筛查投资者账户的范围,决策筛查策略;
74、分类筛查模块,获取所述筛查投资者账户的待筛查参数,依据对应的所述筛查策略执行所述待筛查参数的配资筛查,输出所述筛查投资者账户的配资识别结果与判定类型,并存储账户各复合型指标特征值得分及综合得分;
75、综合分析模块,依据所述配资识别结果与判定类型进行综合分析,展示探头分析系统前端图表和支持稽查线索分析;
76、所述一种针对场外配资账户的多级分类筛查装置用于执行所述的一种针对场外配资账户的多级分类筛查方法。
77、本发明涉及人工智能技术领域,具体涉及一种针对场外配资账户的多级分类筛查方法和装置,通过划分业务模式,针对“独立型”“分仓型”2种场外配资模式,在设置通用规则基础上进行业务场景化分,扩展考察模式范围,增强筛查针对性,采用复合型指标体系,采用复合型指标组成指标体系,而非简单的指标模式,更加全面、科学、精准,使用科学的筛查流程,综合考虑运算复杂度、数据规模、系统算力等因素,将计算简单、特征典型的指标优先筛查,计算复杂、数据质量不高的指标靠后筛查,综合考虑指标分层的质效,提高模型可操作性,识别精准度高、筛查覆盖度高、运算效率高、筛查时间范围长,将筛查时间范围为近半年,减少随机误差。