交易数据信息的类别确定方法、装置、设备及存储介质与流程

文档序号:34364054发布日期:2023-06-04 19:01阅读:43来源:国知局
交易数据信息的类别确定方法、装置、设备及存储介质与流程

本技术涉及大数据领域,尤其涉及一种交易数据信息的类别确定方法、装置、设备及存储介质。


背景技术:

1、目前,现有的反洗钱模型的构建仍以基于规则引擎识别的方式为主,传统的规则引擎依赖于人工经验总结的业务规则,需要业务专家定义解释变量。随着互联网金融的发展,业务的种类更加丰富、在线业务占比增多、业务量增大。业务环境的变化导致传统规则引擎无法满足现有需求。

2、因此,亟需一种交易数据信息的类别确定方法,能够更少依赖于人工预先制定的规则,能更好地适应业务环境的变化,减少调整规则模型所需的人工劳动,并且能够识别出洗钱的交易数据信息。


技术实现思路

1、本技术提供一种交易数据信息的类别确定方法、装置、设备及存储介质,能够更少依赖于人工预先制定的规则,能更好地适应业务环境的变化,减少调整规则模型所需的人工劳动,并且能够识别出洗钱的交易数据信息。

2、第一方面,本技术提供一种交易数据信息的类别确定方法,所述方法包括:

3、获取待确定类别的交易数据信息;

4、将所述交易数据信息输入至训练后的类别识别模型,得到第一结果;

5、将所述交易数据信息输入至预设的规则中,得到第二结果;

6、根据所述第一结果和所述第二结果,确定所述交易数据信息的类别;其中,所述训练后的类别识别模型是基于至少一条第一交易数据信息、至少一条第二交易数据信息和预设的规则训练得到的;其中,所述第一交易数据信息表征具备标签的交易数据信息;所述第二交易数据信息表征不具备标签的交易数据信息。

7、在一个示例中,所述根据所述第一结果和所述第二结果,确定所述交易数据信息的类别,包括:

8、若所述第一结果和所述第二结果的差值大于阈值,则对所述第一结果和所述第二结果进行聚类分析,得到聚类结果;

9、根据所述聚类结果,更新所述预设的规则。

10、在一个示例中,所述根据所述聚类结果,更新所述预设的规则,包括:

11、根据所述聚类结果,确定第三数据特征;

12、若所述第三数据特征不在所述预设的规则中,则添加所述第三数据特征至所述预设的规则中。

13、在一个示例中,所述训练后的类别识别模型是基于至少一条第一交易数据信息、至少一条第二交易数据信息和预设的规则训练得到的,包括:

14、基于预设的规则,确定所述第二交易数据信息的标签,并得到第三交易数据信息;其中,所述第三交易数据信息表征具备标签的交易数据信息;

15、将所述第一交易数据信息和所述第三交易数据信息输入至类别识别模型中,以训练所述类别识别模型,并得到训练后的类别识别模型;其中,所述第一交易数据信息表征具备标签的交易数据信息;所述第二交易数据信息表征不具备标签的交易数据信息。

16、第二方面,本技术提供一种类别识别模型的训练方法,包括:

17、获取至少一条第一交易数据信息和至少一条第二交易数据信息;其中,所述第一交易数据信息表征具备标签的交易数据信息;所述第二交易数据信息表征不具备标签的交易数据信息;

18、根据预设的规则,确定所述第二交易数据信息的标签,并得到第三交易数据信息;其中,所述第三交易数据信息表征具备标签的交易数据信息;

19、将所述第一交易数据信息和所述第三交易数据信息输入至类别识别模型中,以训练所述类别识别模型,并得到训练后的类别识别模型;其中,所述训练后的类别识别模型用于确定交易数据信息的类别。

20、在一个示例中,所述将所述第一交易数据信息和所述第三交易数据信息输入至类别识别模型中,以训练所述类别识别模型,包括:

21、提取所述第一交易数据信息的第一数据特征;其中,所述第一数据特征表征所述第一交易数据信息的对象、交易金额和交易频率;

22、提取所述第三交易数据信息的第二数据特征;其中,所述第二数据特征表征所述第三交易数据信息的对象、交易金额和交易频率;

23、将所述第一数据特征和所述第二数据特征输入至类别识别模型中,以训练所述类别识别模型。

24、在一个示例中,所述提取所述第三交易数据信息的第二数据特征,包括:

25、基于所述预设的规则,提取所述第三交易数据信息的第二数据特征。

26、在一个示例中,在所述获取至少一条第一交易数据信息和至少一条第二交易数据信息之后,所述方法还包括:

27、对所述至少一条第一交易数据信息和至少一条第二交易数据信息进行数据处理,得到处理后的交易数据信息。

28、在一个示例中,所述将所述第一数据特征和所述第二数据特征输入至类别识别模型中,以训练所述类别识别模型,包括:

29、基于所述类别识别模型中的遮挡任务,对所述第一数据特征进行处理,得到第一损失函数;

30、基于所述类别识别模型中的语句关系任务,对所述第二数据特征进行处理,得到第二损失函数;

31、基于所述第一损失函数与所述第二损失函数,得到所述类别识别模型的损失函数;

32、基于所述类别识别模型的损失函数,训练所述类别识别模型。

33、在一个示例中,所述基于所述类别识别模型中的语句关系任务,对所述第二数据特征进行处理,得到第二损失函数,包括:

34、基于所述类别识别模型中的语句关系任务,对所述第二数据特征进行处理,得到预测值;

35、基于所述预测值与真实值之间的距离值,确定所述第二损失函数;其中,所述真实值表征所述第二交易数据信息的标签。

36、在一个示例中,所述提取所述第三交易数据信息的第二数据特征,包括:

37、基于所述预设的规则,提取所述第三交易数据信息的第二数据特征。

38、在一个示例中,所述提取所述第一交易数据信息的第一数据特征,包括:

39、基于所述类别识别模型中的卷积层,提取所述第一交易数据信息的特征向量,将所述特征向量作为所述第一数据特征。

40、第三方面,本技术提供一种交易数据信息的类别确定装置,所述装置包括:

41、第一获取单元,用于获取待确定类别的交易数据信息;

42、第一确定单元,用于将所述交易数据信息输入至训练后的类别识别模型,得到第一结果;

43、第二确定单元,用于将所述交易数据信息输入至预设的规则中,得到第二结果;

44、第三确定单元,用于根据所述第一结果和所述第二结果,确定所述交易数据信息的类别;其中,所述训练后的类别识别模型是基于至少一条第一交易数据信息、至少一条第二交易数据信息和预设的规则训练得到的;其中,所述第一交易数据信息表征具备标签的交易数据信息;所述第二交易数据信息表征不具备标签的交易数据信息。

45、在一个示例中,第三确定单元,包括:

46、聚类模块,用于若所述第一结果和所述第二结果的差值大于阈值,则对所述第一结果和所述第二结果进行聚类分析,得到聚类结果;

47、更新模块,用于根据所述聚类结果,更新所述预设的规则。

48、在一个示例中,更新模块,包括:

49、确定子模块,用于根据所述聚类结果,确定第三数据特征;

50、添加子模块,用于若所述第三数据特征不在所述预设的规则中,则添加所述第三数据特征至所述预设的规则中。

51、在一个示例中,所述装置包括:

52、第四确定单元,用于基于预设的规则,确定所述第二交易数据信息的标签,并得到第三交易数据信息;其中,所述第三交易数据信息表征具备标签的交易数据信息;

53、第一训练单元,用于将所述第一交易数据信息和所述第三交易数据信息输入至类别识别模型中,以训练所述类别识别模型,并得到训练后的类别识别模型;其中,所述第一交易数据信息表征具备标签的交易数据信息;所述第二交易数据信息表征不具备标签的交易数据信息。

54、第四方面,本技术提供一种类别识别模型的训练装置,包括:

55、第二获取单元,用于获取至少一条第一交易数据信息和至少一条第二交易数据信息;其中,所述第一交易数据信息表征具备标签的交易数据信息;所述第二交易数据信息表征不具备标签的交易数据信息;

56、第五确定单元,用于根据预设的规则,确定所述第二交易数据信息的标签,并得到第三交易数据信息;其中,所述第三交易数据信息表征具备标签的交易数据信息;

57、第二训练单元,用于将所述第一交易数据信息和所述第三交易数据信息输入至类别识别模型中,以训练所述类别识别模型,并得到训练后的类别识别模型;其中,所述训练后的类别识别模型用于确定交易数据信息的类别。

58、在一个示例中,第二训练单元,包括:

59、第一提取模块,用于提取所述第一交易数据信息的第一数据特征;其中,所述第一数据特征表征所述第一交易数据信息的对象、交易金额和交易频率;

60、第二提取模块,用于提取所述第三交易数据信息的第二数据特征;其中,所述第二数据特征表征所述第三交易数据信息的对象、交易金额和交易频率;

61、训练模块,用于将所述第一数据特征和所述第二数据特征输入至类别识别模型中,以训练所述类别识别模型。

62、在一个示例中,训练模块,包括:

63、第一确定子模块,用于基于所述类别识别模型中的遮挡任务,对所述第一数据特征进行处理,得到第一损失函数;

64、第二确定子模块,用于基于所述类别识别模型中的语句关系任务,对所述第二数据特征进行处理,得到第二损失函数;

65、第三确定子模块,用于基于所述第一损失函数与所述第二损失函数,得到所述类别识别模型的损失函数;

66、训练子模块,用于基于所述类别识别模型的损失函数,训练所述类别识别模型。

67、在一个示例中,第二确定子模块,具体用于:

68、基于所述类别识别模型中的语句关系任务,对所述第二数据特征进行处理,得到预测值;

69、基于所述预测值与真实值之间的距离值,确定所述第二损失函数;其中,所述真实值表征所述第二交易数据信息的标签。

70、在一个示例中,第二提取模块具体用于:

71、基于所述预设的规则,提取所述第三交易数据信息的第二数据特征。

72、在一个示例中,第一提取模块具体用于:

73、基于所述类别识别模型中的卷积层,提取所述第一交易数据信息的特征向量,将所述特征向量作为所述第一数据特征。

74、在一个示例中,该装置还包括:

75、处理单元,用于对所述至少一条第一交易数据信息和至少一条第二交易数据信息进行数据处理,得到处理后的交易数据信息。

76、第五方面,本技术提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;

77、所述存储器存储计算机执行指令;

78、所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面或第二方面所述的方法。

79、第六方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面或第二方面所述的方法。

80、本技术提供的一种交易数据信息的类别确定方法、装置、设备及存储介质,通过获取待确定类别的交易数据信息,将所述交易数据信息输入至训练后的类别识别模型,得到第一结果,将所述交易数据信息输入至预设的规则中,得到第二结果,根据所述第一结果和所述第二结果,确定所述交易数据信息的类别;其中,所述训练后的类别识别模型是基于至少一条第一交易数据信息、至少一条第二交易数据信息和预设的规则训练得到的;其中,所述第一交易数据信息表征具备标签的交易数据信息;所述第二交易数据信息表征不具备标签的交易数据信息。采用本技术方案,能够更少依赖于人工预先制定的规则,能更好地适应业务环境的变化,减少调整规则模型所需的人工劳动,并且能够识别出洗钱的交易数据信息。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1