数据查询方法及相关装置与流程

文档序号:30900337发布日期:2022-07-26 23:21阅读:82来源:国知局
数据查询方法及相关装置与流程

1.本发明涉及金融领域,特别涉及一种数据查询方法及相关装置。


背景技术:

2.目前主要是使用传统的关系型数据库结合复杂的联表sql查询,从而实现个人虚假借款风险线索监测。个人虚假借款风险线索监测涉及的实体多,设计的数据量巨大,虽然可以从sql语句优化和数据库索引优化等方面提升联表查询的速度,但是查询效率仍然低下,实时性不足。


技术实现要素:

3.鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的一种数据查询方法及相关装置。
4.第一方面,一种数据查询方法,包括:
5.建立知识图谱的schema,其中,所述schema涉及多个实体;
6.从数据库中获取银行的业务表,并根据所述业务表构造相应的结构化数据,其中,所述结构化数据涉及多个实体数据;
7.将所述结构化数据与所述schema进行匹配,从而将实体数据导入相应的实体;
8.从所述知识图谱中查询得到目标实体。
9.结合第一方面,在某些可选的实施方式中,所述从数据库中获取银行的业务表,并根据所述业务表构造相应的结构化数据,包括:
10.从数据库中获取银行的多个业务表;
11.将各所述业务表中的数据作为所述实体数据存储至预先建立的csv文件中,从而构造得到所述结构化数据,其中,所述csv文件中预先结构化为不同区域,不同区域用于存储不同的实体数据。
12.结合上一个实施方式,在某些可选的实施方式中,所述多个实体包括:借款合同实体、借款凭证实体、借款人实体、账户实体和交易实体;
13.所述将所述结构化数据与所述schema进行匹配,从而将实体数据导入相应的实体,包括:
14.将所述csv文件中相应的实体数据与所述schema相应的实体进行匹配,并将相应的所述实体数据导入至相应的所述实体。
15.结合上一个实施方式,在某些可选的实施方式中,所述从所述知识图谱中查询得到目标实体,包括:
16.从所述知识图谱中查询获得借款合同当前未到截止日期的借款合同实体;
17.从所述知识图谱中查询获得与所述当前未到截止日期的借款合同实体关联的借款凭证实体;
18.从所述知识图谱中查询获得与所述借款凭证实体关联的借款人实体;
19.从所述知识图谱中查询获得与所述借款人实体关联的账户实体;
20.从所述知识图谱中查询获得与所述账户实体关联的交易实体。
21.结合上一个实施方式,在某些可选的实施方式中,在所述从所述知识图谱中查询获得与所述账户实体关联的交易实体之后,所述方法还包括:
22.判断所述借款人实体关联的所述账户实体的数量是否大于预设数量阈值;
23.若大于,则计算所述借款人实体关联的各所述账户实体的总转入金额,并计算所述借款人实体关联的各所述借款凭证实体的总凭证金额;
24.计算所述总转入金额与所述总凭证金额的比值;
25.判断所述比值是否大于预设比例阈值,若大于,则输出所述借款人实体。
26.结合上一个实施方式,在某些可选的实施方式中,在确定所述比值大于预设比例阈值之后,所述方法还包括:
27.获得与所述借款人实体关联并在所述借款合同签定日期之后发生的交易实体;
28.根据在所述借款合同签定日期之后发生的各所述交易实体,确定所述借款人实体的借款资金流向。
29.第二方面,一种数据查询装置,包括:schema建立单元、数据构造单元、数据导入单元和实体查询单元;
30.所述schema建立单元,用于建立知识图谱的schema,其中,所述schema涉及多个实体;
31.所述数据构造单元,用于从数据库中获取银行的业务表,并根据所述业务表构造相应的结构化数据,其中,所述结构化数据涉及多个实体数据;
32.所述数据导入单元,用于将所述结构化数据与所述schema进行匹配,从而将实体数据导入相应的实体;
33.所述实体查询单元,用于从所述知识图谱中查询得到目标实体。
34.结合第二方面,在某些可选的实施方式中,所述数据构造单元,包括:业务表获取子单元和数据构造子单元;
35.所述业务表获取子单元,用于从数据库中获取银行的多个业务表;
36.所述数据构造子单元,用于将各所述业务表中的数据作为所述实体数据存储至预先建立的csv文件中,从而构造得到所述结构化数据,其中,所述csv文件中预先结构化为不同区域,不同区域用于存储不同的实体数据。
37.第三方面,一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的数据查询方法。
38.第四方面,一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述任一项所述的数据查询方法。
39.借由上述技术方案,本发明提供的一种数据查询方法及相关装置,可以通过建立知识图谱的schema,其中,所述schema涉及多个实体;从数据库中获取银行的业务表,并根据所述业务表构造相应的结构化数据,其中,所述结构化数据涉及多个实体数据;将所述结构化数据与所述schema进行匹配,从而将实体数据导入相应的实体;从所述知识图谱中查
询得到目标实体。由此可以看出,本发明通过知识图谱查询相应的实体,效率较高,实时性较好。
40.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
41.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
42.图1示出了本发明提供的第一种数据查询方法的流程图;
43.图2示出了本发明提供的一种知识图谱的schema的示意图;
44.图3示出了本发明提供的第二种数据查询方法的流程图;
45.图4示出了本发明提供的第三种数据查询方法的流程图;
46.图5示出了本发明提供的第四种数据查询方法的流程图;
47.图6示出了本发明提供的一种数据查询装置的结构示意图;
48.图7示出了本发明提供的一种电子设备的结构示意图。
具体实施方式
49.传统的关系性数据库在进行复杂关系的多层分析时时间复杂度往往较高,通过算法优化不能从根本上解决分析的时效性问题。而图算法配合图数据库是目前比较好的一种解决问题的方向。图数据库系统通过查询分析个人客户的资金活期交易明细,通过客户关联关系获取关联人信息,再通过客户获取账号,并匹配交易对手等信息,通过复杂的关联分析语句,从大量表中找出满足系统监控所需的数据。
50.利用图数据库实现个人虚假借款风险线索监测。用于对发放的个人借款进行信息监测,具体监控规则如下:(1)同一客户发放多笔借款(一户多贷):监测一定期间内发放的有余额的个人借款凭证清单,对存在同一借款人,对应借款凭证超过两笔(含)且借款合同超过两个(含)的情况进行预警。(2)同一还款账号关联多笔借款(一户多还_一级):监测一定期间内发放的有余额的个人借款凭证清单,对存在同一还款账户且对应借款合同超过两个(含)的情况进行预警。(3)多笔借款一人使用(多贷一用_一级):监测一定期间内发放的有余额的个人借款凭证清单,对多笔借款同一收款账户的进行预警。
51.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
52.如图1所示,本发明提供了一种数据查询方法,包括:s100、s200、s300和s400;
53.s100、建立知识图谱的schema,其中,所述schema涉及多个实体;
54.可选的,知识图谱的schema属于本领域的公知概念,本文对此不做过多描述。需要说明的是:知识图谱的schema相当于一个领域内的数据模型,包含了该领域内有意义的概
念类型以及这些类型的属性,任何一个领域的schema主要由类型(type)和属性(property)来表达。即本发明可以建立多个实体的类型(type)和属性(property)。
55.例如,本发明可以建立如图2所示的schema,其中,图2中的“cont”是借款合同实体,“vch”是借款凭证实体,“client”是借款人实体,“card”是账户实体,“transaction”是交易实体。由于借款凭证表中合同号/凭证号仅和借款人的证件号对应,无法直接对应上账号,所以模型是通过借款人实体中转到账号实体。为了区分不同的交易,本发明把交易也列为实体。账号会发起交易,也会作为交易的接收方。
56.可选的,如图2所示,建立的各个实体可以理解为空的实体,每个实体还未导入具有实际意义的数据。后续需要向图2所示的各个实体导入相应的实体数据,例如,对于借款合同实体可以导入具体的合同号,对于借款人实体可以导入具体的借款人姓名,本发明对此不做限制。
57.s200、从数据库中获取银行的业务表,并根据所述业务表构造相应的结构化数据,其中,所述结构化数据涉及多个实体数据;
58.可选的,本发明可以从图数据中获取业务表,并按照商业银行主要相关业务表的结构造结构化数据。将不同的业务表的数据放到同一个csv文件中(为了简化可以将借记卡和信用卡放在一个csv文件),从而构建得到结构化数据,本发明对此不做限制。
59.可选的,构造结构化数据可以有利于后续将结构化数据与schema进行匹配,本发明对此不做限制。
60.例如,如图3所示,结合图1所示的实施方式,在某些可选的实施方式中,所述s200,包括:s210和s220;
61.s210、从数据库中获取银行的多个业务表;
62.s220、将各所述业务表中的数据作为所述实体数据存储至预先建立的csv文件中,从而构造得到所述结构化数据,其中,所述csv文件中预先结构化为不同区域,不同区域用于存储不同的实体数据。
63.可选的,csv文件属于本领域的公知概念,本发明对此不做过多描述。需要说明的是:本发明可以根据实际需要,在csv文件中预先设置不同的区域,本发明对此不做限制。
64.s300、将所述结构化数据与所述schema进行匹配,从而将实体数据导入相应的实体;
65.可选的,如前所述,本发明所建立的schema可以包括多个实体,即便是对于同一种实体也可以建立多个。例如,本发明可以建立多个借款合同实体、多个借款凭证实体,多个借款人实体,多个账户实体和多个是交易实体。通过将结构化数据与schema进行匹配,以便于将实体数据导入对应的实体,并且可以根据结构化数据记录的各个实体数据之间的关系确定导入实体数据后的各个实体之间的关系,本发明对此不做限制。
66.例如,结合上一个实施方式,在某些可选的实施方式中,所述多个实体包括:借款合同实体、借款凭证实体、借款人实体、账户实体和交易实体;
67.所述s300,包括:将所述csv文件中相应的实体数据与所述schema相应的实体进行匹配,并将相应的所述实体数据导入至相应的所述实体。
68.s400、从所述知识图谱中查询得到目标实体。
69.可选的,在构建好上述知识图谱之后,本发明可以通过预先编写好的算法,查询上
述知识图谱,从而查询得到目标实体。例如,可以查询得到目标借款人实体,该目标借款人实体具有如下条件:1.涉及三个或三个以上借款凭证的账户;2.这些账户存在(总转入金额
÷
总凭证金额)》0.8。
70.可选的,本发明对于从所述知识图谱中查询得到目标实体的过程不做限制。例如,如图4所示,结合上一个实施方式,在某些可选的实施方式中,所述s400,包括:s410、s420、s430、s440和s450;
71.s410、从所述知识图谱中查询获得借款合同当前未到截止日期的借款合同实体;
72.可选的,每一份借款合同都会注明相应的还款日期,即可以理解为截止日期。本发明可以从当前还未到截止日期的借款合同出发,确定与该借款合同相关的借款凭证,本发明对此不做限制。
73.s420、从所述知识图谱中查询获得与所述当前未到截止日期的借款合同实体关联的借款凭证实体;
74.可选的,如前所述,同一借款合同可以通过多个借款凭证向借款人打款。即,本发明可以从知识图谱中查询获得与所述当前未到截止日期的借款合同实体关联的多个借款凭证实体,本发明对此不做限制。
75.s430、从所述知识图谱中查询获得与所述借款凭证实体关联的借款人实体;
76.可选的,一个借款合同一般只有一个借款人,即前述查询获得的多个借款凭证实体可以关联同一个借款人实体,本发明对此不做限制。
77.s440、从所述知识图谱中查询获得与所述借款人实体关联的账户实体;
78.可选的,在实际生活中,一个人可以有多张银行卡,即可以拥有多个银行账户。因此,本发明可以查询获得一个借款人实体关联的多个账户实体,本发明对此不做限制。
79.s450、从所述知识图谱中查询获得与所述账户实体关联的交易实体。
80.可选的,在借款合同生效后,借款人的账户可能与其它账户进行交易,为了能够准确确定借款人资金的流向,本发明可以查询借款人的各账户实体关联的交易实体。交易实体中可以记录交易发生时间、交易金额已经交易对方账户等属性信息,本发明对此不做限制。
81.可选的,在查询得到目标实体之后,本发明可以对查询得到的实体进行统计和计算。例如,如图5所示,结合上一个实施方式,在某些可选的实施方式中,在所述s450之后,所述方法还包括:s500、s600、s700、s800和s900;
82.s500、判断所述借款人实体关联的所述账户实体的数量是否大于预设数量阈值;
83.若大于,则执行s600;
84.可选的,本发明对于预设数量阈值不做限制,可以根据实际需要进行设定。例如,预设数量阈值可以设置为“3”,本发明对此不做限制。
85.s600、计算所述借款人实体关联的各所述账户实体的总转入金额,并计算所述借款人实体关联的各所述借款凭证实体的总凭证金额;
86.可选的,本发明可以计算在借款合同生效后相应借款人的所有账户的总转入金额,以及计算相应借款人已收到的总借款金额,即各所述借款凭证实体的总凭证金额,本发明对此不做限制。
87.s700、计算所述总转入金额与所述总凭证金额的比值;
88.s800、判断所述比值是否大于预设比例阈值;
89.若大于,则执行s900;
90.可选的,本发明对于预设比例阈值不做限制,可以根据实际需要进行设定。例如,预设比例阈值可以设置为0.8,本发明对此不做限制。
91.s900、输出所述借款人实体。
92.结合上一个实施方式,在某些可选的实施方式中,在确定所述比值大于预设比例阈值之后,所述方法还包括:步骤1.1和步骤1.2;
93.步骤1.1、获得与所述借款人实体关联并在所述借款合同签定日期之后发生的交易实体;
94.步骤1.2、根据在所述借款合同签定日期之后发生的各所述交易实体,确定所述借款人实体的借款资金流向。
95.可选的,本发明可以通过确定交易实体中记录的交易金额和交易对方账户等属性信息,确定借款资金的流向,本发明对此不做限制。
96.如图6所示,本发明提供了一种数据查询装置,包括:schema建立单元100、数据构造单元200、数据导入单元300和实体查询单元400;
97.所述schema建立单元100,用于建立知识图谱的schema,其中,所述schema涉及多个实体;
98.所述数据构造单元200,用于从数据库中获取银行的业务表,并根据所述业务表构造相应的结构化数据,其中,所述结构化数据涉及多个实体数据;
99.所述数据导入单元300,用于将所述结构化数据与所述schema进行匹配,从而将实体数据导入相应的实体;
100.所述实体查询单元400,用于从所述知识图谱中查询得到目标实体。
101.结合图6所示的实施方式,在某些可选的实施方式中,所述数据构造单元200,包括:业务表获取子单元和数据构造子单元;
102.所述业务表获取子单元,用于从数据库中获取银行的多个业务表;
103.所述数据构造子单元,用于将各所述业务表中的数据作为所述实体数据存储至预先建立的csv文件中,从而构造得到所述结构化数据,其中,所述csv文件中预先结构化为不同区域,不同区域用于存储不同的实体数据。
104.结合上一个实施方式,在某些可选的实施方式中,所述多个实体包括:借款合同实体、借款凭证实体、借款人实体、账户实体和交易实体;
105.所述数据导入单元300,包括:数据导入子单元;
106.所述数据导入子单元,用于将所述csv文件中相应的实体数据与所述schema相应的实体进行匹配,并将相应的所述实体数据导入至相应的所述实体。
107.结合上一个实施方式,在某些可选的实施方式中,所述实体查询单元400,包括:合同查询子单元、凭证查询子单元、借款人查询子单元、账户查询子单元和交易查询子单元;
108.所述合同查询子单元,用于从所述知识图谱中查询获得借款合同当前未到截止日期的借款合同实体;
109.所述凭证查询子单元,用于从所述知识图谱中查询获得与所述当前未到截止日期的借款合同实体关联的借款凭证实体;
110.所述借款人查询子单元,用于从所述知识图谱中查询获得与所述借款凭证实体关联的借款人实体;
111.所述账户查询子单元,用于从所述知识图谱中查询获得与所述借款人实体关联的账户实体;
112.所述交易查询子单元,用于从所述知识图谱中查询获得与所述账户实体关联的交易实体。
113.结合上一个实施方式,在某些可选的实施方式中,所述装置还包括:数量判断单元、金额计算单元、比值计算单元、比值判断单元和输出单元;
114.所述数量判断单元,用于在所述从所述知识图谱中查询获得与所述账户实体关联的交易实体之后,判断所述借款人实体关联的所述账户实体的数量是否大于预设数量阈值;若大于,则触发金额计算单元;
115.所述金额计算单元,用于计算所述借款人实体关联的各所述账户实体的总转入金额,并计算所述借款人实体关联的各所述借款凭证实体的总凭证金额;
116.所述比值计算单元,用于计算所述总转入金额与所述总凭证金额的比值;
117.所述比值判断单元,用于判断所述比值是否大于预设比例阈值,若大于,则触发所述输出单元;
118.所述输出单元,用于输出所述借款人实体。
119.结合上一个实施方式,在某些可选的实施方式中,所述装置还包括:交易实体获得单元和资金流向确定单元;
120.所述交易实体获得单元,用于在确定所述比值大于预设比例阈值之后,获得与所述借款人实体关联并在所述借款合同签定日期之后发生的交易实体;
121.所述资金流向确定单元,用于根据在所述借款合同签定日期之后发生的各所述交易实体,确定所述借款人实体的借款资金流向。
122.本发明提供了一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一项所述的数据查询方法。
123.如图7所示,本发明提供了一种电子设备70,所述电子设备70包括至少一个处理器701、以及与所述处理器701连接的至少一个存储器702、总线703;其中,所述处理器701、所述存储器702通过所述总线703完成相互间的通信;所述处理器701用于调用所述存储器702中的程序指令,以执行上述任一项所述的数据查询方法。
124.在本技术中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
125.本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例
的部分说明即可。
126.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
127.以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1