本发明涉及风险评估,尤其涉及一种基于知识图谱的铜精矿进口风险分析方法及系统。
背景技术:
1、近几年,随着我国经济的快速发展,铜需求与消费持续高涨,而铜精矿作为铜冶炼的主要原料,每年需要大量进口才能满足消费需求。
2、进口铜精矿的贸易风险隐藏在生产、存储、运输、交易各个环节中,这些贸易风险体现在进口的铜精矿是否合规、是否符合环保政策以及数量/重量及价格是否存在欺诈、产品品质是否达到合同要求、是否是多矿混合等,如何精准的识别这些风险,是风险预警的难点。目前,海关对于进口铜精矿的风险布控是基于合规强制性要求、历史风险信息等制定的一种分类布控,如何精准反馈铜精矿历史风险信息以及铜精矿关键风险参数信息是识别铜精矿潜在风险的关键。
3、现有技术中,通过人工对每一批次进口的铜精矿的材料进行审查,包括合同、提单、发票、质检单据等铜精矿进口涉及的所有单据,整个审查过程工作量具大、效率低、且人工分析、审查也常常会出现结果不准确、数据出现纰漏等问题,并不能很好的规避上述风险。
4、知识图谱(knowledge graph)是人工智能的重要分支技术,它在2012年由谷歌提出,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单元是“实体—关系—实体”的三元组,其中实体、关系中可包含若干个相关的属性键值对,实体间通过关系相互联结,构成网状的知识结构。知识图谱可以自动构建行业图谱,摆脱原始的人工输入,可以应用于智能搜索、文本分析、机器阅读理解、异常监控、风险控制等场景,达到真正的智能和自动。现有技术中,并未发现针对铜精矿进口风险分析过程中采用知识图谱的技术方案,并且,在铜精矿进口风险分析领域,如何使用各种各样的数据,这也是铜精矿风险分析的一大难点;同时,在针对铜精矿进口风险分析领域,如何高效利用各种复杂繁琐的数据,从而尽可能快的得到风险分析结果也是目前面临解决的一大技术难题。
5、基于此,将知识图谱与铜精矿进口风险分析相结合,通过多种类型数据实现自动快速的对各种数据进行审查、分类、汇总、提取关键信息,自动进行风险分析的研究十分必要。
技术实现思路
1、针对现有技术存在的缺陷,本发明提出一种基于知识图谱的铜精矿进口风险分析方法,具体包括如下步骤:
2、步骤s1,数据采集:从报关系统中获取进口铜精矿的历史报关资料;所述历史报关资料包括历史铜精矿进口的报关单、合同、发票、提单、原产地证、检测报告、历史风险记录;
3、步骤s2,确定关键词:根据所述历史风险记录,确定与所述进口风险相关的关键词;
4、步骤s3,确定实体信息:按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息;
5、步骤s4,确定实体关系:所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系;
6、步骤s5,构建铜精矿进口知识图谱:根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱;
7、步骤s6,待测实体信息获取:对待测进口铜精矿的报关资料进行处理,获取待测实体信息;
8、步骤s7:风险分析:将所述待测实体信息输入所述铜精矿进口知识图谱,输出风险结果。
9、进一步的,步骤s2中,所述关键词包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、收货企业名称、装运船舶名称、重量、支付率、计价周期、税则子目、税率、计价信息、装港铜含量、装港金含量、装港银含量、检测报告中的不合格信息。
10、进一步的,步骤s3中,按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息具体包括:
11、按照信息完整度由高到低对所述历史报关资料中的各个文件进行排序;
12、根据得到的顺序依次对各个文件进行关键词识别,判断在后文件中识别到的关键词是否出现在在先文件中;
13、若在后文件中识别到的关键词已出现在在先文件中,且已获取到所述关键词对应的实体信息,则不再进行在后文件中该关键词对应实体信息的获取;
14、若在后文件中识别到的关键词已出现在在先文件中,但未获取到所述关键词对应的实体信息,则获取在后文件中该关键词对应实体信息;
15、若在后文件中识别到的关键词未出现在在先文件中,则获取在后文件中该关键词对应的实体信息。
16、进一步的,所述信息完整度为所述历史报关资料中不同文件包含的关键词的数量,所述文件中包含关键词的数量越多,所述信息完整度越高;所述文件中包含关键词的数量越少,所述信息完整度越低。
17、进一步的,步骤s5,根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱,具体包括:
18、分别确定与所述商品质量实体关系、经营状况实体关系、信用状况实体关系相关的实体信息;
19、分别确定与所述商品质量实体关系、经营状况实体关系、信用状况实体关系相关的历史风险记录;
20、通过所述商品质量实体关系、经营状况实体关系、信用状况实体关系构建铜精矿进口知识图谱。
21、进一步的,与所述商品质量实体关系相关的实体信息包括:原产国国名、铜矿山名称、生产企业名称、发货人名称、装港铜含量、装港金含量、装港银含量、检测报告中的不合格信息。
22、进一步的,与所述经营状况实体关系相关的实体信息包括:铜矿山名称、生产企业名称、发货人名称、收货人名称、装运船舶名称、税则子目、税率、计价信息、检测报告中的不合格信息。
23、进一步的,与所述信用状况实体关系相关的实体信息包括:铜矿山名称、生产企业名称、发货人名称、装运船舶名称、重量、支付率、计价周期、税则子目、税率、计价信息、检测报告中的不合格信息。
24、一种基于知识图谱的铜精矿进口风险分析系统,使用如上任一项所述的基于知识图谱的铜精矿进口风险分析方法,包括如下模块:
25、数据采集模块:用于从报关系统中获取进口铜精矿的历史报关资料;所述历史报关资料包括历史铜精矿进口的报关单、合同、发票、提单、原产地证、检测报告、历史风险记录;
26、关键词确定模块:与所述数据采集模块连接,用于根据所述历史风险记录,确定与所述进口风险相关的关键词;
27、实体信息确定模块:与所述关键词确定模块连接,用于按照预设顺序识别所述历史报关资料中所述关键词以及所述关键词对应的实体信息;
28、实体关系确定模块:与所述实体信息确定模块连接,所述实体关系包括:商品质量实体关系、经营状况实体关系、信用状况实体关系;
29、铜精矿进口知识图谱构建模块:与所述实体关系确定模块连接,用于根据所述实体信息、所述实体关系、所述历史风险记录,构建铜精矿进口知识图谱;
30、风险分析模块:与所述铜精矿进口知识图谱构建模块连接,用于将所述待测实体信息输入所述铜精矿进口知识图谱,输出风险结果。
31、与现有技术相比较,本发明的有益效果在于:
32、其一,本发明采用知识图谱对铜精矿进口贸易进行风险分析,用简单的框架展示各个环节及历史报关信息的关联,以进口铜精矿历史报关信息及其关联的检验结果为基础数据,扩展、收集、完善进口铜精矿贸易各个环节的中信息,及时给出准确的风险分析结果;
33、其二,本发明通过对大数据进行分析,合理选择关键词,根据关键词确定实体信息,建立实体关系,可使风险预测结果更加客观准确;
34、其三,本发明通过不断对报关资料进行分析选择,最终确定出用于筛选实体的关键词,并根据关键词提取相应实体信息;通过实体信息去确定构建实体关系,确定了用于铜精矿进口风险分析的实体关系:商品质量实体关系、经营状况实体关系、信用状况实体关系,进而提高风险评估的速度和准确率。