基于知识图谱的人工智能辅助行政审批方法、系统及终端与流程

文档序号:17996121发布日期:2019-06-22 01:13阅读:843来源:国知局
基于知识图谱的人工智能辅助行政审批方法、系统及终端与流程
本发明涉及人工智能
技术领域
,更为具体地,涉及一种基于知识图谱的人工智能辅助行政审批方法、系统及终端。
背景技术
:为落实国务院对政府公共服务“简政放权”的改革目标,政府在不断推进各种简便与高效的行政审批方式,其中以“互联网+政务”服务为主推形式。但随着审批业务的不断扩大,窗口行政事项的办理压力大幅增加,原因主要如下:1、办件量大,工作人员业务负荷重。审批业务受理量大,工作人员工作强度大幅增加,此外行政审批种类繁多、标准化程度低,办事人员因资料不齐/不符合标准而多次面柜,审核人员重复审核资料,存在大量重复性冗余劳动,降低工作效率,增加沟通成本;2、审批标准化程度不高,种类繁多。行政审批的标准化差,审批种类繁多,窗口工作人员与当事人对“一次性告知”的办事体验易形成不满情绪而使窗口工作人员面临不必要的投诉,从而损伤了办事人与工作人员之间的信任关系。行政审批事项作为市场准入、国家经济监管的重要环节,在审批事项办理中,材料提交的种类、审批标准不一,不同的工作人员有不同的要求标准。办事对象大多数情况下属于初次办理,对行政审批的很多环节、材料、操作步骤都不够熟悉,材料准备不够充分导致多次面柜,加重工作人员的任务负荷,增加办事人员的时间投入;3、审批质量与效率受人的自然特性制约明显。当前行政审批主要由人工来完成各类工作,存在较大的主观性,且收到人的天然特性的制约。例如人的知识水平、业务素质、智力程度会明显影响审批事项的分析、判断结果,因而可能造成不必要的纠纷。此外,人的体力、情绪等天然特性也会在审批过程中影响到审批事项的质量和效率;4、审批过程仍存在大量重复性冗余工作,拖累效率提升。审批流程中存在大量纸质存档文档,存储、管理、查询不便,造成审核期间无法查询历史审核记录,降低工作效率,影响审批质量。审批流程的重复、阻塞现象普遍存在于审批部门。常见的情况有:审批流程复杂、手续繁琐、周期漫长;一些涉及多个部门的审批事项,数据、资料不共享,审批权限、标准不一,造成申报人无所适从,重复乃至反复提供同一材料;造成各地审批大厅存在审批事项承诺件比例大、即办件比例小的问题,在受理审批事项后在部门内部积淀,降低了审批效率。与此同时,人工智能技术和大数据分析技术的发展为行政审批的推进带来了新的思路。一方面,采用人工智能技术进行辅助审批,可以在一定程度上帮助审批人员实现判定准则的标准化,并且可以较好的克服人的天然因素制约。另一方面,行政审批类别多样,但存在一定的规律性,对应办事人员审批事项,需提供材料及咨询事宜等规则明确的工作完全可以用机器替代人工,解放一部分工作人员投入到繁杂的内容审查工作中。行政审批的繁琐是由于法律行政法规对行政审批事项形式和内容要求严格,该部分工作可以通过机器知识储备的智能解答,利用技术解构繁琐步骤,给当事人予以详细释明,推进行政审批事项的公开、透明。知识图谱作为大数据时代下新的知识组织与检索技术,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属值-值对,实体间通过关系相互联结,构成网状的知识结构。经过人机交互技术,获取大量的、计算机可读的知识,实现知识图谱的构建与完善,运用知识图谱的强大信息检索功能进行高效查询。人工智能技术中的图像智能识别技术用以对图像进行对象识别,以识别各种不同模式的目标和对象。对于表格与表格之间相互嵌套、存在水印等问题,现有方法下切分准确度不高,抗噪能力弱。自然语言处理技术是对文本数据进行处理从而使计算机可以理解的一种技术。机器学习用以从数据中自动发现模式。但是,如何将人工智能技术真正融合于行政审批工作中,仍是本领域亟待解决的问题。经过检索发现:申请号为201510487211.7的中国专利申请《一种基于人工智能平台辅助业务办理行政审批的方法》,公开了一种基于人工智能平台辅助业务办理行政审批的方法,行政业务系统通过人工智能平台与请求人交互,人工智能平台确认请求人的身份信息及待办事项后,根据预设的办理条件,提示请求人提供与办理条件相对应的信息材料,当信息材料为实物时,则采集实物的影像数据;当信息材料中的一部分在办理当前的待办事项之前已进行采集并证实,则不再提示请求人再次提供;信息材料被审批合格后,请求人前往办事窗口,将实物与先前选的影像数据进行对比,核实信息材料的真伪,如果为真,则待办事项继续进行至完成。最大限度减少纸质存档,大大提高信息检索的速度、管理的有序性、服务的快捷性;基于大数据分析可提供各类统计数据和高质量的决策支持。该方法通过人工智能平台登录并访问相关部门的行政业务系统,获取请求人的资料,并对相关信息材料的图像数据进行采集,减少纸质存档,大大提高信息检索的速度。该方法的人工智能平台,设置有虚拟办事员,基于大数据分析和知识库,与请求人开展高度拟人的对话式交流,实现辅助业务办理。但该方法的人工智能平台侧重于辅助业务办理,运用的效果和效益受限于各部门的行政业务系统。同时,人工智能平台下设置的知识库,是基于大数据分析根据请求人的信息推测相关度最高的内容,缺乏一定的语义关联和逻辑性,没有对知识库中的数据进行进一步数据分析与挖掘,并且未涉及行政审批环节。目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。技术实现要素:针对现有行政审批中存在的上述不足,本发明的目的是提供一种基于知识图谱的人工智能辅助行政审批方法、系统及终端,充分发挥互联网的优势,借助先进的计算机与人工智能技术,为行政审批高效化、智能化提供技术支撑,辅助窗口工作人员完成事项审核,加快工作人员审核速度,提高审核准确率与工作效率。本发明是通过以下技术方案实现的。根据本发明的一个方面,提供了一种基于知识图谱的人工智能辅助行政审批方法,包括:提取审批规则,运用命名实体抽取方式和关系抽取方式分别对审批规则的命名实体以及实体与实体之间的审批逻辑关系进行抽取,得到审批规则库;基于审批规则库,构建审批本体;抽取审批材料中的审批知识;基于审批本体,从抽取的审批知识中建立审批本体与知识之间的关系,构建审批知识图谱;基于构建的审批知识图谱,根据审批材料的不同审批事项,利用知识图谱的查询功能,进行相关审批知识的获取,并进行自动审批。优选地,所述审批规则的命名实体为构建审批本体提供相关术语,包括如下一项或多项:-申请公司相关实体,包括:申请名称、名称预先核准文号、住所、生产经营地、邮政编码、公司类型、经营范围以及营业期限中的任意一项或任意多项;-人员相关实体,包括法定代表人、监理、董事、经理、财务负责人、股东发起人以及联络员中的任意一项或任意多项;-人员信息相关属性实体,包括姓名、固定电话、移动电话、电子邮箱、身份证类型以及身份证号码中的任意一项或任意多项;所述审批逻辑关系包括如下任意一项或任意多项:-一致性检查,审查申请材料中相关信息的一致性;-完备性检查,审查递交材料是否满足完备性要求;-矛盾性审查,审查申请材料是否违反相应的法律条例;-有效性检查,审查申请材料中信息是否有效;优选地,采用七步法构建审批本体,包括如下步骤:本体需求分析:利用领域内通用的知识概括,为审批材料的自然语言处理提供领域词典,将审批相关知识进行抽取并进行结构化的存储;参考及复用现有本体:没有能够参考及复用的现有本体;罗列重要概念及术语:参考审批材料、审批规则、法律法规,规范标准和/或先验知识,得到重要概念及术语作为审批术语,以审批术语作为本体概念,对存在重复和交叉的本体概念进行剔除,从而进行本体概念的确定,将最终确定的本体概念作为本体类的来源;建立本体框架:通过本体概念之间的关系,确定本体的框架,所述本体的框架包括:审批主体、审批材料、审批要点以及审批依据;其中,所述审批主体为需要审查的对象;所述审批要点为审批主体的需要审批的属性;所述审批材料为需要审批的材料;所述审批依据为审批结果判断的依据;整理本体概念的层次结构:所述审批主体、审批材料、审批要点以及审批依据分别构成一个父类,每一个父类包含若干个子类,每一个子类又可以包含若干个下一层子类,层层类推;添加本体概念之间的关系和限制:所述本体概念之间的关系包括对象属性和数据属性,其中对象属性是指类与类或实例与实例之间的关系,数据属性是指实例的值;对本体概念之间的关系进行限制,得到如下属性关系:通过以上步骤,构建完成本体,对本体进行检验和评价:通过对构建完成的本体实例进行初步的检验和评价,经过反复修改直至达到设定要求,最终形成审批本体。其中,所述初步的检验和评价是按照设定要求进行,设定要求包括:所述构建完成的本体应满足审批要求,所述本体框架中定义的术语、概念、属性应覆盖审批过程所涉及审批主体、审批要点、审批依据、审批材料;所述构建完成的本体应符合本体的构建准则,满足术语、概念定义清晰,满足关系定义完整,满足本体的前后一致性。不满足所述设定要求中的任何一项要求,都要对所述构建完成的本体中定义的术语、概念、属性进一步明确、补充、修改,直至达到所述设定要求,最终形成审批本体。上述初步的检验和评价的过程可以通过人工或计算机来实现。优选地,抽取审批材料中的审批知识,包括:通过ocr技术对审批材料进行文字识别,首先进行块识别,区分出文字区域块,再将文字区域块分别转化为统一的json格式信息;在json格式信息的基础上,采用正则表达式对信息进行审批知识提取。优选地,构建审批知识图谱,包括:对于每一个审批本体中的命名实体,将在审批知识中出现的该命名实体单独创建实例,作为审批本体的实例化,所述审批本体的实例化与审批知识之间的连接关系为信息来源,形成实例化后的审批知识图谱;实例化后的审批知识图谱采用rdf进行存储;实例化过程采用填充知识图谱中的三元组方式,通过create_individual函数实现。优选地,在进行自动审批的步骤中,将审批规则与相应的法律法规进行关联,采用sparql语言,获取知识图谱中的相关审批知识后,根据知识图谱中的审批规则,进行自动审批。优选地,还包括:输出审批结果。所述审批结果包括通过、不通过以及人工审核三种。根据本发明的第二个方面,提供了一种基于知识图谱的人工智能辅助行政审批系统,包括:-审批规则库抽取模块:提取审批规则和法律法规,运用命名实体抽取方式和关系抽取方式分别对审批规则的基本实体以及实体与实体之间的关系进行抽取,得到审批规则库;-审批本体搭建模块:基于所述审批规则库抽取模块抽取的审批规则库构建审批本体,包括术语定义单元、术语属性定义单元以及术语之间基本关系定义单元;-审批知识提取模块:提取审批材料中的属性概念信息及其所对应的属性信息作为审批知识;-基于本体的审批知识图谱构建模块:基于审批本体搭建模块中搭建的审批本体,利用知识图谱的实例化方式,从审批材料中抽取的审批知识中建立知识之间的关系,构建审批知识图谱的实例化,并将实例化后的知识图谱作为审批知识图谱进行存储;-基于知识图谱高效查询的审批模块:利用基于本体的审批知识图谱构建模块构建的审批知识图谱的查询功能,根据审批材料的不同审批事项,从审批知识图谱中提取相应的审批点信息,根据审批规则进行审批,得到审批结果。优选地,所述审批知识图谱以rdf格式进行存储。优选地,所述术语定义单元用于定义法律概念、审核主体和/或审批材料;所述术语属性定义单元用于描述术语自身具有的值;所述术语之间基本关系定义单元用于定义术语之间部分与整体的关系、术语之间的继承关系、术语的实例与术语之间的关系和/或术语的属性关系。根据本发明的第三个方面,提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时可用于执行上述任一所述的方法。根据本发明的第四个方面,提供了另一种终端,包括存储器、处理器及存储在存储器上并可通过处理器运行上述任一所述的系统。优选地,所述的系统可用于执行上述任一所述的方法。与现有技术相比,本发明具有如下有益效果:本发明提供了一种基于知识图谱的人工智能辅助行政审批方法、系统及终端,运用人工智能技术,实现审批判断准则的标准化,实现部分审批材料的智能审批,以及复杂审批点提醒人工注意,有效解放人力资源,降低人力成本,提高审批效率和质量。进一步的,本发明所提供的基于知识图谱的人工智能辅助行政审批方法、系统及终端,可以在审批过程中将审批材料、审批结果、审批记录统一存储管理,运用知识图谱强大的信息检索功能,辅助审批人员开展各类审批工作,提高审批速度。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:图1为本发明一实施例中系统的结构示意图;图2为本发明一实施例中行政审批方法中七步法构建审批本体流程图;图3为本发明一实施例中所提供的行政审批方法中进行自动审批的过程示意图;图4为本发明一实施例中所提供的行政审批方法中采用七步法构建的审批本体框架结构示意图;图5为本发明一实施例中所提供的行政审批方法流程图;图6为本发明一实施例中所提供的行政审批方法中审批本体具有的主要的属性关系示意图;图7为本发明一实施例中所提供的行政审批方法中审核本体框架在protégé中搭建后的部分结构示意图;图8为本发明一实施例中所提供的行政审批方法中建立审批知识图谱时采用的实例化方法示意图;图9为本发明一实施例中新设公司申请材料中的一份公司登记(备案)申请书图表。具体实施方式下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。本发明实施例提供一种基于知识图谱的人工智能辅助行政审批系统,包括五个模块,分别为:审批规则库抽取模块,审批本体搭建模块,审批知识提取模块,基于本体的审批知识图谱构建模块,基于知识图谱高效查询的审批模块。其中:审批规则库抽取模块:提取审批规则和法律法规,运用命名实体抽取方式和关系抽取方式分别对审批规则的基本实体以及实体与实体之间的关系进行抽取。审批规则是智能审批的依据,审批规则库的建立可以为审批本体的构建提供领域专业术语,也可以使审批本体更具有针对性,即使得基于该审批本体的审批知识图谱做到“检查什么就获取什么信息”。这样不仅提高了审批的效率,节省了信息存储的空间,同时因为本体自身的易扩展的性质使之更容易被维护。所述命名实体抽取方式是指整理审批规则的命名实体,所述关系抽取方式是指对审批规则进行逻辑筛选并整理审批事项的审批逻辑。将得到的审批规则加入数据库并进行整理和管理,建立审批规则库。审批本体搭建模块:搭建审批本体,包括术语定义单元、术语属性定义单元以及术语之间基本关系定义单元;其中,术语定义单元用于定义法律概念、审核主体和/或审批材料;术语属性定义单元用于描述术语自身具有的值;术语之间基本关系定义单元用于定义术语之间部分与整体的关系、术语之间的继承关系、术语的实例与术语之间的关系和/或术语的属性关系。知识图谱的构建离不开领域本体(即审批本体)的框架搭建。领域本体(domainontology)是专业性的本体,描述的是特定领域中的概念和概念之间的关系,提供了某个专业学科领域中概念的词表以及概念间的关系,或在该领域里占主导地位的理论。审批本体的搭建主要包括术语的定义、术语属性的定义和术语之间的基本关系的定义。术语是领域中的重要概念,在人工智能辅助行政审批项目中,术语应基本涵盖法律概念、审核主体、审批材料等方面。术语的属性主要描述术语自身具有的各方面的性质,例如审查主体的值、置信度等。术语之间的基本关系可以理解为领域本体框架的基本结构,这些关系多种多样,包括术语之间部分与整体的关系、术语之间的继承关系、术语的实例与术语之间的关系、术语的属性关系等。审批知识提取模块:提取审批材料中的属性概念信息及其所对应的属性信息作为审批知识。审批材料是审批所需知识的载体,但是审批材料可能涉及多种多样的格式,如文本、表格、图片等等,要提高审批效率,首先要对审批知识进行结构化存储。结构化存储审批知识的第一步是提取审批知识,即审批材料中的属性概念信息及其所对应的属性信息。首先通过ocr技术对行政审批中以图片、表格等形式递交的审批材料进行文字识别,转化为json格式。之后由于样式比较统一,对于识别后的审批信息,可以利用正则表达式进行提取。基于本体的审批知识图谱构建模块:基于审批本体搭建模块搭建的领域本体,从审批知识中提取所需知识,建立知识之间的关系,完成审批知识图谱的构建,并对审批知识图谱进行存储。基于本体从审批材料中“有目的”地抽取知识,建立知识之间的关系,完成审批知识图谱的构建。基于知识图谱高效查询的审批模块:通过图查询方式在基于本体的审批知识图谱构建模块构建的审批知识图谱中进行查询图查找,并根据查找得到的信息进行匹配审批,得到审批结果。由于知识图谱中的数据在逻辑上本身就是一种图结构,因此本发明通过图查询技术来完成相应查询图的查找。根据查找得到的信息进行匹配审批,得到审批结果。在一具体应用实施例中,基于知识图谱的人工智能辅助行政审批系统结构如图1所示,包括五个模块:审批规则库抽取模块11,审批本体搭建模块12,审批知识提取模块13,基于本体的审批知识图谱构建模块14和基于知识图谱高效查询的审批模块15。其中:审批规则库抽取模块11,用以提取与审批相关的审批规则和法律法规,运用命名实体抽取技术和关系抽取技术分别对审批相关规则的基本实体以及实体和实体之间的关系进行抽取。审批本体搭建模块12,用以根据审批相关内容,搭建审批本体,通过对行政审批涉及的相关术语、术语的属性以及术语之间的关系等概念进行人工梳理,采用七步法,基于protégé平台搭建审批本体,如图4所示,图中实线表示父类和子类之间的关系,虚线表示对象属性。审批知识提取模块13,审批知识的提取是审批知识结构化存储的第一步,由于行政审批中审批材料的样式比较统一,对于通过ocr技术文字识别后的审批材料,可以采用正则表达式进行提取。基于本体的审批知识图谱构建模块14,用以基于审批本体搭建模块12中搭建的审批本体,利用知识图谱的实例化技术,从审批材料中“有目的”地抽取知识,建立知识之间的关系,完成审批知识图谱的实例化,并将实例化后的知识图谱采用rdf(resourcedescriptionframework,资源描述框架)进行存储。基于知识图谱高效查询的审批模块15,用以利用基于本体的审批知识图谱构建模块13中构建的审批知识图谱的强大、高效的查询能力,根据审批材料的不同审批事项,采用sparql语言从知识图谱提取相应的审批点信息,根据审批规则进行自动审核,得到审批结果。在本发明实施例还提供了一种基于知识图谱的人工智能辅助行政审批方法,该方法可以参照以下步骤进行:s1,审批规则库的抽取审批规则库的抽取主要包括命名实体的抽取和逻辑关系的抽取。命名实体抽取主要针对审批规则中的有固定含义的名词进行提取,这类名词可以作为审批本体中的审批主体或审批要点。逻辑关系提取则主要是梳理审批规则之间的逻辑结构,梳理其条件判断、因果关系,以及相互引用及嵌套关系等。s2,审批本体的搭建采用七步法,基于protégé平台搭建审批本体。七步法是美国斯坦福大学医学院开发的本体建模方法,较之之前的本体构建方法,其应用范围更广,在音乐领域、地理领域、疾病领域等方面都有应用和研究,且符合人类的思维逻辑,操作简单,具有较强的推理能力以及很好的扩展特性。通过利用七步法创建本体,包括如下子步骤:(1)本体需求分析审批本体的建立旨在能够在建立少而全的概念结构下,利用领域内通用的知识概括,同时为审批相关文件和材料的自然语言处理提供领域词典,将审批相关知识进行抽取并进行结构化的存储。(2)参考及复用现有本体目前,国内外研究中关于审批本体构建尚处于空白,因此在审批本体构建中,想要复用现有本体几乎不可行。(3)罗列重要概念及术语参考审批材料、法律法规,规范标准以及专家的经验积累(先验知识),以审批相关术语作为本体中的概念,对存在重复和交叉的概念进行剔除,从而进行概念的确定,将最终确定的概念作为本体类的来源。(4)建立本体框架通过本体概念之间的关系,确定本体的框架,包括:审批主体、审批材料、审批要点以及审批依据。表1本体概念及涵义概念涵义审批主体主要指需要审查的对象审批要点主要指审批主体的需要审批的属性审批材料主要指需要审批的材料审批依据主要指审批结果判断的依据,包括审批过程中涉及的法律法规、行业标准等。(5)整理本体概念的层次结构,创建本体实例通过本体概念之间的关系,可以确定本体的框架。首先,在该本体项目中,先创建审批主体、审批材料、审批要点、审批依据这几个父类,每个父类也包含一定的子类,这样层层类推。添加本体概念之间的关系和限制在构建本体时,主要的关系分为对象属性(objectproperty)和数据属性(dataproperty)两个方面。对象属性是指类与类或实例与实例之间的关系,数据属性是指实例的值。通过对审批相关文件的分析,该审批本体具有以下六个主要的属性关系。表2本体中的关系(7)本体的检验和评价通过对构建完的本体按照下述设定要求进行初步的检验和评价:构建完的本体应满足审批要求,在本体框架中定义的术语、概念、属性应覆盖审批过程所涉及审批主体、审批要点、审批依据、审批材料;构建完的本体应符合本体的构建准则,满足术语、概念定义清晰,满足关系定义完整,满足本体的前后一致性。不满足设定要求中的任何一项要求,都要对构建完成的本体中定义的术语、概念、属性进一步明确、补充、修改,直至达到设定要求,最终形成审批本体。protégé软件是斯坦福大学医学院生物信息研究中心基于java语言开发的本体编辑和知识获取软件,即本体开发工具。本实施例基于protégé平台,采用上述七步法,搭建了审批本体框架。s3,审批知识的提取审批知识的提取是审批知识结构化存储的第一步,由于行政审批中审批材料的样式比较统一,在通过ocr技术对图片、表格等审批材料进行文字识别转化为json格式信息后,可以采用正则表达式进行提取。正则表达式即是利用设定的表达式对文本相应约束下的知识进行提取的工具。首先,应对审批材料按照知识表达方式进行分类;其次,对不同的知识表达方式确定正则表达式;最后,对各类审批材料依据相应的正则表达式进行抽取。s4,基于本体,构建审批知识图谱知识图谱是实现审批知识结构化存储的重要方向,基于本体的审批知识图谱构建主要依赖于知识图谱的实例化技术。在读取项目信息之后,可以根据知识图谱框架进行实例化。对于每份材料中出现的每个审批实体单独创建实例,这个实例是审批实体的实例化,与审批材料的连接关系是信息来源。实例化之后的知识图谱主要利用图数据库对其进行存储,采用rdf(resourcedescriptionframework,资源描述框架)来制定术语之间以及术语和其属性值之间的关系。s5,基于审批知识图谱,进行相关审批指示的高效查询,并进行自动审批审批过程从审批要点出发,每个审批要点与不同的实体相关联,需要参与审批的实体根据其实例化类别和信息来源确定。根据审批规则进行审核,会得到“通过”“不通过”“人工审核”三种审核结果,审批规则与相关的法律法规进行关联。本专利采用sparql语言,进行知识的获取与管理,对获取的知识进行审批。sparql是simpleprotocolandrdfquerylanguage的缩写,是由w3c为rdf数据开发的一种查询语言和数据获取协议,是被知识图谱广泛支持的查询语言。s6,输出审批结果。审批结果包括:通过、不通过以及人工审核三种结果。在一具体应用实施例中,基于知识图谱的人工智能辅助行政审批方法工作流程图如图3和图5所示。下面本实施举例以新设公司申请材料审批为例,进行基于知识图谱的人工智能辅助行政审批:步骤s21:建立审批规则库。首先,梳理审批规则的命名实体;其次,对审批规则进行逻辑筛选,梳理审批事项的审批逻辑;最后,对于梳理得到的审批规则,加入数据库进行整理和管理。命名实体包括:(1)申请公司相关实体,如申请名称,名称预先核准文号,住所,生产经营地,邮政编码,公司类型,经营范围,营业期限等等;(2)人员相关实体,如法定代表人,监理,董事,经理,财务负责人,股东发起人,联络员等;(3)人员信息相关属性实体,如姓名,固定电话,移动电话,电子邮箱,身份证类型,身份证号码,等等;以及其他相关实体。这些实体可以为后续建立审批本体提供相关领域术语。审批逻辑包括:(1)一致性检查,主要审查申请材料中相关信息的一致性,例如《公司备案登记申请书》中的法定代表人与《法定代表人信息》的一致性;(2)完备性检查,主要审查递交材料是否满足完备性要求,例如股东签名是否齐全、申请材料中的信息是否完整,等等;(3)矛盾性审查,主要审查申请材料是否违反相应的法律条例,比如《公司法》第51条规定“有限责任公司设监事会,其成员不得少于三人”,就需要先审查其是否为有限责任公司,若为有限责任公司则需审查其是否设有监事会且成员不少于三人;(4)有效性检查,主要审查申请材料中信息是否有效,例如身份证日期是否在有效期内,电话和邮箱是否满足要求等;以及其他类型的审批逻辑。步骤s22,构建审批本体。本实施例中搭建的审批本体中,术语包括法条、审批主体和审批材料,术语的属性包括审批主体的值,术语之间的关系,包括术语的实例与术语之间的关系,术语的属性关系等。由于本体的需求已经明确,目前也没有可以复用的本体,步骤s21也给出了相关的重要概念和术语,本体框架也已经明确,因此从七步法的“梳理本体概念的层次结构,创建本体实例”这一步开始,给出基于protégé平台搭建本体的实施步骤。梳理本体概念的层次结构,创建本体实例:通过本体概念之间的关系,可以确定本体的框架。首先,在该本体项目中,先创建审批主体、审批材料、审批要点、审批依据这几个父类,每个父类也包含一定的子类,这样层层类推,如下表3所示。表3本体概念及其子类父类子类审批主体包括法定代表人、申请公司、财务负责人、股东发起人,等等。审批要点包括法定代表人的姓名、身份证号,申请公司的公司名称、公司类型、出资时间,等等。审批材料包括人员信息相关材料,公司相关材料,土地财产相关材料,等等。审批依据包括《公司法》、《企业法定代表人法定代表人登记管理规定》等法律法规中的条文条例。添加本体概念之间的关系和限制:通过对审批相关文件的分析,该审批本体具有的主要的属性关系如图6所示,层级关系以递进来表示。本体的检验和评价:通过对构建完的本体进行初步的检验和评价,反复修改,最终形成审核本体框架在protégé中搭建后,部分结构如图7所示。本体中包含115个实体,36种对象属性关系和3种数据属性关系。步骤s23:审批材料知识抽取。如图9所示,是本实施例新设公司申请材料中的一份公司登记(备案)申请书图表。首先,通过ocr技术对该份审批材料进行文字识别,先进行块识别,区分出文字区域块,再分别转化为统一的json格式。由于审批材料格式较为统一,在json格式信息的基础上,采用正则表达式对审批信息进行知识提取。下面是对ocr技术识别结果进行json格式存储的部分例子:{'blocks':[{'position':{'bounding_box':{'width':240,'height':30,'left':10,'top':8},'vertices':[{'y':8,'x':10},{'y':9,'x':250},{'y':38,'x':250},{'y':36,'x':10}]},'lines':[{'position':{'bounding_box':{'width':240,'height':30,'left':10,'top':8},'vertices':[{'y':8,'x':10},{'y':9,'x':250},{'y':38,'x':250},{'y':36,'x':10}]},'char_centers':[{'y':22,'x':26},{'y':22,'x':54},{'y':23,'x':85},{'y':23,'x':109},{'y':23,'x':136},{'y':23,'x':164},{'y':24,'x':192},{'y':24,'x':219},{'y':24,'x':241}],'score':0.9848548769950867,'characters':[{'position':{'bounding_box':{'width':31,'height':35,'left':9,'top':4},'vertices':[{'y':4,'x':9},{'y':4,'x':40},{'y':39,'x':40},{'y':39,'x':9}]},'score':0.9999991655349731,'text':'名'},{'position':{'bounding_box':{'width':29,'height':35,'left':40,'top':4},'vertices':[{'y':4,'x':40},{'y':5,'x':69},{'y':39,'x':69},{'y':39,'x':40}]},'score':0.9999939203262329,'text':'称'},{'position':{'bounding_box':{'width':28,'height':35,'left':69,'top':5},'vertices':[{'y':5,'x':69},{'y':5,'x':97},{'y':40,'x':97},{'y':39,'x':69}]},'score':0.9999918937683105,'text':'预'},{'position':{'bounding_box':{'width':26,'height':35,'left':97,'top':5},'vertices':[{'y':5,'x':97},{'y':5,'x':123},{'y':40,'x':123},{'y':40,'x':97}]},'score':0.9999979734420776,'text':'先'},{'position':{'bounding_box':{'width':27,'height':35,'left':123,'top':5},'vertices':[{'y':5,'x':123},{'y':5,'x':150},{'y':40,'x':150},{'y':40,'x':123}]},'score':0.9999568462371826,'text':'核'},{'position':{'bounding_box':{'width':28,'height':35,'left':150,'top':5},'vertices':[{'y':5,'x':150},{'y':6,'x':178},{'y':40,'x':178},{'y':40,'x':150}]},'score':0.9735845327377319,'text':'准'},{'position':{'bounding_box':{'width':27,'height':35,'left':178,'top':6},'vertices':[{'y':6,'x':178}步骤s24,建立审批知识图谱。基于步骤s22中创建的审批本体,从步骤s23中抽取的审批知识,建立知识之间的关系,从而完成审批知识图谱的构建。对于审批材料中出现的每个审批实体单独创建实例,作为审批实体的实例化,与审批材料的关系是信息来源,如图3所示。如图8所示,本实例构建的审批本体中,法人作为审批主体之一,公司登记申请作为审批材料之一,对于材料中出现的法人创建实例,作为审批主体法人的实例化,与审批材料公司登记申请的连接关系是信息来源。实例化后的知识图谱采用rdf进行存储。实例化过程主要是填充知识图谱中的三元组,通过create_individual函数来实现,具体代码如下:defcreate_individual(g,doc_file,individual_name,class_name,relation,owner,source,uriref,rdf,owl):add_individual(g,individual_name,uriref,rdf,owl)add_individual_to_class(g,individual_name,class_name,uriref,rdf)if(owner!='null'):add_individual_relation(g,individual_name,owner,'属于',uriref)if(relation!='null'):add_individual_relation(g,owner,individual_name,relation,uriref)add_individual_relation(g,individual_name,source,'信息来源',uriref)if(doc_file[0]=="null")or(doc_file[0]=="无")or(doc_file=="null"):add_individual_data_property(g,individual_name,'值','null',uriref)add_individual_data_property(g,individual_name,'最小置信度','0',uriref)add_individual_data_property(g,individual_name,'平均置信度','0',uriref)else:add_individual_data_property(g,individual_name,'值',str(doc_file[0]),uriref)if(str(doc_file[1])=='null'):add_individual_data_property(g,individual_name,'最小置信度','0',uriref)else:add_individual_data_property(g,individual_name,'最小置信度',str(doc_file[1]),uriref)if(str(doc_file[2])=='null'):add_individual_data_property(g,individual_name,'平均置信度','0',uriref)else:add_individual_data_property(g,individual_name,'平均置信度',str(doc_file[2]),uriref)create_individual函数的参数为需要进行实例化扩充的知识图谱g,用于实例化的审批知识doc_file,审批要点实例名称individual_name,该实例属于的类的名称class_name,需要扩充的关系relation,该实例属于的审批主体名称owner,该实例的信息来源名称source以及知识图谱的相关参数uriref、rdf和owl。首先,在知识图谱g中增加一个新的实例individual_name,并将该实例添加到相应的类。接着,判断其属于的审批主体名称和信息来源名称是否存在,若存在则添加相应的“属于”对象属性和“信息来源”对象属性。最后,根据抽取的审批知识添加其数据属性,包括值属性、平均置信度属性和最小置信度属性。步骤s25:高效检索规则审批。基于以上步骤建立的知识图谱,根据审批材料的不同审批事项,利用知识图谱强大的查询能力,用sparql语言,进行相关审批主体属性值等知识的获取。如图3所示,审批规则与相关的法律法规进行关联,获取相关审批点信息后,根据知识图谱中的审批规则,进行自动审批。以“法定代表人姓名”为例,可以依据实例的属性和信息来源进行查找,对应的sparql查找代码如下:select,指定要查询的变量。在这里,我们查询的变量为“”和“”,分别是法定代表人姓名的实例值和平均置信度。where,指定要查询的图模式。步骤s26:输出审批结果,相应地会得到“通过”“不通过”“人工审核”这三种审核结果。如图3所示,在以上步骤建立的知识图谱中,审批结果将作为审批规则的属性与审批规则相关联。基于上述的基于知识图谱的人工智能辅助行政审批方法、系统,本发明实施例中还提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时可用于执行实施例2中所提供的方法。基于上述的基于知识图谱的人工智能辅助行政审批方法、系统,本发明实施例中还提供了另外一种终端,包括存储器、处理器及存储在存储器上并可通过处理器运行的实施例1中所提供的系统。进一步地,系统可用于执行上述的基于知识图谱的人工智能辅助行政审批方法。本发明上述实施例所提供的基于知识图谱的人工智能辅助行政审批方法、系统及终端,运用人工智能技术,实现审批判断准则的标准化,实现部分审批材料的智能审批,以及复杂审批点提醒人工注意,有效解放人力资源,降低人力成本,提高审批效率和质量。同时,本发明所提供的基于知识图谱的人工智能辅助行政审批方法、系统及终端,可以在审批过程中将审批材料、审批结果、审批记录统一存储管理,运用知识图谱强大的信息检索功能,辅助审批人员开展各类审批工作,提高审批速度。需要说明的是,本发明提供的所述方法中的步骤,可以利用所述系统中对应的模块、装置、单元等予以实现,本领域技术人员可以参照所述系统的技术方案实现所述方法的步骤流程,即,所述系统中的实施例可理解为实现所述方法的优选例,在此不予赘述。本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个模块、装置、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1