公证文书模板生成方法、装置、电子设备及存储介质与流程

文档序号:32890388发布日期:2023-01-12 22:59阅读:113来源:国知局
公证文书模板生成方法、装置、电子设备及存储介质与流程

1.本技术涉及计算机技术领域,具体而言,本技术涉及一种基于知识图谱的公证文书模板生成方法、装置、电子设备及存储介质。


背景技术:

2.目前,在公证部门,许多公证事务都依赖于公证员手动完成,例如,撰写公证文书。由于公证事务繁多,且类型杂乱,公证员需要投入大量精力撰写公证文书。
3.并且,由于公证流程具有严格的程序和规范,对应的公证文书通常也具有规范的排版、格式、内容表达等方面的行文要求。基于公证文书的范式特点,公证员要投入大量精力做着重复性劳动,不仅效率低下,还造成人力资源的极大浪费。
4.由上可知,公证文书的撰写效率低下成为了亟需解决的问题。


技术实现要素:

5.本技术各实施例提供了一种基于知识图谱的公证文书模板生成方法、装置、电子设备及存储介质,可以解决相关技术中存在的公证文件的撰写效率低下的问题。所述技术方案如下:
6.根据本技术实施例的一个方面,一种基于知识图谱的公证文书模板生成方法,包括:获取公证文书的样书,并对所述样书进行命名实体识别,得到所述样书中的待链指实体;基于公证领域知识图谱对所述待链指实体进行实体链指,由所述待链指实体得到候选实体;基于待填充集合中所述样书对应的待填充个案信息,将属于所述待填充个案信息的候选实体作为目标实体;在所述样书中,将所述目标实体替换为所述目标实体的对应参数,生成公证文书模板。
7.根据本技术实施例的一个方面,一种基于知识图谱的公证文书模板生成装置,包括:实体识别模块,用于获取公证文书的样书,并对所述样书进行命名实体识别,得到所述样书中的待链指实体;实体链指模块,用于基于公证领域知识图谱对所述待链指实体进行实体链指,由所述待链指实体得到候选实体;确认模块,用于基于待填充集合中所述样书对应的待填充个案信息,将属于所述待填充个案信息的候选实体作为目标实体;模板生成模块,用于在所述样书中,将所述目标实体替换为所述目标实体的对应参数,生成公证文书模板。
8.根据本技术实施例的一个方面,一种电子设备,包括:至少一个处理器、至少一个存储器、以及至少一条通信总线,其中,存储器上存储有计算机程序,处理器通过通信总线读取存储器中的计算机程序;计算机程序被处理器执行时实现如上所述的公证文书模板生成方法。
9.根据本技术实施例的一个方面,一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上所述的公证文书模板生成方法。
10.本技术提供的技术方案带来的有益效果是:
11.在上述技术方案中,首先获取公证文书的样书,通过命名实体识别得到样书中的待链指实体,基于公证领域知识图谱中对待链指实体进行实体链指,得到候选实体,通过待填充集合确定候选实体中属于待填充信息的部分,将该部分替换为参数,生成对应于样书的公证文书模板,在后续公证文书制作时,针对具体案情适应性地在公证文书模板中的参数位置填入填充内容,便可完成公证文书的生成,从而能够有效地解决相关技术中存在的公证文书的撰写效率低下的问题。
附图说明
12.为了更清楚地说明本技术实施例中的技术方案,下面将对本技术实施例描述中所需要使用的附图作简单地介绍。
13.图1是根据本技术所涉及的实施环境的示意图;
14.图2是根据一示例性实施例示出的一种基于知识图谱的公证文书模板生成方法的流程图;
15.图3是图2对应实施例中步骤310之前的步骤在一个实施例的流程图;
16.图4是图2对应实施例中步骤330之前的步骤在一个实施例的流程图;
17.图5是根据一示例性实施例示出的公证文书的样书的示意图;
18.图6是图2对应实施例中步骤330之后的步骤在一个实施例的流程图;
19.图7是图2对应实施例中步骤330之后的步骤在一个实施例的流程图;
20.图8是图2对应实施例中步骤370之后的步骤在一个实施例的流程图;
21.图9是根据一示例性实施例示出的公证文书模板的示意图;
22.图10是一应用场景中一种基于知识图谱的公证文书模板生成方法的具体实现示意图;
23.图11是根据一示例性实施例示出的一种基于知识图谱的公证文书模板生成装置的结构框图;
24.图12是根据一示例性实施例示出的一种服务器的硬件结构图;
25.图13是根据一示例性实施例示出的一种电子设备的结构框图。
具体实施方式
26.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
27.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
28.如前所述,由于公证文书的范式特点,公证员要投入大量精力做着重复性劳动,导
致公证文书的撰写效率低下。
29.近些年,人工智能技术扶携各行各业高歌猛进地进入智能化时代,唯独公证行业尚且未能“乘此东风”,实现智能化转型。因此,在当下依然有很多公证事务需要依靠公证员手动、脑力操作才能完成,例如,撰写公证文书。
30.撰写公证文书是公证员日常业务中必不可少的工作,这里所说的公证文书是指贯穿于公证事务整个流程所产生的过程文件和结果文件,包括但不限于访谈笔录、告知书、受理通知书、公证书等。由于公证事务的多且杂,通常公证员需投入大量精力在这些公证文书的撰写上。因此,公证员需要投入大时间和精力在撰写公证文书上。
31.此外,公证文书在司法活动和日常证明活动中扮演着极为重要的角色,尤其是具有特殊司法证明效力的公证书,视为公证文书的重要种类。因此,出具一份形式规范、内容合法有效的公证文书更是公证机构最重要的职责所在。然而,人工撰写的公证文书,其质量完全取决于公证员的业务水平和公证机构的严格完备的审核机制和审核能力。为了提高公证文书的撰写水平,公证机构不得不投入更多资源在对公证员的撰写能力的培训上。即使这样,依然无法确保公证文书质量的稳定性。
32.因此,如果在撰写公证文书时,减少对人工的依赖性,将公证文书的撰写智能化,可以理解,这将大大提高撰写公证文书的效率,并提高公证文书的撰写质量,减少人力资源的浪费。
33.由上可知,相关技术中仍存在公证文书的撰写效率低下的缺陷。
34.为此,本技术提供的基于知识图谱的公证文书模板生成方法,能够有效地提升公证文书撰写的效率,相应地,该公证文书模板生成方法适用于公证文书模板生成装置,该信息推荐装置可部署于电子设备,该电子设备可以是配置冯诺依曼体系结构的计算机设备,例如,该计算机设备可以是台式电脑、笔记本电脑、服务器等等。
35.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
36.图1为一种公证文件生成方法所涉及的一种实施环境的示意图。需要说明的是,该种实施环境只是一个适配于本发明的示例,不能认为是提供了对本发明的使用范围的任何限制。
37.该实施环境包括采集端110和服务端130。
38.具体地,采集端110,可以是具有采集图片、文本、多媒体中至少一种或多种数据功能的电子设备,在此不构成具体限定。
39.服务端130,该服务端130可以是台式电脑、笔记本电脑、服务器等等电子设备,还可以是由多台服务器构成的计算机设备集群,甚至是由多台服务器构成的云计算中心。其中,服务端130用于提供后台服务,例如,后台服务包括但不限于公证文书模板生成服务等等。
40.服务端130与采集端110之间通过有线或者无线等方式预先建立网络通信连接,并通过该网络通信连接实现服务端130与采集端110之间的数据传输。传输的数据包括但不限于:公证文书的样书等等。
41.通过采集端110与服务端130的交互,采集端110将公证文书的样书发送给服务端130,服务端130结合知识图谱对获取到的公证文书的样书进行处理,便能够生成公证文书
模板。
42.请参阅图2,本技术实施例提供了一种基于知识图谱的公证文书模板生成方法,该方法适用于电子设备,该电子设备可以是图1所示出实施环境中的服务端130。
43.在下述方法实施例中,为了便于描述,以该方法各步骤的执行主体为电子设备为例进行说明,但是并非对此构成具体限定。
44.如图2所示,该方法可以包括以下步骤:
45.步骤310,获取公证文书的样书,并对样书进行命名实体识别,得到样书中的待链指实体。
46.其中,公证文书的样书是指贯穿于公证事务整个流程所产生的过程文件和结果文件,包括但不限于访谈笔录、告知书、受理通知书、公证书等。也就是说,依据实体法律关系类型不同,公证事务中所涉及的公证文书的样书也各不相同。
47.关于命名实体识别,是指从样书中识别出特定命名指向的词,这些词就是样书中的待链指实体,比如人名、地名、法律文件名称和组织机构名等。其中,命名实体识别可以通过基于规则、无监督学习、有监督学习、深度学习等方法实现,在此不作限定。
48.在一个可能的实现方式,调用由神经网络模型训练生成的命名实体预测模型对公证文书的样书进行命名实体识别。该命名实体预测模型的构建步骤如图3所示。
49.步骤3101,获取历史公证文书。
50.其中,历史公证文书包括但不限于:通过光学符号识别(ocr识别)技术获得的公证纸卷文书的电子文档数据,以及通过公证服务平台数据库获取的结构化数据。
51.步骤3103,构建语料库。
52.具体地,将ocr技术获取的非结构化数据(即电子文档数据)转化成结构化数据,并结合公证服务平台数据库中的结构化数据,组成语料库。
53.步骤3105,根据标注规则,生成标注后的公证文本。
54.具体地,配置标注规则,基于标注规则对语料库中的历史公证文书进行标注,生成标注后的公证文本。
55.其中,标注规则可以是bio标注规则(b-命名实体的前缀,i-命名实体的非前缀,o-非命名实体),也可以是bioes标注规则(b-命名实体的前缀,i-命名实体的非前缀,o-非命名实体,e-命名实体的后缀,s-独立词)等,在此不作限定。以bio标注规则为例,该房屋属于甲某,则标注为“b(该)i(房)i(屋)o(属)o(于)b(甲)i(某)”。
56.步骤3107,对标注后的公证文本进行独热编码,并输入embedding层。
57.具体而言,对标注后的公证文本进行独热编码,然后再通过嵌入embedding层的字符嵌入矩阵,将独热向量转换为字符向量。
58.步骤3109,将字符向量输入bilstm模块。
59.具体地,将字符向量作为双向长短时记忆bilstm模块的输入,以便于开始bilstm模型的训练。
60.步骤3111,将bilstm模块输出的各类标注分数经过处理后输入crf模块,获得参数初始化的命名实体预测模型。
61.具体地,将bilstm模块输出的各类标注分数经过处理后,首先输入crf模块;然后通过crf模块根据相邻词性标注间关系,获取bilstm模块输出的标注序列最优解,即获得参
数初始化的命名实体预测模型。
62.步骤3113,超参数优化,得到命名实体预测模型。
63.具体而言,在bilstm-crf模型训练中,采用丢弃dropout技术,即每次训练时随机丢弃一部分神经元,被丢弃掉的神经元对于传播不会产生影响,使得网络不过多依赖于神经元权重改变的方法来进行调参,以缓解过拟合问题。
64.收集并保存每次训练获得的最优参数,并将通过测试后的bilstm-crf模型封装成命名实体预测模型。
65.待上述训练过程完成,该命名实体预测模型便具备了适用于公证文书的命名实体识别能力,从而能够对公证文书的样书进行命名实体识别,得到样书中的待链指实体。
66.步骤330,基于公证领域知识图谱对待链指实体进行实体链指,由待链指实体得到候选实体。
67.其中,公证领域知识图谱用于描述公证领域中的概念及其相互关系。在进行实体链指之前,需要创建一个公证领域知识图谱。
68.在一个可能的实现方式,如图4所示,步骤330之前,创建一个公证领域知识图谱可以包括以下步骤:
69.步骤3301,获取历史公证文书,并对历史公证文书进行命名实体识别,得到若干个训练实体。
70.如前所述,可以通过基于规则、无监督学习、有监督学习、深度学习等方法对语料库中的历史公证文书进行命名实体识别,得到的识别结果为若干个训练实体。
71.在一个可能的实现方式,通过调用命名实体预测模型对历史公证文书中的命名实体进行识别,得到若干个训练实体。
72.步骤3303,提取各训练实体间的关联关系。
73.其中,关联关系可以通过基于规则的关系提取方法、预定义关系类型、深度学习等方法实现,在此不作限定。
74.在一个可能的实现方式,基于规则的关系提取方法,对若干个训练实体间的关联关系进行提取。
75.首先说明的是,该若干个训练实体可以通过步骤3301获得,还可以利用公证实体词典对语料库中的历史公证文书进行分词得到。其中,公证实体词典是通过步骤3113训练得到的命名实体预测模型,对语料库中的历史公证文书进行命名实体识别预先构建的。同理,公证法律词典也可以通过命名实体预测模型对公证相关的法律文件(例如《中华人民共和国民法通则》等)进行命名实体识别预先构建,进而利用该公证法律词典对公证相关的法律文件进行分词,得到待提取关联关系的若干个训练实体。
76.其次,通过nlp(natural language processing,自然语言处理)文本标注工具(例如doccano词性标注工具)对若干个训练实体进行词性标注。进一步地,若干个训练实体还将依照公证相关法律法规、司法解释等设置的标注规则进行词性标注。
77.然后,利用《全国公证综合管理信息系统技术规范》配置《关系提取规则》,如表1所示。
78.表1关系提取规则
[0079][0080]
最后,基于《关系提取规则》,利用模式匹配方法对进行了词性标注的若干个训练实体之间的关联关系进行提取。其中,模式匹配是数据结构中字符串的一种基本运算,给定一个子串,要求在某个字符串中找出与该子串相同的至少一个子串。例如,如表1所示,假设给定一个子串“属于”,若历史公证文书中进行了词性标注的若干个训练实体所构成的字符串中,存在该子串“属于”,则认为该若干个训练实体间的关联关系为从属关系。
[0081]
步骤3305,将各训练实体分别存储于各节点,并将各训练实体间的关联关系分别作为连接相邻节点间的路径。
[0082]
首先说明的是,公证领域知识图谱包含了节点和路径,其中节点用于存储训练实体、以及训练实体的属性信息,如格式属性等,路径用于连接相邻节点,并存储了相邻节点间(也就是训练实体间)的关联关系,如“属于”“是”等。
[0083]
当两个节点之间存在关联关系,那么就可以基于该关联关系构建路径,进而将两个节点连接。例如训练实体“李明”和“房屋”之间的关联关系为房屋属于李明,为两者构建路径,得到“李明《—属于—房屋”。
[0084]
步骤3307,由各节点及路径,构建得到公证领域知识图谱。
[0085]
提取各节点之间的关联关系,基于关联关系为各节点构建路径,连接各节点,得到公证领域知识图谱。在一个可能的实现方式,公证领域知识图谱通过neo4j图数据库表示,以将训练实体和关联关系存储于neo4j图数据库并展示,在此不作限定。
[0086]
在得到公证领域知识图谱后,便可通过实体链指方式由待链指实体得到候选实体。
[0087]
关于实体链指,是指将待链指实体链接到公证领域知识图谱中实体的操作。
[0088]
在一个可能的实现方式,实体链指可以通过确定待链指实体与公证领域知识图谱中实体的相似性实现。在一个可能的实现方式,实体链指还可以通过对不太相似的待链指实体与公证领域知识图谱中实体进行实体消歧和/或指代消解实现。
[0089]
例如:样书中的待链指实体包括“房屋”,公证领域知识图谱也存在实体“房屋”,则该待链指实体“房屋”便能够链接至公证领域知识图谱中的实体“房屋”,也就是说,该待链指实体“房屋”可作为候选实体。
[0090]
步骤350,基于待填充集合中样书对应的待填充个案信息,将属于待填充个案信息的候选实体作为目标实体。
[0091]
其中,待填充集合包括各类型公证文书的样书中的待填充个案信息。
[0092]
在确认属于待填充个案信息的候选实体之前,需要针对不同公证事务场景,预先
配置公证文书中“待填充的个案信息”清单,即待填充集合。
[0093]
在一个可能的实现方式,基于设定规则对各类型样书中的待填充个案信息进行提取,生成待填充集合。其中,各类型样书包括声明书、委托书、合同公证书等,在此不作限定。
[0094]
关于设定规则,在一份完整公证文书中,包括案件不同,相应的部分不会改变的信息,以及随着案件变化,相应的部分会适应性变化的信息,该信息即视为待填充个案信息。以声明书为例,可能涉及的实体包括:申请人、公证处字号,还可能涉及主文中引用的法律文件《中华人民共和国民法通则》,对于《声明书》的公证事务来说,申请人和公证处字号属于待填充个案信息,而法律文件《中华人民共和国民法通则》无需改变,不属于待填充个案信息。如图5所示,其中,待填充个案信息通过至少一个字符x表示。
[0095]
关于确认属于待填充个案信息的候选实体,首先确定样书类型对应的待填充集合,例如,样书为声明书,对应的是声明书的待填充集合。将该样书中的候选实体与该待填充集合中样书对应的待填充个案信息进行对比,进而确定属于待填充个案信息的候选实体。
[0096]
步骤370,在样书中,将目标实体替换为目标实体的对应参数,生成公证文书模板。
[0097]
确定了目标实体后,将这些目标实体在样书中替换为目标实体的对应参数,便得到该样书对应的公证文书模板。
[0098]
通过上述过程,首先获取公证文书的样书,通过命名实体识别得到样书中的待链指实体,基于公证领域知识图谱中对待链指实体进行实体链指,得到候选实体,通过待填充集合确定候选实体中属于待填充信息的部分,将该部分替换为参数,生成对应于样书的公证文书模板,在后续公证员处理公证事务时,针对具体案情在公证文书模板的相应参数位置填入填充内容,完成公证文书的撰写,从而使得公证文书的撰写更加智能化,减少了公证员撰写公证文书的时间和精力,进而能够有效地解决相关技术中存在的公证文书的撰写效率低下的问题。
[0099]
可以理解,若公证领域知识图谱中存在与待链指实体对应的候选实体,则实体链指成功;若不存在与待链指实体对应的候选实体,则实体链指失败。
[0100]
下面对实体链指失败时针对待链指实体的处理过程进行详细地说明:
[0101]
在一个示例性实施例中,如图6所示,步骤330之后,该方法还可以包括以下步骤:
[0102]
步骤410,若实体链指失败,则对待链指实体进行实体消歧和/或指代消解。
[0103]
其中,实体消歧用于当一个待链指实体有多种含义时,结合上下文消除待链指实体的歧义。例如,待链指实体“苹果”,可以对应“苹果公司”、“苹果手机”“苹果(水果)”等,在“xx农庄采摘的1吨苹果属于李明”这句话中,结合上下文可以可知,待链指实体“苹果”的真实含义为“苹果(水果)”。
[0104]
指代消解用于在多个指称项指向的是同一待链指实体时,将这些指称项合并到正确的待链指实体。例如,在“李明将房屋赠与张三,
……
,受赠人需在xx月xx日前办理登记手续,
……”
中,“受赠人”指代“张三”,因此可以将两个指代项合并为待链指实体“受赠人”。
[0105]
步骤430,针对完成和/或指代消解的待链指实体,在公证领域知识图谱进行实体链指,得到候选实体。
[0106]
对完成实体消歧和/或指代消解的待链指实体,再次进行实体链指,若公证领域知识图谱中存在与待链指实体对应的候选实体,则实体链指成功,若不存在与待链指实体对
应的候选实体,则实体链指失败。
[0107]
在实体消歧和/或指代消解后的实体链指再次失败后,还可以执行步骤510至步骤530,对实体链指失败后的待链指实体做进一步处理。
[0108]
在一个示例性实施例中,如图7所示,步骤330之后,该方法还可以包括以下步骤:
[0109]
步骤510,若实体链指失败,则在公证领域知识图谱中创建一新节点。
[0110]
步骤530,将待链指实体链指至公证领域知识图谱的新节点。
[0111]
当实体链指失败,说明在公证领域知识图谱中不存在对应于待链指实体的候选实体,无法将该待链指实体链接至公证领域知识图谱的节点中,因此,可以在公证领域知识图谱中创建一个新节点,将待链指实体链接至该新节点中。
[0112]
在上述实施例的配合下,在实体链指失败后,可以对待链指实体进行实体消歧和/或指代消解,再次进行实体链接,也可以在公证领域知识图谱中创建新节点,将候选节点链接至新节点,以此增加通过实体链指由待链指实体得到候选实体的成功率,并且候选实体在后续步骤中还用于确定待填充个案信息,以及生成公证文书模板,增加实体链指的成功率,有助于提高公证文书模板的质量。
[0113]
请参阅图8,在一个示例性实施例中,步骤370之后,该方法还可以包括以下步骤:
[0114]
步骤610,基于公证领域知识图谱,提取目标实体的格式属性。
[0115]
如前所述,目标实体存储于公证领域知识图谱的节点中,该节点还存储了目标实体的属性信息,因此,从该待填充个案信息的目标实体对应的节点中,提取该目标实体的格式属性。
[0116]
其中,格式属性可以包括该目标实体的正则表达式,用于表达对字符串的过滤逻辑。例如:电子邮箱的的正则表达式为“^\w+([+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$”;手机号码的正则表达式为“^(13[0-9]14[57]15[012356789]18[012356789])\d{8}$”;日期的正则表达式为“^\d{4}-\d{l,2}-\d{l,2}”等等。由此,利用格式属性中的正则表达式可以为参数配置校验规则。
[0117]
步骤630,根据格式属性,为目标实体所替换的参数配置校验规则。
[0118]
其中,校验规则用于对替换公证文书模板中参数的填充内容进行格式校验。通过配置校验规则,可以约束后续填充内容的规范性和正确性。
[0119]
在一个可能的实现方式,如图9所示,利用目标实体的正则表达式,为所替换的参数配置校验规则。若该正则表达式要求在公证文书模板中替换相应参数的填充内容为金额(数字),而后续公证员在相应参数位置填入的填充内容是文字,此时,文字不符合正则表达式的要求,电子设备便能够识别到该错误,从而报错提醒公证员。
[0120]
在上述实施例的作用下,基于公证领域知识图谱,从属于待填充个案信息的候选实体中提取格式属性,为公证文书模板的参数配置校验规则,当后续公证员在公证文书模板中的相应参数位置填入的填充内容不符合校验规则要求时,电子设备将会报错提醒公证员,实现智能化识别公证文书撰写中的错误,提升公证文书撰写的准确性,避免因公证员、公证机构的疏忽造成公证文书的质量下降,提高了公证文书质量的稳定性,有助于公证文书在地区间的互认。
[0121]
图10是一应用场景中一种基于知识图谱的公证文书模板生成方法的具体实现示意图。
[0122]
通过步骤701,获取命名实体预测模型,并构建公证领域知识图谱。
[0123]
其中,该命名实体预测模型由基于深度学习的神经网络模型训练而成。
[0124]
通过步骤703,配置待填充集合,该待填充集合中包括各类型样书的待填充个案信息。
[0125]
通过步骤705,获取公证文书的样书。其中,该样书可以是纸质公证文书的,也可以是电子公证文书的。
[0126]
通过步骤707,基于命名实体预测模型,识别得到样书中的待链指实体。
[0127]
通过步骤709,基于公证领域知识图谱,对待链指实体进行实体链指。
[0128]
若步骤709的实体链指成功,则得到候选实体。
[0129]
若步骤709的实体链指失败,则执行步骤711。
[0130]
通过步骤711,对待链指实体进行实体消歧和/或实体链指,并针对完成实体消歧和/或指代消解的待链指实体进行二次实体链指。
[0131]
若步骤711的实体链指成功,则得到候选实体。
[0132]
若步骤711的实体链指失败,则执行步骤713。
[0133]
通过步骤713,在公证领域知识图谱中创建新节点,将待链指实体链接至该新节点,视为得到候选实体。
[0134]
通过步骤717,基于待填充集合,将属于待填充个案信息的候选实体作为目标实体,并将该目标实体替换为目标实体的对应参数。
[0135]
通过步骤719,基于公证领域知识图谱提取得到的目标实体的格式属性,为该目标实体所替换的参数配置校验规则。其中,校验规则用于对替换公证文书模板中参数的填充内容进行格式校验。
[0136]
通过步骤721,生成对应于样书的公证文书模板。
[0137]
在一个可能的实现方式,在生成公证文书模板后,可以存储该公证文书模板,也可以展示该公证文书模板。
[0138]
在本应用场景中,通过命名实体预测模型对公证文书的样书进行命名识别,得到待链指实体,再基于公证领域知识图谱通过实体链指,由待链指实体得到候选实体,然后通过待填充集合确定属于待填充个案信息的候选实体,将其替换为参数,为参数配置格式属性,最后输出公证文书模板。一方面,通过公证文书模板,可以减少公证员耗费在撰写公证文书上的时间和精力,提高公证文书的撰写效率,另一方面,通过配置格式属性,对公证员填入参数位置的填充内容进行格式识别,减少了公证文书内容的错误,提高了公证文书质量的稳定性。
[0139]
下述为本技术装置实施例,可以用于执行本技术所涉及的一种基于知识图谱的公证文书模板生成方法。对于本技术装置实施例中未披露的细节,请参照本技术所涉及的公证文书模板生成的方法实施例。
[0140]
请参阅图11,本技术实施例中提供了一种基于知识图谱的公证文书模板生成装置900,包括但不限于:实体识别模块910、实体链指模块930、确认模块950以及模板生成模块970。
[0141]
其中,实体识别模块910,用于获取公证文书的样书,并对样书进行命名实体识别,得到样书中的待链指实体。
[0142]
实体链指模块930,用于基于公证领域知识图谱对待链指实体进行实体链指,由待链指实体得到候选实体。
[0143]
确认模块950,用于基于待填充集合中样书对应的待填充个案信息,将属于待填充个案信息的候选实体作为目标实体。
[0144]
模板生成模块970,用于在样书中,将目标实体替换为目标实体的对应参数,生成公证文书模板。
[0145]
需要说明的是,上述实施例所提供的公证文书模板生成装置在进行公证文书模板生成时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即公证文书模板生成装置的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。
[0146]
另外,上述实施例所提供的公证文书模板生成装置与公证文书模板生成方法的实施例属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
[0147]
图12根据一示例性实施例示出的一种服务器的结构示意。该服务器适用于图1所示出实施环境中的服务端130。
[0148]
需要说明的是,该服务器只是一个适配于本技术的示例,不能认为是提供了对本技术的使用范围的任何限制。该服务器也不能解释为需要依赖于或者必须具有图12示出的示例性的服务器2000中的一个或者多个组件。
[0149]
服务器2000的硬件结构可因配置或者性能的不同而产生较大的差异,如图12所示,服务器2000包括:电源210、接口230、至少一存储器250、以及至少一中央处理器(cpu,central processing units)270。
[0150]
具体地,电源210用于为服务器2000上的各硬件设备提供工作电压。
[0151]
接口230包括至少一有线或无线网络接口231,用于与外部设备交互。例如,进行图1所示出实施环境中采集端110与服务端130之间的交互。
[0152]
当然,在其余本技术适配的示例中,接口230还可以进一步包括至少一串并转换接口233、至少一输入输出接口235以及至少一usb接口237等,如图12所示,在此并非对此构成具体限定。
[0153]
存储器250作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统251、应用程序253及数据255等,存储方式可以是短暂存储或者永久存储。
[0154]
其中,操作系统251用于管理与控制服务器2000上的各硬件设备以及应用程序253,以实现中央处理器270对存储器250中海量数据255的运算与处理,其可以是windows servertm、mac os xtm、unixtm、linuxtm、freebsdtm等。
[0155]
应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序,其可以包括至少一模块(图12未示出),每个模块都可以分别包含有对服务器2000的计算机程序。例如,公证文书模板生成装置可视为部署于服务器2000的应用程序253。
[0156]
数据255可以是存储于磁盘中的照片、图片等,还可以是历史公证文书等,存储于存储器250中。
[0157]
中央处理器270可以包括一个或多个以上的处理器,并设置为通过至少一通信总
线与存储器250通信,以读取存储器250中存储的计算机程序,进而实现对存储器250中海量数据255的运算与处理。例如,通过中央处理器270读取存储器250中存储的一系列计算机程序的形式来完成公证文书模板生成方法。
[0158]
此外,通过硬件电路或者硬件电路结合软件也能同样实现本技术,因此,实现本技术并不限于任何特定硬件电路、软件以及两者的组合。
[0159]
请参阅图13,本技术实施例中提供了一种电子设备4000,该电子设备4000可以包括:台式电脑、笔记本电脑、服务器等。
[0160]
在图13中,该电子设备4000包括至少一个处理器4001、至少一条通信总线4002以及至少一个存储器4003。
[0161]
其中,处理器4001和存储器4003相连,如通过通信总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本技术实施例的限定。
[0162]
处理器4001可以是cpu(central processing unit,中央处理器),通用处理器,dsp(digital signal processor,数据信号处理器),asic(application specific integrated circuit,专用集成电路),fpga(field programmable gate array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。
[0163]
通信总线4002可包括一通路,在上述组件之间传送信息。通信总线4002可以是pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。通信总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图13中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0164]
存储器4003可以是rom(read only memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,ram(random access memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom(electrically erasable programmable read only memory,电可擦可编程只读存储器)、cd-rom(compact disc read only memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
[0165]
存储器4003上存储有计算机程序,处理器4001通过通信总线4002读取存储器4003中存储的计算机程序。
[0166]
该计算机程序被处理器4001执行时实现上述各实施例中的公证文书模板生成方法。
[0167]
此外,本技术实施例中提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述各实施例中的公证文书模板生成方法。
[0168]
本技术实施例中提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在存储介质中。计算机设备的处理器从存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行上述各实施例中的公证文书模板生成方法。
[0169]
与相关技术相比,首先获取公证文书的样书,通过命名实体识别得到样书中的待链指实体,基于公证领域知识图谱中对待链指实体进行实体链指,得到候选实体,通过待填充集合确定候选实体中属于待填充信息的部分,将该部分替换为参数,并为参数配置校验规则,生成对应于样书的公证文书模板。在后续公证员处理公证事务时,针对具体案情在公证文书模板的参数位置填入填充内容,根据校验规则对填充内容完成格式校验后,完成公证文书的撰写。本技术实现了智能化生成公证文书模板,以及智能化识别参数位置填充内容的错误,减少了公证员撰写公证文书的时间和精力,提高了公证文书的出证质量,进而能够有效地解决相关技术中存在的公证文书的撰写效率低下的问题。
[0170]
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0171]
以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1