本发明涉及政务咨询系统领域,尤其涉及一种政务咨询自动问答方法与系统。
背景技术:
1、政务咨询是指由市民提供案件描述,随后由政务工作人员参照办事指南出具咨询意见。政务服务的权力目录是指各政务服务部门的权责目录及其主管的事项名称,例如“基本医疗保险参保人员异地就医备案(异地就医直接结算)”、“基本医疗保险参保登记和变更登记”、“医疗救助对象待遇核准支付”等。权力目录仅列出事项的名称,不规定具体的实施细则,例如a市b区医疗保障局、a市d区医疗保障局等都可以具备同一条权力目录。办理事项是隶属于某一政务部门下某一条权力目录的具体办事准则,不同政务部门之间同一权力目录的办理事项的办理流程、受理窗口可能不同,具有地域性。
2、现有的政务咨询服务多以人工为主,由于政务知识专业性较强,且具有政策地域性差异,因此一般需要多次转接直到相关专员才能得到有效处理,这使得办事效率大打折扣,常常出现坐席忙难以接通现象。某些地市出台了在线机器人问答服务以缓解坐席压力,但这些机器人普遍灵活性较低,难以应对复杂的问答情境。
3、现有的知识问答技术方案大致可分为三类:
4、基于知识图谱的问答方法、基于知识库的问答方法、基于生成式预训练大语言模型的问答方法。
5、基于知识图谱的问答方法发展历程相对较长,技术成熟度较高,形成了基于传统模板的方法、基于语义解析的方法以及基于信息提取的方法和基于语义模型的细分方法。尽管随着技术的发展,基于知识图谱的问答方法能够对指向性较强的问句作出良好的反馈,并在多跳推理方面具备优势,但难以应对需要融合多条知识作出综合性回答的问句。
6、基于知识库的问答方法,首先需要构建一个“问题-答案”数据库,然后比较输入的问句与数据库中“问题”的语义相似度,输出相似度较高的“问题”对应的“答案”。这类方法要求输入的问句具备较强的规范性,否则匹配答案的准确度较低。且此方法同样难以应对需要融合多条知识作出综合性回答的问句。
7、基于生成式预训练大语言模型的问答方法,是将问题直接输入到生成式预训练大语言模型(llm),输出模型的推理结果。而大语言模型容易得出已经失效的错误回答,且在专业性较强的领域,直接使用大语言模型的方法,准确性较低。
8、针对上文所描述的技术短板,出现了结合大语言模型与知识库问答或知识图谱的方法。
9、这类方法是先根据问句从知识图谱获得候选子图或三元组并将其转换为候选回答文本,或从知识库获得候选回答文本,
10、然后将这些候选文本输入生成式预训练大语言模型,最终得到回答。
11、这类方法通过额外的知识图谱或知识库为大语言模型补充了专业性较强的事实知识,从而提升大语言模型问答的准确性。
12、由于政务咨询案件描述表述方式格式各异,用语不规范,且各项政策地域性较强,直接从知识图谱或知识库中难以获得可靠的候选回答文本,因而无法保障问答的准确性。
技术实现思路
1、针对现有技术中政务咨询案件系统回答不准确的技术问题,本发明提供了一种政务咨询自动问答方法与系统,该方法包括以下步骤:
2、s1、构建政务服务权力目录向量集合c和政务服务知识图谱g;
3、s2、输入案件描述s,提取地址信息l与案件描述关键信息k;
4、s3、从政务服务权利目录向量集合c中获得与案件描述关键信息k相似度最高的权力目录q;
5、s4、根据地址信息l获得区域信息region,并使用区域信息region和权力目录q,从政务服务知识图谱g中获得部门d与办理事项t,根据t获得办事指南信息集合i;
6、s5、将办事指南信息集合i和案件描述s根据预设的模板拼接为指令prompt;将prompt输入生成式预训练的大语言模型llm获得回答,并输出回答。
7、进一步地,步骤s1具体如下:
8、s11、获取政务服务数据集合d;
9、s12、对政务服务数据集合中的权力目录实体做文本嵌入,获得权力目录向量,并依据权力目录向量构建政务服务权力目录向量集合c;
10、s13、使用政务服务数据集合d构建政务服务知识图谱g。
11、进一步地,步骤s2具体通过预训练的大语言模型llm提取案件描述s的地址信息l与案件描述关键信息k。
12、进一步地,步骤s3具体如下:
13、s31、获取案件描述关键信息k的特征向量vk;
14、s32、在政务服务权力目录向量集合c中检索与特征向量vk欧式距离最近的向量及其对应的权力目录q。
15、进一步地,步骤s4具体如下:
16、s41、根据地址信息l获得区域名称region和区域层级level;
17、s42、在政务服务图知识图谱g中根据区域名称region和权力目录q检索,得到部门d;
18、s43、在政务服务图知识图谱g中根据部门d和权力目录q检索获得办理事项t;
19、s44、检索与办理事项t具有办事子项所属办理事项关系r<task,transact>的办事指南信息集合i。
20、一种政务咨询自动问答系统,包括:
21、向量集合与知识图谱构建模块:构建政务服务权力目录向量集合c和政务服务知识图谱g;
22、检索模块:输入案件描述s,提取地址信息l与案件描述关键信息k;
23、权力目录获取模块:从政务服务权利目录向量集合c中获得与案件描述关键信息k相似度最高的权力目录q;
24、办事指南信息获取模块:根据地址信息l获得区域信息region,并使用区域信息region和权力目录q,从政务服务知识图谱g中获得部门d与办理事项t,根据t获得办事指南信息集合i;
25、结果输出模块:将办事指南信息集合i和案件描述s根据预设的模板拼接为指令prompt;将prompt输入生成式预训练的大语言模型llm获得回答,并输出回答。
26、进一步地,所述向量集合与知识图谱构建模块包括:政务服务数据获取单元、向量集合构建单元和知识图谱构建单元;
27、政务服务数据获取单元:获取政务服务数据集合d;
28、向量集合构建单元:对政务服务数据集合中的权力目录实体做文本嵌入,获得权力目录向量,并依据权力目录向量构建政务服务权力目录向量集合c;
29、知识图谱构建单元:使用政务服务数据集合d构建政务服务知识图谱g。
30、进一步地,检索模块具体通过预训练的大语言模型llm提取案件描述s的地址信息l与案件描述关键信息k。
31、进一步地,权力目录获取模块包括:特征向量获取单元和权力目录获取单元;
32、特征向量获取单元:获取案件描述关键信息k的特征向量vk;
33、权力目录获取单元:在政务服务权力目录向量集合c中检索与特征向量vk欧式距离最近的向量及其对应的权力目录q。
34、办事指南信息获取模块包括:区域信息获取单元、部门获取单元、办理事项获取单元和办事指南信息获取单元;
35、区域信息获取单元:根据地址信息l获得区域名称region和区域层级level;
36、部门获取单元:在政务服务图知识图谱g中根据区域名称region和权力目录q检索,得到部门d;
37、办理事项获取单元:在政务服务图知识图谱g中根据部门d和权力目录q检索获得办理事项t;
38、办事指南信息获取单元:检索与办理事项t具有办事子项所属办理事项关系r<task,transact>的办事指南信息集合i。
39、本发明的有益效果是:
40、(1)本发明构建了专门的政务服务知识图谱,包含区域、部门、权力目录、办理事项等实体及其关系,使问答更贴合政务咨询领域。且采用图数据库存储数据的方式,可以更好表达实体间的复杂关系,方便查询和更新;
41、(2)本发明充分利用案件描述中的地址信息,考虑政策的地域性差异,减少因区域差异导致的错误,又能增强回答跨区域问题的正确。
42、(3)先提取区域信息与关键信息,再进行后续操作,而不是直接从知识库中搜索,提高了不规范问句的匹配准确度;
43、(4)将知识图谱查询结果整合为用户友好的答复,提升大语言模型在专业问答中的准确性。