医疗信息摘要自动生成方法、系统、终端及介质

文档序号:36971373发布日期:2024-02-07 13:21阅读:17来源:国知局
医疗信息摘要自动生成方法、系统、终端及介质

本发明涉及医疗数据处理技术,更具体地说,是一种医疗信息摘要自动生成方法、系统、终端及介质。


背景技术:

1、摘要自动生成指从各种形式结构的文本数据中提取关键信息并生成总结性的自然语言文本,输入包括但不限于对话、文档、表格等长文本,输出则是简短精炼的描述性摘要。在生物医疗领域中,能够通过各种来源的文档总结出院小结、首次病程记录等等病历文档,无疑可以大幅减少医生用在总结患者信息上所消耗的精力时间。

2、然而,医疗领域的记录涉及患者的生命健康,生成病历的文本信息忠实性必须得到保证,摘要中的每句话中包含的信息必须与来源文档一致。现有的模型与方法大多存在以下缺点:

3、无法确保生成文本中的信息来源,即无法找出摘要文本中的任一句子是从何而来,在可解释性较低的模型生成流程中,现有方法无法避免这一点;

4、由于无法溯源,摘要文本的信息忠实性无法保证,这在大模型+prompt范式中是巨大的缺陷,因为在面对海量的生成结果时,大模型生成的文本在没有源文本信息的情况下完全无法判断真伪,现有方法不仅无法保证大模型不出现幻觉,也不存在除人工方法外的高精确、可解释的自动检错纠错方法,这无疑是与医学领域的需求不相符的。

5、综上所述,本交叉领域亟需设计一种新的医疗文本摘要技术来解决上述问题。目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。


技术实现思路

1、本发明针对现有技术中存在的上述不足,提供了一种基于大模型反思确保医疗摘要任务信息忠实性的医疗信息摘要自动生成方法、系统、终端及介质。

2、根据本发明的一个方面,提供了一种医疗信息摘要自动生成方法,包括:

3、根据电子病历数据,获取电子病历子字段;

4、提供一摘要生成大模型,该摘要生成大模型用于生成医疗信息摘要并能标注所述医疗信息摘要中每一句的来源内容;

5、建立对应所述电子病历子字段的prompt与icl示例,将所述prompt内容、所述icl示例以及所述来源内容输入所述摘要生成大模型,生成第一摘要以及所述第一摘要中每个第一句子对应的来源内容;

6、检查所有所述第一句子与所述来源内容是否一致,若一致,则所述第一摘要作为最终的医疗信息摘要。

7、可选择,所述检查所有所述第一句子与所述来源内容是否一致,还包括:

8、若所述第一句子与所述来源内容不一致,则对所述prompt和icl示例进行微调;

9、将微调后的所述prompt和icl示例输入所述摘要生成大模型,对所述第一句子与所述来源内容不一致的部分重新生成,得到对应的第二句子;

10、检查所述第二句子与所述来源内容是否一致,若一致,则用所述第二句子替换对应的所述第一句子;

11、将包含所述第二句子的所述第一摘要,作为最终的医疗信息摘要。

12、可选地,所述检查所有所述第一句子与所述来源内容是否一致,还包括:

13、若所述第一句子与所述来源内容不一致,则对所述prompt和icl示例进行微调;

14、将微调后的所述prompt和icl示例输入所述摘要生成大模型,得到修改后摘要及所述修改后摘要中每个修改后句子对应的来源内容;

15、检查所有所述修改后句子与所述来源内容是否一致,若一致,则所述修改后摘要作为最终的医疗信息摘要;若不一致,则将修改后句子作为输入重新进行摘要生成过程。

16、可选地,所述方法还包括反馈机制,所述反馈机制为至少一轮反馈机制,或者为多轮反馈迭代机制,所述反馈机制对所述摘要生成大模型生成的所述医疗信息摘要结果进行自我检查与纠正。

17、可选地,所述反馈机制包括:

18、将来源于来源内容的句子与所述医疗信息摘要输入反馈器,所述反馈器输出所述医疗信息摘要中与所述来源于来源内容的句子不一致的部分,并根据不一致的部分给出错误修正意见;

19、根据所述反馈器给出的错误修正意见和所述医疗信息摘要,重新输入所述摘要生成大模型,根据反馈修改所述医疗信息摘要。

20、根据本发明的第二方面,提供一种医疗信息摘要自动生成系统,包括:

21、数据获取模块:根据电子病历数据,获取电子病历子字段;

22、模板构建模块:该模块提供一摘要生成大模型,该摘要生成大模型用于生成医疗信息摘要并能标注所述医疗信息摘要中每一句的来源内容;

23、摘要自动生成模块:该模块建立对应所述电子病历子字段的prompt与icl示例,将所述prompt内容、所述icl示例以及所述来源内容输入所述摘要生成大模型,生成第一摘要以及所述第一摘要中每个第一句子对应的来源内容;

24、摘要检查模块:该模块检查所有所述第一句子与所述来源内容是否一致,若一致,则所述第一摘要作为最终的医疗信息摘要。

25、所述系统还包括反馈模块,所述反馈模块为至少一轮反馈机制或者为多轮反馈迭代机制,所述反馈机制对所述摘要生成大模型生成的所述医疗信息摘要结果进行自我检查与纠正。

26、根据本发明的第三个方面,提供了一种计算机终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时可用于执行本发明上述中任一项所述的方法,或,运行本发明上述中任一项所述的系统。

27、根据本发明的第四个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可用于执行本发明上述中任一项所述的方法,或,运行本发明上述中任一项所述的系统。

28、由于采用了上述技术方案,本发明与现有技术相比,具有如下至少一项的有益效果:

29、本发明提供的医疗信息摘要自动生成方法和系统,采用摘要生成大模型自动标注输出的摘要中每一句的来源,并进一步进行检查一致性,可以解决自动生成病历的文本信息忠实性问题。

30、本发明提供的医疗信息摘要自动生成方法和系统,通过检查、修正框架,尽最大可能减少模型输出幻觉信息的概率,可以进行多轮自我修正,有效提高了医学摘要文本的忠实性。

31、本发明提供的医疗信息摘要自动生成方法和系统,通过设置摘要生成大模型输出摘要文本来源并检测错误的prompt范式构造,配合反馈器实现反馈迭代机制,提升生成器和反馈器的能力,通过优化流程各环节输出效果来确保最终输出文本的信息忠实性。



技术特征:

1.一种医疗信息摘要自动生成方法,其特征在于,包括:

2.根据权利要求1所述的医疗信息摘要自动生成方法,其特征在于,所述检查所有所述第一句子与所述来源内容是否一致,还包括:

3.根据权利要求1所述的医疗信息摘要自动生成方法,其特征在于,所述检查所有所述第一句子与所述来源内容是否一致,还包括:

4.根据权利要求1所述的医疗信息摘要自动生成方法,其特征在于,所述摘要生成大模型还包括反馈器,所述反馈器对所述摘要生成大模型生成的所述医疗信息摘要结果进行自我检查与纠正。

5.根据权利要求4所述的医疗信息摘要自动生成方法,其特征在于,所述反馈器用于实现至少一轮反馈机制或者多轮反馈迭代机制,包括:

6.根据权利要求1所述的医疗信息摘要自动生成方法,其特征在于,所述检查所有所述第一句子与所述来源内容是否一致,其中,采用检索方法进行分段检查。

7.一种医疗信息摘要自动生成系统,其特征在于,包括:

8.根据权利要求7所述的医疗信息摘要自动生成系统,其特征在于,还包括反馈模块,所述反馈模块为至少一轮反馈机制或者为多轮反馈迭代机制,所述反馈机制对所述摘要生成大模型生成的所述医疗信息摘要结果进行自我检查与纠正。

9.一种计算机终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时可用于执行权利要求1-6中任一项所述的方法,或,运行权利要求7或8所述的系统。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可用于执行权利要求1-6中任一项所述的方法,或,运行权利要求7或8所述的系统。


技术总结
本发明提供了一种医疗信息摘要自动生成方法及系统,根据电子病历数据,获取电子病历子字段;提供一摘要生成大模型,用于生成医疗信息摘要,并能标注医疗信息摘要中每一句的来源内容;建立prompt与ICL示例,将prompt内容、ICL示例以及来源内容输入摘要生成大模型的生成器,生成第一摘要以及第一摘要中每个第一句子对应的来源内容;检查所有第一句子与来源内容是否一致,若一致,则第一摘要作为最终的医疗信息摘要,若不一致,对生成结果进行自我检查与纠正;通过多轮反馈形成新的医疗信息摘要。该方法可以有效解决自动生成医疗信息摘要文本的溯源和忠实度问题,极大地提高了生物医疗领域自动生成文本的可靠性。

技术研发人员:柏志安,叶琪,姜胜耀,阮彤,朱立峰,钟博洋,李寅驰
受保护的技术使用者:上海交通大学医学院附属瑞金医院
技术研发日:
技术公布日:2024/2/6
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1