医保限定支付文本逻辑表达式生成方法、系统及存储介质

文档序号:31409005发布日期:2022-09-03 08:15阅读:111来源:国知局
医保限定支付文本逻辑表达式生成方法、系统及存储介质

1.本发明涉及文本数据处理技术领域,更具体的说是涉及一种医保限定支付文本逻辑表达式生成方法、系统及存储介质。


背景技术:

2.药品限定支付管理直接关系到参保人的合法权益、医保基金的有效利用和医院的医保费用返还,因此,在医保管理及相关医疗服务系统中非常重要。在现在技术中,医保目录中的药品限定支付范围的规定主要通过“备注”、“限定支付范围”等字段,以非结构化的描述文本予以说明,目前有关医保用药提醒、结算等系统主要通过关键词匹配,辅以简单规则引擎予以解决。该类解决的方法可以在一定程度起到降低人工查阅和审核的时间负担,但由于其并没有改变限定用药说明的表达形式,使其满足计算机理解需要,因此,也大大限制了其在智能化用药提醒、医疗结算、核保和监控等智能医疗系统中的应用。因此,对本领域技术人员来说,如何将非结构化的文本转换为计算机能够理解的逻辑表达式,是亟待解决的问题。


技术实现要素:

3.有鉴于此,本发明提供了一种医保限定支付文本逻辑表达式生成方法、系统及存储介质,以解决背景技术中提出的问题。
4.为了实现上述目的,本发明采用如下技术方案:一种医保限定支付文本逻辑表达式生成方法,具体步骤包括如下:
5.获取医保药品限定支付说明文本;
6.构建辅助术语知识库;
7.基于所述辅助术语知识库,将限定支付说明文本转换为药品限付文本特征序列;
8.根据所述药品限付文本特征序列构建文本特征序列-逻辑表达式对照模板库;
9.根据所述文本特征序列-逻辑表达式对照模板库,读取未处理的特征序列,基于模式匹配,自动生成对应的逻辑表达式。
10.可选的,还包括对所述限定支付说明文本进行预处理。
11.可选的,所述预处理包括拆分、去重、分类与过滤。
12.可选的,所述辅助术语知识库包括:限付类别特征词表、逻辑运算符-特征词映射表、药品限付文本特征序列停用词表。
13.可选的,所述药品限付文本特征序列的生成过程为:
14.基于所述逻辑运算符-特征词映射表,通过字符串正向最大匹配,将药品限定支付说明文本中的逻辑运算特征词标注并替换为逻辑运算符,形成初始的由所述逻辑运算符分隔的第一药品限付文本特征序列,并基于标注出来的逻辑运算特征词生成原始逻辑运算特征词序列;
15.基于所述药品限付文本特征序列停用词表,通过字符串正向最大匹配,从所述第
一药品限付文本特征序列中删除无意义词汇,生成所述药品限付文本特征序列。
16.可选的,所述构建文本特征序列-逻辑表达式对照模板库的过程为:
17.从所述药品限付文本特征序列中抽取逻辑运算符序列;
18.对所述逻辑运算符序列进行去重,得到第一序列;
19.根据所述药品限付文本特征序列对应的逻辑运算符序列,对第一序列进行分类,构成各类集合;
20.从所述各类集合中获取药品限付文本特征序列,构建对应的逻辑表达式,形成所述文本特征序列-逻辑表达式对照模板库。
21.可选的,若逻辑运算符序列对应多个逻辑表达式模板,则计算待处理特征序列对应的逻辑运算符特征词序列与逻辑表达模板对应的逻辑运算符特征词序列的相似度,进而比较相似度的大小,根据相似度最大的序列对应的逻辑表达式模板进行逻辑表达式自动构建,如果最大相似度对应的序列有多个,则随机选一个。
22.可选的,还包括人工修正与反馈,通过人工审核、修正自动处理结果,并将修正后的结果进行反馈,更新所述辅助术语知识库和所述文本特征序列-逻辑表达式对照模板库。
23.另一方面,提供一种医保限定支付文本逻辑表达式生成系统,包括文本获取模块、知识库构建模块、特征序列生成模块、模板库构建模块、逻辑表达式自动生成模块;其中,
24.所述文本获取模块,用于获取医保药品限定支付说明文本;
25.所述知识库构建模块,用于构建辅助术语知识库;
26.所述特征序列生成模块,用于基于所述辅助术语知识库,将限定支付说明文本转换为药品限付文本特征序列;
27.所述模板库构建模块,用于根据所述药品限付文本特征序列构建文本特征序列-逻辑表达式对照模板库;
28.所述逻辑表达式自动生成模块,用于根据所述文本特征序列-逻辑表达式对照模板库,读取未处理的特征序列,基于模式匹配,自动生成对应的逻辑表达式。
29.最后,提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种医保限定支付文本逻辑表达式生成方法的步骤。
30.经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种医保限定支付文本逻辑表达式生成方法、系统及存储介质,可以将药品限定支付范围表述从非结构化的自由文本转换为计算机能够理解的逻辑表达式,如将“限低纤维蛋白原血症致活动性出血”描述文本转换成计算机可理解的逻辑表达式为:“低纤维蛋白原血症”and“活性出血”,为加速用药提醒、医疗结算、核保等医保管理工作的智能化发展提供语义表达技术支持;利用本发明方法完成医保目录中的药品限定支付范围描述文本的逻辑表达式的生成,即可为其他药品目录中药品限定支付范围描述文本的逻辑表达式的生成提供知识库或模板库基础,快速实现其他目录中药品限定支付范围文本的逻辑表达式生成,降低人工查阅和审核的时间负担,提高效率。
附图说明
31.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
32.图1为本发明的方法流程图;
33.图2为本发明的系统结构图。
具体实施方式
34.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
35.本发明实施例公开了一种医保限定支付文本逻辑表达式生成方法,如图1所示,具体步骤包括如下:
36.s1、获取医保药品限定支付说明文本;
37.s2、构建辅助术语知识库;
38.s3、基于辅助术语知识库,将限定支付说明文本转换为药品限付文本特征序列;
39.s4、根据药品限付文本特征序列构建文本特征序列-逻辑表达式对照模板库;
40.s5、根据文本特征序列-逻辑表达式对照模板库,读取未处理的特征序列,基于模式匹配,自动生成对应的逻辑表达式。
41.在本实施例中,以《国家基本医疗保险、工伤保险和生育保险药品目录(2020)》(简称《2020国家医保目录》)“备注”栏目中的药品限定支付范围说明文本为例,展示生成医保限定支付逻辑表达式的过程,
42.s1、从《2020国家医保目录》“备注”字段中获取药品限定支付范围文本。抽取结果示例见表1。
43.表1
44.[0045][0046]
s2、人工构建辅助术语知识库
[0047]
s21、分析并构建限付类别特征词表:如分析发现“二线用药”是《2020国家医保目录》中药品限付类别之一;“二线用药”、“二线治疗”均可作为“二线用药”类别的特征词,据此,限付类别关键特征词表中应包括表2所示的内容。
[0048]
表2
[0049]
限付类别类别特征词二线用药二线用药 二线治疗
[0050]
s22、构建逻辑运算符-特征词映射表。人工分析《2020国家医保目录》中限付文本,获得逗号“,”“且”“或”“不含”等表征逻辑运算语义的特征词,并据此形成了表3所示的逻辑运算符-特征词映射表。
[0051]
表3
[0052]
逻辑运算符特征词使用规则and与
ꢀꢀ

ꢀꢀ

ꢀꢀ
引起的 or或
ꢀꢀ
、 非不含
ꢀꢀ
不予 [0053]
s23、药品限付文本特征序列停用词表:人工分析《2020国家医保目录》中限付备注文本,可获得“限”“患者”、数字、标点等对限付语义理解中无意义的词汇,形成药品限付文本特征序列停用词表,如表4所示(简称停用词表)。
[0054]
表4
[0055][0056]
s3、对获得的药品限付文本进行预处理。
[0057]
s31、拆分:通过“;限”分隔标识,将复合限付描述文本拆分成单个限付描述文本。如将
“▲
;限儿童”拆分为两条单个限付描述文本:
“▲”
和“限儿童”;将“限万古霉素治疗不可耐受的重症感染的二线治疗;限耐万古霉素的肠球菌感染”拆分为:“限万古霉素治疗不可耐受的重症感染的二线治疗”和“限耐万古霉素的肠球菌感染”。
[0058]
s32、去重:对拆分后的所有单个限付描述文本进行去重。如上一步骤中拆分获得的“限儿童”与表1中的第2行“限儿童”重复,去重后保留一条限付文本。
[0059]
s33、分类:利用类别特征词表对去重后的药品限用文本进行限付分类。如基于表2,通过特征词字符串精确匹配,将“限轻中度特应性皮炎患者的二线用药”和“限万古霉素治疗不可耐受的重症感染的二线治疗”两个药品限用文本分类为“二线用药”。
[0060]
s33、过滤:赋予后续技术方案无法处理的类别添加“暂不处理”标识,如将“二线用药限制”类的限付文本标识为“暂不处理”。
[0061]
s4、生成由逻辑运算符分隔的药品限付文本特征序列。
[0062]
s41、基于映射表,通过字符串正向最大匹配,标注出药品限付文本中的逻辑运算特征词,替换为逻辑运算符,形成初始的由逻辑运算符分隔的药品限付文本特征序列和原始逻辑运算特征词序列。如:“限低钾血症引起的心律失常或洋地黄中毒引起的心律失常”的初始限付文本特征序列为[限低钾血症and心律失常or洋地黄中毒ands心律失常],原始逻辑运算特征词序列为[引起的或引起的];“限治疗血纤维蛋白溶解亢进引起出血的患者”的初始限付文本特征序列为[限治疗血纤维蛋白溶解亢进and出血的患者],原始逻辑运算特征词序列为[引起]。
[0063]
s42、基于停用词表,通过字符串正向最大匹配,从[限低钾血症and心律失常or洋地黄中毒ands心律失常]中删除无意义的特征词汇“限”,生成有意义的限付文本特征序列[低钾血症and心律失常or洋地黄中毒and心律失常];从“限中长效胰岛素难以控制的2型糖尿病患者”的初始限付文本特征序列[限中长效胰岛素and 2型糖尿病患者]中删除无意义的特征词汇“限”“患者”,生成有意义的限付文本特征序列[中长效胰岛素and 2型糖尿病]。
[0064]
s5、构建初始限付文本特征序列-逻辑表达式对照模板库。
[0065]
s51、从药品限付文本特征序列中抽取逻辑运算符序列。如可从“低钾血症and心律失常or洋地黄中毒and心律失常”中获得逻辑运算符序列“x1 and x2 or x3 and x4”;从“中长效胰岛素and 2型糖尿病”获得逻辑运算符序列“x1 and x2”。
[0066]
s52、通过字符串精确匹配,对获得逻辑运算符序列进行去重,获得限付文本特征序列类别。如:“x1 and x2”。
[0067]
s53、根据限付文本特征序列对应的逻辑运算符序列,对限付文本特征序列进行分类。如将逻辑运算符序列“x1 and x2”对应的“中长效胰岛素and 2型糖尿病”和“癌症疼痛and吞咽困难”限付文本序列分为同一类集合。
[0068]
s54、从各类集合中抽取任意1个限付文本序列及其对应的原始描述文本,人工构建逻辑表达式,形成逻辑运算符序列对应的逻辑表达式模板。如从“x1 and x2”抽取“中长效胰岛素and 2型糖尿病”及其对应的原始描述文本“限中长效胰岛素难以控制的2型糖尿病患者”,构建逻辑表达式:“中长效胰岛素”and“2型糖尿病”。据此,形成逻辑运算符序列[x1 and x2]对应的逻辑表达式模板:“x1”and“x2”。重复此步骤,完成所有逻辑运算符序列对应的逻辑表达式模板构建,形成初始限付文本特征序列-逻辑表达式对照模板库。表5为
限付文本特征序列-逻辑表达式对照模板库实例:
[0069]
表5
[0070][0071]
s6、基于模式匹配方式半自动生成由逻辑表达式。
[0072]
如根据逻辑运算符序列[x1 and x2]与逻辑表达式模板:“x1”and“x2”的对应关系,自动完成该序列集合中其他限付文本序列的逻辑表达式生成。如:[糖尿病诊断and微循环障碍临床证据]
→“
糖尿病诊断”and“微循环障碍临床证据”;[癌症疼痛and吞咽困难]
→“
癌症疼痛”and“吞咽困难”吞咽困难。
[0073]
s7、人工修正与反馈。
[0074]
进一步的对自动生成的逻辑表达式进行修正,正则表达式程序根据逻辑运算符序列[x1 and x2 or x3 and x4]与逻辑表达式模板“x1”and“x2”or“x3”and“x4”的对应关系,自动完成该序列集合中[慢性动脉闭塞的诊断and明确的溃疡or间歇性跛行or严重疼痛体征]序列的逻辑表达式生成:“慢性动脉闭塞的诊断”and“明确的溃疡”or“间歇性跛行”or“严重疼痛体征”。人工审核发现有误,将其修正为:“慢性动脉闭塞的诊断”and(“明确的溃疡”or“间歇性跛行”or“严重疼痛体征”)”;并将正确的逻辑表达对应的模板更新到模板库中。如表6所示,针对逻辑运算符序列[x1 and x2 or x3 and x4],新增一条逻辑表达式模板:“x1”and(“x2”or“x3”or“x4”)。
[0075]
表6
[0076][0077]
本发明实施例2公开了一种医保限定支付文本逻辑表达式生成系统,如图2所示,包括文本获取模块、知识库构建模块、特征序列生成模块、模板库构建模块、逻辑表达式自动生成模块;其中,
[0078]
文本获取模块,用于获取医保药品限定支付说明文本;
[0079]
知识库构建模块,用于构建辅助术语知识库;
[0080]
特征序列生成模块,用于基于辅助术语知识库,将限定支付说明文本转换为药品限付文本特征序列;
[0081]
模板库构建模块,用于根据药品限付文本特征序列构建文本特征序列-逻辑表达
式对照模板库;
[0082]
逻辑表达式自动生成模块,用于根据文本特征序列-逻辑表达式对照模板库,读取未处理的特征序列,基于模式匹配,自动生成对应的逻辑表达式。
[0083]
最后,提供一种计算机存储介质,计算机存储介质上存储有计算机程序,计算机程序被处理器执行时实现一种医保限定支付文本逻辑表达式生成方法的步骤。
[0084]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0085]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1