一种患者主索引数据生成方法、系统及装置与流程

文档序号:32311943发布日期:2022-11-23 11:59阅读:502来源:国知局
一种患者主索引数据生成方法、系统及装置与流程

1.本发明涉及临床医学数据化技术领域,具体为一种患者主索引数据生成方法、系统及装置。


背景技术:

2.目前,在很多医院的数据系统中his、lis、pacs、手麻、心电这些系统往往都不是一家公司的产品。从业务需求看,很多系统对数据的表述也各有不同。如果不进行规范和统一,在数据交互和业务协同时必然存在解读的差异。
3.公开号为“cn104699715a”,名称为《患者主索引平台系统构建方法》的中国专利披露了通过建立统一的患者主索引,将分散在不同系统的患者标识进行交叉索引,从而实现主索引系统进行数据的复杂和组合查询。然而该专利未能解决如下问题,即:随时间发展,人员数据的结构也会发生变化,此时匹配规则的准确性会降低,就需要再次进行数据采集测试等流程操作,维护工作需要人工成本和时间成本。


技术实现要素:

4.本发明的目的在于提供一种患者主索引数据生成方法、系统及装置,能够提高大量数据匹配的准确性和效率,有利于不同医院系统的患者数据的整合和共享。
5.为实现上述目的,本发明提供如下技术方案:一种患者主索引数据生成方法,包括如下步骤:步骤1、获取患者的注册数据;步骤2、验证所述注册数据是否合规,若合规则转向步骤3;步骤3、根据所述注册数据,在主索引库中进行相似度匹配查询,若查询结果满足自动合并条件则转向步骤4,若满足自动新建条件则转向步骤5,若满足人工处理条件则转向步骤6;步骤4、将所述注册数据与对应的患者索引数据合并,并将所述注册数据的差异部分覆盖所述患者索引数据对应的部分;步骤5、将所述注册数据创建为新的患者索引数据并存入主索引库中;步骤6、提供人工处理界面。
6.进一步地,所述步骤2包括:所述注册数据中的必填项为空值则判定为不合规,生成记录并通知给数据来源方;所述注册数据中的必填项的数据类型存在错误类型则判定为不合规,其他字段存在错误类型则清空,记录该操作并留存原始数据,并允许继续进行后续步骤;所述注册数据中的身份证号码不合法则判定为不合规,生成记录并通知给数据来源方;所述注册数据中的手机号码验证未通过则清空,记录该操作并留存原始数据,并
允许继续进行后续步骤。
7.进一步地,所述步骤3包括如下步骤:步骤31、将所述第一字段组合作为查询条件,判断主索引库中是否存在相一致的主索引数据,若存在则满足自动合并条件,否则转向步骤32;所述第一字段组合为权重值的总和超过第一阈值的最小数量的所有字段的组合,所述权重值、第一阈值和第一字段组合预设在匹配组合知识库中;步骤32、将所述第二字段组合作为查询条件,判断主索引库中是否存在相一致的主索引数据,若存在则满足人工处理条件,否则满足自动新建条件;所述第二字段组合为权重值的总和超过第二阈值、但不超过第一阈值的最小数量的所有字段的组合,所述第二阈值和第二字段组合预设在匹配组合知识库中。
8.进一步地,所述匹配组合知识库通过如下步骤构建:步骤a、采集患者数据;步骤b、校验所述患者数据中各个字段的正确性,并计算各个字段的正确率;步骤c、根据各个字段的正确率设置各个字段的权重值以及第一阈值和第二阈值;步骤d、统计第一字段组合和第二字段组合;步骤e、利用所述患者数据进行匹配测试得到测试结果,所述测试结果包括各个字段的权重值、第一阈值、第二阈值、第一字段组合和第二字段组合;步骤f、根据所述测试结果构建匹配组合知识库。
9.进一步地,所述步骤e包括:步骤e1、将所述患者数据逐一与主索引库中的患者索引数据进行相似度匹配,并根据匹配结果确定输入方式;步骤e2、查验经过e1后的主索引库中的患者索引数据是否合理,若合理则转向步骤e3,否则转向步骤c;步骤e3、判断测试次数是否达到预设次数,若是则输出测试结果并转向步骤f,否则转向步骤a。
10.进一步地,所述e1包括如下步骤:步骤e11、将所述第一字段组合作为查询条件,查询主索引库中是否存在相一致的主索引数据,若存在则转向在步骤e13,否则转向步骤e2;步骤e12、将所述第二字段组合作为查询条件,查询主索引库中是否存在相一致的主索引数据,若存在则转向步骤e14,否则转向步骤e15;步骤e13、采用自动合并方式将患者数据输入至主索引库中;步骤e14、采用人工输入方式将患者数据输入至主索引库中;人工方式为人工合并或人工新建;步骤e15、采用自动新建方式将患者数据输入至主索引库中。
11.本发明还提供了一种患者主索引数据生成系统,包括:注册模块,用于获取患者的注册数据;验证模块,用于验证所述注册数据是否合规,若合规则激活匹配模块;匹配模块,用于根据所述注册数据,在主索引库中进行相似度匹配查询,若查询结果满足自动合并条件则激活合并模块,若满足自动新建条件则激活新建模块,若满足人工
处理条件则激活人工模块;合并模块,用于将所述注册数据与对应的患者索引数据合并,并将所述注册数据的差异部分覆盖所述患者索引数据对应的部分;新建模块,用于将所述注册数据创建为新的患者索引数据并存入主索引库中;人工模块,用于提供人工处理界面。
12.进一步地,所述匹配模块包括:第一匹配子模块,用于将所述第一字段组合作为查询条件,判断主索引库中是否存在相一致的主索引数据,若存在则满足自动合并条件,否则激活第二匹配子模块;所述第一字段组合为权重值的总和超过第一阈值的最小数量的所有字段的组合,所述权重值、第一阈值和第一字段组合预设在匹配组合知识库中;第二匹配子模块,用于将所述第二字段组合作为查询条件,判断主索引库中是否存在相一致的主索引数据,若存在则满足人工处理条件,否则满足自动新建条件;所述第二字段组合为权重值的总和超过第二阈值、但不超过第一阈值的最小数量的所有字段的组合,所述第二阈值和第二字段组合预设在匹配组合知识库中。
13.进一步地,所述匹配组合知识库通过知识库系统构建得到,所述知识库系统包括:采集模块,用于采集患者数据;计算模块,用于校验所述患者数据中各个字段的正确性,并计算各个字段的正确率;设置模块,用于根据各个字段的正确率设置各个字段的权重值以及第一阈值和第二阈值;统计模块,用于统计第一字段组合和第二字段组合;测试模块,用于利用所述患者数据进行匹配测试得到测试结果,所述测试结果包括各个字段的权重值、第一阈值、第二阈值、第一字段组合和第二字段组合;构建模块,用于根据所述测试结果构建匹配组合知识库。
14.本发明还提供了一种患者主索引数据生成装置,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器执行计算机程序时实现上述方法的步骤。
15.与现有技术相比,本发明的有益效果是:1、本发明能够根据数据匹配合并流程,保证主索引库的唯一性。同时,通过数据校验确保数据的正确性。
16.2、本发明能够根据数据采集标记计算的方式,创建生成匹配组合知识库,能够提高匹配准确性和效率。
17.3、本发明能够通过主索引系统,应对各种各样的患者数据,并把这些散在各个医院系统的患者数据整合起来,为实现数据共享提供有利条件。
附图说明
18.图1为本发明中的方法流程图;图2为本发明中构建匹配组合知识库的方法流程图。
具体实施方式
19.下面结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.如图1所示,一种患者主索引数据生成方法,包括如下步骤:步骤1、获取患者的注册数据。注册数据包括基本数据和就诊数据。基本数据包括姓名、性别、出生日期、身份证号等。就诊数据包括就诊卡号、病案号、医保账号等。某患者的注册数据如下(带“*”为必填项):姓名*:王某洁性别:女手机号:13888888888出生日期:1949年12月31日身份证号码*:11010519491231002x就诊卡号:空医保账号:空病案号:空步骤2、验证注册数据是否合规,若合规则转向步骤3。为了防止错误数据误入,需要对患者数据进行验证,通过验证后方可进入下一流程,未通过验证则判定为错误数据,退出流程。数据验证的具体方法为:步骤21、必填项验证:必填项包括身份证号码、姓名、性别、出生日期、户口所在地、病案号或住院号等(实际情况需要根据医院患者数据库来制定)。必填项为空值的话则判定为不合规,生成记录并通知给数据来源方。
21.步骤22、数据类型验证:例如数字类型,时间类型,文字类型等,数据要符合对应的数据类型。必填项存在错误类型则判定为不合规,其他字段存在错误类型则清空,记录该操作并留存原始数据,可以继续进行后续流程。
22.步骤23、身份证号码合法验证:采取校验位校验算法验证身份证是否正确合法,如果身份证未验证通过则判定为不合规,生成记录并通知给数据来源方。身份证号码作为独一无二代表公民数据的号码,它的组成是由以下的数字表示的:(1)第1、2位数字表示:所在省(直辖市、自治区)的代码;(2)第3、4位数字表示:所在地级市(自治州)的代码;(3)第5、6位数字表示:所在区(县、自治县、县级市)的代码;(4)第7-14位数字表示:出生年、月、日;(5)第15、16位数字表示:所在地的派出所的代码;(6)第17位数字表示性别:奇数表示男性,偶数表示女性;(7)第18位数字是校检码:是根据《中华人民共和国国家标准gb11643-1999》中有关公民身份号码的规定,根据精密的计算公式计算出来的。患者王某洁的身份证号码为11010519491231002x,其身份证号码合法验证的步骤为:步骤231、计算前17位数与其系数的乘积之和s,公式为:;表示身份证号码的第n位
数字,表示每位数字对应的系数,n取值1-17,至依次取值为:7、9、10、5、8、4、2、1、6、3、7、9、10、5、8、4、2。根据计算可知,s=1
×
7+1
×
9+0
×
10+1
×
5+0
×
8+5
×
4+1
×
2+9
×
1+4
×
6+9
×
3+1
×
7+2
×
9+3
×
10+1
×
5+0
×
8+0
×
4+2
×
2=167。
23.步骤232、计算s除以11后的余数a,公式为:,n表示商值。根据计算可知,a=167-11
×
15=2。
24.步骤233、根据余数a确定第18位数,余数a与第18位数的对应关系如下表所示:步骤234、若经过计算得到的第18位数与患者的注册数据中记录的身份证号码的第18位数一致,则验证通过,否则验证不通过。根据步骤233中的对应关系表可知,a为2时,a
18
=x,与身份证号码的第十八位数字一致,验证通过。
25.4、手机号码合法验证:采用正则判断手机号码正确性,手机号码验证未通过则清空,记录该操作并留存原始数据,可以继续进行后续流程。由于我国手机号码均由电信,移动,联通目前发行而来,采用正则表达式验证更加精确。正则表达式为^1[3|4|5|7|8][0-9]{9}$。
[0026]
经过验证,王某洁患者的注册数据均合规,可以继续后续的流程。
[0027]
步骤3、根据注册数据,在主索引库中进行相似度匹配查询,若查询结果满足自动合并条件则转向步骤4,若满足自动新建条件则转向步骤5,若满足人工处理条件则转向步骤6。
[0028]
步骤3包括如下步骤:步骤31、将第一字段组合作为查询条件,判断主索引库中是否存在相一致的主索引数据,若存在则满足自动合并条件,否则转向步骤32。第一字段组合为权重值的总和超过第一阈值的最小数量的所有字段的组合,权重值、第一阈值和第一字段组合预设在匹配组合知识库中。注册数据中各字段的权重值如下表所示:本例中,第一阈值为99,第一字段组合如下表所示:
根据上表的字段组合进行遍历查询,在主索引库中未能找到与患者王某洁的注册数据相匹配的患者索引数据,因此需要继续查询,转向步骤32。
[0029]
步骤32、将第二字段组合作为查询条件,判断主索引库中是否存在相一致的主索引数据,若存在则满足人工处理条件,否则满足自动新建条件。第二字段组合为权重值的总和超过第二阈值、但不超过第一阈值的最小数量的所有字段的组合,第二阈值和第二字段组合预设在匹配组合知识库中。
[0030]
本例中,第二阈值为49,第二字段组合如下表所示:根据上表的字段组合进行遍历查询,在主索引库中也未能找到与患者王某洁的注册数据相匹配的患者索引数据,因此需要新建该患者的数据,转向步骤5。
[0031]
步骤4、将注册数据与对应的患者索引数据合并,并将注册数据的差异部分覆盖患者索引数据对应的部分。合并之后生成合并记录,备份原始数据,便于以后还原回原始数据。
[0032]
例如:患者索引数据中工作单位名称、工作单位-省、工作单位-市、工作单位-县、工作单位邮编、工作单位电话号等这些数据缺少,在注册数据中有这些数据,就用注册数据中的新数据填充患者索引数据中的老数据。又例如:注册数据中的手机号字段和患者索引数据中的不一致,可能因为该患者换了新的手机号码,因此也要覆盖老数据。
[0033]
步骤5、将注册数据创建为新的患者索引数据并存入主索引库中。创建的同时分配一个主索引号,主索引号是一个索引的id标识,提供给第三方业务系统用于查询主索引信息。本例中,由于在步骤3中经历两次查询也未能找到与患者王某洁的注册数据相匹配的患者索引数据,因此根据该患者的注册数据直接在主索引库中新建该患者的患者索引数据,并匹配一个主索引号。
[0034]
步骤6、提供人工处理界面。如果经过步骤32找到了该患者的患者索引数据,则说明该数据存在潜在重复的可能性,因此需要交由人工进行判断是否新建数据还是合并数据。例如,以“姓名+出生日期”进行查询,查到主索引库中有一条相匹配的患者索引数据,内容如下:姓名:王某洁性别:空手机号:空出生日期:1949年12月31日身份证号码:11010519491230002x就诊卡号:空医保账号:空病案号:空如果经过人工对比发现,患者索引数据与患者的注册数据中身份证号码相似度极高,经过人工核实发现患者索引数据中身份证号码填写错误,此时判定两个数据同属一个患者,因此应当按照合并原则将两个数据合并,并用正确的身份证号码覆盖错误的身份证号码。
[0035]
如果经过人工对比发现,患者索引数据与患者的注册数据中身份证号码相似度极高,经过人工核实发现患者索引数据中身份证号码填写正确,此时判定两个数据分别属于两个患者,因此应当按照新建原则,将注册数据新增到主索引库中形成新的患者索引数据。
[0036]
如图2所示,本发明还提供了一种匹配组合知识库构建方法,包括如下步骤:步骤a、采集患者数据。收集医院多个业务系统中的历史患者信息数据,例如一次性采集5万条患者数据。数据从不同的系统中提取,重复性较高,便于用来做匹配测试。
[0037]
步骤b、校验患者数据中各个字段的正确性,并计算各个字段的正确率。例如:采集的5万条数据中,“姓名”数据正确的有4.9万,那么“姓名”字段的正确率为98%;“籍贯”字段有大量的空值并且有许多错误的数据类型,比如数字、英文字母等,正确率则很低。
[0038]
步骤c、根据各个字段的正确率设置各个字段的权重值以及第一阈值和第二阈值。对具有唯一性标识的字段赋予较高的权重值,反之则赋予较低的权重值。
[0039]
步骤d、统计第一字段组合和第二字段组合。第一字段组合为权重值的总和超过第一阈值的最小数量的所有字段的组合,第二字段组合为权重值的总和超过第二阈值、但不超过第一阈值的最小数量的所有字段的组合。
[0040]
步骤e、利用患者数据进行匹配测试得到测试结果。该步骤包括:步骤e1、将患者数据逐一与主索引库中的患者索引数据进行相似度匹配,并根据匹配结果确定输入方式。更具体地,该步骤包括:步骤e11、将第一字段组合作为查询条件,查询主索引库中是否存在相一致的主索引数据,若存在则转向在步骤e13,否则转向步骤e2。
[0041]
步骤e12、将第二字段组合作为查询条件,查询主索引库中是否存在相一致的主索引数据,若存在则转向步骤e14,否则转向步骤e15。
[0042]
步骤e13、采用自动合并方式将患者数据输入至主索引库中;步骤e14、采用人工输入方式将患者数据输入至主索引库中;人工方式为人工合并
或人工新建。
[0043]
步骤e15、采用自动新建方式将患者数据输入至主索引库中。
[0044]
步骤e2、查验经过e1后的主索引库中的患者索引数据是否合理,若合理则转向步骤e3,否则转向步骤c。
[0045]
步骤e3、判断测试次数是否达到预设次数,若是则输出测试结果并转向步骤f,否则转向步骤a。
[0046]
步骤f、判断测试次数是否达到预设次数,若是则输出测试结果并转向步骤g,否则转向步骤a。测试结果包括各个字段的权重值、第一阈值、第二阈值、第一字段组合和第二字段组合。本例中,预设次数为5次。经过测试后得到的测试结果如下:各字段的权重值如下表所示:第一阈值为99,第二阈值为49。
[0047]
第一字段组合如下表所示:第二字段组合如下表所示:
步骤g、根据测试结果构建匹配组合知识库。
[0048]
本发明还提供了一种患者主索引数据生成系统,包括:注册模块、验证模块、匹配模块、合并模块、新建模块和人工模块。
[0049]
注册模块用于获取患者的注册数据。验证模块用于验证注册数据是否合规,若合规则激活匹配模块。匹配模块用于根据注册数据,在主索引库中进行相似度匹配查询,若查询结果满足自动合并条件则激活合并模块,若满足自动新建条件则激活新建模块,若满足人工处理条件则激活人工模块。合并模块用于将注册数据与对应的患者索引数据合并,并将注册数据的差异部分覆盖患者索引数据对应的部分。新建模块用于将注册数据创建为新的患者索引数据并存入主索引库中。人工模块用于提供人工处理界面。
[0050]
其中,匹配模块还包括:第一匹配子模块和第二匹配子模块。
[0051]
第一匹配子模块用于将第一字段组合作为查询条件,判断主索引库中是否存在相一致的主索引数据,若存在则满足自动合并条件,否则激活第二匹配子模块;第一字段组合为权重值的总和超过第一阈值的最小数量的所有字段的组合,权重值、第一阈值和第一字段组合预设在匹配组合知识库中。
[0052]
第二匹配子模块用于将第二字段组合作为查询条件,判断主索引库中是否存在相一致的主索引数据,若存在则满足人工处理条件,否则满足自动新建条件;第二字段组合为权重值的总和超过第二阈值、但不超过第一阈值的最小数量的所有字段的组合,第二阈值和第二字段组合预设在匹配组合知识库中。
[0053]
匹配组合知识库通过知识库系统构建得到,知识库系统包括:采集模块、计算模块、设置模块、统计模块、测试模块和构建模块。
[0054]
采集模块用于采集患者数据。计算模块用于校验患者数据中各个字段的正确性,并计算各个字段的正确率。设置模块用于根据各个字段的正确率设置各个字段的权重值以及第一阈值和第二阈值。统计模块用于统计第一字段组合和第二字段组合。测试模块用于利用患者数据进行匹配测试得到测试结果,测试结果包括各个字段的权重值、第一阈值、第二阈值、第一字段组合和第二字段组合。构建模块用于根据测试结果构建匹配组合知识库。
[0055]
本发明还提供了一种患者主索引数据生成装置,包括处理器和存储器,存储器存储有计算机程序,处理器执行计算机程序时实现上述方法的步骤。
[0056]
本发明未详述之处,均为本领域技术人员的公知技术。
[0057]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产
品的形式。
[0058]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0059]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0060]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0061]
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1