基于病人就诊地理大数据的医疗机构绩效分级评价方法与流程

文档序号:19313209发布日期:2019-12-03 23:44阅读:181来源:国知局
基于病人就诊地理大数据的医疗机构绩效分级评价方法与流程
本发明涉及医学统计学、医院医疗质量监测
技术领域
,尤其涉及一种基于病人就诊地理大数据的医疗机构绩效分级评价方法。
背景技术
:医疗服务质量是医院全部工作所取得的医疗效果的集中表现。它直接决定了医院的绩效评价和诊疗水平。对于医疗服务评价,国家一直有一套现行标准,即:《三级综合医院评审标准(2011年版)》和所对应的《三级综合医院医疗质量管理与控制指标(2011版)》。根据该标准,将医院按级别分为三级、二级和一级,每一级别按等次分为甲等和乙等。等级评审体系在改善医疗服务、提高医疗质量、保障医疗安全方面起到了极大的作用。同时也基本决定了我国公立、私立分类以及医院分级的基本现状。为了更准确地评价医疗服务质量,研究机构针对医疗服务质量也相继提出了一系列评价方法。这些方法一般是以诊断是否正确,治疗是否有效、及时、彻底,疗程长短,差错事故的有无,以及医疗工作效率、费用高低、疾病诊断相关组(drgs)覆盖率等来评价的。评价过程会采用一系列指标,例如,治愈率、病死率、生存率、平均住院日、病床使用率、病床周转率、费用消耗、drgs组数和病例组合指数(cmi)等,此外,还包括医院的一些硬件标准,如床位、科室设置、医疗设备、人员配备等。然而,由于医疗情况的复杂性,仅凭一些数值型的定量指标并不足以如实反映医疗服务的全貌。一些定性指标,如医院的管理水平,每个医生的实际技术水平,专家、病人对医院的评价在医疗服务评价方面也具有十分重要的作用。通过构建指标体系来对医疗服务进行质量评价尽管能够较好地反映实际情况,但是,这种方法在实践过程中也存在一些共性的问题,一是一些定性化指标难以量化处理,人工干预多,有些人为判断较为武断;二是一些定量化指标多是基于抽样调查,未必反映真实全貌,三是指标体系过于繁多,计算复杂。针对这种情况,近年来,一些专利技术直接使用大数据来更为全面和客观地反映医疗服务质量。例如,授权专利:“一种面向医疗质量评价的大数据挖掘方法”(公开号cn106202891a)发明了一种利用大数据挖掘方法来进行医疗质量评价,该发明将数据挖掘中的聚类思想应用到医疗质量评价中各个因素的打分中,针对大数据中的每一条病例,进行基于病例质量模型的分数计算并最终计算出医疗单位的医疗质量分数。在审专利:“基于医疗大数据的医院评价系统及评价方法”(公开号cn106485403a)则直接利用各个医院信息系统存储的住院数据和门诊数据,按照传统思路构建指标体系,并进行打分计算,进行评价。授权专利:“一种医疗机构住院服务绩效评估方法”(公开号:cn104182844a)也直接使用海量病案首页数据提供了一种医疗机构住院服务绩效评估方法,利用国际疾病分类编码icd-10中20章作为“主要疾病分类mdc”,对每一mdc中的疾病,继续按照疾病类目icd编码前三位分组,按照疾病类目分组drgs的方法对所有指标进行标准化处理,来评价医院的医疗技术难度,服务能力、效率和质量。在审专利:“基于数据关联的医生评级推荐系统及方法”则从各个医院的医院信息系统及其网络挂号网站中扒取数据,获取病患对医生的评分,并将评分最高的医生推荐给用户。上述直接利用大数据来对医疗机构进行分级评价能够顾及更为全面的实际情况,大数据的相关理论与技术也为指标的计算提供了较为坚实的理论基础。尽管针对医疗机构的绩效水平所开展的分级评价问题已经取得了较为丰硕的发明成果。但是,已有评价方法更多地从医疗机构自身的角度出发来对医疗机构的绩效或者服务等作出评价。对定量化、精准化、标准化地从病患角度来分析医疗机构的绩效和服务水平的研究较为不足,在各种指标的计算中,尤其缺乏对地理空间数据的分析和利用。事实上,医疗机构的根本目的是为公众提供医疗服务。病患是否选择到某一家医院就诊,事实上已经顾及多种因素(例如该医院的诊疗水平、服务水平、价格情况)做出了对医院的综合评价。此外,病患自身的所处位置,到医院的距离远近,医疗机构的地理位置和空间分布等这些也都是病人就诊时的制约因素。因此,从病患角度出发,公众对医疗机构的实际就诊情况也可以用于反映医疗机构在病人心目中的声望高低,从而有效地反映医院的绩效和服务水平。技术实现要素:本发明的目的就在于为了解决上述问题而提供一种基于病人就诊地理大数据的医疗机构绩效分级评价方法。本发明通过以下技术方案来实现上述目的:本发明包括以下步骤:步骤一、病案首页病患地址信息地图匹配:从海量病案首页提取病患的居住地及其就诊医疗机构文本地址信息,将文本地址信息进行正确分词,根据已有相关区域的地名词典,提取文本地址中所在的市、县、乡镇、道路等,而后自动将文本地址匹配到地图中的相应位置,从而完成病人及其就诊医疗机构的地理定位。在此基础上,建立病案首页空间数据表,数据表包含病人身份编码、疾病代码、现住址、现住址空间坐标、就诊医疗机构名称、就诊医疗机构id、就诊医疗机构空间坐标等字段信息,其中病人身份编码为病人唯一标识码,就诊医疗机构id为医疗机构唯一标识码;步骤二、根据病人就诊信息,构建医疗机构复杂地理网络:在步骤一的基础上,对完成地理定位后的病人、医疗机构建立复杂地理网络;1)构建复杂地理网络节点:在病案首页空间数据表中,选取一种疾病类型,根据病人身份编码提取所有病人空间位置及疾病代码、就医花费、住院时长等信息,作为复杂地理网络中病人节点vpatient;根据就诊医疗机构id提取所有医疗机构空间位置、机构名称等信息,作为复杂地理网络中医疗机构节点vhospital;2)构建复杂地理网络边:在病案首页空间数据表中,选取一种疾病类型,以病人为对象,根据身份编码提取其就诊行为,将每次就诊行为中病人作为起点,医疗机构作为终点,二者之间的空间关联为复杂地理网络中的就诊边etreatment;对同一病人的多次就诊行为,设定就医时间间隔和疾病类型阈值,按时间顺序提取阈值范围内同一病人先后就诊的医疗机构,这些医疗机构之间的空间关联为复杂地理网络中的转诊边etransfer;所有节点与边构成复杂地理网络,复杂地理网络记为符号g={v,e},其中v={vpatient,vhospital}={v1,v2,...vn}代表网络中的节点,包含病人节点和医疗机构节点,而e={etreatment,etransfer}={e1,e2,...em}代表网络中的边,包括就诊边和转诊边,即n个节点和m个边;步骤三、根据医疗机构的度中心性对医疗机构进行大类划分:以医疗机构实际就诊病人人数为基础,构建医疗机构度中心性指标,并依照该指标对医疗机构进行大类划分;1)度中心性指标构建:在医疗机构复杂地理网络中,医疗机构节点vhospital的度为病人选择到该医疗机构就诊的总人数,又被称之为度的中心性,记为ipatient;2)医疗机构大类划分:根据医疗机构度中心性,采用系统聚类法进行聚类,并将医疗机构从整体上按照常见的国家的三级医院分类方法分为九个大类,度中心性相近的医疗机构被分入同一大类;度中心性越强,医疗机构所在大类等级越高,其中度中心性最强的分类为第一大类医疗机构,度中心性最弱的分类为第九大类医疗机构;步骤四、计算医疗机构吸引中心性指标:以每个分类中医疗机构复杂地理网络中病人节点vpatient、医疗机构节点vhospital、就诊边etreatment为基础,计算医疗机构吸引中心性指标;1)医疗机构voronoi图构建:提取医疗机构复杂地理网络中医疗机构节点vhospital,根据医疗机构位置构建voronoi图,voronoi图对医疗机构所在地理空间进行分割,每个voronoi多边形中仅包含1个医疗机构,该多边形的覆盖范围为医疗机构理论上的空间影响范围;2)吸引中心性指标计算:提取医疗机构复杂地理网络中病人节点vpatient,将病人节点vpatient与voronoi图进行空间关联,每一个病人节点落入唯一与之空间关联的多边形内;设对某一个医疗机构vh,落在其所对应的voronoi多边形中的病人人数为pt,到该医疗机构就医的人数为ph,于是定义如下医疗机构吸引中心性指标:步骤五、计算医疗机构的转诊中心性指标:病患在医疗机构之间的相互转诊直观地表明了病患对不同医疗机构的主观对比评价情况,以每个分类中医疗机构复杂地理网络中医疗机构节点vhospital、转诊边etransfer为基础,构建医疗机构转诊中心性指标,该指标为医疗机构节点vhospital在转诊边etransfe上入度的加权求和;提取医疗机构复杂地理网络中的转诊边etransfer,对构成转诊边上的各个医疗机构节点,统计其全部转入次数,设医疗机构的总个数为k个,inij代表第i个医疗机构对第j个医疗机构的入度,即病人由第i个医疗机构转诊到第j个医疗机构的人数,wi为第i个医疗机构的权值,其等级越高,则权值越大,权值为该医疗机构所在分类序号的倒数;步骤六、计算医疗机构的平均住院时长指标:医疗机构的平均住院时长指标为所有病人在该医疗机构的住院时间长度的平均值;提取每个分类医疗机构复杂地理网络中的医疗机构节点vhospital、就诊边etreatment,计算就诊边etreatment每次就诊行为的住院时间,并以医疗机构节点vhospital为统计对象,计算每个医疗机构的平均住院时间,为医疗机构的平均住院时长指标;步骤七、计算医疗机构的平均住院花费指标:医疗机构的平均住院花费指标为所有病人在该医疗机构的住院费用的平均值;提取每个分类医疗机构复杂地理网络中的医疗机构节点vhospital、就诊边etreatment,计算就诊边etreatment每次就诊行为的住院花费,并以医疗机构节点vhospital为统计对象,计算每个医疗机构的平均住院花费,为医疗机构的平均住院花费指标;步骤八、各个指标的规范化计算:将上述的五种指标,也即医疗机构度中心性指标、医疗机构吸引中心性指标、医疗机构转诊中心性指标、医疗机构的平均住院时长和医疗机构的平均花费等指标分别进行规范化;其中后两个指标需要先求倒数,使得和前三个指标保持一致,即指标值越大,该医疗机构的评价分数越高;指标规范化的目的在于消除量纲差异,使得各个指标对最终排序结果的影响保持相同;步骤九、在每一个分类中对医疗机构进行排序评价:根据以上规范计算后的指标值,分别在每一个分类将五种指标值求和,而后根据求和后的结果在每一个分类内部进行医疗机构的排序,从而在每一个分类中对医疗机构进行绩效水平的排序评价。本发明的有益效果在于:本发明是一种基于病人就诊地理大数据的医疗机构绩效分级评价方法,与现有技术相比,本发明方法稳定可靠,易操作使用,具有较强的实用性。按照以上提供的操作步骤,通过对医疗机构病案首页数据的计算和分析,最终就能有效获得医疗机构的声望度,从病患角度出发,综合反映医疗机构的服务质量。附图说明图1为本发明中文地址地图匹配的示意图。图1中:a为病人病案首页中文地址信息,b为分词后地址的自动匹配。图2为本发明确定的四川省儿科病患就诊情况的复杂地理网络图。图3为本发明确定的第三个大类中医疗机构的voronoi图。图4为本发明确定的儿科中四川省各个医疗机构转诊情况网络图。具体实施方式下面结合附图对本发明作进一步说明:本发明在具体实施中,可由以下步骤实现:步骤一、病案首页病患地址信息地图匹配首先根据该地区所有地物的地名信息建立地名词典。然后从病案首页读取病患的文本地址数据,按照中文分词技术中的逆向最大匹配方法进行中文地址分词。具体过程是从病人中文地址的末端开始匹配扫描,每次取最末端的p个字符(p是预先设定的分词阈值,如设置为6等)作为匹配字段,若在地名词典中进行匹配,发现了该地名,则提取该词。反之若匹配失败,则去掉匹配字段最前面的一个字,继续匹配。经过中文地址的自动分词后,可提取文本地址中所在的市、县、乡镇、道路等。例如,如图1(a)是四川省某位病人的病案首页留下的中文地址数据,经过分词后,结果为:四川省/成都市/青白江区/金色港湾/4栋2单元1302(最后的栋和单元不再进一步考虑)。图1(b)则是其中文地址地图自动匹配的结果。步骤二、根据就诊信息构建医疗机构复杂地理网络选择一种疾病类型,将病人、医疗机构视作节点,将病人到医疗机构的就诊和病人在医疗机构之间的转诊视作边,构建复杂地理网络。并记为符号g={v,e}。其中v={v1,v2,...vn}代表网络中的节点,而e={e1,e2,...em}代表网络中的边。选择四川省2017年病人病案首页的儿科数据,生成的复杂医疗就诊地理网络图见图2所示。步骤三、根据医疗机构度中心性对医疗机构进行大类划分在医疗机构复杂地理网络中,将医疗机构作为节点,其节点的度就是病人选择到该医疗机构就诊的总人数(记为ipatient),又被称之为度的中心性。根据医疗机构度中心性,采用系统聚类法进行聚类,其方法是开始时把每个医疗机构作为一类,然后把最靠近的医疗机构(即就诊人数相差最小的)首先聚为新类,再计算新类的就诊人数均值与其他各类的距离,同样再根据计算出的距离合并距离最近的两类为一个新类;循环重复,直至类的个数为九个。这样所有的医疗机构从整体上就被分为了九个大类。第一大类的医疗机构级别最高,度中心性最强,第九大类的医疗机构级别最低,度中心性最弱。下表1-3中罗列了四川省儿科就诊情况中第一大类,第二大类和第三大类的医疗机构名称。表1四川省儿科就诊情况第一大类医疗机构机构名称就诊人数等级成都市妇女儿童中心医院367461表2四川省儿科就诊情况第二大类医疗机构表3四川省儿科就诊情况第三大类医疗机构机构名称就诊人数等级简阳市人民医院83733凉山彝族自治州第一人民医院81523四川省妇幼保健院77503成都市第五人民医院71893甘洛县人民医院67853成都儿童专科医院67183石棉县人民医院66723成都市郫都区人民医院65623成都市天府新区人民医院62463彭州市妇幼保健计划生育服务中心(彭州市妇幼保健院)61583金堂县妇幼保健院60993昭觉县人民医院60543成都市武侯区人民医院59783步骤四、计算医疗机构吸引中心性指标针对上述每个分类中的所有医疗机构,根据该类中医疗机构的位置构建voronoi图,所谓voronoi图,又叫泰森多边形,voronoi图是对空间平面的一种剖分,其特点是多边形内的任何位置离该多边形的控制点的距离最近,离相邻多边形内样点的距离远,且每个多边形内含且仅包含一个样点。voronoi图从数学角度定义了控制点的邻近区域。第三个大类中13家医疗机构所生成的voronoi图部分区域如图3所示;设对某一个医疗机构vh,到该医疗机构就医的病人人数为ph,落在其所对应的voronoi多边形中的病人人数为pt。于是定义如下医疗机构吸引中心性指标,其中,分母中的1是为避免分母出现为零的极端情形。医疗机构吸引中心性指标在一定程度上反映了病患对该医疗机构的认可程度。医疗机构vh的voronoi多边形代表着距离vh较近的区域,如果该区域内的病患虽然距离医疗机构vh较近,但却没有选择到该医疗机构就诊,而是选择到了该大类中的其他机构,那么所计算出的吸引中心性指标就会较小,这也意味着在该分类中,病患对该医疗机构的认可度较小。反之,则较高。例如,图3中的成都市第五人民医院,所有到该医疗机构就诊的人数为7189,而其所对应的voronoi多边形中的病人人数为85067,则其吸引中心性指标值为:0.085。指标值越高就意味着该医疗机构越有可能吸引到了周边的病人到此就诊。反之,则意味着即便是距离该医疗机构近的病人都不选择到该医疗机构就诊。步骤五、根据转诊信息计算医疗机构的转诊中心性指标病患在医疗机构之间的相互转诊直观地表明了病患对不同医疗机构的主观对比评价情况,如果一个医疗机构不断有来自其他医疗机构的转诊病人,这表明该医疗机构更多地获得了医疗专业人士及病患对其综合服务质量的认可。为此定义如下转诊中心性指标。该指标实质上是对节点的入度的一种加权求和。设医疗机构的总个数为k个,inij代表第i个医疗机构对第j个医疗机构的入度,即病人由第i个医疗机构转诊到第j个医疗机构的人数,wi为第i个医疗机构的权值,其等级越高,则权值越大,权值为该医疗机构所在分类序号的倒数。医疗机构之间的转诊信息可以从病案首页数据的病人的转院信息直接获取,另一方面,对同一种疾病,同一个病人在一定时间段内(如两周以内)先后在两家医疗机构就诊,则也可以视作在这两家医疗机构之间发生了转诊行为。图4显示了四川省五个市州的各个医疗机构之间的转诊情况,从图中可以看出,中部成都市以及南部的甘孜州是明显的两个集聚中心,这说明这两个地区的医疗机构得到了更多专家和病人的认可,在服务水平和质量上具有更高水平。步骤六、计算医疗机构的平均住院时长医疗机构的平均住院时长为所有病人在该医疗机构的住院时间长度的平均值。步骤七、计算医疗机构的平均住院花费医疗机构的平均住院花费为所有病人在该医疗机构的住院费用的平均值。步骤八、各个指标的规范化计算将上述的五种指标,也即医疗机构度中心性指标、医疗机构吸引中心性指标和医疗机构转诊中心性指标、医疗机构的平均住院时长和医疗机构的平均花费等指标分别进行规范化计算。其中后两个指标需要先求倒数,使得和前三个指标保持一致,即指标值越大,该医疗机构的评价分数越高。指标规范化的目的在于消除量纲,使得各个指标对最终排序结果的影响保持相同。此处采用零-均值规范化(z-score标准化)方法。零-均值规范化也称标准差归一化,经过处理的数据的均值为0,标准差为1。设原始序列为x1,x2,...xn,将其进行如下变换:这里则新序列y1,y2,...yn的均值为0,而标准差为1,且无量纲。零-均值规范化能够抵抗数据中存在的一些显著异常值。步骤九、在每一个分类中对医疗机构进行排序评价根据以上规范计算后的指标值,分别在每一个分类将五种指标值求和,而后在每一个分类内部进行医疗机构的排序,从而在每一个分类中对医疗机构进行了分级排序评价。步骤十、最终服务和绩效水平分级评价结果及其说明根据上述步骤,我们以各个医疗机构儿科的诊治情况为考察对象。首先根据就诊人数将四川省五个市州共534家医疗机构分为九个大类。这九个大类代表了这些医疗机构在儿科诊治方面的服务和绩效水平的等级划分。由于同一个分类中接待的就诊人数大致相仿,故认为其儿科的医疗资源也大致相同。而后在顾及儿科病患地理分布的前提下,从病患的角度出发采用上述五个指标:度中心性指标、吸引中心性指标、转诊中心性指标、住院时长指标和住院花费指标等再对每个分类内部的医疗机构进行排序。此处主要展现较为重要、病人数目较多的前八个大类的分级排序结果,见下表4-表11。现实中,人们通常依据国家对医疗机构的总体分等定级标准判断医疗机构的服务和绩效水平,但事实上,每一家医疗机构都有其更擅长的领域。表4-表11的结果使得人们可以直观地看到针对儿科对所有医疗机构的分级评价,按照相同的方法,也可以对其他疾病分类开展分级评价,从而更方便病患的选择。表4第一大类医疗机构儿科绩效水平排序表5第二大类医疗机构儿科绩效水平排序表6第三大类医疗机构儿科绩效水平排序表7第四大类医疗机构儿科绩效水平排序表8第五大类医疗机构儿科绩效水平排序表9第六大类医疗机构儿科绩效水平排序表10第七大类医疗机构儿科绩效水平排序表11第八大类医疗机构儿科绩效水平排序考虑到人们在实际生活中一般依据国家对医疗机构的分等定级标准判断医疗机构的诊疗水平,一些疑难疾病会在较高等级医疗机构进行诊治,从而也可能造成了这些医疗机构住院时长和花费的上升。为此,我们仍以儿科的诊治情况为考察对象,再将所有具有相同国家分级的医疗机构作为一类,并比较它们相互之间的排序情况,也即如果有三家医疗机构均属于三级甲等医院,那么可以认为他们的总体医疗资源是大致相当的。于是仍然采用本发明所述的五种指标对其进行排序,以给出它们在儿科领域的服务和绩效水平对比情况,这将既方便病患选择医疗机构就医,也对卫健主管部门监管与决策提供了重要参考性依据。下表12-16主要列举了根据本发明所给出的五个指标对三级甲等、三级乙等、三级未定、二级甲等、二级乙等、二级未定六个大类医疗机构在儿科领域的服务和绩效水平的排序评价情况。表12四川省三级甲等医疗机构儿科绩效水平排序表13四川省三级乙等医疗机构儿科绩效水平排序表14四川省三级未定医疗机构儿科绩效水平排序表15四川省二级甲等医疗机构儿科绩效水平排序表16四川省二级乙等医疗机构儿科绩效水平排序表17四川省二级未定医疗机构儿科绩效水平排序下表18-21则是以第三到第六大类的医疗机构为考察对象,对上述五个指标两两之间的相关系数以及五个指标分别与总排序结果的相关系数的计算,从中可以看出,这五个指标整体上的相对独立性较强,指标之间不存在整体上的高度相关性。这说明这五个指标分别从不同的维度刻画了医疗机构的绩效和服务水平,都具有不可替代性。表18第三大类医疗机指标相关系数吸引中心性转诊中心性度中心性住院时长住院花费总指标吸引中心性-0.0730.023-0.226-0.0530.419转诊中心性0.517-0.611-0.4770.222度中心性-0.386-0.6320.326住院时长0.7030.299住院花费0.338表19第四大类医疗机指标相关系数吸引中心性转诊中心性度中心性住院时长住院花费总指标吸引中心性0.404-0.149-0.060-0.2310.409转诊中心性0.143-0.184-0.4130.403度中心性0.3780.0100.586住院时长0.3780.642住院花费0.316表20第五大类医疗机指标相关系数吸引中心性转诊中心性度中心性住院时长住院花费总指标吸引中心性0.0070.071-0.266-0.0070.401转诊中心性0.071-0.523-0.3870.084度中心性-0.018-0.1270.497住院时长0.6910.440住院花费0.583表21第六大类医疗机指标相关系数吸引中心性转诊中心性度中心性住院时长住院花费总指标吸引中心性-0.2950.1940.2440.1990.568转诊中心性-0.005-0.283-0.1920.095度中心性0.0760.0450.554住院时长0.3140.571住院花费0.578以上显示和描述了本发明的基本原理和主要特征及本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1