基于大数据的DIP分值测算方法与系统与流程

文档序号：26855761发布日期：2021-10-09 03:52阅读：1947来源：国知局

基于大数据的dip分值测算方法与系统
技术领域
1.本技术涉及医保结算的领域，尤其是涉及一种基于大数据的dip分值测算方法与系统。

背景技术：

2.基于dip分值进行医保结算费用的确定是一种新兴的医保结算费用管理理念，其有助于医保结算费用的科学、客观、精细化的管理。在依据dip分值对医保结算费用进行管理时，dip分值的合理性、准确性能够直接决定医保结算费用的合理性，故使dip分值更为合理准确，有利于使医保结算费用更为合理准确。

技术实现要素：

3.为了使医保结算费用更为合理准确，本技术提供了一种基于大数据的dip分值测算方法与系统。
4.第一方面，本技术提供了一种基于大数据的dip分值测算方法。该方法包括：基于预设的dip分组模型对预获取的病例大数据信息进行分组，以确定病种信息；一病种信息对应分组所得的一组病例数据；根据预设的回归决策模型确定每一病种信息的消耗参数信息；一所述消耗参数信息反映一病种信息对应一组病例数据的消耗成本与病例大数据信息消耗总成本的比值；根据所述消耗参数信息确定每一病种信息的结算成本指数；根据所述结算成本指数确定每一病种信息的dip分值。
5.通过采用上述技术方案，在确定dip分值时，引入基于消耗参数确定的结算成本指数，有利于使dip分值更为合理准确，从而有利于使医保结算费用更为合理准确。
6.进一步地，在所述基于预设的dip分组模型对预获取的病例大数据信息进行分组，以确定病种信息之前，还包括：根据预设的数据规范规则，对病例大数据信息中的数据进行清洗和/或裁剪；所述清洗包括：根据所述数据规范规则确定所述病例大数据信息中异常的数据，并删除异常的数据；所述裁剪包括：根据所述数据规范规则中的目标分数位对所述病例大数据信息中的数据进行裁剪，以使所述病例大数据信息中的数据的分数位为目标分数位。
7.进一步地，所述基于预设的dip分组模型对预获取的病例大数据信息进行分组，以确定病种信息包括：根据dip分组模型对所述病例大数据信息进行分组，以确定dip病种信息；获取每一dip病种信息对应的一组病例数据在病例大数据信息中的数量占比；将数量占比小于预设占比的dip病种信息归类为综合病种信息；基于所述dip病种信息，根据预设归类规则对综合病种信息对应的一组病例数据进行归类处理，以确定所述病种信息。
8.进一步地，所述基于预设的dip分组模型对预获取的病例大数据信息进行分组，以确定病种信息还包括：获取每一病种信息的变异系数信息；判断所述变异系数信息是否大于预设阈值；对变异系数信息大于预设阈值的病种信息对应的病例数据作进一步分组，以重新确定所述病种信息。
9.进一步地，所述根据所述消耗参数信息确定每一病种信息的结算成本指数包括：根据eci/cci模型确定所述结算成本指数；根据所述消耗参数信息调校所述eci/cci模型。
10.第二方面，本技术提供了一种基于大数据的dip分值测算系统。该系统包括：病种确定模块，用于基于预设的dip分组模型对预获取的病例大数据信息进行分组，以确定病种信息；一病种信息对应分组所得的一组病例数据；参数确定模块，用于根据预设的回归决策模型确定每一病种信息的消耗参数信息；一所述消耗参数信息反映一病种信息对应一组病例数据的消耗成本与病例大数据信息消耗总成本的比值；指数确定模块，用于根据所述消耗参数信息确定每一病种信息的结算成本指数；以及分值确定模块，用于根据所述结算成本指数确定每一病种信息的dip分值。
11.进一步地，还包括：数据处理模块，用于根据预设的数据规范规则，对病例大数据信息中的数据进行清洗和/或裁剪；所述清洗包括：根据所述数据规范规则确定所述病例大数据信息中异常的数据，并删除异常的数据；所述裁剪包括：根据所述数据规范规则中的目标分数位对所述病例大数据信息中的数据进行裁剪，以使所述病例大数据信息中的数据的分数位为目标分数位。
12.进一步地，所述病种确定模块被进一步配置为：根据dip分组模型对所述病例大数据信息进行分组，以确定dip病种信息；获取每一dip病种信息对应的一组病例数据在病例大数据信息中的数量占比；将数量占比小于预设占比的dip病种信息归类为综合病种信息；基于所述dip病种信息，根据预设归类规则对综合病种信息对应的一组病例数据进行归类处理，以确定所述病种信息。
13.进一步地，所述病种确定模块被进一步配置为：获取每一病种信息的变异系数信息；判断所述变异系数信息是否大于预设阈值；对变异系数信息大于预设阈值的病种信息对应的病例数据作进一步分组，以重新确定所述病种信息。
14.进一步地，所述指数确定模块包括：根据eci/cci模型确定所述结算成本指数；根据所述消耗参数信息调校所述eci/cci模型。
15.综上所述，本技术包括以下至少一种有益技术效果：1.提供了一种基于大数据的dip分值测算方法与系统，该方法与系统能够基于消耗参数信息和结算成本指数确定dip分值，有利于使医保结算费用更为合理准确；2.对病例大数据信息中的数据进行清洗和裁剪，有利于对病例大数据进行规范化分组处理；3.对病例大数据信息进行分组的方式较为合理。
16.应当理解，发明内容部分中所描述的内容并非旨在限定本技术的实施例的关键或重要特征，亦非用于限制本技术的范围。本技术的其它特征将通过以下的描述变得容易理解。
附图说明
17.结合附图并参考以下详细说明，本技术各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标记表示相同或相似的元素，其中：图1示出了能够在其中实现本技术实施例的示例性运行环境的示意图。
18.图2示出了本技术实施例中基于大数据的dip分值测算方法的流程图。
19.图3示出了本技术实施例中基于大数据的dip分值测算系统的方框图。
具体实施方式
20.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例，都属于本技术保护的范围。
21.另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。
22.本技术提供了一种基于大数据的dip分值测算方法与系统，该方法与系统能够自动确定dip分值，且确定所得的dip分值较为合理准确。
23.图1示出了能够在其中实现本技术实施例的示例性运行环境100的示意图。运行环境100包括服务器110和终端设备120。
24.其中，服务器110可以为单台计算机设备或单台pc机等集成式服务器，也可以为由多台计算机设备和/或多台pc机等组成的分布式服务器；服务器110可以为本地服务器，也可以为部署于云端的云服务器；总而言之，不对服务器110作出限制，仅需服务器110具备能够满足需求的数据处理能力即可。在本技术实施例中，服务器110供地方的医保管理部门使用，其具备病例大数据信息的获取权限。
25.终端设备120可以为pc机、pda设备等任意终端设备。终端设备120与服务器110通信连接，具体通信连接方式可以为有线连接，也可以为无线连接，具体连接方式不作限定，仅需服务器110与终端设备120能够实现信息交互即可。终端设备120一般供地方的医保管理部门的工作人员使用。
26.图2示出了本技术实施例中基于大数据的dip分值测算方法200的流程图。方法200
可以由图1中的服务器110执行。
27.方法200包括以下步骤：步骤210：基于预设的dip分组模型对预获取的病例大数据信息进行分组，以确定病种信息；一病种信息对应分组所得的一组病例数据。
28.服务器110本身具备病例大数据信息的获取权限，其连接地方的医疗系统，通过服务器110内置的嗅探器能够实时获取医疗系统中产生的病例数据，从而实现病例大数据信息的获取。
29.为保障病例大数据信息中数据的合理性与规范化，在执行本步骤的方法之前，先基于预设的数据规范规则对病例大数据信息中的数据进行清洗和裁剪。
30.具体来说，服务器110中预存储数据规范规则，数据规范规则依据dip分组模型对数据的需求结合地方的医保管理部门需求的数据精度确定。
31.其中，对数据的清洗工作依托数据规范规则中的数据清洗算法进行，依据数据清洗算法能够去除病例大数据信息中的异常的数据，例如数据的异常值以及不符合逻辑的值等，从而实现病例大数据信息的清洗工作，保障存留的数据均为合理数据。
32.对数据的裁剪工作依托于数据规范规则中的目标分数位执行，目标分数位即指定小数位，依据数据裁剪算法将病例大数据信息中的数据均裁剪至目标分数位，是同种数据保留至指定小数位，以实现数据的规范化。
33.在对病例大数据信息进行清洗和裁剪后，即可依托最终的较为合理、规范的病例大数据信息执行本步骤的方法。
34.本步骤的方法具体包括：根据dip分组模型对病例大数据信息进行分组，以确定dip病种信息；获取每一dip病种信息对应的一组病例数据在病例大数据信息中的数量占比；将数量占比小于预设占比的dip病种信息归类为综合病种信息；基于dip病种信息，根据预设归类规则对综合病种信息对应的一组病例数据进行归类处理，以确定病种信息。
35.具体来说，在本步骤的方法中，dip分组模型依据国家标准的dip技术规范确定，服务器110通过dip分组模型即可实现对病例大数据信息中的数据的分组，其中，得到的一组病例数据对应一种dip病种信息，即dip病种信息相应确定。
36.在确定dip病种信息后，服务器110针对每一dip病种信息，确定相应的一组病例数据中数据数量，结合病例大数据信息中数据总量，能够计算确定每一dip病种信息的数量占比，其中，一dip病种信息的数量占比为相应的一组病例数据中数据数量与病例大数据信息中数据总量的比值。
37.预设占比预存储于服务器110中，预设占比可依据医保管理部门的需求确定，也可结合考虑地方的实际情况确定，此处不对预设占比作出具体限定。服务器110应用比较算法比较预设占比与每一dip病种信息的数据占比，即可确定应归类于综合病种信息的dip病种信息。
38.预设归类规则同样预存储于服务器110中，在本技术实施例中，预设归类规则由数据量和地方细分要素确定，具体来说，预设归类规则中包含多级、多种细分要素，例如内科治疗、介入治疗、细分治疗等大类，每一大类下还可包含若干小类。依据单个dip病种信息的数据量要求，可将综合病种信息中的从属于同一类的若干组病例划分为一类，也可以将综合病种信息中的病例归类至与该病例从属于同一大类且数量占比大于预设占比的dip病种
信息相应的一组病例中，并调整该dip病种信息。基于该方式，最终确定的数据量合理且符合dip分类规则和地方细分要素的dip病种信息即为最终确定的病种信息。
39.依据前述方法步骤确定的病种信息的数据量和分类标准较为合理，既能够符合国家dip分组规范和标准，又能够符合地方的实际需求。
40.为进一步提升病种信息的合理性，本步骤的方法还包括：获取每一病种信息的变异系数信息；判断所述变异系数信息是否大于预设阈值；对变异系数信息大于预设阈值的病种信息对应的病例数据作进一步分组，以重新确定所述病种信息。
41.具体来说，病种信息的变异系数即相应的一组病例数据的概率分布离散程度的一个归一化量化度，其定义为该一组病例数据的标准差与平均值之比，又称离散系数，也可被称为标准离差率或单位风险。
42.预设阈值同样预存储于服务器110中，其可基于本领域技术人员的经验确定，预设阈值反映数据的风险标准。在病种信息的变异系数大于预设阈值时，说明该病种信息对应的一组病例数据存在异常的风险，服务器即对该种病种信息对应的一组病例数据作进一步分组，以便于重新确定病种信息以及每种病种信息对应的一组病例数据，直至病例数据的变异系数全部小于预设阈值时停止，该结果反映病种信息划分较为合理，病种信息对应的一组病例数据存在异常的风险较小。
43.应理解，在执行前述在后的一组方法步骤后，应再次执行在前的一组方法步骤，直至最终的病种信息满足前述两组方法步骤的需求，得到的病种信息才最终合理，相应的每一组病例数据也相应的较为可靠。
44.步骤220：根据预设的回归决策模型确定每一病种信息的消耗参数信息；一消耗参数信息反映一病种信息对应一组病例数据的消耗成本与病例大数据信息消耗总成本的比值。其中，消耗成本是指为治疗一病种信息相应的一组病例数据所消耗的成本，消耗总成本是指为治疗病例大数据全体所消耗的成本。
45.回归决策模型预存储于服务器110中，其包括回归模型和决策树。其中，回归模型为计算标准，决策树包含地方的医保管理部门主观决策的因数。服务器110基于回归模型和决策树能够确定所在地方的每一病种信息的消耗参数信息，消耗参数信息反映该病种信息对应一组病例数据的消耗成本与病例大数据信息的消耗总成本的比值。依据病种信息对应一组病例数据的消耗成本与病例大数据信息的消耗总成本的比值结合医保管理部门的决策树能够确定消耗参数信息，其中，决策树为固定的映射关系，消耗参数信息可被服务器110直接计算确定。
46.步骤230：根据消耗参数信息确定每一病种信息的结算成本指数。
47.结算成本指数即eci/cci指数，其中，eci是指雇佣成本指数，其一般意义为劳动成本的综合性的测算，在本技术实施例中指病种信息的社会资源消耗成本的综合性的测算；cci是指顺势指标，其一般用于测算股价、外汇或者贵金属交易是否超出常态分布范围，在本技术实施例中用于测算病种信息的社会资源消耗成本是否超出常态分布范围。
48.eci/cci指数通过eci/cci模型确定，eci/cci模型同样预存储于服务器110中。服务器110基于eci/cci模型，根据病种信息能够确定每一病种信息的eci/cci指数，在引入携带有决策信息和地方特定信息的消耗参数信息时，能够以与确定消耗参数信息的方式同样的方式确定携带有决策信息和地方特定信息的eci/cci指数，该eci/cci指数即最终的结算
成本指数。
49.步骤240：根据结算成本指数确定每一病种信息的dip分值。
50.服务器110基于病种信息以及每一病种信息的结算成本指数能够实现每一病种信息的dip分值的测算。具体来说，服务器110将结算成本指数匹配至相应的病种信息，确定所有病种信息以及与所有病种信息一一对应的所有结算指数信息，依据一一对应的病种信息和病种信息的结算指数信息能够确定每一病种信息的dip分值，该确定方式为通用方式，不作具体介绍。
51.在本技术实施例的一个示例中，依据结算成本指数确定dip分值的方式可参考公式rwi = mi / mm。
52.其中，rwi为dip分值；mi为第 i 类病种信息的一组病例的平均住院费用，为综合反映历年疾病及费用的发展趋势，可以以近 3 年的往期数据按照时间加权的形式计算该费用均值，如当前年度为 2019 年，则采用前三年历史数据，按照 2016 年:2017 年:2018 年=1:2:7 的比例进行测算；mm为全部病例平均住院费用。
53.在每一病种信息的dip分值均确定后，医保管理系统的工作人员可通过终端设备120获取每一病种信息的dip分值，并针对每一病种信息依据dip分值确定相应的医保结算费用。该确定方式在本技术实施例中并未作出改进，故不作展开介绍。
54.需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本技术并不受所描述的动作顺序的限制，因为依据本技术，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本技术所必须的。
55.以上是关于方法实施例的介绍，以下通过系统实施例，对本技术所述方案进行进一步说明。
56.图3示出了本技术实施例中基于大数据的dip分值测算系统300的方框图。系统300可以被包括在图1中的服务器110中，或者被实现为图1中的服务器110。如图3所示，系统300包括：病种确定模块310，用于基于预设的dip分组模型对预获取的病例大数据信息进行分组，以确定病种信息；一病种信息对应分组所得的一组病例数据；参数确定模块320，用于根据预设的回归决策模型确定每一病种信息的消耗参数信息；一所述消耗参数信息反映一病种信息对应一组病例数据的消耗成本与病例大数据信息消耗总成本的比值；指数确定模块330，用于根据所述消耗参数信息确定每一病种信息的结算成本指数；以及分值确定模块340，用于根据所述结算成本指数确定每一病种信息的dip分值。
57.系统300还可以包括：数据处理模块350，用于根据预设的数据规范规则，对病例大数据信息中的数据进行清洗和/或裁剪。
58.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，所述描述的模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
59.以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本技术中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离前述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：火立龙;孙闯;王智军;朱静;吴杭
技术所有人：武汉金豆医疗数据科技有限公司
我是此专利的发明人

上一篇：一种豌豆蛋白生产用混料装置的制作方法
上一篇：神经网络训练和图像处理方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。