一种个性化体检套餐推荐方法与流程

文档序号:21280034发布日期:2020-06-26 23:32阅读:650来源:国知局
一种个性化体检套餐推荐方法与流程

本发明涉及医疗和人工智能领域,具体涉及一种个性化体检套餐推荐方法。



背景技术:

随着人们生活质量的逐步提高,人民群众对于健康体检的需求也越来越多,健康体检也正在逐渐成为门诊体检之外的体检中心的主流业务。然而,现在大多数的体检机构都是针对年龄和性别制定体检套餐,然后由消费者进行选择,这种方式存在如下问题:a.这些套餐都是针对某个年龄段和性别人群常患疾病的集合,没有考虑患者自身一些个性化的风险因素;b.面对形形色色的套餐价目表,客户眼花缭乱,体检中心只考虑了客户的预算而没有根据客户的健康需求制定体检项目;c.体检机构数据库中的大量体检数据没有得到充分利用,为体检者推荐套餐时并未考虑体检者的历史体检信息,造成一些不必要的体检项目做了但疾病发现率不高。



技术实现要素:

为了克服已有的体检套餐功能单一、个性化适用性较差的不足,本发明提供了一种专业可靠、个性化适用性良好的体检套餐推荐方法,与体检者高效互动,针对体检者的个人健康信息生成可执行的体检方案。

本发明解决上述技术问题所采用的技术方案是:个性化体检套餐推荐方法,包括以下步骤:

s1、构建常见病与风险因素的键值对、问题库、常见病库、体检套餐最小集、体检套餐最大集以及体检者分类机制;

s2、依据体检者分类机制对体检者进行分类;对每类体检者,获取体检者的个人健康信息和体检预算,根据体检预算形成针对体检者的体检套餐;

s3、依据常见病与风险因素的键值对,将个人健康信息量化为体检者的疾病风险因子;

s4、根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,预测个人相关体检项目的异常概率,并计算个人相关体检项目的实际成本;

s5、以体检套餐最小集为初始集合,形成当前体检集;根据体检项目添加规则向当前体检集自动添加体检项目,形成体检套餐并推荐给体检者。

在优选的实施例中,步骤s4根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,计算每个问题的疾病风险因子之和,将疾病风险因子之和超过设定阈值的问题抽取出来组成调查问卷;体检者对调查问卷中的每个问题进行打分,分值有一个最大值和最小值,分值越大则代表问题中的场景在日常生活中出现的频率越高,分值越小则代表问题中的场景在日常生活中出现的频率越低;根据体检者对调查问卷的回答,对涉及到的常见病进行累计积分;根据涉及到的常见病的累计积分、疾病风险因子和相关体检项目在常见病确诊中所占的权重计算个人相关体检项目的异常概率,并计算个人相关体检项目的实际成本。

在优选的实施例中,步骤s1所构建的体检者分类机制将体检者分为两类,第一类为数据库中没有历年体检数据的体检者,第二类为数据库中有历年体检数据的体检者;

在步骤s5中,对于第二类体检者的体检项目添加规则为:

1)根据体检者往年的体检数据,用lstm算法,根据该体检者往年体检指标预测今年体检指标值,判断今年指标异常的概率,并根据指标异常的概率找到符合条件的体检项目直接添加进所有体检套餐中;

2)对数据库中的体检数据,将体检项目的结果离散化,用gsp算法进行序列关联规则挖掘,通过与当前体检者有相同或者相似体检项目异常变化情况的其他体检者的体检结果,来找到符合条件的体检项目并将该体检项目添加进所有体检套餐里;

3)对数据库中每一年的体检结果进行聚类,将与该体检者在同一类中的其他体检者的健康情况作为参考,来寻找符合条件的体检项目并将它们添加到所有体检套餐中。

在步骤s5中对于两类体检者共有的项目添加规则为:将当前套餐里的项目当做先导,体检套餐最大集中没有出现在当前套餐里的体检项目当做后继,进行关联规则挖掘,找到满足最小支持度和置信度的关联规则,获取规则后继的体检项目;如果将当前项目添加进体检套餐,目标的增大量超过了设定阈值,则将该体检项目添加进套餐,否则不添加。

与现有技术相比,本发明取得了如下有益效果:

1、在本发明个性化体检套餐推荐方法中,与体检者高效互动,针对体检者的个人健康信息生成可执行的体检方案;对不同的体检者可以个性化的提供体检套餐;而对于多次体检过的体检者,可以根据其历史体检数据推荐更为可靠的体检套餐。

2、通过本发明的体检套餐推荐方法,体检者可以在预算之内最大可能的发现潜在疾病;且在尽量给体检者提供更有效的体检套餐的同时,可以兼顾医院的收益。

3、本发明简单易用,与人工智能相结合,充分利用了各个体检中心数据库中的海量的体检数据,因而只需在使用初期进行少量的人工处理,后期几乎全部都为机器处理,减少了人工成本;适用性强,可以与各个体检中心对接,实现体检套餐的个性化推荐。

附图说明

图1为本发明一种个性化体检套餐推荐方法的框架图;

图2为本发明一种个性化体检套餐推荐方法的流程图;

图3为本发明一种个性化体检套餐推荐方法的推荐判断流程图;

图4为本发明个性化体检套餐推荐方法的另一种推荐判断流程图;

图5为所构建的常见病与风险因素键值对的示意图;

图6为所构建的问题库的示意图;

图7为常见病库的示意图。

具体实施方式

以下结合附图和实施例对本发明的原理和技术特征进行详细描述,所举实施例只用于解释本发明,并非用于限定本发明的范围,本发明的实施方式并不限于此。

体检项目是单个或多个体检指标的组合,体检套餐是多个体检项目的组合。体检套餐存在一个最小集,即所有人都要检查的项目,同时存在一个最大集,即所有的体检项目都包含在内。体检套餐推荐的过程是向体检套餐最小集中添加体检项目的过程。如图1-4所示,本发明个性化体检套餐推荐的方法,包括以下步骤:

s1、构建常见病与风险因素的键值对、问题库、常见病库、体检套餐最小集、体检套餐最大集以及体检者分类机制。

在步骤s1中,常见病与风险因素的键值对,指保存了常见病以及每种常见病的风险因素及其权重的键值对,比如冠心病的风险因素可能包括家族病史、吸烟、年龄、职业等,家族病史和吸烟的权重可能高于年龄和职业;问题库,指保存了不同常见病病症的日常描述问题的数据库,每个问题有一个与该描述相关的常见病的列表,比如问题“日常生活中是否有胸部不适”的常见疾病列表为冠心病、高血压;常见病库,指保存了各种常见病、每种常见病确诊所需项目及每个项目在确诊中所占的权重和每种常见病的平均治疗费用的数据库,比如高脂血症可以通过血脂组合、空腹血脂来确诊,血脂组合的权重要高于空腹血脂,高血脂症的平均治疗费用可能在700元人民币左右;体检套餐最小集,指所有体检者都需要检查的项目集合;体检套餐最大集,指体检中心所提供的所有体检项目集合;体检者分类机制:指依据某种原则将所有体检者分为不同类别的方法,例如根据数据库中有无体检者的历史体检数据将体检者分为两类,第一类为数据库中没有历年体检数据的体检者,第二类为数据库中有历年体检数据的体检者。

常见病与风险因素键值对如图5所示,其中ill1、ill2、ill3均为常见病,a、b、c、d为风险因素,w1、w2、w3、w4、w5、w6为风险因素所占的权重。问题库如图6所示,其中ill1、ill2、ill3、ill4、ill5为与问题描述相关的常见病。常见病库如图7所示,其中ill1、ill2为常见病,a、b、c为常见病确诊所需的体检项目,w1、w2、w3为不同体检项目在确诊某项疾病中所占的权重。

s2、依据体检者分类机制对体检者进行分类;对每类体检者,获取体检者的个人健康信息和体检预算,根据体检预算形成针对体检者的体检套餐。

本实施例中,依据步骤s1所构建的体检者分类机制将体检者分为两类,第一类为数据库中没有历年体检数据的体检者,第二类为数据库中有历年体检数据的体检者。对于两类体检者,进行个人健康信息收集,包括年龄、性别、职业、既往病史、家族病史、压力、个人历史体检记录、个人历史诊疗记录、生活习惯调查,如吸烟、喝酒、运动、饮食习惯等,还有身高、体重、腰围、血压的测量,并了解体检者的预算,根据预算形成针对体检者的体检套餐。

s3、依据常见病与风险因素的键值对,将个人健康信息量化为体检者的疾病风险因子rf。

疾病风险因子:促使或引起疾病发生的条件,描述了疾病发生的可能性,疾病风险因子越大,疾病越有可能发生。疾病风险因子∈[0,1],本实施例中疾病风险因子<=1。

如果体检者个人健康信息中存在某些风险因素,则对这些风险因素涉及到的常见疾病计算风险因子。在步骤s3中,根据体检者的个人健康信息,计算每种常见病的风险因子。常见疾病i的风险因子为:

其中,riskfactor(i)为常见疾病i的相关风险因素,w(t)为风险因素t在影响该常见病的风险因素中所占的权重。

对于某种常见疾病,它的疾病风险因子为体检者个人健康信息中存在的且与该疾病相关的风险因素在该疾病中所占的权重之和。体检者个人健康信息中涉及到的风险因素越多,风险因素权重越大,则疾病风险因子越大。

s4、根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,预测个人相关体检项目的异常概率,并计算个人相关体检项目的实际成本。

在步骤s4中根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,计算每个问题的疾病风险因子之和,将疾病风险因子之和超过设定阈值的问题抽取出来组成调查问卷。某个问题的疾病风险因子之和,指该问题的常见疾病列表里的疾病的风险因子之和。比如问题“日常生活中是否有胸部不适”的常见疾病列表为冠心病、高血压,体检者的冠心病的风险因子为rf1,心脏病的风险因子为rf2,问题“日常生活中是否有胸部不适”的疾病风险因子之和为rf1和rf2的和,如果这个值超过了设定阈值则将问题“日常生活中是否有胸部不适”添加进调查问卷。

体检者可以对调查问卷中的每个问题进行打分,分值有一个最大值max_score和最小值min_score,分值越大,则代表问题中的场景在日常生活中出现的频率越高,分值越小,则代表问题中的场景在日常生活中出现的频率越低。比如体检者可以用0-9的整数来描述问题中的场景在日常生活中出现的频率,如果体检者在日常生活中经常出现胸部不适的现象,可以用数字9来回答,如果体检者从没出现过胸部不适的现象,则可以用数字0来回答。

根据体检者对调查问卷的回答,对涉及到的常见病进行累计积分,得到常见病的累计积分。特殊情况:若体检者有该疾病的病史,但是该疾病的累计积分不超过设定阈值t1,则可以判断保持的不错,将该疾病的相关检查项目中权重超过设定阈值t2的体检项目标记为“检测而不必关联检测”。“检测而不必关联检测”是指该体检项目需要检测,但是不需要当做先导进行关联规则挖掘。关联规则是形如x→y的蕴含式,其中x和y分别称为关联规则的先导和后继。

根据涉及到的常见病的累计积分、风险因子和相关体检项目在常见病确诊中所占的权重计算体检项目异常的概率。体检项目i异常的概率p(i)计算公式如下:

db_ill为常见病库,rf(ill)为疾病ill的风险因子,w(i)为体检项目在疾病ill确诊中所占的比重,integration(ill)为疾病ill的累计积分,n为调查问卷中题目的数量,max_score为最大分值,min_score为最小分值。当常见病的风险因子越高时或者疾病的累计积分越高时,体检者患该疾病的概率就越高;某种疾病的患病概率越高,体检项目在确诊该疾病中占的比重越大,则该体检项目越有可能异常。由于概率值应该处于0到1之间,所以需要对疾病的累计积分进行归一化处理,且在求和之后如果超过了1,则概率为1。

计算体检项目的成本cost:健康体检的成本主要包括人工成本、办公运行成本、材料成本等。人工成本主要包括医护人员的工资福利;办公运行成本主要包括日常办公用品成本、培训费用和仪器设备的修购费等;材料成本主要包括检验用试剂、针筒、棉球等。对于人工成本,单位时间内完成的体检项目越多,则平均人工成本越低。人工成本labor_cost与完成某个项目所需要的时间proj_needtime有关。

labor_cost∝proj_need_time

人工成本与完成某个项目所需要的时间成正比,完成某个项目所需要的时间越多,则在该项目上所投资的人力资源就越多,单位时间内所能接待的体检者就越少,人工成本就会增加。

对于办公运行成本office_cost,与完成某个项目所花费的时间和项目完成总数有关。

当项目完成总数没有超过设定阈值时,单位时间内完成的项目总数越多,项目完成总数越多,则办公运行成本越少;当项目完成总数超过设定阈值时,仪器设备的修购费会随着项目完成总数的增加而增大,所以此时办公运行成本与完成某个项目所花费时间和项目完成总数成正比。

对于材料成本material_cost,可以把一个体检项目分成几个步骤,体检套餐中所有的步骤组成一个步骤集合steps,这样就发现很多项目包含一些相同的步骤,对每一个步骤标记tag是否已经计算过它的成本,tag=0表示还没计算,tag=1表示已经计算过该步骤的成本。体检套餐有a、b两个体检项目,体检项目a的步骤包括α、β和γ,体检步骤b的步骤包括α和β,那步骤集合steps为α、β和γ。

体检套餐的成本即为套餐内所有项目所涉及的步骤的成本之和。某个项目的实际成本为:

cost_hospital(i)=labor_cost(i)+office_cost(i)+material_cost(i)

其中,material_cost(i)为某个体检项目的成本,labor_cost(i)为人工成本,office_cost(i)为办公运行成本。

每个体检中心都有自己的体检项目成本计算方法。以上成本计算示例只为帮助说明本专利的成本计算思想。

s5、根据体检项目添加规则向体检项目最小集中添加体检项目;依据规则完成项目添加,形成体检套餐并推荐给体检者。

在步骤s5中,对于第二类用户,体检项目添加规则为:

1)根据体检者往年的体检数据,用lstm算法,根据该用户(即体检者)往年体检指标预测今年体检指标值,并判断今年指标异常的概率,并根据指标异常的概率算出体检项目异常的概率p1,如果p1超过了设定阈值t3,则将该项目添加进体检套餐里。项目异常概率为项目内所有指标异常概率的加权和。

2)对数据库中的体检数据,将体检项目的结果离散化为严重偏低、偏低、正常、偏高、严重偏高等多种状态,用gsp算法进行序列关联规则挖掘,可以通过与当前体检者有相同或者相似体检项目异常变化情况的其他体检者的体检结果,来计算该体检者当前每个体检项目异常的概率p2,如果p2超过了设定的阈值t4,则将该体检项目添加进体检套餐里。

p2(i)∝max(support(r)confidence(r))r∈r

r为获得的以i的异常状态为后继的关联规则集合,confidence(r)为规则r的置信度,support(r)为规则r的支持度。支持度越大,表示规则的前件和后继同时出现越频繁,置信度揭示了当前件出现时,后继有多大概率出现,如果置信度太低,则说明前件的出现与后继是否出现关系不大。

3)对数据库中每一年的体检结果进行聚类,将与该体检者在同一类中的其他体检者的健康情况作为参考,如果这些人确诊了某些疾病,则在常见病库db_ill中获取这些疾病的相关体检项目,并将该体检者与其他体检者之间的类内距离distance和他们在同一类中的次数counts转化为项目异常的概率p3,如果项目异常的概率p3超过了设定的阈值t5,则将项目添加进体检套餐里。

如果disance越小则说明这两个用户(体检者)越相似,counts越大,则说明他们变化趋势越相似。

lstm,长短期记忆,是一种时间循环神经网络,适合处理和预测时间序列中间隔和延迟非常长的重要事件,可以根据历年体检数据预测体检者今年的体检指标值;gsp,广义序列模式,采用冗余候选模式的剪除策略和哈希树来实现候选模式的快速访存,可以根据历年体检数据预测体检者体检项目异常的概率。

对于两类体检者共有的项目添加规则为:将当前套餐里的项目当做先导,体检套餐最大集中却没有出现在当前套餐里的体检项目当做后继,进行关联规则挖掘,找到满足最小支持度和置信度的关联规则,获取规则后继的体检项目。如果将当前项目添加进体检套餐,目标的增大量超过了设定的阈值,则将该体检项目添加进套餐,否则不添加。

本步骤实现的目标为:在用户给定预算和个人健康情况以及医院给定体检项目列表和费用、每一项的体检成本的基础上,向用户推荐多个个性化体检套餐供用户选择。我们对推荐的体检套餐有两个要求,最佳个人疾病发现x和最大医院收益y,目标即为最佳个人疾病发现和最大医院收益的加权和。对于不同的套餐,有不同的价格,通过调节权重,实现对最佳

疾病发现和最大医院收益的不同侧重。套餐a:费用在体检者的预算之内,且更侧重于最佳疾病发现;套餐b:费用可以超过体检者的预算,且尽量在最佳疾病发现和最大医院收益之间保持平衡,即二者权重的差值较小,在设定阈值之间;套餐c:费用可以超过体检者的预算,且更侧重于最大医院收益。

最佳个人疾病发现考虑体检者患病种类和患病概率、疾病可预防的概率和疾病的治疗成本。最大医院收益考虑体检套餐中所有项目的价格和体检套餐的实际成本。

最佳个人疾病发现指常见病库中所有常见病的患病概率、可预防概率、治疗成本的乘积之和:

db_ill为常见病库,ill为某种常见病,ill_prob(ill)为患某种常见病的概率,prevention(ill)为某种常见病可预防的概率,ill_cost(ill)为某种常见病治疗的成本。本发明希望通过体检发现一些潜在的疾病,在同样的花费内,发现越多的潜在疾病越好,同时也希望潜在的疾病是可预防的,如果无法人为干预其恶化进程,那发现了该疾病也没有意义,更进一步,通过体检及时预防的疾病的治疗成本越高,我们的体检和预防就越有意义。

最大医院收益指体检套餐的价格与体检套餐的实际成本的差值:

cost(i)=min(cost_hospital(i),cost_hospital(i|t1),cost_hospital(i|t2),…,cost_hospital(i|tn)),t1,t2,…tn∈t

t为体检套餐,price为某个体检项目的价格,cost为某个体检项目的成本,cost_hospital为某个体检项目的实际成本。

计算常见病的患病概率ill_prob:将当前体检套餐中的体检项目与常见病库中的体检项目进行对比,找到涉及到的相关常见病种。对每种涉及到的相关常见病,将体检套餐中存在的该常见病的确诊项目的异常概率的加权和作为它的发病概率,即:

items(ill)为疾病ill的确诊因素,t为体检套餐,p为某个体检项目异常的概率,w为该体检项目在确诊该疾病中所占的权重。对于某种常见病来说,检查的确诊因素越多,则越容易确诊;确诊因素中异常的项目越多,项目异常的概率越大,项目在确诊中所占的比例越大,则体检者患该病的概率越大。例如,如果当前体检套餐包含四个体检项目a、b、c、d,它们的异常概率分别为pa、pb、pc和pd,常见病库中涉及到这四个体检项目的疾病有两个,ill1和ill2。疾病ill1相关的体检项目为a、b、c,它们在确诊ill1时所占的权重分别为w_a1、w_b1、w_c1,疾病ill2相关的体检项目为a、d,它们在确诊ill2时所占的权重分别为w_a2、w_d2,则疾病ill1的患病概率为ill_prob(ill1)=pa*w_a1+pb*w_b1+pc*w_c1,疾病ill2的患病概率为ill_prob(ill2)=pa*w_a2+pd*w_d2。

疾病可预防的概率,指不患该病的概率与该病风险因子的乘积:

prevention(ill)=rf(ill)*(1-ill_prob(ill))

疾病可预防,是指已经有了患病的可能而还没有确诊得病,通过改变日常生活中的不良习惯,即减少疾病风险因素来降低患病的概率。所以疾病可预防概率与疾病风险因子有关,疾病风险因子越大,则说明日常生活中有特别多该疾病的风险因素,那体检者只要改变一些不良习惯,减少该疾病的风险因素,就可能对该疾病的发生产生较大的影响。疾病可预防概率还与不患病的概率有关,因为患病概率越高,则可预防的概率就越小,如果已经确诊该疾病,即患病概率为1,那就不是预防疾病而是治疗了,那疾病可预防的概率为0。

治疗成本,指常见病库中预设的该疾病的平均治疗成本;体检套餐的价格,指体检套餐内所有项目的价格总和;体检套餐的实际成本,指人工成本、办公成本和材料成本之和。

停止向套餐内添加体检项目的条件为:1)对于对套餐费用有限制的套餐,当当前套餐费用等于或接近于预算的时候,停止添加项目;2)对于对套餐费用没有限制的套餐,当所有规则后继的项目都不能按照添加规则添加进体检套餐时,停止添加项目。

向体检者推荐三个体检套餐,体检者可以自由选择其中一个,并根据自己的需求向选中的套餐里添加体检项目或者手动删除套餐里的某些体检项目。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1