一种复诊患者预测方法及装置与流程

文档序号:14504523阅读:785来源:国知局

本发明涉及大数据分析技术领域,特别涉及一种复诊患者预测方法及装置。



背景技术:

潜在患者预测是医疗大数据分析的重要目标之一,通过对所有潜在患者的数据进行关联,利用机器学习的方法,对潜在患者进行分类,能精确定位最有可能来复诊的潜在患者,并通过短信、电话等形式沟通,可扩大医院的患者量,提升医院的服务质量,同时通过筛选,精准定位目标人群,降低医院的营销成本。

目前的潜在患者预测的大数据分析主要在公共卫生领域,比如针对社区医院的居民电子健康档案,分析预测居民的患病风险。在分析时,主要是通过分析潜在患者的医疗特征来预测该潜在患者(已就诊患者)是否来医院复诊,医疗特征一般包括患者的年龄、挂号类型、科室、检查结果、检查指标等。但患者的社会特征也可以在一定程度上反映该患者的收入情况和对疾病的认识情况,实际上也是影响该患者是否来医院复诊的重要因素,但现有技术的潜在患者预测方法中并没有考虑患者的社会特征,因此可能影响预测结果的准确性。



技术实现要素:

本发明提供一种复诊患者预测方法及装置,用以解决现有技术中,在预测已就诊患者是否来医院复诊时准确性低的问题。

为达到上述目的,本发明实施例公开了一种复诊患者预测方法,该方法包括:

针对已就诊患者,根据预先设定的各目标医疗特征和目标社会特征的信息,获取所述已就诊患者各目标社会特征对应的各第一参数值及各目标医疗特征对应的各第二参数值;

根据获取的所述各第一参数值、所述各第二参数值及预先训练完成的潜在患者预测模型,预测所述已就诊患者是否复诊。

进一步地,所述各目标社会特征包括以下特征中的至少一种:

医保类型、职业、学历、年均收入和就诊亲友数量。

进一步地,当所述目标社会特征为就诊亲友数量时,获取所述目标社会特征对应的第一参数值的过程包括:

获取所述已就诊患者的每个亲友;

针对所述每个亲友,判断是否存在该亲友的就诊记录,如果是,对当前保存的第一参数值进行更新。

进一步地,预先对所述潜在患者预测模型进行训练的方法包括:

根据预先保存的患者信息,及预先设定的各医疗特征和各社会特征,确定每个训练样本,其中所述训练样本中包含患者的标识信息、患者的各医疗特征对应的各第三参数值和各社会特征对应的各第四参数值;

根据每个训练样本中包含的各第三参数值、各第四参数值及患者是否复诊的信息,对所述潜在患者预测模型进行训练。

进一步地,预先确定所述各目标社会特征和各目标医疗特征的过程包括:

针对每个社会特征或医疗特征,获取所述训练样本中包含该社会特征或医疗特征的预设数量的测试样本;

将每个所述测试样本中所述社会特征或医疗特征对应的参数值修改为其他值;

根据修改参数值后的测试样本中各社会特征和各医疗特征对应的参数值,及预先训练完成的潜在患者预测模型,针对所述每个测试样本,确定该测试样本中对应的患者是否复诊;

根据每个所述测试样本中包含的是否复诊的信息,及所述预先训练完成的潜在患者预测模型预测的是否复诊的信息,确定该社会特征或医疗特征对应的准确率;

如果所述准确率小于设定的阈值,则将所述社会特征或医疗特征确定为目标社会特征或目标医疗特征。

进一步地,如果所述准确率不小于设定的阈值,所述方法还包括:

将所述社会特征或医疗特征删除。

本发明实施例公开了一种复诊患者预测装置,所述装置包括:

获取模块,用于针对已就诊患者,根据预先设定的各目标医疗特征和目标社会特征的信息,获取所述已就诊患者各目标社会特征对应的各第一参数值及各目标医疗特征对应的各第二参数值;

预测模块,用于根据获取的所述各第一参数值、所述各第二参数值及预先训练完成的潜在患者预测模型,预测所述已就诊患者是否复诊。

进一步地,所述获取模块,具体用于如果所述目标社会特征为就诊亲友数量,获取所述已就诊患者的每个亲友;针对所述每个亲友,判断是否存在该亲友的就诊记录,如果是,对当前保存的第一参数值进行更新。

进一步地,所述装置还包括:

训练模块,用于根据预先保存的患者信息,及预先设定的各医疗特征和各社会特征,确定每个训练样本,其中所述训练样本中包含患者的标识信息、患者的各医疗特征对应的各第三参数值和各社会特征对应的各第四参数值;根据每个训练样本中包含的各第三参数值、各第四参数值及患者是否复诊的信息,对所述潜在患者预测模型进行训练。

进一步地,所述装置还包括:

特征选取模块,用于针对每个社会特征或医疗特征,获取所述训练样本中包含该社会特征或医疗特征的预设数量的测试样本;将每个所述测试样本中所述社会特征或医疗特征对应的参数值修改为其他值;根据修改参数值后的测试样本中各社会特征和各医疗特征对应的参数值,及预先训练完成的潜在患者预测模型,针对所述每个测试样本,确定该测试样本中对应的患者是否复诊;根据每个所述测试样本中包含的是否复诊的信息,及所述预先训练完成的潜在患者预测模型预测的是否复诊的信息,确定该社会特征或医疗特征对应的准确率;如果所述准确率小于设定的阈值,则将所述社会特征或医疗特征确定为目标社会特征或目标医疗特征。

进一步地,所述特征选取模块,还用于如果所述准确率不小于设定的阈值,触发特征删除模块;

所述装置还包括:

特征删除模块,用于将所述社会特征或医疗特征删除。

本发明实施例公开了一种复诊患者预测方法及装置,所述方法包括:针对已就诊患者,根据预先设定的各目标医疗特征和目标社会特征的信息,获取所述已就诊患者各目标社会特征对应的各第一参数值及各目标医疗特征对应的各第二参数值;根据获取的所述各第一参数值、所述各第二参数值及预先训练完成的潜在患者预测模型,预测所述已就诊患者是否复诊。由于在本发明实施中,在预测已就诊患者在患者是否为来医院复诊时,通过所述已就诊者的各社会特征和各医疗特征的参数值进行预测,提高了预测的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例1提供的一种复诊患者预测过程示意图;

图2为本发明实施例提供的一种就诊患者的就诊数关系示意图;

图3为本发明实施例提供的一种医疗系统包含的各个表格的示意图;

图4为本发明实施例提供的一种特征选择结构示意图;

图5为本发明实施例提供的一种特征比较误差结果示意图;

图6为本发明实施例1提供一种复诊患者预测装置结构图;

图7为本发明实施例提供一种复诊患者预测装置结构图。

具体实施方式

为了提高预测已就诊患者是否复诊的准确性,本发明实施例提供了一种复诊患者预测方法及装置。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1:

图1为本发明实施例提供的一种复诊患者预测过程示意图,该过程包括以下步骤;

S101:针对已就诊患者,根据预先设定的各目标医疗特征和目标社会特征的信息,获取所述已就诊患者各目标社会特征对应的各第一参数值及各目标医疗特征对应的各第二参数值。

本发明实施例提供的复诊患者预测方法可以应用于电子设备,该电子设备可以为手机、平板电脑、PC等设备。

为了预测已就诊患者是否复诊,在本发明实施例中根据已就诊患者的各目标医疗特征和各目标社会特征的信息,对该已就诊患者进行预测。其中,该目标医疗特征包括:年龄、性别、科室、挂号类型、检查指标、检查结果和主治医生等特征中的一个或几个,该目标社会特征包括:医保类型、职业、学历、年均收入和就诊亲友数量等特征中的一个或几个。

电子设备中保存有医院的医疗数据库,该医疗数据库中保存有已就诊患者的信息,该信息中包括已就诊患者的各医疗特征和标识信息,其中医疗特征可以包括年龄、性别、科室、挂号类型、检查指标、检查结果和主治医生等特征,标识信息可以是该已就诊患者的姓名、身份证号等可以唯一标识该患者的信息。电子设备中还保存有该患者的社会特征库,该社会特征库中保存有已就诊患者的信息,该信息中包括已就诊患者的各社会特征和标识信息,其中社会特征可以包括医保类型、职业、学历、子女数量、子女职业、年均收入、就诊亲友数量和亲友职业等特征。

具体的在医疗数据库和社会特征库中保存有已就诊患者的标识信息,及该已就诊患者的医疗特征和社会特征对应的第二参数值和第一参数值,或者也可以保存的是已就诊患者的医疗特征和社会特征对应的参数,电子设备中保存有每个参数与对应的参数值之间的对应关系,当电子设备获取了目标医疗特征和目标社会特征时,根据目标医疗特征和目标社会特征对应的参数,及保存的每个参数与对应的参数值之间的对应关系,确定该已就诊患者的各目标社会特征对应的各第一参数值及各目标医疗特征对应的各第二参数值。

S102:根据获取的所述各第一参数值、所述各第二参数值及预先训练完成的潜在患者预测模型,预测所述已就诊患者是否复诊。

在本发明实施例中预先对潜在患者预测模型进行训练,并且在对潜在患者预测模型进行训练时,是根据训练集中每个样本中包含的患者的各目标医疗特征的各第一参数值和各目标社会特征的各第二参数值,以及该样本中包含的每个患者是否来复诊的信息,对潜在患者预测模型训练完成的。

当获取了该已就诊患者的各第一参数值和各第二参数值后,在训练完成的潜在患者预测模型中输入所述各第一参数值和所述各第二参数值,训练完成的潜在患者预测模型可根据输入的所述各第一参数值和所述各第二参数值,对该已就诊患者是否来该医院复诊进行预测。具体的,该潜在患者预测模型会针对该已就诊患者输出响应的结果,即该已就诊患者是否复诊的结果。

其中,根据获取的所述各第一参数值、所述各第二参数值及预先训练完成的潜在患者预测模型,输出相应的结果的过程属于现有技术,在本发明实施例中对该过程不进行赘述。

在本发明实施例中,在对已就诊患者进行预测时,预先设定了对已就诊患者进行预测的各目标医疗特征和各目标社会特征,为了方便电子设备的预测,在电子设备中保存有医疗数据库和社会特征库,其中该医疗数据库是根据该预先设定的各目标医疗特征,在医疗系统中查找包含目标医疗特征的已就诊患者的信息并保存的,社会特征库是根据预先设定的各目标社会特征,在社交网络或医疗系统中查找包含目标社会特征的已就诊患者的信息并保存的。

具体的,在电子设备中的医疗数据库中保存有每个患者的各医疗特征,及各医疗特征对应的各参数值。这是因为同一医疗特征对应的参数是不同的,为了对该医疗特征进行区别,针对该医疗特征对应的参数设置对应的第二参数值,例如,如果医疗特征为年龄,则不同的年龄段对应不同的第二参数值,如果医疗特征为性别,则不同的性别对应不同的第二参数值,如果医疗特征为科室,则不同的科室对应不同的第二参数值,如果医疗特征为挂号类型,则不同的挂号类型对应不同的第二参数值,如果医疗特征为检查指标,则不同的检查指标对应不同的第二参数值,如果医疗特征为主治医生,则不同的主治医生对应不同的第二参数值,如果医疗特征为检查结果,则不同的检查结果对应不同的第二参数值等等。

在医疗数据库中获取各目标医疗特征对应的各第二参数值时,一般情况下,医疗数据库中有完整的各目标医疗特征对应的各第二参数值,也有可能针对该已就诊患者,某一个或某几个目标医疗特征的第二参数值获取不到,即该医疗数据库中没有保存该已就诊患者的该目标医疗特征对应的第二参数值。如果电子设备在设定的时间长度内未获取到已就诊患者的某一目标医疗特征的第二参数值,则确定该第二参数值为0。

或者,在医疗数据库中也可以保存每个患者的各医疗特征,及各医疗特征对应的各参数,电子设备中保存有每个参数与对应的参数值之间的对应关系,电子设备根据该对应关系,确定医疗特征对应的第二参数值。例如,目标医疗特征为挂号类型,该挂号类型可以包括急诊、专家诊、普通诊等,急诊对应的第二参数值为1,专家诊对应的第二参数值为2,普通诊对应的第二参数值为3,在医疗数据库中可以保存有患者A,挂号类型第二参数值3的信息,也可以保存患者A,挂号类型:普通诊的信息。当电子设备获取到该目标医疗特征对应的参数为普通诊时,根据保存的普通诊对应的第二参数值为3,确定该目标医疗特征对应的第二参数值为3。

电子设备中还保存有社会特征库,该社会特征库中保存有每个患者的各社会特征,及各社会特征对应的参数值。这是因为同一社会特征对应的参数是不同的,为了对该社会特征进行区别,针对该社会特征对应的参数设置对应的第一参数值,例如,如果社会特征是医保类型,则不同的医保类型对应不同的第一参数值,如果是社会特征是学历,则不同的学历对应不同的第一参数值,如果社会特征是年均收入,则不同的年均收入范围对应不同的第一参数值,如果社会特征是子女数量,则不同的子女数量对应不同的第一参数值,如果社会特征是就诊亲友数量,则不同的就诊亲友数量对应不同的第一参数值。

在社会特征库中获取各目标社会特征对应的各第一参数值时,一般情况下,社会特征库中有完整的各目标社会特征对应的各第一参数值,也有可能针对该已就诊患者,某一个或某几个社会特征的第一参数值获取不到,如果获取不到该目标社会特征对应的第一参数值,则认为该社会特征库中没有保存该已就诊患者该目标社会特征对应的第一参数值。此时,则可以根据该已就诊患者提供的社交网络账号,例如微博、微信或Facebook的账号信息,在微博、微信、Facebook等社交网络通过网络爬虫方法获取该已就诊患者的第一参数值进行补充。若还是获取不到该已就诊患者的该目标社会特征对应的第一参数值,则可以认为该第一参数值为0。所述通过网络爬虫方法获取该就诊患者的第一参数值属于现有技术,在本发明实施例中对该过程不进行赘述。

另外,在电子设备的社会特征库中也可以保存每个患者的各社会特征,及各社会特征对应的各参数,电子设备中保存有每个参数与对应的参数值之间的对应关系,电子设备根据该对应关系,确定社会特征对应的第一参数值。具体的如上医疗特征对应的第二参数值的确定,在此不进行赘述。

由于在本发明实施中,在预测已就诊患者在患者是否为来医院复诊时,通过所述已就诊者的各社会特征和各医疗特征的参数值进行预测,提高了预测的准确性。

实施例2:

为了准确的确定每个目标社会特征对应的各第一参数值,当所述目标社会特征为就诊亲友数量时,获取所述目标社会特征对应的第一参数值的过程包括:

获取所述已就诊患者的每个亲友;

针对所述每个亲友,判断是否存在该亲友的就诊记录,如果是,对当前保存的第一参数值进行更新。

在就诊患者来医院就诊时,会填写就诊患者的信息,该信息中包括就诊信息来源,所述就诊信息来源可以是电视广告、新闻报纸、浏览网页、亲友推荐等。如果就诊患者填写的就诊信息来源是亲友推荐,还会让该就诊患者提供推荐他来该医院就诊的亲友的信息。推荐他来该医院就诊的亲友可以是一个,也可以是多个。如果电子设备识别到该就诊患者在提供的信息中包括推荐的亲友的信息,则将该推荐的亲友确定为该患者的亲友,该患者的亲友可以是一个,也可以是多个。如果识别到没有提供推荐的亲友的信息,则可以是根据该就诊患者提供的社交网络账号,例如微博、微信或Facebook的账号信息,在微博、微信、Facebook等社交网络通过网络爬虫方法获取该就诊患者的亲友的信息进行补充。所述通过网络爬虫方法获取该就诊患者的亲友的信息属于现有技术,在本发明实施例中对该过程不进行赘述。

在本发明实施例中,所述目标社会特征包括就诊亲友数量,在获取所述目标社会特征对应的第一参数值时,可以是先获取所述已就诊患者的每个亲友的标识信息,所述标识信息可以是姓名、身份证号等唯一可以标识该亲友的信息。针对所述每个亲友的标识信息,电子设备查找是否存在该亲友的就诊记录,当存在该亲友的就诊记录时,则可以对当前保存的所述已就诊患者的就诊亲友数量进行更新。

电子设备在判断是否存在该亲友的就诊记录时,可以是在该已就诊患者来该医院就诊时判断的,根据该已就诊患者提供的推荐他来该医院就诊的亲友的信息,判断该医院的就诊记录中是否存在该亲友的就诊记录,若存在,则说明该亲友比该已就诊患者较早时间来该医院就诊,则对针对该已就诊患者当前保存的就诊亲友数量进行更新。电子设备在判断是否存在该亲友的就诊记录时,也可以是在任意时间判断的,当有一个患者来该医院就诊时,根据该患者的信息,查找是否存在把该患者作为推荐亲友的已就诊患者,如果是,当前患者来该医院就诊则为存在该已就诊患者的亲友的就诊记录,则说明所述已就诊患者比该当前患者即所述已就诊患者的亲友,较早时间来该医院就诊,此时对当前保存的所述已就诊患者的亲友数量进行更新。

对当前保存的就诊亲友数量进行更新时,可以是当判断存在一个亲友的就诊记录时,则对该已就诊患者的就诊亲友数量增加1。例如,图2所示的就诊数关系示意图,图中包括患者A、患者C、患者B、患者E、患者D和患者F,患者B来该医院就诊时提供的推荐的亲友是患者A,则患者A是患者B的亲友;患者E、患者D来该医院就诊时提供的推荐的亲友是患者C,则患者C是患者E和患者D的亲友;患者F来该医院就诊时提供的推荐的亲友是患者A和患者C,则患者A和患者C是患者F的亲友;患者C来该医院就诊时提供的推荐的亲友是患者A,则患者A是患者C的亲友;患者A来该医院就诊时没有提供推荐的亲友,并且没有找到该患者A的亲友的信息。

若患者来该医院就诊时,电子设备判断是否存在该就诊患者提供的推荐他来该医院就诊的亲友的就诊记录。当患者A来该医院就诊时,该患者A为已就诊患者,该已就诊患者A没有提供亲友的信息,则认为该已就诊患者A的就诊亲友数量为0。当患者C来该医院就诊时,该患者C为已就诊患者,该已就诊患者C提供的亲友为患者A,电子设备判断存在该患者A的就诊记录,则对该已就诊患者C的就诊亲友数量增加1。当患者F来该医院就诊时,该患者F为已就诊患者,该已就诊患者F提供的亲友为患者A和患者C,电子设备判断存在该患者A和患者C的就诊记录,则对该已就诊患者F的就诊亲友数量增加2。当患者B来该医院就诊时,该患者B为已就诊患者,该已就诊患者B提供的亲友为患者A,电子设备判断存在该患者A的就诊记录,则对该已就诊患者C的就诊亲友数量增加1。当患者E来该医院就诊时,该患者E为已就诊患者,该已就诊患者E提供亲友为患者C,电子设备判断存在该患者C的就诊记录,则对该已就诊患者E的就诊亲友数量增加1。当患者D来该医院就诊时,该患者D为已就诊患者,该已就诊患者D提供亲友为患者C,电子设备判断存在该患者C的就诊记录,则对该已就诊患者D的就诊亲友数量增加1。统计可以得到患者A的就诊亲友数量为0,患者B、患者E和患者D的就诊亲友数量为1,患者F的就诊亲友数量为2。将已就诊患者和就诊亲友数量的关系以(K,V)的形式联系起来,其中K为该已就诊患者的编号,V为该已就诊患者的就诊亲友数量。

当对所述已就诊患者的就诊亲友数量进行更新时,也可以是根据所述已就诊患者与该亲友的亲密程度来进行更新,不同的亲密程度代表不同的数量,例如该已就诊患者的亲友中包括该已就诊患者的朋友和该已就诊患者的亲属,若该就诊亲友与该已就诊患者为朋友关系,可以将亲密程度设为1,若该就诊亲友与该已就诊患者的关系为叔侄、表亲等亲属关系,则将亲密程度设为2,若该就诊亲友与该已就诊患者的关系为父子、母子、夫妻等亲属关系,则将亲密程度设为3。该就诊亲友与该已就诊患者的关系可以是该已就诊患者在提供该亲友时提供的,也可以是根据该已就诊患者提供的微博、微信或Facebook的账号信息在微博、微信、Facebook等社交网络通过网络爬虫方法获取的。在对该就诊亲友数量进行更新时,当电子设备每判断存在与该已就诊患者的亲密程度为1的患者的就诊记录时,该已就诊患者的就诊亲友数加1,当电子设备每判断存在与该已就诊患者的亲密程度为2的患者的就诊记录时,该已就诊患者的就诊数加2,当电子设备每判断存在与该已就诊患者的亲密程度为3的患者的就诊记录时,该已就诊患者的就诊数加3。所述通过网络爬虫方法获取该就诊亲友与该已就诊患者的关系属于现有技术,在本发明实施例中对该过程不进行赘述。

实施例3:

预先对所述潜在患者预测模型进行训练的方法包括:

根据预先保存的患者信息,及预先设定的各医疗特征和各社会特征,确定每个训练样本,其中所述训练样本中包含患者的标识信息、患者的各医疗特征对应的各第三参数值和各社会特征对应的各第四参数值;

根据每个训练样本中包含的各第三参数值、各第四参数值及患者是否复诊的信息,对所述潜在患者预测模型进行训练。

在本发明实施例中,一般情况下,为了实现对潜在患者预测模型的训练,需要预先收集训练样本集,该训练样本集中的每个样本包含患者的各医疗特征和各社会特征,其中每个样本中包含的医疗特征可以相同,也可以不同,包含的社会特征可以相同,也可以不同,例如共有4个医疗特征分别为医疗特征1、医疗特征2、医疗特征3和医疗特征4,共有3个社会特征,分别为社会特征1、社会特征2和社会特征3,则第一样本中可以包含医疗特征1、医疗特征2、医疗特征3、医疗特征4、社会特征1和社会特征2,第二样本中可以包含医疗特征2、医疗特征3、医疗特征4、社会特征1、社会特征2和社会特征3,第三样本中可以包含医疗特征3、医疗特征、社会特征1和社会特征2等。当然,较佳地,每个样本中包含全部的医疗特征和全部的社会特征会使训练完成的潜在患者预测模型,即每个样本中都包含医疗特征1、医疗特征2、医疗特征3、医疗特征4、社会特征1、社会特征2和社会特征3。

为了预先获取训练样本,在本发明实施例中可以根据医疗系统中保存的各个表格中的信息来获取,图3为医疗系统包含的各个表格的示意图,在医疗系统中保存有门诊检查表、门诊挂号表、诊断信息表、住院信息表和费用使用表等各表格,每个表格中都保存有患者的信息,该信息中包含患者的标识信息和患者的各医疗特征对应的各参数值,所述标识信息可以是患者的姓名、身份证号等唯一可以标识该患者信息,各医疗特征可以是年龄、性别、科室、挂号类型、检查指标、检查结果和主治医生等特征。

针对同一个患者,每个表格中针对该患者的标识信息是相同的,该患者的医疗特征可以是分散保存的,例如,门诊挂号表中保存有该患者的挂号类型的参数值和科室的参数值,诊断信息表中保存有该患者的检查指标、检查结果和主治医生等参数值。

另外,在上述各个表格中还可能保存有患者的社会特征,该社会特征可以是医保类型、职业、学历、年均收入和就诊亲友数量等特征。每个表格中患者的社会特征可以是相同的,也可以是不同的。

将表格中的所有内容整合为训练样本集,训练样本集中的每个训练样本包含患者的标识信息、各医疗特征及对应的第三参数值和各社会特征及对应的第四参数值,其中每个样本中包含的医疗特征可以相同,也可以不同,包含的社会特征可以相同,也可以不同。

为了确保预测的准确性,预先设定了进行模型训练的各特征,该预先设定的特征可以包括各社会特征和各医疗特征,当然因为不知道哪些医疗特征和社会特征会对模型的训练有影响,预先设定的各社会特征和各医疗特征可以比目标医疗特征和目标社会特征多。

一般情况下,医疗系统中保存有完整的预先设定的医疗特征对应的第三参数值,但有可能某个社会特征对应的第四参数值没有保存,此时则可以根据该患者提供的微博、微信或Facebook的账号信息在微博、微信、Facebook等社交网络通过网络爬虫方法获取该诊患者的该社会特征的第四参数值进行补充的。所述通过网络爬虫方法获取该诊患者的该社会特征的第四参数值属于现有技术,在本发明实施例中对该过程不进行赘述。

预先对所述潜在患者预测模型进行训练时,需要预先设定训练时的各医疗特征和各社会特征,针对该医疗特征和社会特征,在医疗系统中保存的患者信息中,针对预先设定的各医疗特征和各社会特征,确定针对患者训练集中的每个训练样本,其中所述训练样本中包含患者的标识信息、患者的各医疗特征对应的各第三参数值和各社会特征对应的的各第四参数值;根据每个训练样本中包含的各第三参数值、各第四参数值及患者是否复诊的信息,对所述潜在患者预测模型进行训练。

另外,在获取上述训练样本集后,可以从该训练样本集中划分出一部分作为测试样本集。在对潜在患者预测模型训练完成后,可以使用测试样本集中的每个样本,检测该潜在患者预测模型的预测结果是否准确。

实施例4:

在对已就诊患者进行预测时,是根据预先设定的各目标医疗特征和目标社会特征的信息对应的各参数值进行预测的,在本发明实施例中,预先确定所述各目标社会特征和各目标医疗特征的过程包括:

针对每个社会特征或医疗特征,获取所述训练样本中包含该社会特征或医疗特征的预设数量的测试样本;

将每个所述测试样本中所述社会特征或医疗特征对应的参数值修改为其他值;

根据修改参数值后的测试样本中各社会特征和各医疗特征对应的参数值,及预先训练完成的潜在患者预测模型,针对所述每个测试样本,确定该测试样本中对应的患者是否复诊;

根据每个所述测试样本中包含的是否复诊的信息,及所述预先训练完成的潜在患者预测模型预测的是否复诊的信息,确定该社会特征或医疗特征对应的准确率;

如果所述准确率小于设定的阈值,则将所述社会特征或医疗特征确定为目标社会特征或目标医疗特征。

在本发明实施例中,在潜在患者预测模型训练完成后,为了确定每个特征对模型的影响,可以获取测试样本,确定每个特征是否需要删除或保留。该测试样本可以是训练样本的一部分,也可以是一些新的测试样本。潜在患者训练集中的每个训练样本中包含患者的各医疗特征及对应的参数值和各社会特征及对应的参数值,还包含该患者实际是否来复诊的信息。

具体的,在本发明实施例中该预先设定的各社会特征和各医疗特征的数量可以大于目标社会特征和目标医疗特征的数量,针对预先设定的每个社会特征或医疗特征,在所述训练样本中获取包含该社会特征和医疗特征的预设数据量的测试样本,将每个所述测试样本中所述社会特征或医疗特征对应的参数值修改为其他值。所述预设数据量可以是一个固定数据量值,也可以是针对训练样本来说的一定比例的数据量值。修改后的参数值与未修改的参数值不同,在修改参数值时,可以是针对每个参数值增加1或2等固定数值,也可以是任意修改,只要改后的参数值与未修改的参数值不同即可。

将修改参数值后的测试样本中的每个社会特征和医疗特征对应的参数值输入到所述预先训练完成的潜在患者预测模型中,该潜在患者预测模型会针对每个样本输出预测的是否复诊的信息。将每个所述测试样本中包含的实际是否复诊的信息,与所述预先训练完成的潜在患者预测模型预测的是否复诊的信息进行对应匹配,确定该社会特征或医疗特征对应的准确率。如果所述准确率小于设定的阈值,则将所述社会特征或医疗特征确定为目标社会特征或目标医疗特征。如果所述准确率不小于设定的阈值,说明该特征对预测结果的影响不大,将所述社会特征或医疗特征从预先设定的特征中删除。

例如,挂号类型这个特征,有1至5五个参数值,其中,1对应主任医师、2对应副主任医师、3对应普通医师、4对应特需、5对应急诊,将训练样本中10%的数据量的样本作为测试样本,将该测试样本中挂号类型对应的参数值进行修改,每个参数值加1,则参数值1变为2,参数值5变为1,将测试样本挂号类型这个特征修改后的各参数值输入到所述潜在患者训练模型中,输出预测的是否复诊的信息,将预测的是否复诊的信息与测试样本中包含的实际是否复诊的信息进行比较匹配,确定准确率。

如图4所示特征选择结构示意图,将包含特征1、特征2、……、特征N的训练样本中的一部分随机样本进行参数值的修改,该一部分随机样本称为测试样本,将改变了参数值的测试样本中的参数值输入到所述预先训练完成的潜在患者预测模型中,预测出是否复诊的信息,将该预测的是否复诊的信息与实际是否复诊的信息比较误差,选择出误差不小于预设值的特征,将该特征作为目标特征,选择出误差小于预定阈值的特征,该特征对预测结果几乎不产生影响,则将该特征删除。

如图5所示的特征比较误差结果示意图,该图中包含预设的12个特征,每个特征都要对应的比较误差结果,可以看出特征11的误差是最高的,特征8的误差是0还有其他特征的比较误差结果,若某个特征的比较误差结果不小于设定阈值,则该特征确定为目标特征。特征8的比较误差结果是0,则将特征8从预设的特征中删除。

图6为本发明实施例1提供一种复诊患者预测装置结构图,所述装置包括:

获取模块11,用于针对已就诊患者,根据预先设定的各目标医疗特征和目标社会特征的信息,获取所述已就诊患者各目标社会特征对应的各第一参数值及各目标医疗特征对应的各第二参数值;

预测模块12,用于根据获取的所述各第一参数值、所述各第二参数值及预先训练完成的潜在患者预测模型,预测所述已就诊患者是否复诊。

所述获取模块11,具体用于如果所述目标社会特征为就诊亲友数量,获取所述已就诊患者的每个亲友;针对所述每个亲友,判断是否存在该亲友的就诊记录,如果是,对当前保存的第一参数值进行更新。

图7为本发明实施例提供一种复诊患者预测装置结构图,在图6基础上,所述装置还包括:

训练模块13,用于根据预先保存的患者信息,及预先设定的各医疗特征和各社会特征,确定每个训练样本,其中所述训练样本中包含患者的标识信息、患者的各医疗特征对应的各第三参数值和各社会特征对应的各第四参数值;根据每个训练样本中包含的各第三参数值、各第四参数值及患者是否复诊的信息,对所述潜在患者预测模型进行训练。

所述装置还包括:

特征选取模块14,用于针对每个社会特征或医疗特征,获取所述训练样本中包含该社会特征或医疗特征的预设数量的测试样本;将每个所述测试样本中所述社会特征或医疗特征对应的参数值修改为其他值;根据修改参数值后的测试样本中各社会特征和各医疗特征对应的参数值,及预先训练完成的潜在患者预测模型,针对所述每个测试样本,确定该测试样本中对应的患者是否复诊;根据每个所述测试样本中包含的是否复诊的信息,及所述预先训练完成的潜在患者预测模型预测的是否复诊的信息,确定该社会特征或医疗特征对应的准确率;如果所述准确率小于设定的阈值,则将所述社会特征或医疗特征确定为目标社会特征或目标医疗特征。

所述特征选取模块14,还用于如果所述准确率不小于设定的阈值,触发特征删除模块;

所述装置还包括:

特征删除模块15,用于将所述社会特征或医疗特征删除。

本发明实施例公开了一种复诊患者预测方法及装置,所述方法包括:针对已就诊患者,根据预先设定的各目标医疗特征和目标社会特征的信息,获取所述已就诊患者各目标社会特征对应的各第一参数值及各目标医疗特征对应的各第二参数值;根据获取的所述各第一参数值、所述各第二参数值及预先训练完成的潜在患者预测模型,预测所述已就诊患者是否复诊。由于在本发明实施中,在预测已就诊患者在患者是否为来医院复诊时,通过所述已就诊者的各社会特征和各医疗特征的参数值进行预测,提高了预测的准确性。

对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者一个操作与另一个实体或者另一个操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1