心脑血管疾病风险预测方法及装置与流程

文档序号:15643433发布日期:2018-10-12 22:18阅读:268来源:国知局

本发明涉及预测分析领域,特别是涉及一种心脑血管疾病风险预测方法及装置。



背景技术:

随着人们的生活压力和精神压力与日俱增,心脑血管疾病的发病率逐年提升,严重影响居民的健康。医学实践表明如果心脑血管疾病患者在早期诊断时能够确诊,对于心脑血管疾病的干预和治疗效果有很大帮助。

现有技术使用数据挖掘技术对于心脑血管疾病的病例数据特征进行挖掘,将所有患者的体检特征数据及回访数据组成一个训练集,使用决策树、逻辑斯蒂回归和人工神经网络算法,训练出预测模型。然后将待预测患者的体检数据作为输入样本,输入到训练出的预测模型中,输出待预测患者是否是心脑血管疾病患者。

以人工神经网络算法训练预测模型为例,使用人工神经网络算法训练预测模型过程中,由于神经网络的输入样本包含了非心脑血管疾病患者样本和心脑血管疾病患者样本,而非心脑血管疾病患者样本与心脑血管疾病患者样本中的特征数据差距较大,因此,将训练集中的所有样本作为输入层的输入,神经网络的输出层的误差函数较大。因为受到不同样本数据的影响,根据误差函数调整神经网络的各层权值及阈值,训练出的预测模型并不准确。因而,使用人工神经网络算法训练预测模型,预测待预测患者是否是心脑血管疾病患者的准确率不高。



技术实现要素:

本发明实施例的目的在于提供一种心脑血管疾病风险预测方法及装置,以提高预测患者是否是心脑血管疾病患者的准确率。具体技术方案如下:

第一方面,本发明实施例提供了一种心脑血管疾病风险预测方法,包括:

获取样本集;所述样本集根据设置完标签的患者医疗数据库集的多个样本所确定的;一条样本包括:患者的编号、特征及特征数据;所述标签包括:第一标签和第二标签;第一标签标识心脑血管疾病患者样本;第二标签标识非心脑血管疾病患者样本;

获取一条输入样本;所述输入样本由待预测患者的医疗健康体检数据及医疗就诊数据合并构成;

使用余弦-大间隔最近邻居cos-lmnn算法进行度量学习,得到所述样本集的全局度量矩阵;

使用预设的聚类算法,将样本集中的样本分为预设数量的局部簇;

根据所述全局度量矩阵,使用余弦相似度算法,计算所述输入样本与所述样本集中样本的距离,组成第一距离集合;

根据预设的第一k值与所述第一距离集合,使用k近邻算法,计算得到输入样本的第一k值个第一邻近样本;

确定所述第一邻近样本所在的局部簇;

在所述第一邻近样本所在的局部簇中,选择第一邻近样本的数量超过第一预设阈值的局部簇,作为目标局部簇;

将所述输入样本划入所述目标局部簇;

根据cos-lmnn算法学习得到的所述目标局部簇的局部度量矩阵,使用余弦相似度算法计算,所述输入样本与所述目标局部簇中样本的距离,组成第二距离集合;

在所述目标局部簇中,根据预设的第二k值与所述第二距离集合,使用k近邻算法,确定所述输入样本第二k值个第二邻近样本;

统计第二邻近样本的第一标签个数与第二标签个数;

如果第一标签个数与第二标签个数的比值超过预设标签阈值,则将第一标签作为输入样本的标签,否则将第二标签作为输入样本的标签;

根据所述输入样本的标签,确定输入样本是否是心脑血管疾病患者的样本;

如果输入样本是心脑血管疾病患者的样本,则确定输入样本中的待预测患者是心脑血管疾病患者;

如果输入样本不是心脑血管疾病患者的样本,则确定输入样本中的待预测患者不是心脑血管疾病患者。

可选的,在所述确定输入样本中的待预测患者是心脑血管疾病患者的步骤之后,所述方法还包括:

根据患者的健康回访数据确定所述待预测患者是否是高危心脑血管疾病患者;

如果所述待预测患者是高危心脑血管疾病患者,则对所述待预测患者作住院治疗的建议;

如果所述待预测患者不是高危心脑血管疾病患者,则对所述待预测患者作增加体检频次的建议;

在所述确定输入样本中的待预测患者不是心脑血管疾病患者的步骤之后,所述方法还包括:

根据患者的健康回访数据确定所述待预测患者是否是健康用户;

如果所述待预测患者是健康用户,则对所述正常患者作保持正常体检频次的建议;

如果所述待预测患者不是健康用户,则将所述待预测患者标记为漏诊患者,将所述漏诊患者的特征数据加入所述患者医疗数据库集;

其中,漏诊患者为心脑血管疾病患者。

可选的,所述第一标签标识心脑血管疾病患者样本,包括:

根据已收集的患者的健康回访数据,确定心脑血管疾病患者的标识信息;

所述患者的健康回访数据包括:患者的编号、特征、特征数据及确认病症;所述标识信息包括:确认病症、确认病症对应的特征及特征数据;

根据心脑血管疾病患者的标识信息,在所述医疗数据库集中确定心脑血管疾病患者样本;

将所述心脑血管疾病患者的样本,设置第一标签;

所述第二标签标识非心脑血管疾病患者样本,包括:

将除所述心脑血管疾病患者样本以外的其他样本,设置第二标签。

可选的,获取样本集,包括:

根据设置标签的患者医疗数据库集的多个样本,将样本缺失值大于第一阈值的样本作样本删除处理;

所述样本缺失值为:一条样本中缺失的特征数量与该样本中特征总数量的比值;

在删除处理后的多条样本中查找,特征缺失值大于第二阈值的特征作特征删除处理;

所述特征缺失值为:多条样本的同一特征中,缺少特征数据的特征数量与同一特征总数量的比值;

在作特征删除处理后的多条样本查找缺失特征数据的特征,作为第一特征;

使用多重填补法,对所述第一特征缺失的特征数据作缺失值填补;

按照数据类型,对缺失值填补后的所述多条样本的特征数据做分类,获得分类结果;

其中,所述分类结果包括:离散特征数据和连续特征数据;

根据分类结果,将所述离散特征数据和连续特征数据,作与数据类型对应的处理;

将所述离散特征数据和连续特征数据做相对应的处理后的特征数据加入所述患者医疗数据库集,作为第一数据库集;

其中,将所述离散特征数据和连续特征数据,作与数据类型对应的处理,包括:对离散特征数据进行独热编码;对连续特征数据,使用正太标准化z-score方法进行标准化处理;

使用欠采样及smote算法,对第一数据库集的样本,进行不均衡处理,获得第二数据库集;

使用方差分析法计算,所述第二数据库集中的同一特征数据的方差,删除特征数据方差值小于预设方差阈值的特征数据;

使用relief算法计算,所述删除特征数据方差值小于预设方差阈值的特征数据后的每个特征数据的权重;

根据特征数据的权重与特征数据的权重对应的分数值,将分数值小于预设分数阈值的特征数据及对应的特征删除,获得第四数据库集;

根据第四数据库集,使用前向选择法,确定样本集。

可选的,所述根据所述全局度量矩阵,使用余弦相似度算法计算所述输入样本与所述样本集中样本的距离,组成第一距离集合,包括:

根据所述全局度量矩阵,使用余弦相似度算法公式计算所述输入样本与所述样本集中样本的距离,组成第一距离集合;

其中,所述余弦相似度算法公式为:

所述第一距离集合d1包括:{d(xi,x1),d(xi,x2),d(xi,x3),…,d(xi,xj)};

其中,i代表输入样本的标号,xi代表第i个输入样本为xi;样本集为x;全局度量矩阵为a;m=ata;j代表样本集中的样本编号;xj代表样本集中第j个的样本;i与j取正整数;d(xi,xj)代表在全局度量矩阵下输入样本xi与x集中第j个样本的距离;a(xi,xj)代表经过a矩阵变换后xi,xj之间的距离。

可选的,所述根据cos-lmnn算法学习得到的所述目标局部簇的局部度量矩阵,使用余弦相似度算法计算所述输入样本与所述目标局部簇中样本的距离,组成第二距离集合,包括:

根据cos-lmnn算法学习得到的所述目标局部簇的局部度量矩阵,使用余弦相似度算法公式计算所述输入样本与所述样本集中样本的距离,组成第二距离集合;

其中,所述余弦相似度算法公式为:

所述第二距离集合d2包括:{d(xi,xs1),d(xi,xs2),…,d(xi,xsi)};

其中,i代表输入样本的标号,xi代表第i个输入样本为x;xsi代表与i同类别的样本;局部度量矩阵为as;ms=astas;i取正整数;d(xi,xsi)代表在局部度量矩阵下输入样本xi与所述目标局部簇中与i同类别的样本的距离;i取正整数;as(xi,xsi)代表经过as矩阵变换后xi,xsi之间的距离。

第二方面,本实施例提供了一种心脑血管疾病风险预测装置,包括:

集合获取模块,用于获取样本集;

所述样本集根据设置完标签的患者医疗数据库集的多个样本所确定的;一条样本包括:患者的编号、特征及特征数据;所述标签包括:第一标签和第二标签;第一标签标识心脑血管疾病患者样本;第二标签标识非心脑血管疾病患者样本;

样本获取模块,用于获取一条输入样本;

所述输入样本由待预测患者的医疗健康体检数据及医疗就诊数据合并构成;

矩阵计算模块,用于使用余弦-大间隔最近邻居cos-lmnn算法进行度量学习,得到所述样本集的全局度量矩阵;

第一局部簇确定模块,用于使用预设的聚类算法,将样本集中的样本分为预设数量的局部簇;

第一距离确定模块,用于根据所述全局度量矩阵,使用余弦相似度算法,计算所述输入样本与所述样本集中样本的距离,组成第一距离集合;

第一样本确定模块,用于根据预设的第一k值与所述第一距离集合,使用k近邻算法,计算得到输入样本的第一k值个第一邻近样本;

第二局部簇确定模块,用于确定所述第一邻近样本所在的局部簇;

目标局部簇确定模块,用于在所述第一邻近样本所在的局部簇中,选择第一邻近样本的数量超过第一预设阈值的局部簇,作为目标局部簇;

局部簇划分模块,用于将所述输入样本划入所述目标局部簇;

第二距离确定模块,用于根据cos-lmnn算法学习得到的所述目标局部簇的局部度量矩阵,使用余弦相似度算法计算,所述输入样本与所述目标局部簇中样本的距离,组成第二距离集合;

第二样本确定模块,用于在所述目标局部簇中,根据预设的第二k值与所述第二距离集合,使用k近邻算法,确定所述输入样本第二k值个第二邻近样本;

统计模块,用于统计第二邻近样本的第一标签个数与第二标签个数;

标签确定模块,用于如果第一标签个数与第二标签个数的比值超过预设标签阈值,则将第一标签作为输入样本的标签,否则将第二标签作为输入样本的标签;

患者样本确定模块,用于根据所述输入样本的标签,确定输入样本是否是心脑血管疾病患者的样本;

心脑血管疾病患者确定模块,用于如果输入样本是心脑血管疾病患者的样本,则确定输入样本中的待预测患者是心脑血管疾病患者;

非心脑血管疾病患者确定模块,用于如果输入样本不是心脑血管疾病患者的样本,则确定输入样本中的待预测患者不是心脑血管疾病患者。

可选的,本实施例提供的一种心脑血管疾病风险预测装置还包括:

高危确定模块,用于根据患者的健康回访数据确定所述待预测患者是否是高危心脑血管疾病患者;

住院建议模块,用于如果所述待预测患者是高危心脑血管疾病患者,则对所述待预测患者作住院治疗的建议;

增加体检建议模块,用于如果所述待预测患者不是高危心脑血管疾病患者,则对所述待预测患者作增加体检频次的建议;

健康确定模块,用于根据患者的健康回访数据确定所述待预测患者是否是健康用户;

正常体检建议模块,用于如果所述待预测患者是健康用户,则对所述正常患者作保持正常体检频次的建议;

漏诊患者确定模块,用于如果所述待预测患者不是健康用户,则将所述待预测患者标记为漏诊患者,将所述漏诊患者的特征数据加入所述患者医疗数据库集;

其中,漏诊患者为心脑血管疾病患者。

可选的,所述集合获取模块,包括:

样本删除子模块,用于根据设置标签的患者医疗数据库集的多个样本,将样本缺失值大于第一阈值的样本作样本删除处理;

所述样本缺失值为:一条样本中缺失的特征数量与该样本中特征总数量的比值;

特征删除子模块,用于在删除处理后的多条样本中查找,特征缺失值大于第二阈值的特征作特征删除处理;

所述特征缺失值为:多条样本的同一特征中,缺少特征数据的特征数量与同一特征总数量的比值;

第一特征子模块,用于在作特征删除处理后的多条样本查找缺失特征数据的特征,作为第一特征;

缺失值填充子模块,用于使用多重填补法,对所述第一特征缺失的特征数据作缺失值填补;

数据分类子模块,用于按照数据类型,对缺失值填补后的所述多条样本的特征数据做分类,获得分类结果;

其中,所述分类结果包括:离散特征数据和连续特征数据;

数据处理子模块,用于根据分类结果,将所述离散特征数据和连续特征数据,作与数据类型对应的处理;

集合更新子模块,用于将所述离散特征数据和连续特征数据做相对应的处理后的特征数据加入所述患者医疗数据库集,作为第一数据库集;

其中,将所述离散特征数据和连续特征数据,作与数据类型对应的处理,包括:对离散特征数据进行独热编码;对连续特征数据,使用正太标准化z-score方法进行标准化处理;

均衡处理子模块,用于使用欠采样及smote算法,对第一数据库集的样本,进行不均衡处理,获得第二数据库集;

方差删除子模块,用于使用方差分析法计算,所述第二数据库集中的同一特征数据的方差,删除特征数据方差值小于预设方差阈值的特征数据;

权重计算子模块,用于使用relief算法计算,所述删除特征数据方差值小于预设方差阈值的特征数据后的每个特征数据的权重;

集合确定子模块,用于根据每个特征数据的权重及第二数据库集,使用前向选择法,确定样本集。

在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述任一所述的一种心脑血管疾病风险预测方法。

在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的一种心脑血管疾病风险预测方法。

在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的一种心脑血管疾病风险预测方法。

本发明实施例提供的一种心脑血管疾病风险预测方法及装置,通过获取样本的获取样本集;将样本集中的样本分为预设数量的局部簇,根据预设的第一k值与所述第一距离集合,使用k近邻算法,计算得到输入样本的第一k值个第一邻近样本,从而确定目标局部簇,将所述输入样本划入所述目标局部簇后,计算所述输入样本与所述目标局部簇中样本的距离,从而确定输入样本第二k值个第二邻近样本;统计第二邻近样本的第一标签个数与第二标签个数,从而确定输入样本的标签,确定输入样本是否是心脑血管疾病患者的样本;最终确定待预测患者是否是心脑血管疾病患者。本实施例考虑到心脑血管疾病患者特征数据相似度较高,计算样本之间的相似度距离,确定输入样本的最邻近的样本,从而确定输入样本中的待预测患者是否是心脑血管疾病患者,避免了不同样本特征数据对训练预测模型的影响。因此,可以提高预测待预测患者是否是心脑血管疾病患者的准确率。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的一种心脑血管疾病风险预测方法流程图;

图2为本发明实施例中图1中s101步骤的具体流程图;

图3为本发明实施例的一种心脑血管疾病风险预测装置结构图;

图4为本发明实施例的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本实施例为了解决现有技术使用决策树、逻辑斯蒂回归和人工神经网络算法训练预测模型,预测待预测患者是否是心脑血管疾病患者的准确率不高的问题,可以理解的是心脑血管疾病患者之间的特征数据都相似,因此,可以利用心脑血管疾病患者样本之间的相似度距离,获得与待预测患者样本相似的样本,从而得知待预测患者样本是否是心脑血管疾病患者样本,确定待预测患者是否是心脑血管疾病患者。

如图1所示,本发明实施例所提供的一种心脑血管疾病风险预测方法,包括如下步骤:

s101,获取样本集;样本集根据设置完标签的患者医疗数据库集的多个样本所确定的;一条样本包括:患者的编号、特征及特征数据;标签包括:第一标签和第二标签;第一标签标识心脑血管疾病患者样本;第二标签标识非心脑血管疾病患者样本;

举例而言,一条样本包括:患者的编号0001;特征包括:年龄、性别、城市、职业、家族遗传史、疾病史、饮食规律、吸烟习惯、饮酒习惯、血压、脉搏、血脂、血糖等;特征数据包括:年龄:50;性别:男;城市:武汉;职业:教师;家族遗传史:无;疾病史:高血压;饮食规律:早餐不吃、午餐面食或者米饭、晚餐烧烤;吸烟习惯:一天两根烟;饮酒习惯:至少三天一次;血压:100-145mmhg;脉搏:60~100次/分;血清总胆固醇:2.9~5.17mmoi/l;血清甘油三酯:0.56~1.7mmoi/l;高密度脂蛋白胆固醇:0,94~2.0mmoi/l;低密度脂蛋白胆固醇:2.07~3.12i/l;血糖:空腹7.8--9.0mmol/l等。

可以理解的是,本实施例中的患者医疗数数据库集中设置完标签的多条样本,是预先将患者的医疗体检数据和医疗就诊数据合并形成一条样本,或者也可以在每次获取样本集时,将患者的医疗体检数据和医疗就诊数据合并形成一条样本。鉴于前者可以节省时间,本实施例采用预先将患者的医疗体检数据和医疗就诊数据合并形成一条样本,然后根据患者的健康回访数据设置标签。患者的健康回访数据包含:患者的标号、患者确认的病症及患者确认病症的数据特征。例如:健康回访数据包括:“脑卒中”、“高血压”、“冠心病”、“高血脂”、“高血糖”、“咳血”、“晕倒”、“脑梗”及“心力衰竭”等多种心脑血管疾病。患者确认的病症的方式可以是现有技术中经医生确诊或者患者身体反映出的病症或者患者家属确认的病症,在此不做赘述。

患者的医疗体检数据和医疗就诊数据与现有技术中一样,医疗体检数据包含患者的标号及特征数据,医疗就诊数据包含患者标号及患者的基本信息。将患者的医疗体检数据和医疗就诊数据根据患者标号合并形成一条样本,然后根据患者的健康回访数据包含的患者的标号及患者确认的病症确定该样本是否是心脑血管疾病患者样本,给该样本设置标签。

s102,获取一条输入样本;输入样本由待预测患者的医疗健康体检数据及医疗就诊数据合并构成;

s103,使用余弦-大间隔最近邻居cos-lmnn算法进行度量学习,得到样本集的全局度量矩阵;

本实施例中的cos-lmnn算法是将余弦cos算法与大间隔最近邻居lmnn算法结合的算法,计算样本集的全局度量矩阵,结合的方式与现有技术的方法一样,在此不做赘述。

s104,使用预设的聚类算法,将样本集中的样本分为预设数量的局部簇;

其中,预设数量是根据行业经验设定的数量,预设的聚类算法可以是现有技术k-means聚类算法、层次聚类算法、som聚类算法、fcm聚类算法等等。预设数量可以根据不同的聚类算法做适应的调整。

可以理解的是,本实施例是将样本集中的样本分类,划分至不同的局部簇中,例如样本集中的样本有7个,分别是a、b、c、d、e、f和g,划分之后的结果是局部簇1:a和b;局部簇2:c、f、g;局部簇3:d和e。

s105,根据全局度量矩阵,使用余弦相似度算法,计算输入样本与样本集中样本的距离,组成第一距离集合;

s106,根据预设的第一k值与第一距离集合,使用k近邻算法,计算得到输入样本的第一k值个第一邻近样本;

本实施例中第一k值是根据实际经验预先设定的数值,第一k值的取值与使用k近邻算法计算输入样本的第一邻近样本的个数相同。

举例而言,样本集中包含:样本1、2、3及4,假设样本1、2及3是心脑血管疾病患者样本,则样本1、2及3之间的样本距离可以为0。如果输入样本是心脑血管疾病患者样本,第二k值设定为2,那么输入样本的第一k值个第一邻近样本是样本1和2、或者2和3、或者1和3。

s107,确定第一邻近样本所在的局部簇;

s108,在邻近样本所在的局部簇中,选择第一邻近样本的数量超过第一预设阈值的局部簇,作为目标局部簇;

s109,将输入样本划入目标局部簇;

s110,根据cos-lmnn算法学习得到的目标局部簇的局部度量矩阵,使用余弦相似度算法计算,输入样本与目标局部簇中样本的距离,组成第二距离集合;

s111,在目标局部簇中,根据预设的第二k值与第二距离集合,使用k近邻算法,确定输入样本的第二k值个第二邻近样本;

本实施例为了在目标局部簇中,确定输入样本的第二邻近样本,第二邻近样本个数与第二k值取值相同,获得的确定输入样本的第二邻近样本可以包含多个或者一个。

s112,统计第二邻近样本的第一标签个数与第二标签个数;

s113,如果第一标签个数与第二标签个数的比值超过预设标签阈值,则将第一标签作为输入样本的标签,否则将第二标签作为输入样本的标签;

s114,根据输入样本的标签,确定输入样本是否是心脑血管疾病患者的样本;

s115,如果输入样本是心脑血管疾病患者的样本,则确定输入样本中的待预测患者是心脑血管疾病患者;

s116,如果输入样本不是心脑血管疾病患者的样本,则确定输入样本中的待预测患者不是心脑血管疾病患者。

相较于,现有技术使用数据挖掘技术对于心脑血管疾病的病例数据特征进行挖掘,将所有患者的体检特征数据及回访数据组成一个训练集,使用决策树、逻辑斯蒂回归和人工神经网络算法,训练出预测模型。然后将待预测患者的体检数据作为输入样本,输入到训练出的预测模型中,输出待预测患者是否是心脑血管疾病患者。

由于决策树在训练预测模型过程中要分析所有待预测患者的体检数据,将体检数据信息量增益最大的样本数据作为第一节点,其他体检数据按照体检数据信息量增益高低依次作为分支,当数据样本只有一种类别时候停止训练,获得预测模型。由于当信息量增益最大的体检数据是非心脑血管疾病患者的体检数据时,该方法训练出来的预测模型,受体检数据信息量增益最大的样本数据的影响,决策树训练出的预测模型预测结果准确率并不高。

使用逻辑斯蒂回归算法训练预测模型过程中,需要求解损失函数的最小,确定预测模型。由于求解损失函数的最小的过程容易受不同样本数据的影响,预测模型的输出待预测患者是心脑血管疾病患者的概率,从而确定待预测患者是否是心脑血管疾病患者并不准确。

本实施例通过获取样本的获取样本集;将样本集中的样本分为预设数量的局部簇,计算得到输入样本的第一k值个第一邻近样本,从而确定目标局部簇。通过计算所述输入样本与所述目标局部簇中样本的距离,从而确定输入样本第二k值个第二邻近样本;统计第二邻近样本的第一标签个数与第二标签个数,从而确定输入样本的标签,确定输入样本是否是心脑血管疾病患者的样本;最终确定待预测患者是否是心脑血管疾病患者。本实施例不用训练预测模型,考虑到心脑血管疾病患者特征数据相似度较高,使用样本相似度距离达到确定待预测患者是否是心脑血管疾病患者的目的,避免使用决策树在训练预测模型过程中,受体检数据信息量增益最大的样本数据的影响。本实施例也不用使用逻辑斯蒂回归算法求解损失函数训练预测模型,避免求解损失函数的最小的过程容受不同样本数据的影响,导致训练出来的预测模型不准确。因此,可以提高预测待预测患者是否是心脑血管疾病患者的准确率。

可选的,本发明的一种心脑血管疾病风险预测方法实施例的中,在s115如果输入样本是心脑血管疾病患者的样本,则确定输入样本中的待预测患者是心脑血管疾病患者步骤之后,所述方法还包括:

步骤一:根据患者的健康回访数据确定待预测患者是否是高危心脑血管疾病患者;

健康回访数据中的特征数据超出正常指标,体征信息异常,症状异常,因此可以判断待预测患者为高危心脑血管疾病患者。比如,血压超标,血红蛋白超标,症状异常,比如,出现晕倒、咳嗽咯血。

步骤二:如果待预测患者是高危心脑血管疾病患者,则对待预测患者作住院治疗的建议;

根据待预测患者是高危心脑血管疾病患者,根据该患者的特征数据给该患者提供与该患者的特征数据对应的住院天数及治疗方案。

本实施例预先建立心脑血管患者治疗数据库,心脑血管患者治疗数据库包括:患者的特征数据、特征数据对应的住院天数及治疗方案。治疗方案包括:注射胰岛素的计量、频次及吃降压药的计量和频次、锻炼身体或者是否需要外科治疗等等。

例如:高危心脑血管疾病患者的血压:120-155mmhg;血糖:空腹7.8--9.0mmol/l对应的得住院天数是20天,特征数据对应的治疗方案为射胰岛素每天1u。

本实施例节省了医生诊断建议的时间,节省了医疗资源。判断该患者是高危心脑血管疾病患者,给出待预测患者作住院治疗的建议。

步骤三:如果待预测患者不是高危心脑血管疾病患者,则对待预测患者作增加体检频次的建议。

可理解的是,本实施例在如果待预测患者是心脑血管疾病患者之后,如果患者的健康回访数据记录待预测患者特征数据属于一定数量的心脑血管疾病患者特征数据的范围内,该待预测患者体征信息未异常,症状未异常,则该患者不是高危心脑血管疾病患者。可以根据特征数据的范围,给该患者建议与特征数据的范围对应的体检频次。

例如:100个心脑血管疾病患者的血压范围为:100-145mmhg,待预测患者的血压为:102-140mmhg,该患者也未出现晕倒、咳嗽咯血等危及生命的症状,该患者不是高危心脑血管疾病患者。如果该患者之前体检频次为一个月作一次体检,该患者特征数据中的血压值范围为102-140mmhg。假设与该患者特征数据对应的体检频次为一个月二次,则建议该患者一个月作二次体检。本实施例节省了医生诊断建议的时间,节省了医疗资源。

可选的,本发明的一种心脑血管疾病风险预测方法实施例的中,在s115,确定输入样本中的待预测患者不是心脑血管疾病患者的步骤之后,还包括:

步骤一:根据患者的健康回访数据确定待预测患者是否是健康用户;

其中,健康用户是待预测患者的各项特征数据都在医学各项特征数据规定的标准范围内。例如:医学规定正常血压:80-90/120-140mmhg,如果健康回访数据显示待预测患者的血压在82/125mmhg,该患者的其他特征数据都在医学各项特征数据规定的标准范围内,该患者为健康用户。

步骤二:如果待预测患者是健康用户,则对正常患者作保持正常体检频次的建议;

可理解的是,如果待预测患者是健康用户,健康用户的体检频次与该患者的数据特征对应。建议该患者保持与之前体检频次相同的体检次数。例如:该患者之前体检频次为一个月一次,建议保持一个月一次的体检频次。本实施例挑选出健康用户,给出合适的建议,节省了医生诊断建议的时间,同时为患者减少了医疗方面的支出。

步骤三:如果待预测患者不是健康用户,则将待预测患者标记为漏诊患者,将漏诊患者的特征数据加入患者医疗数据库集;

其中,漏诊患者为心脑血管疾病患者。

可以理解的是,如果待预测患者不是健康用户,根据患者的健康回访数据可以确定待预测患者是心脑血管疾病患者或者不是心脑血管疾病患者。如果待预测患者是心脑血管疾病患者,将该患者标记为漏诊患者,并将该患者的特征数据加入患者医疗数据库集,以防止同类型的待预测患者在预测是否是心脑血管疾病患者时,发生错误预测,提高预测待预测患者是否是心脑血管疾病患者的准确率。

可选的,本发明的一种心脑血管疾病风险预测方法实施例的中,第一标签标识心脑血管疾病患者样本,包括:

步骤一:根据已收集的患者的健康回访数据,确定心脑血管疾病患者的标识信息;

患者的健康回访数据包括:患者的编号、特征、特征数据及确认病症;标识信息包括:确认病症、确认病症对应的特征及特征数据;

步骤二:根据心脑血管疾病患者的标识信息,在医疗数据库集中确定心脑血管疾病患者样本;

步骤三:将心脑血管疾病患者的样本,设置第一标签。

本实施例通过患者的健康回访数据,区分出医疗数据库集中确定心脑血管疾病患者样本,并设置第一标签,为确定输入样本的标签,节省时间。

可选的,本发明的一种心脑血管疾病风险预测方法实施例的中,第二标签标识非心脑血管疾病患者样本,包括:

将除心脑血管疾病患者样本以外的其他样本,设置第二标签。

本实施例可以采用用户体检后一个月的健康回访数据。对于健康回访数据中关于心脑血管疾病样本及非心脑血管疾病样本设置标签。标签包括:字母、数字、符号等等。例如:健康回访数据包括:“脑卒中”、“高血压”、“冠心病”、“高血脂”、“高血糖”、“脑梗”及“心力衰竭”等多种心脑血管疾病描述设置标签为正样本,并新增类别“label”字段,设置标签“1”。所有非正样本的样本均作为负样本,设置标签“0”,加入医疗数据库集。

本实施例通过患者的健康回访数据,区分出医疗数据库集中确定非心脑血管疾病患者样本,并设置第二标签,为确定输入样本的标签,节省时间。

可选的,本发明的一种心脑血管疾病风险预测方法实施例中,s101获取样本集,包括:

s201,根据设置标签的患者医疗数据库集的多个样本,将样本缺失值大于第一阈值的样本作样本删除处理;

样本缺失值为:一条样本中缺失的特征的数量与该样本中特征总数量的比值;

其中,第一阈值是人为根据行业经验规定的数值,下面举例说明样本缺失值。例如,一条样本中包含的特征10个,缺失特征数据的特征有7个,那么该样本中缺失的特征数量与该样本中特征总数量的比值是假设规定的第一阈值是则将该样本作样本删除处理。

本实施例将样本缺失值大于第一阈值的样本作样本删除处理的目的是:减少患者医疗数据库集中的特征数据较少的样本,提高患者医疗数据库集中样本的质量,并且为后续处理节省时间。

s202,在删除处理后的多条样本中查找,特征缺失值大于第二阈值的特征作特征删除处理;

本实施例将特征缺失值大于第二阈值的特征作特征删除处理;目的是:减少患者医疗数据库集的样本中较少的特征数据,提高患者医疗数据库集的样本中的特征数据的质量,并且为后续处理节省时间。

特征缺失值为:多条样本的同一特征中,缺少特征数据的特征数量与同一特征总数量的比值;

其中,第二阈值是人为根据行业经验规定的数值。下面举例说明特征缺失值,例如,10个样本中有同一特征:脉搏。缺少特征数据的脉搏特征数量共有7个,脉搏特征的总数量是10,假设规定的第一阈值是则将脉搏特征作特征删除处理。

本实施例将特征缺失值大于第二阈值的特征作特征删除处理目的是:减少患者医疗数据库集的样本中较少的特征数据,提高患者医疗数据库集的样本中的特征数据的质量,并且为后续处理节省时间。

s203,在作特征删除处理后的多条样本查找缺失特征数据的特征,作为第一特征;

s204,使用多重填补法,对所述第一特征缺失的特征数据作缺失值填补;

其中,采用ibmspssstatistics23中使用多重填补法构建的模块来对缺失值进行填补,例如有2条样本血压特征数据缺失,使用多重填补法构建的模块,根据患者的特征数据:年龄:50;血脂:1、血清总胆固醇2.9~5.17mmoi/l;2、血清甘油三酯0.56~1.7mmoi/l;3、高密度脂蛋白胆固醇0.94~2.0mmoi/l;4、低密度脂蛋白胆固醇2.07~3.12i/l;血糖:空腹7.8--9.0mmol/l,将2条样本中的血压特征数据填补数值100-145mmhg,具体填补方式与现有技术填补的方式相同,在此不作赘述。

本实施例对多条样本的缺失特征数据进行缺失值填补,可以提高样本的质量,以提高获取样本集的质量。

s205,按照数据类型,对缺失值填补后的多条样本的特征数据做分类,获得分类结果;

其中,分类结果包括:离散特征数据和连续特征数据;

s206,根据分类结果,将离散特征数据和连续特征数据,作与数据类型对应的处理;

s207,将离散特征数据和连续特征数据作相对应的处理后的特征数据加入患者医疗数据库集,作为第一数据库集;

其中,将离散特征数据和连续特征数据,作与数据类型对应的处理,包括:对离散特征数据进行独热编码;对连续特征数据,使用正太标准化z-score方法进行标准化处理;

患者的特征数据的数据类型包含:离散特征数据和连续特征数据。例如血压数据、心跳数据是连续类型,年龄数据是离散类型。

举例而言,对于离散特征数据,编写适用特征数据的独热编码的代码。以对“年龄”编码为例,首先,将年龄特征,按照样本数等频分段,分为“76及以上”,“66-75”,“55-65”,“46-55”,“36-45”,“26-35”,“25以下”7个区间,若一个人的年龄为30岁,则独热编码后年龄值为0000010。其他离散特征类似年龄特征,如性别、城市、职业、家族遗传史、疾病史、饮食规律、吸烟习惯、饮酒习惯、每周运动规律等都进行独热编码转换。

可理解的是,本实施例中对连续特征数据,使用正太标准化z-score方法进行标准化处理的方法与现有技术的处理方式一样,在此不作赘述。本实施例根据不同的数据类型,将离散特征数据和连续特征数据作相对应的处理后,避免使用相同的方法处理数据造成数据结果一致,可以提高处理数据的准确性。

s208,使用欠采样及smote算法,对第一数据库集的样本,进行不均衡处理,获得第二数据库集;

本实施例中对第一数据库集的样本,进行不均衡处理是为了使得同类型的样本分布较为均匀,以得到准确的第二数据库集。

s209,使用方差分析法计算,第二数据库集中的同一特征数据的方差,删除特征数据方差值小于预设方差阈值的特征数据,获得第三数据库集;

本实施例选择删除特征数据方差值小于预设方差阈值的特征数据,可以减少样本特征数据差异较小的数据,将特征数据方差值小于预设方差阈值的特征数据删除后的第二数据库集,作为第三数据库集。可以理解的是:差异值越大,样本的差异就越大,区分心脑血管疾病样本与非心脑血管疾病的准确率越高。

s210,使用relief算法计算,删除特征数据方差值小于预设方差阈值的特征数据后的每个特征数据的权重;

s211,根据特征数据的权重与特征数据的权重对应的分数值,将分数值小于预设分数阈值的特征数据及对应的特征删除,获得第四数据库集;

本实施例预先建立权重数据库,权重数据库包括:特征数据的权重与特征数据的权重对应的分数值。根据每个特征数据的权重,在数据库中查找各个特征数据的权重对应的分数值,给各个特征数据打分。将第三数据库集中分数值未超过分数阈值的特征数据及对应的特征删除,分数阈值是根据行业经验设定的数值。

s212,根据第四数据库集,使用前向选择法,确定样本集。

可以理解的是,使用前向选择法确定样本集的过程,可以使用评价函数评价第四数据库集中各个特征对应的特征数据,确定各个特征对应的特征数据的评价函数值。

在一些实例中,对于同一特征对应的特征数据,可以将与评价函数值相同的特征对应的特征数据对应的样本,作为模型样本集,模型样本集包含多个样本,多个样本包含:至少一个相同的特征及特征对应的特征数据;然后评价各个模型样本集,最终选择评价函数值最高的模型样本集作为样本集。评价各个模型样本集可以包括:计算模型样本集中所有特征数据评价函数值的平均值,或者选择计算模型样本集中心脑血管疾病相关的特征数据的平均值,评价各个模型样本集还可以使用现有技术评价集合的方法,此处不再赘述。

下面举例说明:假设有3个特征数据分别是:血压:100-145mmhg;脉搏:60~100次/分;血糖:空腹7.8--9.0mmol/l。三个特征数据的评价函数值分别是64、78、12;选择脉搏:60~100次/分所在的样本,组成模型样本集1;选择血压:100-145mmhg所在的样本,组成模型样本集2;选择血糖:空腹7.8--9.0mmol/l所在的样本,组成模型样本集3;模型样本集1中特征数据评价函数值的平均值为50分,模型样本集2中特征数据评价函数值的平均值为45分,模型样本集3中特征数据评价函数值的平均值为65分,将模型样本集3作为样本集。

本实施例通过对患者医疗数据库集的样本及样本中的特征数据做预处理,提高了样本的质量,因此,可以提高样本集的质量。

可选的,步骤s105,根据全局度量矩阵,使用余弦相似度算法计算输入样本与样本集中样本的距离,组成第一距离集合,包括:

根据全局度量矩阵,使用余弦相似度算法公式计算所述输入样本与所述样本集中样本的距离,组成第一距离集合;

其中,所述余弦相似度算法公式为:

所述第一距离集合d1包括:{d(xi,x1),d(xi,x2),d(xi,x3),…,d(xi,xj)};

其中,i代表输入样本的标号,xi代表第i个输入样本为xi;样本集为x;全局度量矩阵为a;m=ata;j代表样本集中的样本编号;xj代表样本集中第j个的样本;i与j取正整数;d(si,xj)代表在全局度量矩阵下输入样本xi与x集中第j个样本的距离;a(xi,xj)代表经过a矩阵变换后xi,xj之间的距离。

可选的,步骤s110,根据cos-lmnn算法学习得到的目标局部簇的局部度量矩阵,使用余弦相似度算法计算,输入样本与目标局部簇中样本的距离,组成第二距离集合,包括:

使用余弦相似度算法公式计算输入样本与样本集中样本的距离;

其中,余弦相似度算法公式为:

第二距离集合d2包括:{d(xi,xs1),d(xi,xs2),…,d(xi,xsi)};

其中,i代表输入样本的标号,xi代表第i个输入样本为x;xsi代表与i同类别的样本;局部度量矩阵为as;ms=astas;i取正整数;d(xi,xsi)代表在局部度量矩阵下输入样本xi与所述目标局部簇中与i同类别的样本的距离;i取正整数;as(xi,xsi)代表经过as矩阵变换后xi,xsi之间的距离。

如图3所示,本发明实施例所提供的一种心脑血管疾病风险预测装置,包括:

集合获取模块301,用于获取样本集;

样本集根据设置完标签的患者医疗数据库集的多个样本所确定的;一条样本包括:患者的编号、特征及特征数据;所述标签包括:第一标签和第二标签;第一标签标识心脑血管疾病患者样本;第二标签标识非心脑血管疾病患者样本;

样本获取模块302,用于获取一条输入样本;

输入样本由待预测患者的医疗健康体检数据及医疗就诊数据合并构成;

矩阵计算模块303,用于使用余弦-大间隔最近邻居cos-lmnn算法进行度量学习,得到样本集的全局度量矩阵;

第一局部簇确定模块304,用于使用预设的聚类算法,将样本集中的样本分为预设数量的局部簇;

第一距离确定模块305,用于根据全局度量矩阵,使用余弦相似度算法,计算输入样本与所述样本集中样本的距离,组成第一距离集合;

第一样本确定模块306,用于根据预设的第一k值与所述第一距离集合,使用k近邻算法,计算得到输入样本的第一k值个第一邻近样本;

第二局部簇确定模块307,用于确定第一邻近样本所在的局部簇;

目标局部簇确定模块308,用于在邻近样本所在的局部簇中,选择第一邻近样本的数量超过第一预设阈值的局部簇,作为目标局部簇;

局部簇划分模块309,用于将输入样本划入所述目标局部簇;

第二距离确定模块310,用于根据cos-lmnn算法学习得到的目标局部簇的局部度量矩阵,使用余弦相似度算法计算,输入样本与目标局部簇中样本的距离,组成第二距离集合;

第二样本确定模块311,用于在目标局部簇中,根据预设的第二k值与第二距离集合,使用k近邻算法,确定输入样本的第二k值个第二邻近样本;

统计模块312,用于统计第二邻近样本的第一标签个数与第二标签个数;

标签确定模块313,用于如果第一标签个数与第二标签个数的比值超过预设标签阈值,则将第一标签作为输入样本的标签,否则将第二标签作为输入样本的标签;

患者样本确定模块314,用于根据输入样本的标签,确定输入样本是否是心脑血管疾病患者的样本;

心脑血管疾病患者确定模块315,用于如果输入样本是心脑血管疾病患者的样本,则确定输入样本中的待预测患者是心脑血管疾病患者;

非心脑血管疾病患者确定模块316,用于如果输入样本不是心脑血管疾病患者的样本,则确定输入样本中的待预测患者不是心脑血管疾病患者。

可选的,本发明实施例所提供的一种心脑血管疾病风险预测装置,还包括:

高危确定模块,用于根据患者的健康回访数据确定待预测患者是否是高危心脑血管疾病患者;

住院建议模块,用于如果待预测患者是高危心脑血管疾病患者,则对待预测患者作住院治疗的建议;

增加体检建议模块,用于如果待预测患者不是高危心脑血管疾病患者,则对待预测患者作增加体检频次的建议;

健康确定模块,用于根据患者的健康回访数据确定待预测患者是否是健康用户;

正常体检建议模块,用于如果待预测患者是健康用户,则对所述正常患者作保持正常体检频次的建议;

漏诊患者确定模块,用于如果待预测患者不是健康用户,则将所述待预测患者标记为漏诊患者,将漏诊患者的特征数据加入所述患者医疗数据库集;

其中,漏诊患者为心脑血管疾病患者。

可选的,集合获取模块301,包括:

样本删除子模块,用于根据设置标签的患者医疗数据库集的多个样本,将样本缺失值大于第一阈值的样本作样本删除处理;

所述样本缺失值为:一条样本中缺失的特征数量与该样本中特征总数量的比值;

特征删除子模块,用于在删除处理后的多条样本中查找,特征缺失值大于第二阈值的特征作特征删除处理;

所述特征缺失值为:多条样本的同一特征中,缺少特征数据的特征数量与同一特征总数量的比值;

第一特征子模块,用于在作特征删除处理后的多条样本查找缺失特征数据的特征,作为第一特征;

缺失值填充子模块,用于使用多重填补法,对所述第一特征缺失的特征数据作缺失值填补;

数据分类子模块,用于按照数据类型,对缺失值填补后的所述多条样本的特征数据做分类,获得分类结果;

其中,所述分类结果包括:离散特征数据和连续特征数据;

数据处理子模块,用于根据分类结果,将离散特征数据和连续特征数据,作与数据类型对应的处理;

集合更新子模块,用于将所述离散特征数据和连续特征数据做相对应的处理后的特征数据加入所述患者医疗数据库集,作为第一数据库集;

其中,将所述离散特征数据和连续特征数据,作与数据类型对应的处理,包括:对离散特征数据进行独热编码;对连续特征数据,使用正太标准化z-score方法进行标准化处理;

均衡处理子模块,用于使用欠采样及smote算法,对第一数据库集的样本,进行不均衡处理,获得第二数据库集;

方差删除子模块,用于使用方差分析法计算所述第二数据库集中的同一特征数据的方差,删除特征数据方差值小于预设方差阈值的特征数据,获得第三数据库集;

权重计算子模块,用于使用relief算法计算所述第三数据库集中每个特征数据的权重;

分数删除子模块,用于根据特征数据的权重与特征数据的权重对应的分数值,将第三数据库集中分数值小于预设分数阈值的特征数据及对应的特征删除,获得第四数据库集;

集合确定子模块,用于根据所述第四数据库集,使用前向选择法,确定样本集。

本实施例的一种心脑血管疾病风险预测装置还包括:

高危确定模块,用于根据患者的健康回访数据确定待预测患者是否是高危心脑血管疾病患者;

住院建议模块,用于如果待预测患者是高危心脑血管疾病患者,则对待预测患者作住院治疗的建议;

增加体检建议模块,用于如果待预测患者不是高危心脑血管疾病患者,则对待预测患者作增加体检频次的建议;

健康确定模块,用于根据患者的健康回访数据确定待预测患者是否是健康用户;

正常体检建议模块,用于如果待预测患者是健康用户,则对正常患者作保持正常体检频次的建议;

漏诊患者确定模块,用于如果待预测患者不是健康用户,则将待预测患者标记为漏诊患者,将漏诊患者的特征数据加入患者医疗数据库集;

其中,漏诊患者为心脑血管疾病患者。

可选的,第一距离确定模块具体用于:根据全局度量矩阵,使用余弦相似度算法公式计算输入样本与样本集中样本的距离,组成第一距离集合;

其中,余弦相似度算法公式为:

第一距离集合d1包括:{d(xi,x1),d(xi,x2),d(xi,x3),…,d(xi,xj)};

其中,i代表输入样本的标号,xi代表第i个输入样本为xi;样本集为x;全局度量矩阵为a;m=ata;j代表样本集中的样本编号;xj代表样本集中第j个的样本;i与j取正整数;d(xi,xj)代表在全局度量矩阵下输入样本xi与x集中第j个样本的距离;a(xi,xj)代表经过a矩阵变换后xi,xj之间的距离。

可选的,第二距离确定模块,具体用于:

根据cos-lmnn算法学习得到的所述目标局部簇的局部度量矩阵,使用余弦相似度算法公式计算所述输入样本与所述样本集中样本的距离,组成第二距离集合;

其中,余弦相似度算法公式为:

第二距离集合d2包括:{d(xi,xs1),d(xi,xs2),…,d(xi,xsi)};

其中,i代表输入样本的标号,xi代表第i个输入样本为x;xsi代表与i同类别的样本;局部度量矩阵为as;ms=astas;i取正整数;d(xi,xsi)代表在局部度量矩阵下输入样本xi与所述目标局部簇中与i同类别的样本的距离;i取正整数;as(xi,xsi)代表经过as矩阵变换后xi,xsi之间的距离。

本发明实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,

存储器403,用于存放计算机程序;

处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:

获取样本集;样本集根据设置完标签的患者医疗数据库集的多个样本所确定的;一条样本包括:患者的编号、特征及特征数据;标签包括:第一标签和第二标签;第一标签标识心脑血管疾病患者样本;第二标签标识非心脑血管疾病患者样本;

获取一条输入样本;输入样本由待预测患者的医疗健康体检数据及医疗就诊数据合并构成;

使用余弦-大间隔最近邻居cos-lmnn算法进行度量学习,得到样本集的全局度量矩阵;

使用预设的聚类算法,将样本集中的样本分为预设数量的局部簇;

根据所述全局度量矩阵,使用余弦相似度算法,计算输入样本与样本集中样本的距离,组成第一距离集合;

根据预设的第一k值与第一距离集合,使用k近邻算法,计算得到输入样本的第一k值个第一邻近样本;

确定所述第一邻近样本所在的局部簇;

在邻近样本所在的局部簇中,选择第一邻近样本的数量超过第一预设阈值的局部簇,作为目标局部簇;

将输入样本划入所述目标局部簇;

根据cos-lmnn算法学习得到的所述目标局部簇的局部度量矩阵,使用余弦相似度算法计算,输入样本与所述目标局部簇中样本的距离,组成第二距离集合;

在所述目标局部簇中,根据预设的第二k值与所述第二距离集合,使用k近邻算法,确定所述输入样本的第二k值个第二邻近样本;

统计第二邻近样本的第一标签个数与第二标签个数;

如果第一标签个数与第二标签个数的比值超过预设标签阈值,则将第一标签作为输入样本的标签,否则将第二标签作为输入样本的标签;

根据输入样本的标签,确定输入样本是否是心脑血管疾病患者的样本;

如果输入样本是心脑血管疾病患者的样本,则确定输入样本中的待预测患者是心脑血管疾病患者;

如果输入样本不是心脑血管疾病患者的样本,则确定输入样本中的待预测患者不是心脑血管疾病患者。

上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的一种心脑血管疾病风险预测方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的一种心脑血管疾病风险预测方法。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1