一种宫颈病变的临床决策系统及其方法与流程

文档序号:15494877发布日期:2018-09-21 21:27阅读:262来源:国知局

本发明涉及医疗卫生技术领域,特别涉及数据挖掘与深度学习领域,具体涉及一种宫颈病变的临床决策系统及其方法。



背景技术:

数据挖掘(datamining):是一个跨学科的计算机科学分支。它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。经常用于大规模数据或信息处理(数据采集、数据提取、数据存储、数据分析和数据统计),还有决策支持系统方面的应用(包括人工智能、机器学习和商业智能)。

数据挖掘的实际工作是对大规模数据进行自动或半自动的分析,以提取过去未知的有价值的潜在信息,例如数据的分组(通过聚类分析)、数据的异常记录(通过异常检测)和数据之间的关系(通过关联式规则挖掘)。这些潜在信息可通过对输入数据处理之后的总结来呈现,之后可以用于进一步分析,比如机器学习和预测分析。

深度学习(deeplearning):是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

深度学习的基础是机器学习中的分散表示。分散表示假定观测值是由不同因子相互作用生成。在此基础上,深度学习进一步假定这一相互作用的过程可分为多个层次,代表对观测值的多层抽象。更高层次的概念从低层次的概念学习得到。这一分层结构常常使用贪婪算法逐层构建而成,并从中选取有助于机器学习的更有效的特征。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。

深度神经网络(deepneuralnetwork):神经网络是一组大致模仿人类大脑构造设计的算法,用于识别模式,可以对原始输入数据信息进行聚类、标记和分类,发现事物间的关联。深度神经网络的数据在模式识别的多部流程中所经过的节点层数多余传统的机器学习,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂,因为每一层会整合并重组前一层的特征。用已标记数据训练后的深度神经网络即可用于处理未标记、非结构化数据,并自动提取特征,从而实现在未经人工整理成关系数据库的数据中,甚至是尚未命名的数据中识别出相似点和异常情况。

目前尚无同类技术被用于高级别宫颈上皮内瘤变及宫颈癌发病风险的智能评估。国内、外现有宫颈癌筛查方案是基于宫颈薄层液基细胞学检查(thinprepcytologytest,tct)和人乳头瘤病毒(humanpapillomavirus,hpv)检查结果人为制定筛选宫颈癌发病高风险患者的划分标准,符合标准的患者需进一步接受有创检查,并最终确诊是否已经存在宫颈高级别上皮内瘤变或者宫颈癌。存在的缺点是:1.初筛检查方案存在争议,即tct与hpv单项筛查还是二者联合,报道的不同方案的诊断价值指标存在研究间差异;2.美国认证的hpv试剂盒在我国未得到推广,国内缺乏权威认证的hpv检测试剂盒导致国内筛查手段多样、无序,为医疗纠纷埋下隐患;3.特异度较低,在我国接受宫颈癌筛查的患者中,超过50%的高危患者经过病理检查证实并无高级别宫颈病变或癌症,造成严重医疗资源浪费、阴道镜过度转诊和患者的过度医疗;4.增加并发症发生几率,给患者带来不必要的痛;5.纳入的筛查因素单一。



技术实现要素:

本发明的目的在于提供一种宫颈病变的临床决策系统及其方法,克服或减轻现有技术的至少一个上述缺陷。

为实现上述目的,本发明的技术方案为:一种宫颈病变的临床决策系统,基于数据挖掘和深度学习,该宫颈病变的临床决策系统包括:

终端采集模块,用于获取患者病例数据并上传至网络数据中心;

输入转化模块,用于提取患者病例数据转化为特征变量;

数据处理模块,用于将特征变量分别进行离散化、稀疏编码以及二值化处理;

预测模块,用于将处理过的特征变量经权重及偏置维度赋值处理、整流函数relu变换、以及softmax回归操作后输出预测结果以及对应的进一步处理建议及健康指导;

确认诊断模块,用于确认最终临床诊断结果,为预测模块提供患者是否存在宫颈病变的真实标签,并上传至数据中心模块;

数据中心模块,接收并保存患者的检查结果、全部特征变量、预测结果及专家最终确认专断结果,,并定期对预测模块进行迭代和推送更新;

显示模块,用于显示预测结果、最终临床诊断结果、患者的健康指导建议以及相关医疗服务信息。

优选地是,所述预测模块包括第一层输入层、第二层隐藏层以及第三层输出层,其中第二层隐藏层分为两分层;

第一层输入层用于接收处理过的特征变量,每个特征变量对应着第二层隐藏层中第一分层全连接的所有神经元,并初始化权重和偏置维度;

第二层隐藏层中的两分层由不同个数的神经元组成,均使用relu作为激活函数,其中第二层隐藏层中第一分层接收来自第一层输入层的数据,并设置两分层对应的权重和偏置维度,经过整流函数relu变换后输出数据到第三层输出层;

第三层输出层由softmax回归组成,该softmax回归将第二层隐藏层中第二分层数据进行变换,输出最终所有类别所占概率,获得预测结果。

优选地是,所述患者病例数据包括个人基本情况、既往专科查体结果及诊断信息、宫颈细胞学检查结果以及人乳头瘤病毒检测结果;所述患者病例数据与患者的所述特征变量间的关系为:患者病例数据包括x名患者的y项特征变量。

优选地是,所述终端采集模块、所述确认诊断模块以及所述显示模块内设于终端设备中,所述输入转化模块、所述数据处理模块、所述预测模块、所述数据中心模块内设于所述网络数据中心;其中终端设备为医疗机构远程设备或者患者app,网络数据中心中的预测模块根据所有上传的数据定期进行迭代。

优选地是,所述终端采集模块、所述输入转化模块、所述数据处理模块、所述预测模块、所述确认诊断模块以及所述显示模块均内设于医疗机构远程设备中,所述数据中心模块内设于网络数据中心;其中医疗机构远程设备中的预测模块通过向网络数据中心下载安装包更新。

优选地是,所述终端采集模块、所述输入转化模块、所述确认诊断模块以及所述显示模块均内设于宫颈病变远程临床决策装置中,所述数据处理模块、所述预测模块、所述数据中心模块内设于所述网络数据中心;其中网络数据中心中的预测模块根据所有上传的数据定期进行迭代。

一种医疗机构远程设备,所述医疗机构远程设备包括方盒状的机身、内设于机身内部的硬件系统、嵌装于机身正面上的显示屏和机身背面上的传感器、以及设置于机身边框上的多个用于传输数据的接口;其中,传感器用于采集患者检查报告结果并将其传送至硬件系统;硬件系统则包含输入转化芯片和数据收发芯片,该输入转化芯片用于接收传感器传输的数据并将其识别采集出患者的特征变量,数据收发芯片用于接收特征变量信息,并通过数据接口将其传送至网络数据中心进行信息处理和预测运算,并且接收网络数据中心反馈的信息;显示屏用于显示传感器采集的患者检查报告、输入转化芯片处理后的特征变量信息和网络数据中心推送的预测结果及反馈意见。

优选地是,所述显示屏为触摸显示屏,便于输入各项数据;所述传感器为高清摄像头,用于拍摄患者纸质检查报告;所述机身内部还设置有音响,用于音频输入各项数据;所述机身背面上安装有可折叠的四方形钢制支架,其中四方形钢制支架上部内嵌于机身背面,下部套装有两副防滑橡胶套;所述接口包括一处用于连接互联网的wan接口、一处4g手机网络插口、一处sd卡插槽、三处用于数据传输与充电的usb接口、一处用于数据传输与投影显示的hdmi接口、以及用于连接供电设备的电源插口,其中4g手机网络插口通过手机移动4g网络保证所述硬件系统与所述网络数据中心间的数据实时传输;sd卡内的电子数据通过所述硬件系统处理,并通过所述显示屏显示,同时该sd卡在无网络状况下储存患者的所述特征变量。

一种宫颈病变的临床决策方法,包括如下步骤:

步骤一,通过终端设备采集患者病例数据并上传至网络数据中心;

步骤二,通过终端设备提取患者病例数据转化为特征变量;

步骤三,网络数据中心分别对特征变量进行离散化、稀疏编码以及二值化处理;

步骤四,网络数据中心将步骤三处理过的特征变量经权重及偏置维度赋值处理、整流函数relu变换、以及softmax回归操作后输出预测结果以及对应的进一步处理建议及健康指导;

步骤五,网络数据中心将预测结果以及对应的进一步处理建议及健康指导推送回终端设备;

步骤六,通过终端设备显示临床专家对预测结果进行分析判断后给出的最终临床诊断结果并将其上传至网络数据中心;

步骤七,网络数据中心根据上传的患者全部特征变量及信息定期优化预测功能。

优选地是,所述步骤四采用监督式深度神经网络算法作为技术模型,该模型包括第一层输入层、第二层隐藏层以及第三层输出层,其中第二层隐藏层分为两分层;

第一层输入层用于接收处理过的特征变量,每个特征变量对应着第二层隐藏层中第一分层全连接的所有神经元,并初始化权重和偏置维度;

第二层隐藏层中的两分层由不同个数的神经元组成,均使用relu作为激活函数,其中第二层隐藏层中第一分层接收来自第一层输入层的数据,并设置两分层对应的权重和偏置维度,经过整流函数relu变换后输出数据到第三层输出层;

第三层输出层由softmax回归组成,该softmax回归将第二层隐藏层中第二分层数据进行变换,输出最终所有类别所占概率,获得预测结果。

本发明所提供的宫颈病变的临床决策系统及其方法有益效果在于:1)将数据挖掘与深度学习智能技术引进到医学筛查与治疗决策中;2)规避了不同宫颈癌筛查策略之间存在的争议;3)细化阴道镜下宫颈多点活检术的手术指征;4)能够较好地解决阴道镜过度转诊的实际临床问题;5)提高目前宫颈癌筛查策略的特异度和准确率;6)有助于提高患者参与宫颈癌筛查的主动性;7)实现宫颈癌筛查大数据共享和集成化网络管理;8)随着数据的不断增加,预测模型自主校正并不断提高准确率。

附图说明

图1为本发明宫颈病变的临床决策系统中的各模块间的连接示意图;

图2为本发明宫颈病变的临床决策系统中的预测模块实现校正操作的结构示意图;

图3为本发明宫颈病变的临床决策系统应用于设备中的结构示意图;

图4为本发明宫颈病变远程临床决策装置的正视图;

图5为本发明宫颈病变远程临床决策装置的后视图;

图6为本发明宫颈病变远程临床决策装置的侧视图;

图7为本发明宫颈病变远程临床决策装置的预测流程图;

图8为本发明宫颈病变的临床决策方法的流程示意图;

图9为本发明宫颈病变的临床决策方法中输入模型步骤一训练过程实例的对比曲线图。

附图标记:

1-显示屏、2-sd卡插槽、3-4g手机网络插口、4-wan接口、5-钢制支架、6-电源插口、7-power键、8-音响、9-高清摄像头、(10、11、12)-usb接口、13-hdmi接口。

具体实施方式

以下实施例用于说明本发明,但不用来限制本发明的范围。

下面结合附图对本发明的宫颈病变的临床决策系统及其方法做进一步详细说明。

如图1所示,一种宫颈病变的临床决策系统,基于数据挖掘和深度学习,该宫颈病变的临床决策系统包括:终端采集模块、输入转化模块、数据处理模块、预测模块、确认诊断模块、数据中心模块以及显示模块。

其中,终端采集模块用于获取患者病例数据,患者病例数据具体包括个人基本情况、既往专科查体结果及诊断信息、宫颈细胞学检查结果以及人乳头瘤病毒检测结果并将患者全部病例资料信息上传至网络数据中心。

输入转化模块用于提取患者病例数据转化为特征变量,患者病例数据与患者的特征变量间的关系为:患者病例数据包括x名患者的y项特征变量,所述x、y均为正整数。通过数据处理模块对特征变量分别进行离散化、稀疏编码以及二值化处理。

预测模块用于将处理过的特征变量经权重及偏置维度赋值处理、整流函数relu变换、以及softmax回归操作后输出预测结果以及对应的进一步处理建议及健康指导。其中预测模块采用监督式深度神经网络算法作为技术模型,该预测模块具体选择包含第一层输入层、含有两分层的第二层隐藏层以及第三层输出层的技术模型。其中第一层输入层用于接收处理过的特征变量,每个特征变量对应着第二层隐藏层中第一分层全连接的所有神经元,并根据特征变量数量和第二层隐藏层中第一分层的神经元个数初始化设置权重和偏置维度。第二层隐藏层中的两分层由不同个数的神经元组成,均使用relu作为激活函数,其中第二层隐藏层中的第一分层接收来自第一层输入层的数据,并设置两分层对应的权重和偏置维度,其中第二层隐藏层中第一分层权重和偏置维度根据第二层隐藏层两分层神经元个数设置,第二层隐藏层中第二分层权重和偏置维度是根据该分层神经元个数设置,经过整流函数relu变换后输出数据到第三层输出层。第三层由softmax回归组成,该softmax回归将第二层隐藏层中第二分层数据进行变换,输出最终所有类别所占概率,获得预测结果,其中概率总和为1,其中概率最大者为分类结果。从而该预测模块能够将病例数据在输入技术模型时,经过计算得出预测值(0或1)及相应信区间,即预测病变的结果及发生概率。

确认诊断模块用于确认最终临床诊断结果,具体为临床专家对预测结果进行分析判断,若判断患者需要接受进一步病理检查,则根据病理结果确认最终临床诊断结果,若判断患者无需接受进一步病理检查,则根据临床经验默认最终临床诊断结果为阴性,即患者宫颈不存在高级别宫颈上皮内瘤变和宫颈癌,为预测模块提供患者是否存在宫颈病变的真实标签,以校对预测模块的技术模型,并上传至网络数据中心,见图2所示。

数据中心模块接收并保存患者的检查结果、全部特征变量、预测结果及专家最终确认专断结果,并定期对预测模块进行迭代和推送更新,以逐渐提高预测准确率;存储基于深度学习获得的医疗信息。

显示模块输出预测结果、最终临床诊断结果、患者的健康指导建议以及附近可以就诊的医疗机构等医疗服务信息。

如图3所示,本发明宫颈病变的临床决策系统的各模块能够内设于不同终端设备中。第一实施例是将:终端采集模块、确认诊断模块以及显示模块内设于医疗机构远程设备中,输入转化模块、数据处理模块、预测模块、数据中心模块内设于网络数据中心。该医疗机构远程设备通过终端采集模块接收临床医生输入的就诊患者的检查结果。联网状态下检查结果自动上传至网络数据中心,并通过输入转化模块提取和转化为特征变量,再通过数据处理模块对特征变量进行预处理,之后运行预测模块预测风险,给出的预测结果及对应的进一步处理建议及健康指导被推送至医疗机构远程设备上,通过显示模块显示输出。临床专家对预测结果进行分析判断,通过确认诊断模块给出最终临床诊断结果,并自动上传至网络数据中心。需要说明的是,患者的检查结果、全部特征变量、预测结果以及诊断结果等信息均上传并保存至网络数据中心。网络数据中心中的数据中心模块接收全部医疗机构远程设备上传的信息并对预测模块定期进行迭代,联网的全部医疗机构远程设备共享一致的预测模块,从而通过互联网实现了医疗机构与网络数据中心间的交互传输、数据共享和网络集成化管理。

第二实施例是将:终端采集模块、输入转化模块、数据处理模块、预测模块、确认诊断模块以及显示模块内设于医疗机构远程设备中,数据中心模块内设于网络数据中心。该医疗机构远程设备通过终端采集模块接收临床医生输入的就诊患者的检查结果,并通过输入转化模块提取和转化为特征变量。特征变量通过数据处理模块进行预处理,再运行预测模块预测风险,给出的预测结果及对应的进一步处理建议及健康指导通过显示模块显示输出。临床专家对预测结果进行分析判断,通过确认诊断模块给出最终临床诊断结果,并通过显示模块显示。需要说明的是,由于是在非联网状态下,患者的检查结果、全部特征变量、预测结果及诊断结果等信息均保存至医疗机构远程设备而不上传至网络数据中心。网络数据中心通过接收其他联网的医疗机构远程设备上传的数据资料,对预测模块定期进行迭代。非联网医疗机构远程设备需自行定期访问数据中心站点,下载并安装最新版预测模块,确保全部医疗机构远程设备共享一致的预测模块,从而通过互联网实现了医疗机构与网络数据中心间的数据共享和网络集成化管理。

第三实施例是将:终端采集模块、输入转化模块、确认诊断模块以及显示模块内设于宫颈病变远程临床决策装置中,数据处理模块、预测模块、数据中心模块内设于网络数据中心。如图4至图6,该装置包括方盒状的机身、内设于机身内部的硬件系统、嵌装于机身正面上的显示屏1和机身背面上的传感器、以及设置于机身边框上的多个用于传输数据的接口。

如图7所示,传感器用于采集患者检查报告结果并将其传送至硬件系统,需要说明的是,本传感器主要采集患者检查报告结果中的薄层液基宫颈上皮细胞检查结果及人乳头瘤病毒检查结果。硬件系统则包含输入转化芯片和数据收发芯片,其中输入转化芯片用于接收传感器传输的数据并将其识别采集出患者的特征变量,主要通过文字、图像识别等方式采集,需要说明的是,采集的特征变量主要为年龄、细胞形态异常分级、病毒阳性亚型以及病毒载量,此时采集到的特征变量可通过显示屏1显示。数据收发芯片用于接收特征变量信息,并通过各种数据接口将其传输至网络数据中心进行信息处理和预测运算,该数据收发芯片也用于接收网络数据中心反馈的预测结果。显示屏1用于显示传感器采集的患者检查报告、输入转化芯片处理后的特征变量信息和网络数据中心推送的预测结果及对应的进一步诊疗意见。临床专家对预测结果进行分析判断,通过确认诊断模块给出最终临床诊断结果,并自动上传至网络数据中心。

需要说明的是,患者的检查结果、全部特征变量、预测结果以及诊断结果等信息均上传并保存至网络数据中心。网络数据中心中的数据中心模块接收全部宫颈病变远程临床决策装置上传的信息并对预测模块定期进行迭代,联网的全部宫颈病变远程临床决策装置共享一致的预测模块,从而通过互联网实现了医疗机构与网络数据中心间的交互传输、数据共享和网络集成化管理。

需要说明的是,在实施例机身背面上安装有可折叠的四方形钢制支架5,用以支撑本装置,其中四方形钢制支架5上部内嵌于机身背面,下部套装有两副防滑橡胶套,进而保证整体稳定。本实施例中的显示屏1为触摸显示屏,用于输入各项数据。本实施例中的传感器为高清摄像头9,用于拍摄患者纸质检查报告。在本实施例机身内部还设置有音响8,在无法获得纸质报告情况时,通过音频输入特征变量等各项数据。本实施例机身边框上的多个接口包括一处wan接口4、一处4g手机网络插口3、一处sd卡插槽2、三处usb接口(10、11、12)、一处hdmi接口13以及电源插口6,其中,wan接口4通过网线连接互联网。在未有能力提供网络的情况下或者针对移动式诊断,通过手机移动4g网络保证本装置中的硬件系统与网络数据中心间的数据实时传输。sd卡插槽2用于放置内存卡,sd卡内的电子数据通过本装置中的硬件系统处理,并通过显示屏1显示,当无法获得纸质报告或者音频数据时,可将数据储存在sd卡,通过此接口即可获得用户电子信息,当患者特征变量信息无法上传至网络数据中心时,通过此接口可暂时将信息保存在sd卡中。usb2.0接口用于数据传输和充电,而hdmi接口13则用于高速数据传输和投影显示。电源插口6用于连接供电设备,机身边框上的power键7则控制开机与关机。

第四实施例是将:终端采集模块、确认诊断模块以及显示模块内设于患者app中,输入转化模块、数据处理模块、预测模块与数据中心模块内设于网络数据中心。网络数据中心直接接收患者通过终端采集模块输入的个人基本情况和拍照或扫描的纸质检查报告,通过图像识别技术自动提取个人数据并通过输入转化模块及数据处理模块转化为特征变量和预处理,之后运行预测模块分析,经数据中心模块向患者app推送患者宫颈病变预测结果和进一步处理建议、健康指导以及附近可以就诊的医疗机构等医疗服务信息,并通过显示模块显示。患者将预测结果交由临床专家进行分析判断,输入最终临床诊断结果,通过显示模块输出,并上传至网络数据中心。需要说明的是,患者的检查结果、全部特征变量、预测结果及诊断结果等信息均上传并保存至网络数据中心。网络数据中心中的数据中心模块接收全部app用户上传的信息并对预测模块定期进行迭代,从而通过互联网实现了患者个人app与网络数据中心两者间的交互传输、数据共享和网络集成化管理。

需要说明的是,本发明宫颈病变的临床决策系统的三个实施例能够相互结合同时使用。

下面介绍本发明宫颈病变的临床决策方法,包括如下步骤:

步骤一,通过终端设备采集患者病例数据,患者病例数据具体包括个人基本情况、既往专科查体结果及诊断信息、宫颈细胞学检查结果以及人乳头瘤病毒检测结果并上传至网络数据中心。

步骤二,网络数据中心提取患者病例数据转化为特征变量,患者病例数据与患者的特征变量间的关系为:患者病例数据包括x名患者的y项特征变量,所述x、y为正整数。

步骤三,网络数据中心分别对特征变量进行离散化、稀疏编码以及二值化处理。

步骤四,网络数据中心将步骤三处理过的特征变量经权重及偏置维度赋值处理、整流函数relu变换、以及softmax回归操作后输出预测结果。本步骤采用监督式深度神经网络算法作为技术模型,该模型包括第一层输入层、含有两分层的第二层隐藏层以及第三层输出层。第一层输入层接收处理过的特征变量,每个特征变量对应着第二层隐藏层中第一分层全连接的所有神经元,并根据特征变量数量和第二层隐藏层中第一分层的神经元个数初始化设置权重和偏置维度。第二层隐藏层中的两分层由不同个数的神经元组成,均使用relu作为激活函数,其中第二层隐藏层中的第一分层接收来自第一层输入层的数据,并设置两分层对应的权重和偏置维度,其中第二层隐藏层中第一分层权重和偏置维度根据第二层隐藏层两分层神经元个数设置,第二层隐藏层中第二分层权重和偏置维度是根据该分层神经元个数设置,经过整流函数relu变换后输出数据到第三层输出层。第三层输出层由softmax回归组成,该softmax回归将第二层隐藏层中第二分层数据进行变换,输出最终所有类别所占概率,获得预测结果以及对应的进一步处理建议及健康指导。

步骤五,网络数据中心将预测结果以及对应的进一步处理建议及健康指导推送回终端设备;

步骤六,通过终端设备显示临床专家对预测结果进行分析判断后给出的最终临床诊断结果并将其上传至网络数据中心;

步骤七,网络数据中心根据上传的患者全部特征变量及信息定期优化预测功能。

需要说明的是,终端设备可选医疗机构远程设备或者患者app。

下面通过一具体实施例简述本发明宫颈病变的临床决策方法,见图8所示。

一、患者数据

患者前往医院门诊或体检中心,接受宫颈癌筛查检查,包括宫颈上皮薄层液基细胞学和人乳头瘤病毒检查,获得相应原始结果,如:tct-hsil,hpv-16(+),病毒载量10e6。

二、数据清理

本数据采用人工采集的16个特征数据,在输出诊断系统前对数据进行以下处理:

1、离散化

离散化是对数据进行处理的必要步骤,数据被规约和简化,对于使用者来说,离散化的数据都更易于理解,使用和解释,本发明对患者年龄数据进行六分类:[025],[2635],[3645],[4655],[5665],[65100],病毒类型:16、18、31、33、35、39、45、51、52、56、58、59、68。病毒检测中包含的第6和第11病毒亚型不包含在模型处理范畴中,tct检查结果包括:正常范围(negativeforintraepitheliallesionormalignancy,nilm);(2)不能明确意义的非典型鳞状细胞(atypicalsquamouscellsofundeterminedsignificance,asc-us);(3)非典型腺细胞(atypicalglandularcells,agc);(4)非典型鳞状细胞—不排除高度鳞状上皮内瘤变(atypicalsquamouscells–cannotexcludehsil,asc-h);(5)低级别鳞状上皮内瘤变(lowgradesquamousintraepitheliallesion,lsil);(6)高级别鳞状上皮内瘤变(highgradesquamousintraepitheliallesion,hsil);(7)鳞状细胞癌(squamouscervicalcancer,scc)和腺癌(adenocarcinoma,ac)。tct检查离散表见表1所示。

表1为tct检查离散表

2、稀疏编码

对于离散特征,可以采用稀疏编码的方式将特征表示为一个m维向量,其中m为特征的取值个数。稀疏矩阵向量中只有一个维度的值为1,其余为0,见表2和表3所示。本发明中hpv检测结果和病毒亚型进行稀疏矩阵编码,使用稀疏矩阵编码离散特征的取值扩展到了欧式空间,便于进行相似度计算。

表2为hpv检查结果编码表

表3为病毒亚型编码表

3、二值化

特征二值化的方法是将特征的取值转化为0或1。本发明中对病理结果进行二值化处理,见表4所示。

表4病理结果二值化表

三、输入模型

本发明采用监督式深度神经网络算法作为技术模型,该模型包括第一层输入层,第二层隐藏层和第三层输出层,其中第二层隐藏层分为两分层。第一层输入层包含16个神经元,第二层隐藏层的第一分层神经元包含1024个神经单元,第二分层包含32个神经元,两分层神经元之间使用全连接的前馈神经网络模型,使用relu作为激活函数。

模型第一层为输入层,该层将接受处理过的病例数据,每例数据含有16个经过预处理的特征变量,每个特征变量对应着下一层全连接的所有神经元,并初始化权重w1和偏置b1,其中w1的维度为[161024],b1的维度为[161024],接收来自输入层数据为[116]维度的特征变量。

模型第二层为隐藏层,接收来自输入层的数据,第一分层其对应的权重和偏置维度为[102432],第二分层对应的权重和维度[321],经过整流函数relu变换后输出结果到第三层输出层。

第三层输出层由softmax回归组成,softmax将隐藏层数据进行变换最终输出所有类别所占概率,并且总和为1,其中概率最大者即为分类结果。

以一个具体的训练过程实例说明该输入模型。

实验过程使用十倍交叉验证(10foldercrossvalidation)方法,随机将全部数据打乱,分成10份,其中5组用来训练,5组用来测试,最终准确率为10次试验的平均值。训练时首先将分组后的特征变量输入训练模型,经过softmax输出后,和真实结果对比,然后采用梯度下降(学习率为0.001)的方式将误差后传,不断更新权重和偏置,直至找到logloss损失函数全局最小值。为了预防过度拟合,采用cross-validation的方式记录学习分布曲线,对比traningscore和testscore,寻找最佳模型参数,见图9所示。每次训练结束后,将剩余50%数据作为测试数据输出训练所得模型,得到测试数据的准确率。该模型给予1510个病人数据得到74.1%的准确率,其中平均confusionmatrix结果如下表5所示:

表5十倍交叉验证法四格表

四、输出分类结果和置信区间

将新的病例数据输入模型时,经过计算模型得出预测值(0或1)及相应的置信区间,分别代表预测病变的结果及发生概率,例如:0[0.94771098,0.05228902],预测结果为正常或存在低度病变,概率为94.8%,存在高度病变或宫颈癌的概率为5.2%。

五、确认诊断结果

患者接受临床处理并明确诊断,此后由临床专家在模型系统中确认最终临床诊断结果,即该名患者是否存在宫颈病变的真实标签。模型获取真实标签后将信息反馈至网络数据中心,模型进行再次深度学习。新病例数量达到一定量级或经过固定时间间隔时,模型更新,从而提高逐步预测准确率。

虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1