一种BCLC分期模型建立方法及终端与流程

文档序号:15352603发布日期:2018-09-04 23:31阅读:225来源:国知局

本发明涉及数据处理技术领域,尤其涉及一种bclc分期模型建立方法及终端。



背景技术:

随着大数据技术的进步、成熟,现已可将临床记录、医学影像、检验信息等不同形式的数据,迅速而有效地挖掘并有机整合,并进行及时的计算和分析。

bclc分期(巴塞罗那分期,barcelonacliniclivercancer)是临床上用于分析hcc(肝细胞肝癌,hepatocellularcarcinoma)的肿瘤情况、制定诊疗方案及评估预后的重要依据。自1999年jm.llovet等首次提出后,bclc分期历经2005年、2010年、2016年等数次版本更新。2005年分期去除了okuda分期影响,将孤立病灶直径在2cm以下定义为0期(极早期),早期治疗方案加入rfa,tace成为b期首选治疗,c期建议参加药物ii期研究或随机对照研究。2010年提出索拉菲尼成为c期的治疗方。2016年提出0期病人是潜在肝移植受者概念,明确将直径2cm也定义为0期,分期治疗方面取消所谓根治性及非根治性疗法的说法,进而提出0期、a期、b期、c期均应采取具有生存获益的有效治疗。

临床研究在挖掘历史数据时,需对既往病例进行分期的人工校正,不仅费时费力,且不可避免地会发生主观性错误,从而导致临床研究的数据集存在由于人的主观因素引发的错误。另外,非肝脏专科医生、尤其基层医生对相关专科知识的认识不足和相对滞后也可能导致其错判肿瘤分期,从而导致对病人实施错误的治疗方案。因此,实现hcc的自动化bclc分期具有积极的临床实用价值。



技术实现要素:

有鉴于此,本发明的目的在于提供一种bclc分期模型建立方法及终端,以解决如何实现hcc的自动化bclc分期的问题。

为了实现上述目的,本发明采用的技术方案为:

本发明提供一种bclc分期模型建立方法,包括以下步骤:

s1:获取hcc病人的临床资料;

s2:根据所述hcc病人的临床资料,创建数据库;

s3:从所述数据库中获取第一数量的病人的临床资料,得到第一数据集;所述临床资料包括病人的生理参数及诊断报告;

s4:根据第一数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的child-pugh分级结果;

s5:根据第一数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况;

s6:根据每一个病人的child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过预设的bclc分期判定标准,进行分期后得到相应的bclc分期结果;

s7:根据每一个病人的bclc分期结果、child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过xgboots算法,构建得到目标模型。

本发明还提供一种bclc分期模型建立终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

s1:获取hcc病人的临床资料;

s2:根据所述hcc病人的临床资料,构建数据库;

s3:从所述数据库中获取第一数量的病人的临床资料,得到第一数据集;所述临床资料包括病人的生理参数及诊断报告;

s4:根据第一数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的child-pugh分级结果;

s5:根据第一数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况;

s6:根据每一个病人的child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过预设的bclc分期判定标准,进行分期得到相应的bclc分期结果;

s7:根据每一个病人的bclc分期结果、child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过xgboots算法,构建得到目标模型。

本发明的有益效果在于:本发明提供了一种bclc分期模型建立方法及终端,根据hcc病人的临床资料,创建数据库,并从数据库中获取第一数量病人的临床资料,得到第一数据集,根据第一数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的child-pugh分级结果;以及根据第一数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,从而通过预设的bclc分期判定标准,得到相应的bclc分期结果,并根据每一个病人的bclc分期结果、child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过xgboots算法,构建得到目标模型。本发明基本肝癌大数据集的基础上,采用自动化bclc分期模型替代人工的bclc分期方法,从而消除人为主观错误而造成难以避免的问题,并且提高了数据提取的精确性,从而保证目标模型稳定可靠。

附图说明

图1所示为本发明提供的一种bclc分期模型建立方法的流程图;

图2所示为本发明提供的一种bclc分期模型建立终端的结构示意图;

附图标号说明:

1、处理器;2、存储器。

具体实施方式

下面结合附图和具体实施例对本发明做进一步的说明如下:

如图1所示,本发明提供了一种bclc分期模型建立方法,包括以下步骤:

s1:获取hcc病人的临床资料;

s2:根据所述hcc病人的临床资料,创建数据库;

s3:从所述数据库中获取第一数量的病人的临床资料,得到第一数据集;所述临床资料包括病人的生理参数及诊断报告;

s4:根据第一数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的child-pugh分级结果;

s5:根据第一数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况;

s6:根据每一个病人的child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过预设的bclc分期判定标准,进行分期后得到相应的bclc分期结果;

s7:根据每一个病人的bclc分期结果、child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过xgboots算法,构建得到目标模型。

从上述描述可知,本发明提供了一种bclc分期模型建立方法,根据hcc病人的临床资料,创建数据库,并从数据库中获取第一数量病人的临床资料,得到第一数据集,根据第一数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的child-pugh分级结果;以及根据第一数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,从而通过预设的bclc分期判定标准,得到相应的bclc分期结果,并根据每一个病人的bclc分期结果、child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过xgboots算法,构建得到目标模型。本发明基本肝癌大数据集的基础上,采用自动化bclc分期模型替代人工的bclc分期方法,从而消除人为主观判断错误而造成肝癌分期判断错误,对病人造成难以挽救的问题;本发明提高了数据提取的精确性,从而保证目标模型稳定可靠。

进一步的,所述s7之后还包括:

从所述数据库中获取第二数量的病人的临床资料,得到第二数据集;

根据第二数据集,对所述目标模型的各个参数进行校正。

从上述描述可知,通过上述方法,能够对目标模型中的各个参数进行校正,可提高bclc分期判断的准确性。

进一步的,所述根据第二数据集,对所述目标模型的各个参数进行校正具体为:

根据第二数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的第一child-pugh分级结果;

根据第二数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况;

根据每一个病人的第一child-pugh分级结果及对应的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况,通过所述bclc分期判定标准,进行分期得到相应的第一bclc分期结果;

根据每一个病人的第一bclc分期结果、第一child-pugh分级结果及对应的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况,通过xgboots算法,对所述目标模型的各个参数进行校正,得到校正后的第一目标模型。

从上述描述可知,通过上述方法,实现了bclc分期的目标模型的校正,其中所述第二数据集的数据与第一数据集的数据并不重复,可提高数据校正的精确性。

进一步的,所述s5具体为:

将所述第一数据集中每一个病人的诊断报告,转换为文本信息,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况。

其中,所述诊断报告为ct/mr/彩超/胃镜对应诊断报告。

从上述描述可知,通过上述方法,可快速提取诊断报告的关键信息,从而得到病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况;上述步骤可自动完成,无需人工参与,提高了数据处理的速率,并保证数据处理的精确性。

进一步的,所述s7之后还包括:

从所述数据库中获取第三数量的病人的临床资料,得到第三数据集;

根据第三数据集,对所述目标模型进行验证。

从上述描述可知,通过上述方法,能够对目标模型进行验证,以确保在实际医学应用中通过目标模型自动化进行bclc分期,且分期结果稳定可靠。

如图2所示,本发明提供了一种bclc分期模型建立终端,包括存储器2、处理器1及存储在存储器2上并可在处理器1上运行的计算机程序,所述处理器1执行所述计算机程序时实现以下步骤:

s1:获取hcc病人的临床资料;

s2:根据所述hcc病人的临床资料,构建数据库;

s3:从所述数据库中获取第一数量的病人的临床资料,得到第一数据集;所述临床资料包括病人的生理参数及诊断报告;

s4:根据第一数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的child-pugh分级结果;

s5:根据第一数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况;

s6:根据每一个病人的child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过预设的bclc分期判定标准,进行分期得到相应的bclc分期结果;

s7:根据每一个病人的bclc分期结果、child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过xgboots算法,构建得到目标模型。

进一步的,所述的一种bclc分期模型建立终端,所述s7之后还包括:

从所述数据库中获取第二数量的病人的临床资料,得到第二数据集;

根据第二数据集,对所述目标模型的各个参数进行校正。

进一步的,所述的一种bclc分期模型建立终端,所述根据第二数据集,对所述目标模型的各个参数进行校正具体为:

根据第二数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的第一child-pugh分级结果;

根据第二数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况;

根据每一个病人的第一child-pugh分级结果及对应的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况,通过所述bclc分期判定标准,进行分期得到相应的第一bclc分期结果;

根据每一个病人的第一bclc分期结果、第一child-pugh分级结果及对应的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况,通过xgboots算法,对所述目标模型的各个参数进行校正,得到校正后的第一目标模型。

进一步的,所述的一种bclc分期模型建立终端,所述s5具体为:

将所述第一数据集中每一个病人的诊断报告,转换为文本信息,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况。

进一步的,所述的一种bclc分期模型建立终端,所述s7之后还包括:

从所述数据库中获取第三数量的病人的临床资料,得到第三数据集;

根据第三数据集,对所述目标模型进行验证。

优选实施例一:

本实施例提供一种bclc分期模型建立方法,包括以下步骤:

s1:获取hcc病人的临床资料;

其中,所述s1具体为:

收集福建医科大学孟超肝胆医院2015年4月至2017年6月收治的1076例hcc病人的临床资料;

s2:根据所述hcc病人的临床资料,创建数据库;

其中数据库中的病人的临床资料纳入标准和排除标准为:

纳入标准:1、入院后完善影像学、乙肝两对半、afp等检查,临床诊断为hcc;2、行手术或穿刺活检者病理确诊为hcc;3、临床资料准确完整;

排除标准:1、手术或穿刺病理诊断其他类型肝癌或转移瘤等;2、临床资料不完整;

s3:从所述数据库中获取第一数量的病人的临床资料,得到第一数据集;所述临床资料包括病人的生理参数及诊断报告;

优先的,所述第一数量为826例;

s4:根据第一数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的child-pugh分级结果;

其中,所述生理参数包括肝性脑病、腹水、总胆红素、白蛋白、凝血酶原时间;按照以下原理进行child-pugh分级:

将肝性脑病按照无、1-2级、3-4级进行分类打分,无肝性脑病为1分,1-2级肝性脑病为2分,3-4级肝性脑病为3分;将腹水按照无、轻度、中重度进行分类,无腹水为1分,轻度腹水为2分,中重度为3分;总胆红素小于等于34umol/l为1分,总胆红素大于34umol/l小于51umol/l为2分,大于等于51umol/l为3分;白蛋白大于等于35g/l为1分,白蛋白小于35g/l大于28为2分,小于等于28为3分;凝血酶原时间延长小于等于4秒为1分,凝血酶原时间延长大于4秒小于6秒为2分,凝血酶原时间延长大于等于6秒为3分;将以上五个维度的分数相加,即为child-pugh分级标准;5-6分为child-pugh分级标准a级;7-9分为child-pugh分级标准b级;>=10分为child-pugh分级标准c级;

s5:根据第一数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况;

其中,所述s5具体为:

将所述第一数据集中每一个病人的诊断报告,转换为文本信息,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况;

其中,所述诊断报告为ct/mr/彩超/胃镜对应诊断报告;

在建模过程中门静脉癌栓情况为有门静脉癌栓或无门静脉癌栓,目标模型建立可用1代替有门静脉癌栓,0代替无门静脉癌栓;肝外转移情况分别有肝外转移和无肝外转移,同理,可用1代替有肝外转移,0代替无肝外转移;

s6:根据每一个病人的child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过预设的bclc分期判定标准,进行分期后得到相应的bclc分期结果;

其中,所述bclc分期判定标准为:

child-pugh评分为c级,无论任何数量的肿瘤和任何肿瘤的大小,其bclc分期结果都为d期,即只要child-pugh评分为c级,其bclc分期结果为d期;

有门静脉癌栓或者有肝外转移(淋巴结或肺部转移),则为bclc分期结果为c期;

child-pugh评分为a/b级,且肿瘤数量大于1,则为bclc分期结果为b期;

child-pugh评分为a/b级,肿瘤数量等于1,且肿瘤直径大于2厘米或者有门静脉癌栓,则为bclc分期结果为a期;

child-pugh评分为a/b级,肿瘤数量等于1,肿瘤直径小于2厘米且无门静脉癌栓,则为bclc分期结果为0期;

上述的bclc分期判定标准还可以为:

child-pugh评分为c级或者行为状态ps评分为3-4级时,无论任何数量的肿瘤和任何肿瘤的大小,其bclc分期结果都为d期,即只要child-pugh评分为c级,其bclc分期结果为d期;

行为状态ps评分为1-2级或者有门静脉癌栓或者有肝外转移(淋巴结或肺部转移),则为bclc分期结果为c期;

行为状态为0级且child-pugh评分为a/b级,且肿瘤数量大于1,则为bclc分期结果为b期;

行为状态为0级且child-pugh评分为a/b级,肿瘤数量等于1,且肿瘤直径大于2厘米或者有门静脉癌栓,则为bclc分期结果为a期;

行为状态为0级且child-pugh评分为a/b级,肿瘤数量等于1,肿瘤直径小于2厘米且无门静脉癌栓,则为bclc分期结果为0期;

其中上述的行为状态评级为从护理库中直接导入,护理库中每一个病人的状态评级为医生或护师对其进行评判的结果;

s7:根据每一个病人的bclc分期结果、child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过xgboots算法,构建得到目标模型;

其中,在通过xgboots算法构建得到目标模型过程中,门静脉癌栓情况为有门静脉癌栓或无门静脉癌栓,目标模型建立可用1代替有门静脉癌栓,0代替无门静脉癌栓;肝外转移情况分别有肝外转移和无肝外转移,同理,可用1代替有肝外转移,0代替无肝外转移;

s8:从所述数据库中获取第二数量的病人的临床资料,得到第二数据集;根据第二数据集,对所述目标模型的各个参数进行校正;

其中,所述根据第二数据集,对所述目标模型的各个参数进行校正具体为:

根据第二数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的第一child-pugh分级结果;

根据第二数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况;

根据每一个病人的第一child-pugh分级结果及对应的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况,通过所述bclc分期判定标准,进行分期得到相应的第一bclc分期结果;

根据每一个病人的第一bclc分期结果、第一child-pugh分级结果及对应的第一肿瘤个数、第一肿瘤直径、第一门静脉癌栓情况和第一肝外转移情况,通过xgboots算法,对所述目标模型的各个参数进行校正,得到校正后的第一目标模型;

优先的,第二数量为100例;

s9:从所述数据库中获取第三数量的病人的临床资料,得到第三数据集;根据第三数据集,对所述第一目标模型进行验证;

优先的,第三数量为150例;

在验证过程中,若验证结果的可靠性在95%以上,则认为该模型是可靠的,即95%以上的病人数据通过第一目标模型,其得到的结果与实际的bclc分期结果是一致的,则认为第一目标模型是可靠的;在实际应用中,为了进一步提高第一目标模型的可靠性,将第一目标模型对应的函数,通过泰勒二阶展开和巧妙的定义了正则项,然后用求解到的数值作为决策树的预测值,可进一步提高第一目标模型的可靠性。

优选实施例二:

本实施例提供一种bclc分期模型建立终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现优先实施例一中s1至s9的步骤。

综上所述,本发明提供了一种bclc分期模型建立方法及终端,根据hcc病人的临床资料,创建数据库,并从数据库中获取第一数量病人的临床资料,得到第一数据集,根据第一数据集中每一个病人的生理参数,进行child-pugh分级,得到每一病人对应的child-pugh分级结果;以及根据第一数据集中每一个病人的诊断报告,通过关键词的特征提取方法,得到该病人的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,从而通过预设的bclc分期判定标准,得到相应的bclc分期结果,并根据每一个病人的bclc分期结果、child-pugh分级结果及对应的肿瘤个数、肿瘤直径、门静脉癌栓情况和肝外转移情况,通过xgboots算法,构建得到目标模型。本发明基本肝癌大数据集的基础上,采用自动化bclc分期模型替代人工的bclc分期方法,从而消除人为主观错误而造成难以避免的问题,并且提高了数据提取的精确性,从而保证目标模型稳定可靠。

本发明已由上述相关实施例和附图加以描述,然而上述实施例仅为实施本发明的范例。必须指出的是,已揭露的实施例并未限制本发明的范围。相反地,包括于权利要求的精神及范围的修改及均等设置均包括于本发明的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1