肺癌标志物及其应用的制作方法

文档序号:14514692阅读:248来源:国知局
肺癌标志物及其应用的制作方法

本发明涉及生物检测领域,具体地,本发明涉及肺癌标志物及其应用,更具体地,本发明涉及肺癌标志物、试剂盒、试剂在制备试剂盒中的用途、诊断肺癌或者评估肺癌风险的系统。



背景技术:

肺癌是目前我国最常见的恶性肿瘤之一。我国肺癌的发病率与死亡率正逐年增高。全国肿瘤登记中心2014年发布的数据显示,2010年,我国新发肺癌病例60.59万,居恶性肿瘤首位,占恶性肿瘤新发病例的19.59%。并且多数患者发现时已是晚期,失去早期治疗的机会。肺癌主要有小细胞肺癌(smallcelllungcancer,sclc)(16.8%)和非小细胞肺癌(non-smallcelllungcancer,nsclc)(80.4%)两种类型。非小细胞肺癌主要有三类:鳞状细胞癌、肺腺癌和大细胞肺癌。其中肺腺癌是最常见的肺癌形式(30%-65%)。肺癌的病因至今尚不完全明确。

然而,现有诊断肺癌的方法存在特异性不够、准确性和敏感度不高等缺点,因此,特异性更高、准确性和敏感度更高的诊断方法是科学家们拭待解决的关键问题。



技术实现要素:

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

在本发明的第一方面,本发明提出了一组肺癌标志物。根据本发明的实施例,所述肺癌标志物包括下列细菌的至少之一:haemophilus_influenzae,corynebacterium_argentoratense,fusobacterium_sp._4_8,capnocytophaga_ochracea,staphylococcus_epidermidis,campylobacter_concisus,streptococcus_sp._i-p16,fusobacterium_nucleatum,acidovorax_sp._js42,bacteroides_salanitronis。根据本发明实施例的肺癌标志物能够有效用于评估肺癌风险或者早期肺癌诊断,并且具有高灵敏性、高特异性和重复性好的优点。

在本发明的第二方面,本发明提出了一组肺癌标志物。根据本发明的实施例,所述标志物具有seqidno:1~10所示核苷酸序列的至少之一。根据本发明实施例的肺癌标志物能够有效用于评估肺癌风险或者早期肺癌诊断,并且具有高灵敏性、高特异性和重复性好的优点。

在本发明的第三方面,本发明提出了一种试剂盒。根据本发明的实施例,包括试剂,所述试剂用于检测下列细菌的至少之一:haemophilus_influenzae,corynebacterium_argentoratense,fusobacterium_sp._4_8,capnocytophaga_ochracea,staphylococcus_epidermidis,campylobacter_concisus,streptococcus_sp._i-p16,fusobacterium_nucleatum,acidovorax_sp._js42,bacteroides_salanitronis。根据本发明实施例的试剂盒能够有效用于评估肺癌风险或者早期肺癌诊断,并且具有高灵敏性、高特异性和重复性好的优点。

在本发明的第四方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂盒用于诊断肺癌或者评估肺癌风险,所述试剂用于检测下列细菌的至少之一:haemophilus_influenzae,corynebacterium_argentoratense,fusobacterium_sp._4_8,capnocytophaga_ochracea,staphylococcus_epidermidis,campylobacter_concisus,streptococcus_sp._i-p16,fusobacterium_nucleatum,acidovorax_sp._js42,bacteroides_salanitronis。发明人发现,上述细菌可作为肺癌标志物,有效用于评估肺癌风险或者早期肺癌诊断,具有高灵敏性、高特异性和重复性好的优点。

在本发明的第五方面,本发明提出了一种诊断肺癌或者评估肺癌风险的系统。根据本发明的实施例,所述系统包括:测定装置,所述测定装置用于确定待诊断对象的样本中前面所述标志物的相对丰度;确定装置,所述确定装置用于基于所述测定装置中所得到的所述标志物相对丰度,确定所述对象的诊断结果。根据本发明实施例的系统能够有效用于评估肺癌风险或者早期肺癌诊断,并且具有高灵敏性、高特异性和重复性好的优点。

附图说明

图1是根据本发明实施例的诊断肺癌或者评估肺癌风险的系统;

图2是根据本发明实施例的利用标志物在第一群体样品中鉴别肺癌患者的结果;以及

图3是根据本发明实施例的利用标志物在第二群体样品中鉴别肺癌患者的结果。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

肺癌标志物

在本发明的一方面,本发明提出了一组肺癌标志物。根据本发明的实施例,所述肺癌标志物包括下列细菌的至少之一:haemophilus_influenzae,corynebacterium_argentoratense,fusobacterium_sp._4_8,capnocytophaga_ochracea,staphylococcus_epidermidis,campylobacter_concisus,streptococcus_sp._i-p16,fusobacterium_nucleatum,acidovorax_sp._js42,bacteroides_salanitronis。根据本发明实施例的肺癌标志物能够有效用于评估肺癌风险或者早期肺癌诊断,并且具有高灵敏性、高特异性和重复性好的优点。

在本发明的再一方面,本发明提出了一组肺癌标志物。根据本发明的实施例,所述标志物具有seqidno:1~10所示核苷酸序列的至少之一。

其中,seqidno:1表示haemophilus_influenzae的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_014922.1;

seqidno:2表示corynebacterium_argentoratense的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_022198.1;

seqidno:3表示fusobacterium_sp._4_8的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_021281.1;

seqidno:4表示capnocytophaga_ochracea的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_013162.1;

seqidno:5表示staphylococcus_epidermidis的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_002976.3;

seqidno:6表示campylobacter_concisus的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_009802.1;

seqidno:7表示streptococcus_sp._i-p16的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_022582.1;

seqidno:8表示fusobacterium_nucleatum的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_003454.1;

seqidno:9表示acidovorax_sp._js42的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_008782.1;

seqidno:10表示bacteroides_salanitronis的基因组的核苷酸序列,其获取网址为https://www.ncbi.nlm.nih.gov/nuccore/nc_015164.1。

根据本发明实施例的肺癌标志物能够有效用于评估肺癌风险或者早期肺癌诊断,并且具有高灵敏性、高特异性和重复性好的优点。

需要说明的是,根据本发明实施例的肺癌标志物是经过研究得出的,和肺癌有关联的细菌物种或细菌基因组,上述每个物种都与肺癌有关联性,因此,在不考虑判断准确性的情况下或者对此要求较低的情况下,可以单独或者组合用于肺癌检测或者患病风险评估。但是,本申请的一种优选方案中,这些标志物组可一起用于肺癌检测或者患病风险评估,这将在后面的优选技术方案中详细描述。

还需要补充说明的是,根据本发明实施例的用于肺癌检测或患病风险评估的生物标志物组合,并不是直接根据检测生物标志物组合的有或者无进行肺癌检测或患病风险评估的,而是,在检测到生物标志物组合后,通过分析其相对丰度,并将相对丰度带入多元统计模型,如随机森林模型进行判断,根据随机森林模型输出的概率判断待测对象是否患有肺癌或评估待测对象患肺癌的风险,这将在后面的技术方案中详细说明。

需要说明的是,根据本发明实施例的标志物组合中的10个物种代表的是肺部的10种微生物;根据本发明的实施例,通过对肺部的上述10种微生物的含量进行检测,并对其相对丰度与肺癌的关系进行统计分析,建立随机森林模型,以此判断待测对象是否患有肺癌或是否具有患肺癌的风险。

还需要说明的是,肺部微生物数量远不止10个种;但是,根据本发明实施例的,从随机森林模型中筛选出10种微生物,可作为肺癌检测的生物标志物,为肺癌的检测和评估提供了一条新的途径。

试剂盒

再一方面,本发明提出了一种试剂盒。根据本发明的实施例,包括试剂,所述试剂用于检测下列细菌的至少之一:haemophilus_influenzae,corynebacterium_argentoratense,fusobacterium_sp._4_8,capnocytophaga_ochracea,staphylococcus_epidermidis,campylobacter_concisus,streptococcus_sp._i-p16,fusobacterium_nucleatum,acidovorax_sp._js42,bacteroides_salanitronis。根据本发明实施例的试剂盒能够有效用于评估肺癌风险或者早期肺癌诊断,并且具有高灵敏性、高特异性和重复性好的优点。

用于检测上述细菌的试剂不受特别限制,只要能够有效检出上述细菌即可。根据本发明的具体实施例,所述试剂包括适用于全基因组测序的通用引物。在全基因组测序中,将微生物基因组dna随机打断成500bp的小片段,然后在片段两端加入所述通用引物进行pcr扩增测序,再将测序得到的序列比对到参考数据库,确定检出微生物的相对含量。

试剂在制备试剂盒中的用途

再一方面,本发明提出了试剂在制备试剂盒中的用途,所述试剂盒用于诊断肺癌或者评估肺癌风险,所述试剂用于检测下列细菌的至少之一:haemophilus_influenzae,corynebacterium_argentoratense,fusobacterium_sp._4_8,capnocytophaga_ochracea,staphylococcus_epidermidis,campylobacter_concisus,streptococcus_sp._i-p16,fusobacterium_nucleatum,acidovorax_sp._js42,bacteroides_salanitronis。发明人发现,上述细菌可作为肺癌标志物,有效用于评估肺癌风险或者早期肺癌诊断,具有高灵敏性、高特异性和重复性好的优点。

可以理解,根据本发明实施例的标志物组合本身就是针对肺癌而研究的,当然可以用于肺癌的检测或风险评估;而根据本发明实施例的标志物组合也可以整合到一些专门用于肺癌检测的试剂盒或工具中,以方便肺癌的检测和评估,只要采用了本申请的生物标志物组合,都在本申请的保护范围内。与此同时,由于本申请的生物标志物组合可以检测肺癌或者对肺癌进行患病风险评估;当然,可以对比检测用药前和用药后的肺癌患病情况或者患病风险变化,从而判断所用药物是否有效,以达到药物筛选的目的。

再一方面,本申请公开了一种通过检测生物标志物判断肺癌的方法在制备肺癌检测或患病风险评估试剂盒或工具中的应用;其中,生物标志物为本申请的肺癌标志物组合。

根据本发明的实施例,通过检测生物标志物判断肺癌的方法包括以下步骤:

1)对待测对象进行样品采集,检测所采集的样品中本申请的生物标志物组合,并分析生物标志物组合中各物种的水平;

2)将步骤1)测得的各物种的水平与参考数据集或参考值进行比较,获得检测结果;

优选地,各物种的水平为各物种的相对丰度;参考数据集或参考值为来源于肺癌患者和非肺癌对照的生物标志物组合中各物种的水平。

更优选地,步骤2)中的参考数据集或参考值为表3的一组;将各物种的水平与参考数据集或参考值进行比较获得检测结果,具体包括,利用多元统计模型计算得出患病概率,优选地,多元统计模型为随机森林模型。

本申请的再一方面公开了一种筛选治疗肺癌的候选药物的方法,包括以下步骤,

1)分别测定用药前和用药后的样品中本申请的标志物组合,并分析标志物组合中各核酸的水平;

2)根据比较用药前和用药后的样品中各物种的水平,判断候选药物;

步骤2)中,比较用药前和用药后的样品中各物种的水平,具体包括,利用多元统计模型计算得出患病概率,优选地,多元统计模型为随机森林模型。

诊断肺癌或者评估肺癌风险的系统

在本发明的再一方面,本发明提出了一种诊断肺癌或者评估肺癌风险的系统。根据本发明的实施例,参考图1,所述系统包括:测定装置100,所述测定装置100用于确定待诊断对象的样本中前面所述标志物的相对丰度;确定装置200,所述确定装置200用于基于所述测定装置中所得到的所述标志物相对丰度,确定所述对象的诊断结果。根据本发明实施例的系统能够有效用于评估肺癌风险或者早期肺癌诊断,并且具有高灵敏性、高特异性和重复性好的优点。

根据本发明的实施例,所述确定装置200包括适用于执行以下操作的模块:所述标志物相对丰度输入多元统计模型,得到患病概率;将所述患病概率与预定阈值比较,所述患病概率高于预定阈值,是所述对象患有肺癌或肺癌高风险的指示。

根据本发明的实施例,所述多元统计模型为随机森林模型。

根据本发明的实施例,所述随机森林模型是基于已知肺癌患者和非肺癌对照群体构建的。

根据本发明的实施例,所述预定阈值是0.5。

根据本发明的实施例,所述样本为肺泡灌洗液。肺泡灌洗液作为生物标志物检测样本具有取材方便、操作步骤简单和可连续体外检测的优点。

根据本发明的实施例,所述测定装置包括适于执行测序的模块。

本申请的用于肺癌检测的肺癌标志物,为肺癌的检测或风险评估提供了一条新的途径,能够用于肺癌的早期诊断,避免了依赖症状、影像学等常规检测对肺癌诊断或治疗的延误。本申请的其他主要优点包括:

(a)本申请的生物标志物用于肺癌的检测或患病风险评估,具有高灵敏性、高特异性的优点,具有重要的应用价值。

(b)肺泡灌洗液样品作为生物标志物检测样本具有取材方便、操作步骤简单和可连续体外检测等优点。

(c)本申请的标志物用于肺癌的检测或患病风险评估具有重复性好的特点。

下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

实施例

1.材料与方法

1.1样品收集

本例的样品采集由华西医院呼吸科及胸外科医生协助进行。研究对象主要是华西医院呼吸科及胸外科就诊的患者,研究对象的组织与分类为早期肺癌患者与良性病变、正常人群。根据肺泡灌洗液医学取样标准流程取标本,每例标本10-15ml进行微生物组学研究。所有符合以上标准的个体都进行详细的表型信息登记,以了解其病史、家族史、用药史及生活习惯等,并且均签署了知情同意书。

(1)各组病人的纳入排除标准

1)肺癌组

纳入标准:

年龄在18-80岁的病理确诊的肺癌患者,无其他基础疾病或者是系统免疫性疾病(无严重心、肝、肾疾患,非孕妇。无肺外结核、糖尿病、肿瘤、精神病、癫痫病史),

取样前2周内未接受过抗生素或者免疫抑制剂的治疗

排除标准:

病人基本信息丢失

未能明确诊断

存在严重心肺基础疾病或免疫系统疾病

近2周接收抗生素治疗

2)健康组:

纳入标准:

年龄在18-80岁的志愿者

胸部影像学无异常

无hiv及其他基础疾病

取样前2周没有接受抗生素或者免疫抑制剂的治疗

取样前4周内没有急性呼吸道感染的症状(发热,咳嗽等)及呼吸道相关药物用药史

排除标准:

现患有肺疾病或者有肺部疾病的既往史

肺功能不正常者

胸部影像学提示异常

近2周使用抗生素或免疫抑制剂

近4周呼吸道症状及呼吸道相关药物使用

根据以上标准,本例筛选出85例适合人群,作为第一群体。第一群体中,各有65位肺癌患者和20位非肺癌个体。

(2)样品制作与运输

1)肺泡灌洗液标准操作

直接从生理盐水瓶中取10ml生理盐水至样品杯中(neatsaline);

用无菌注射器将10ml生理盐水注入支气管镜后收集到样品杯中(scopesaline)。

注意:在收集健康组肺泡灌洗液时,所有入组对象在进行纤维支气管镜操作前需禁止吸烟12h。

2)标本运输及处理

标本在4℃条件下运输,30min内处理;离心后于-80℃条件下冻存。

1.2dna提取与ngs测序

(1)dna提取

使用qiagen离子交换柱:500g,4℃离心10min,去除细胞;然后用qiagen试剂盒提取dna。

(2)文库制备

核酸片段化:取500ng核酸于超声打断仪中进行打断至片段集中于150-200bp,打断结果用2100进行检测。

末端修复:取100ng上一步骤的打断产物进行末端修复。接头连接:每份样本使用单独的接头以区分不同的样本。pcr扩增:接头连接完成的产物需进行8-10个循环的pcr扩增以检验及获得成熟的文库。

(3)上机测序

所涉及的测序工作均在bgiseq-100平台上进行,操作流程按照bgiseq-100标准流程进行。全基因组测序样本,数据量为1gbase/份。

以上文库构建和测序等由广州华大基因进行。

1.3标准数据处理

数据预处理及质量控制:为了提高数据分析的准确性,首先进行数据的预处理,包括:去除序列短于35bp的序列以及低质量的序列(n碱基个数>=10或n碱基占比>=10%)。

去除数据中人的序列:由于样本中含有大量的人的dna序列,为了减少比对造成的错误比对以及对后续分析造成不必要的影响,首先将数据使用burrows-wheeleralignment(bwa)软件比对到人类参考基因组(hg19),去除人的序列。

与细菌数据库(1494种细菌微生物,即1494个细菌物种)比对:通过使用burrows-wheeleralignment(bwa)软件比对到细菌数据库进行比对,得到比对结果,进一步得到每种标志物的比对数量,计算每个样本中每一个物种的相对丰度,其中某一物种的相对丰度为某个样本中该物种的丰度与该样本中所有物种丰度之和的比值。

1.4随机森林分类器

为了建立一个能够鉴别异常状态样品的模型,利用r软件(3.3.2rc)中randomforest工具包对每个样品的物种的相对丰度与肺癌状态进行拟合,采用默认参数;其中,每个样品的物种是至少存在于10%的样品中的物种,也就是说,剔除在各个部位的所有待测样品中只在有不到10%的样品中才能检出的物种。之后进行5次10折交叉验证,将5次10折交叉验证的误差曲线进行平均,将平均后曲线的最低误差加上该点的标准误差作为可接受误差的域值。在分类误差小于域值的各组物种中,其中,物种数目最少的为最优物种组合,作为鉴别肺癌的生物标志物组合。

1.5生物标志物验证

为了验证本例得到的生物标志物,本例另外采用了独立的受试群体,即第二群体进行验证。第二群体中,各有27位肺癌患者和10位非肺癌个体。

2.实验结果

2.1与疾病相关的微生物

为了得到用来鉴别肺癌的细菌物种生物标志物,本例建立随机森林模型,具体步骤为:(1)以物种相对丰度作为输入特征,设计基于第一群体的随机森林模型;(2)对于随机森林模型,设计10折交叉验证算法,把第一群体分为肺癌个体与非肺癌个体两类,并分别得到随机森林模型的roc曲线,以各roc曲线下面积auc值作为评价指标。

本例利用随机森林模型,并结合10折交叉验证,得到了各个部位最优的生物标志物,如表1所示,用于鉴别肺癌。表2为标志物在样品中的富集信息,表3为标志物在第一群体样品的相对丰度信息。本例中,生物标志物鉴别肺癌患者的结果,如图2所示。

表1:生物标志物

根据表1,在进行样品检测时,要计算各物种的相对丰度,将相对丰度输入随机森林模型,得到结果,判断是否为肺癌。

表2:标志物各物种丰度信息

表2中,肺癌组是指第一群体的65个采集对象中患有肺癌的样品,对照组是指第一群体的20个采集对象中没有患肺癌的样品。

表3:标志物各物种在第一群体中的相对丰度信息

图2为标志物鉴别肺癌,图中,a图为随着物种数量的增加,对随机森林鉴别肺癌进行5次10折交叉验证的错误率分布情况,该模型用样品中物种的相对丰度进行训练,总计采用了65位肺癌个体和20位非肺癌个体的肺泡灌洗液样品,黑色线代表5次试验的平均值,灰色线则分别代表5次试验,黑色竖线代表最佳组合中物种数目;b图为经过交叉验证过的组合的接收者操作曲线,曲线下面积auc为0.8623,阴影面积代表95%置信区间,对角线代表auc为0.5的曲线。

由图2的结果可以看出,细菌物种的生物标志物组能够鉴别肺癌个体和非肺癌个体;roc的曲线下面积auc值为0.8623。其中,auc是曲线下面积,该值越大,即越接近1,表示判断能力越强,即判断越准确。

2.2生物标志物验证

将随机森林得到的物种生物标志物在第二群体样品中进行验证,结果如表4所示。表4中,标志物预测个体患有肺癌的概率,由此得到的roc曲线为图3。表4中,概率>0.5认为通过该部位的标志物判断个体具有患肺癌的风险或者患有肺癌。

表4:标志物预测第二群体样品患有肺癌的概率

图3的结果显示标志物判断肺癌概率,其auc值为0.8537;可见,这个标志物具有较高的鉴别能力,能够用于肺癌的检测,该结果与表4的结果相符。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1