用于鉴定结肠细胞增殖性病症的RNA标志物和方法与流程

文档序号:33507322发布日期:2023-03-18 03:55阅读:463来源:国知局
用于鉴定结肠细胞增殖性病症的rna标志物和方法相关申请的交叉引用1.本技术要求2020年4月29日提交的美国临时专利申请号63/017,552和2020年5月14日提交的美国临时专利申请号63/024,875的权益,其中每个申请均通过引用整体并入本文。
背景技术
::2.癌症筛查和早期检测被认为是对抗癌症最有效的策略,因为在症状出现之前的早期阶段检测到恶性肿瘤或前期病变是治疗最有效的时候。例如,在结直肠癌中,结肠镜检查在改善早期诊断方面起作用。虽然结肠镜检查对早期检测有用,但患者的依从率很低,而且由于程序的侵入性,筛查的进行低于推荐的规律性。因此,非侵入性方法为早期癌症检测提供了更有前景的手段。技术实现要素:3.本公开提供了涉及与结肠细胞增殖性病症(例如,结直肠癌)检测和疾病进展相关的基因的微小核糖核酸(微小rna或mirna)谱分析的方法和系统。本公开的一些实施方案提供了与未患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的低风险的对象的相应样品相比在患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的高风险的对象的样品中差异丰富的mirna。在一些实施方案中,具有发展结肠细胞增殖性病症的高风险的对象和具有发展结肠细胞增殖性病症的低风险的对象中的每个在结直肠黏膜内均有非侵入性前期病变(下文中称为结直肠病变)。在患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的高风险的对象的样品中以不同丰度(通常称为“差异性表达”)存在的mirna可以用作诊断、治疗和/或预防结肠细胞增殖性病症的生物标志物。4.本文鉴定的mirna可以用于鉴定患有结肠细胞增殖性病症的对象,以将其与未患有结肠细胞增殖性病症的对象区分开;或鉴定具有发展结肠细胞增殖性病症的较高风险的对象,以将其与具有发展结肠细胞增殖性病症的较低风险的对象区分开;或鉴定有结肠细胞增殖性病症前兆(诸如导管内乳头状黏液性肿瘤(ipmn))与非ipmn的对象;或鉴定患有恶性ipmn与良性ipmn的对象。因此,这些mirna可以用作辅助工具,以指导有关结肠细胞增殖性病症的监测、治疗和管理的决策。5.本公开的一些实施方案提供了一种针对本文所述的mirna进行训练的机器学习模型分类器,所述mirna在患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的高风险(例如,当对象具有结直肠病变时)的对象的样品中差异性表达。在一个实例中,提供了一种用于基于血液的微创性mirna测定的方法,其可以用于评估具有结直肠病变的对象的组织学严重程度。在另一个实施方案中,在来自对象的无细胞样品,例如来自对象的体液样品诸如全血、血浆或血清中检测指示结肠细胞增殖性病症的mirna。因此,本公开提供了可以用于区分结肠细胞增殖性病症的存在或不存在、需要治疗(诸如手术切除、免疫疗法、放疗或化疗)的高风险或低风险结直肠病变和可以监测的低风险结直肠病变的mirna。可以例如通过结肠镜检查、超声、mm或ct扫描来监测和确认结肠细胞增殖性病症或病变的存在。6.一方面,本公开提供了一种为结肠细胞增殖性病症所特有的微小核糖核酸(mirna)特征小组,其包含:选自表1-11中列出的组的一个或多个、两个或更多个、三个或更多个、或四个或更多个mirna的预先确定的集,其中所述四个或更多个mirna在患有结肠细胞增殖性病症或其亚型的对象的生物样品与未患有结肠细胞增殖性病症或其亚型的对象的生物样品之间差异性表达。7.在一些实施方案中,mirna特征小组是晚期腺瘤所特有的,并且所述特征小组包含:预先确定的mirna集,其包含:a)hsa-mir-1273a、hsa-mir-17-5p、hsa-mir-20a-3p、hsa-mir-20b-5p;b)hsa-mir-3065-5p、hsa-mir-4785、hsa-mir-5096、hsa-mir-5189-5p,或c)hsa-mir-545-3p、hsa-mir-570-3p、hsa-mir-624-3p、hsa-mir-1181、hsa-mir-6073,其中所述mirna在患有晚期腺瘤或其亚型的对象的生物样品与未患有晚期腺瘤或其亚型的对象的生物样品之间差异性表达。8.在一些实施方案中,mirna特征小组是结直肠癌所特有的,并且所述特征小组包含:预先确定的mirna集,其包含:a)hsa-mir-1250-5p、hsa-mir-1255a、hsa-mir-223-3p、hsa-mir-338-3p、hsa-mir-338-5p;b)hsa-mir-424-5p、hsa-mir-424-3p、hsa-mir-450a-5p、hsa-mir-450b-5p、hsa-mir-4772-3p;c)hsa-mir-4772-5p、hsa-mir-625-5p、hsa-mir-7847-3p、hsa-mir-1181、hsa-mir-3651、hsa-mir-6073;d)hsa-mir-6125、hsa-mir-7704、hsa-mir-19b-3p、hsa-mir-19a-3p、hsa-mir-3157-5p;e)hsa-mir-142-3p、hsa-mir-30c-5p、hsa-mir-6741-5p、hsa-mir-590-3p、hsa-mir-4685-5p;f)hsa-mir-3648、hsa-mir-331-3p、hsa-mir-1303、hsa-mir-6790-3p、hsa-mir-6867-5p、hsa-mir-942-5p;g)hsa-mir-378a-3p、hsa-mir-1287-5p、hsa-mir-4785、hsa-mir-324-3p、hsa-mir-550b-2-5p;h)hsa-mir-200c-3p、hsa-mir-200b-3p、hsa-mir-3679-5p、hsa-mir-550a-3-5p、hsa-mir-3187-3p;i)hsa-mir-181b-5p、hsa-mir-3138、hsa-mir-146a-5p、hsa-mir-6721-5p、hsa-mir-23b-3p、hsa-mir-28-5p;j)hsa-mir-320d、hsa-mir-940、hsa-mir-320d-1、hsa-mir-10a-5p、hsa-mir-340-5p;k)hsa-mir-320b、hsa-mir-335-5p、hsa-mir-320c、hsa-mir-501-3p、hsa-mir-548n;或l)hsa-mir-27a-3p、hsa-mir-3065-3p、hsa-mir-548aa@、hsa-mir-584-3p、hsa-mir-22-3p,其中所述mirna在患有结直肠癌或其亚型的对象的生物样品与未患有结直肠癌或其亚型的对象的生物样品之间差异性表达。9.在一些实施方案中,预先确定的mirna集包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、或至少250个选自表1-11中列出的组的mirna。10.在一些实施方案中,生物样品选自:体液、粪便、结肠排出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞及其组合。11.在一些实施方案中,生物样品包括核酸、dna、rna或无细胞核酸(cfdna或cfrna)。12.在一些实施方案中,mirna包括成熟mirna和mirna发夹。13.在一些实施方案中,特征小组包含在1个或多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、11个或更多个、或12个或更多个选自表1-11中列出的组的mirna中的差异表达。14.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌(colorectalcancer)、结肠癌、直肠癌、结直肠癌(colorectalcarcinoma)、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。15.在一些实施方案中,结肠细胞增殖性病症选自1期结直肠癌、2期结直肠癌、3期结直肠癌和4期结直肠癌。16.在另一方面,本公开提供了一种能够区分健康对象(例如,未患有结肠细胞增殖性病症的对象)群体与患有结肠细胞增殖性病症的对象群体的分类器,所述分类器包括:a)测量值集,其代表在6个或更多个、或12个或更多个选自表1-11中列出的组的预先选择的mirna中的差异mirna表达,其中所述测量值获自健康对象和患有结肠细胞增殖性病症的对象的mirna表达数据,b)其中所述测量值用于生成与差异mirna表达的特性相对应的特征集,并且其中使用机器学习模型(例如,统计模型)对所述特征集进行计算机处理,c)其中所述机器模型提供用作分类器的特征向量,所述分类器能够区分健康对象群体与患有结肠细胞增殖性病症的对象群体。17.在一些实施方案中,预先选择的mirna包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、或至少250个选自表1-11中列出的组的mirna。18.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。19.在一些实施方案中,所述测量值集描述了选自以下的差异mirna表达的特点:观察到的具有不同计数的片段的计数或比率、原始mirna丰度、归一化到管家基因的mirna丰度、归一化到合成序列的mirna丰度、log归一化的mirna丰度、片段长度、片段中点、读取映射位置和沿成熟mirna或mirna发夹的读取堆、以及mirna簇的丰度。20.在一些实施方案中,机器学习模型使用从以下中获得的训练数据来训练:训练生物样品、被鉴定为对应于患有结肠细胞增殖性病症的对象的所述训练生物样品的第一子集和被鉴定为对应于未患有结肠细胞增殖性病症的对象的所述训练生物样品的第二子集。21.在一些实施方案中,所述分类器提供在用于检测结肠细胞增殖性病症的系统中,所述系统包括:a)包括分类器的计算机可读介质,所述分类器可操作以基于mirna特征小组来对所述对象进行分类;和b)一个或多个处理器,用于执行存储在计算机可读介质上的指令。22.在一些实施方案中,所述系统包括分类回路,所述分类回路被配置为选自以下的机器学习分类器:深度学习分类器、神经网络分类器、线性判别分析(lda)分类器、二次判别分析(qda)分类器、支持向量机(svm)分类器、随机森林(rf)分类器、线性核支持向量机分类器、一阶或二阶多项式核支持向量机分类器、岭回归分类器、弹性网算法分类器、序列最小优化算法分类器、朴素贝叶斯算法分类器和主成分分析分类器。23.在另一方面,本公开提供了一种用于确定来自对象的生物样品的微小核糖核酸(mirna)谱的方法,所述方法包括:a)从生物样品中分离rna分子;b)在rna分子逆转录为互补脱氧核糖核酸(cdna)分子之前或之后,将rna衔接子连接到rna分子上;c)扩增cdna分子;d)确定cdna分子的核酸序列;e)将所述核酸序列与选自表1-11中列出的组的mirna小组的参考核酸序列相比对(align);以及f)至少部分基于所比对的核酸序列确定对象的mirna谱。24.在一些实施方案中,预先选择的mirna包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、或至少250个选自表1-11中列出的组的mirna。25.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。26.在一些实施方案中,所述方法还包括富集或耗尽rna分子或cdna分子。27.在一些实施方案中,参考核酸序列包括基因组、转录组或定制转录组参考核酸序列。28.在一些实施方案中,所述方法还包括在扩增前制备mirna文库。29.在一些实施方案中,衔接子连接包括c)之前的rna衔接子连接、衔接子阻断、衔接子环化以及二聚体去除。30.在一些实施方案中,连接rna衔接子包括进行衔接子阻断、衔接子环化和/或二聚体去除。31.在一些实施方案中,连接rna衔接子包括进行3'rna衔接子连接、5'rna衔接子连接、逆转录和独特分子标识符(umi)分配、和/或cdna清理。32.在另一方面,本公开提供了一种用于确定来自对象的生物样品的微小核糖核酸(mirna)谱的方法,所述方法包括进行以下一项或多项:1)从生物样品中提取rna分子,接着直接计数rna,2)从生物样品中提取rna分子,接着加a尾,然后逆转录(rt)为cdna,并进行模板转换,3)从生物样品中提取rna分子,接着加a尾,然后进行逆转录聚合酶链式反应(rt-pcr)和定量pcr(qpcr)或数字液滴pcr(ddpcr),4)从生物样品中提取rna分子,接着进行序列特异性连接,然后进行rt-pcr和qpcr或ddpcr,以及5)在不进行rna分离的情况下,对来自生物样品的rna分子进行无提取的mirna谱分析;以及确定来自对象的生物样品的mirna谱。33.在一些实施方案中,确定mirna谱包括使用作为人类基因组或人类转录组数据库的一部分的参考核酸序列。34.在一些实施方案中,确定mirna谱包括生成所表达的mirna的计数表。35.在一些实施方案中,确定mirna谱包括基于所表达的mirna生成归一化的计数表,以鉴定差异丰富的mirna。36.在一些实施方案中,mirna谱与结肠细胞增殖性病症相关,并提供将对象分类为患有结肠细胞增殖性病症或未患有结肠细胞增殖性病症的分类。37.在一些实施方案中,来自对象的生物样品选自:体液、粪便、结肠排出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞及其组合。38.在一些实施方案中,所述方法还包括将mirna谱与来自健康对象的参考mirna谱的数据库进行比较;以及至少部分基于测量到mirna谱的mirna表达相对于参考mirna谱变化了至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、或至少50%,确定所述对象患结肠细胞增殖性病症的风险增加。39.在一些实施方案中,所述方法还包括将mirna谱与来自健康对象的参考mirna谱的数据库进行比较;以及至少部分基于测量到mirna谱的mirna表达相对于参考mirna谱变化了至少15%,确定所述对象患结肠细胞增殖性病症的风险增加。40.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。41.在一些实施方案中,结肠细胞增殖性病症选自1期结直肠癌、2期结直肠癌、3期结直肠癌和4期结直肠癌。42.在一些实施方案中,晚期腺瘤包括管状腺瘤、管状绒毛状腺瘤、绒毛状腺瘤、腺癌或增生性息肉。43.在另一方面,本公开提供了一种用于检测对象中结肠细胞增殖性病症的存在或不存在的方法,所述方法包括:a)从生物样品中分离核糖核酸(rna)分子;b)在rna分子逆转录为互补脱氧核糖核酸(cdna)分子之前或之后,将rna衔接子连接到rna分子上;c)扩增cdna分子;d)确定cdna分子的核酸序列;e)将所述核酸序列与选自表1-11中列出的组的mirna的预先鉴定小组的参考核酸序列比对;f)至少部分基于所比对的核酸序列确定mirna谱;以及g)使用机器学习模型对所述mirna谱进行计算机处理,所述机器学习模型被训练为能够区分健康对象与患有结肠细胞增殖性病症的对象,以提供与存在或不存在结肠细胞增殖性病症相关的输出值,从而指示所述对象中结肠细胞增殖性病症的存在或不存在。44.在一些实施方案中,b)包括并入样品特异性条形码和/或分子特异性独特分子标识符(umi)。45.在一些实施方案中,预先选择的mirna包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、或至少250个选自表1-11中列出的组的mirna。46.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。47.在一些实施方案中,所述参考核酸序列是人类基因组或人类转录组数据库的一部分。48.在一些实施方案中,确定对象的mirna谱包括生成所表达的mirna的计数表。49.在一些实施方案中,确定对象的mirna谱包括生成所表达的mirna的计数表,以鉴定差异丰富的mirna。50.在一些实施方案中,来自对象的生物样品选自:体液、粪便、结肠排出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞及其组合。51.在一些实施方案中,所述方法还包括将mirna谱与来自健康对象的参考mirna谱的数据库进行比较;以及至少部分基于测量到mirna谱的mirna表达相对于参考mirna谱变化了至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、或至少50%,确定所述对象患结肠细胞增殖性病症的风险增加。52.在一些实施方案中,所述方法还包括将mirna谱与来自健康对象的参考mirna谱的数据库进行比较;以及至少部分基于测量到mirna谱的mirna表达相对于参考mirna谱变化了至少15%,确定所述对象患结肠细胞增殖性病症的风险增加。53.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。54.在一些实施方案中,结肠细胞增殖性病症选自1期结直肠癌、2期结直肠癌、3期结直肠癌和4期结直肠癌。55.在另一方面,本公开提供了一种用于确定来自对象的生物样品的mirna谱的方法,所述方法包括:a)从生物样品中分离核糖核酸(rna)分子;b)将rna分子逆转录为互补脱氧核糖核酸(cdna)分子;c)将rna衔接子连接到rna分子或cdna分子上;d)扩增cdna分子;e)确定cdna分子的核酸序列;f)将所述核酸序列与选自表1-11中列出的组的mirna小组的参考核酸序列比对;以及g)至少部分基于所比对的核酸序列确定mirna谱。56.在一些实施方案中,预先选择的mirna包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、或至少250个选自表1-11中列出的组的mirna。57.在一些实施方案中,所述方法还包括基于检测到的结肠细胞增殖性病症向对象施用治疗。在一些实施方案中,所述治疗包括化疗、放疗、免疫疗法或手术。58.在另一方面,本公开提供了一种用于检测对象中结肠细胞增殖性病症的存在或不存在的方法,所述方法包括:a)从生物样品中分离核糖核酸(rna)分子;b)将rna分子逆转录为互补脱氧核糖核酸(cdna)分子;c)将rna衔接子连接到rna分子或cdna分子上;d)扩增cdna分子;e)确定cdna分子的核酸序列;f)将所述核酸序列与选自表1-11中列出的组的mirna小组的参考核酸序列比对;g)至少部分基于所比对的核酸序列确定mirna谱;h)使用机器学习模型对所述mirna谱进行计算机处理,所述机器学习模型被训练以区分未患有结肠细胞增殖性病症的对象与患有结肠细胞增殖性病症的对象;以及i)通过机器学习模型输出与患有结肠细胞增殖性病症的对象或未患有结肠细胞增殖性病症的对象相关的值,从而检测所述对象中结肠细胞增殖性病症的存在或不存在。59.在一些实施方案中,预先选择的mirna包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、或至少250个选自表1-11中列出的组的mirna。60.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。61.在一些实施方案中,所述方法还包括基于检测到的结肠细胞增殖性病症向对象施用治疗。在一些实施方案中,所述治疗包括化疗、放疗、免疫疗法或手术。62.在另一方面,本公开提供了一种用于监测先前针对疾病进行治疗的对象中的微小残留疾病的方法,所述方法包括:使用选自表1-11中列出的组的mirna小组来确定来自对象的生物样品的微小核糖核酸(mirna)谱,从而生成基线mirna状态;在生成基线mirna状态后的一个或多个时间点确定从对象获得的生物样品的mirna谱,从而生成当前mirna状态;以及确定基线mirna状态与当前mirna状态之间的差异,从而检测对象中微小残留疾病的变化。63.在一些实施方案中,微小残留疾病选自对治疗的反应、肿瘤负荷、术后残留肿瘤、复发、二次筛查、一次筛查和癌症进展。在一些实施方案中,所述方法还包括基于在对象中检测到的微小残留疾病的变化向对象施用治疗。在一些实施方案中,所述治疗包括化疗、放疗、免疫疗法或手术。64.在另一方面,提供了一种用于确定对象对治疗的反应的方法,所述方法包括:使用选自表1-11中列出的组的mirna小组来确定来自对象的生物样品的微小核糖核酸(mirna)谱,从而生成基线mirna状态;在生成基线mirna状态后的一个或多个时间点确定从对象获得的生物样品的mirna谱,从而生成当前mirna状态;以及确定基线mirna状态与当前mirna状态之间的差异,从而确定对象对治疗的反应。在一些实施方案中,所述方法还包括基于确定的对象对治疗的反应向对象施用治疗。在一些实施方案中,所述治疗包括化疗、放疗、免疫疗法或手术。65.在另一方面,提供了一种用于监测对象的肿瘤负荷的方法,所述方法包括:使用选自表1-11中列出的组的mirna小组来确定来自对象的生物样品的微小核糖核酸(mirna)谱,从而生成基线mirna状态;在生成基线mirna状态后的一个或多个时间点确定从对象获得的生物样品的mirna谱,从而生成当前mirna状态;以及确定基线mirna状态与当前mirna状态之间的差异,从而监测对象的肿瘤负荷。在一些实施方案中,所述方法还包括基于对象的肿瘤负荷向对象施用治疗。在一些实施方案中,所述治疗包括化疗、放疗、免疫疗法或手术。66.在另一方面,提供了一种用于检测对象的术后残留肿瘤的方法,所述方法包括:使用选自表1-11中列出的组的mirna小组来确定来自对象的生物样品的微小核糖核酸(mirna)谱,从而生成基线mirna状态;在生成基线mirna状态后的一个或多个时间点确定从对象获得的生物样品的mirna谱,从而生成当前mirna状态;以及确定基线mirna状态与当前mirna状态之间的差异,从而检测对象的术后残留肿瘤。在一些实施方案中,所述方法还包括基于对象的术后残留肿瘤向对象施用治疗。在一些实施方案中,所述治疗包括化疗、放疗、免疫疗法或手术。67.在另一方面,提供了一种用于检测对象的复发的方法,所述方法包括:使用选自表1-11中列出的组的mirna小组来确定来自对象的生物样品的微小核糖核酸(mirna)谱,从而生成基线mirna状态;在生成基线mirna状态后的一个或多个时间点确定从对象获得的生物样品的mirna谱,从而生成当前mirna状态;以及确定基线mirna状态与当前mirna状态之间的差异,从而检测对象的复发。在一些实施方案中,所述方法还包括基于检测到的对象的复发向对象施用治疗。在一些实施方案中,所述治疗包括化疗、放疗、免疫疗法或手术。68.在另一方面,提供了一种用于至少部分基于对象的mirna谱来进行二次筛查的方法。69.在另一方面,提供了一种用于至少部分基于对象的mirna谱来进行一次筛查的方法。70.在另一方面,提供了一种用于监测对象的癌症进展的方法,所述方法包括:使用选自表1-11中列出的组的mirna小组来确定来自对象的生物样品的微小核糖核酸(mirna)谱,从而生成基线mirna状态;在生成基线mirna状态后的一个或多个时间点确定从对象获得的生物样品的mirna谱,从而生成当前mirna状态;以及确定基线mirna状态与当前mirna状态之间的差异,从而监测对象的癌症进展。在一些实施方案中,所述方法还包括基于对象的癌症进展向对象施用治疗。在一些实施方案中,所述治疗包括化疗、放疗、免疫疗法或手术。71.在一些实施方案中,mirna谱以至少约40%的敏感性指示对象中结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约50%的敏感性指示对象中结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约60%的敏感性指示对象中结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约70%的敏感性指示对象中结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约80%的敏感性指示对象中结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约90%的敏感性指示对象中结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约95%的敏感性指示对象中结直肠癌的存在或易感性。72.在一些实施方案中,mirna谱以至少约30%的阳性预测值(ppv)指示对象中结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约40%的阳性预测值(ppv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约50%的阳性预测值(ppv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约60%的阳性预测值(ppv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约70%的阳性预测值(ppv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约80%的阳性预测值(ppv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约90%的阳性预测值(ppv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约95%的阳性预测值(ppv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约99%的阳性预测值(ppv)指示结直肠癌的存在或易感性。73.在一些实施方案中,mirna谱以至少约40%的阴性预测值(npv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约50%的阴性预测值(npv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约60%的阴性预测值(npv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约70%的阴性预测值(npv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约80%的阴性预测值(npv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约90%的阴性预测值(npv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约95%的阴性预测值(npv)指示结直肠癌的存在或易感性。在一些实施方案中,mirna谱以至少约99%的阴性预测值(npv)指示结直肠癌的存在或易感性。74.在一些实施方案中,训练过的算法以至少约0.50的曲线下面积(auc)确定对象中结直肠癌的存在或易感性。在一些实施方案中,训练过的算法以至少约0.60的曲线下面积(auc)确定对象中结直肠癌的存在或易感性。在一些实施方案中,训练过的算法以至少约0.70的曲线下面积(auc)确定对象中结直肠癌的存在或易感性。在一些实施方案中,训练过的算法以至少约0.80的曲线下面积(auc)确定对象中结直肠癌的存在或易感性。在一些实施方案中,训练过的算法以至少约0.90的曲线下面积(auc)确定对象中结直肠癌的存在或易感性。在一些实施方案中,训练过的算法以至少约0.95的曲线下面积(auc)确定对象中结直肠癌的存在或易感性。在一些实施方案中,训练过的算法以至少约0.99的曲线下面积(auc)确定对象中结直肠癌的存在或易感性。75.在一些实施方案中,所述方法还包括在用户的电子装置的图形用户界面上显示报告。在一些实施方案中,用户是对象、个体或患者。76.在一些实施方案中,所述方法还包括确定对象、个体或患者中结直肠癌的存在或易感性的可能性。77.在一些实施方案中,训练过的算法(例如,机器学习模型或分类器)包括有监督的机器学习算法。在一些实施方案中,有监督的机器学习算法包括深度学习算法、支持向量机(svm)、神经网络或随机森林(randomforest)。78.在一些实施方案中,所述方法还包括为所述对象提供至少部分基于mirna谱或分析的治疗干预,诸如治疗结直肠癌患者的治疗干预(例如,化疗、放疗、免疫疗法或手术)。79.在一些实施方案中,所述方法还包括监测结直肠癌的存在或易感性,其中所述监测包括在多个时间点评估所述对象的结直肠癌的存在或易感性,其中所述评估至少是基于在多个时间点中的每一个处所确定的结直肠癌的存在或易感性。80.在一些实施方案中,在多个时间点中评估对象中结直肠癌的存在或易感性的差异指示一个或多个选自以下的临床指示:(i)对象的结直肠癌的存在或易感性的诊断,(ii)对象的结直肠癌的存在或易感性的预后,以及(iii)治疗对象的结直肠癌的存在或易感性的治疗过程有效或无效。81.在一些实施方案中,所述方法还包括通过使用训练过的算法对对象的结直肠癌进行分层,以从多个不同的结直肠癌亚型或阶段中确定对象的结直肠癌亚型。82.本公开的另一方面提供了一种用于区分患有结肠细胞增殖性病症的对象群体与未患有结肠细胞增殖性病症的对象群体的分类器,所述分类器包括:测量值集,其代表在6个或更多个选自表1-11中列出的组的mirna中的差异mirna丰度,其中所述测量值获自未患有结肠细胞增殖性病症的对象和患有结肠细胞增殖性病症的对象的mirna表达数据,其中所述测量值用于生成与差异mirna丰度的特性相对应的特征集,并且其中所述特征被并入机器学习或统计模型中,其中所述机器学习或统计模型提供用作分类器的特征向量,所述分类器能够区分未患有结肠细胞增殖性病症的对象群体与患有结肠细胞增殖性病症的对象群体。83.本公开的另一方面提供了一种包括机器可执行代码的非暂时性计算机可读介质,所述机器可执行代码在由一个或多个计算机处理器执行时,实现上述或本文其他地方的任何方法。84.本公开的另一方面提供了一种系统,其包括一个或多个计算机处理器和与之耦合的计算机存储器。计算机存储器包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时,实现上述或本文其他地方的任何方法。85.本公开的另一方面提供了一种系统,其包括:a)包括分类器的计算机可读介质,所述分类器用于基于mirna特征小组,使用机器学习模型区分患有结肠细胞增殖性病症的对象群体与未患有结肠细胞增殖性病症的对象群体;和b)一个或多个处理器,用于执行存储在所述计算机可读介质上的指令。援引并入86.本说明书中提到的所有出版物、专利和专利申请都通过引用并入本文,其并入程度如同每个单独的出版物、专利或专利申请被明确且单独地指示通过引用并入。就通过引用并入的出版物和专利或专利申请与本说明书中包含的公开内容相矛盾而言,本说明书旨在取代和/或优先于任何这种矛盾的材料。附图说明87.现将参考附图仅以举例的方式来描述本公开的实施例。本发明的新颖特征在随附权利要求中具体阐述。通过参考阐述了利用本发明原理的说明性实施方案的以下详细描述和附图(在本文中也称为“图(figure)”和“图(fig.)”)将获得对本发明的特征和优点的更好的理解,在附图中:88.图1提供了为实现本文所提供的方法而进行编程或以其他方式配置机器学习模型和分类器的计算机系统的示意图。89.图2提供了示出在特征选择期间所选择的mirna的直方图。90.图3提供了示出前10个最常被选择的mirna的逻辑回归系数的图。具体实施方式91.尽管本文已经示出和描述了本发明的各个实施方案,但对于本领域技术人员显而易见的是,这样的实施方案只是以举例的方式提供。在不偏离本发明的情况下,本领域技术人员可以想到多种变化、改变和替代。应当理解,可以采用针对本文所描述的本发明实施方案的各种可替选方案。92.癌症筛查和早期检测被认为是对抗癌症最有效的策略,因为在症状出现之前的早期阶段检测到恶性肿瘤或前期病变是治疗最有效的时候。例如,在结直肠癌中,结肠镜检查在改善早期诊断方面起作用。虽然结肠镜检查对早期检测有用,但患者的依从率很低,而且由于程序的侵入性,筛查的进行低于推荐的规律性。因此,非侵入性方法为早期癌症检测提供了更有前景的手段。93.本公开提供了涉及与结肠细胞增殖性病症(例如,结直肠癌)检测和疾病进展相关的基因的微小核糖核酸(微小rna或mirna)谱分析的方法和系统。本公开的一些实施方案提供了与未患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的低风险的对象的相应样品相比在患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的高风险的对象的样品中差异丰富的mirna。在一些实施方案中,具有发展结肠细胞增殖性病症的高风险的对象和具有发展结肠细胞增殖性病症的低风险的对象中的每个在结直肠黏膜内均有非侵入性前期病变(下文中称为结直肠病变)。在患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的高风险的对象的样品中以不同丰度(通常称为“差异性表达”)存在的mirna可以用作诊断、治疗和/或预防结肠细胞增殖性病症的生物标志物。94.本文鉴定的mirna可以用于鉴定患有结肠细胞增殖性病症的对象,以将其与未患结肠细胞增殖性病症的对象区分开;或鉴定具有发展结肠细胞增殖性病症的较高风险的对象,以将其与具有发展结肠细胞增殖性病症的较低风险的对象区分开;或鉴定有结肠细胞增殖性病症前兆(诸如导管内乳头状黏液性肿瘤(ipmn))与非ipmn的对象;或鉴定患有恶性ipmn与良性ipmn的对象。因此,这些mirna可以用作辅助工具,以指导有关结肠细胞增殖性病症的监测、治疗和管理的决策。95.本公开的一些实施方案提供了一种针对本文所述的mirna进行训练的机器学习模型分类器,所述mirna在患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的高风险(例如,当对象具有结直肠病变时)的对象的样品中差异性表达。在一个实例中,提供了一种用于基于血液的微创性mirna测定的方法,其可以用于评估具有结直肠病变的对象的组织学严重程度。在另一个实施方案中,在来自对象的无细胞样品,例如来自对象的体液样品诸如全血、血浆或血清中检测指示结肠细胞增殖性病症的mirna。因此,本公开提供了可以用于区分结肠细胞增殖性病症的存在或不存在、需要治疗(诸如手术切除、免疫疗法、放疗或化疗)的高风险或低风险结直肠病变和可以监测的低风险结直肠病变的mirna。可以例如通过结肠镜检查、超声、mm或ct扫描来监测和确认结肠细胞增殖性病症或病变的存在。96.本公开总体上涉及癌症检测和疾病监测。更具体地说,所述领域涉及癌症相关的微小rna(mirna)检测和早期结直肠癌的疾病监测。具体来说,提供了循环mirna特征小组及其用途以用于鉴定患有或有发展结肠细胞增殖性病症诸如结直肠癌(crc)和/或结直肠腺瘤(ca)(例如,晚期结直肠腺瘤(aa))的风险的人类对象。97.本公开总体上涉及癌症检测和疾病监测。本公开鉴定对象中的mirna,其指示结肠细胞增殖性病症的存在或例如当对象具有结直肠病变时,发展结肠细胞增殖性病症的高风险。癌症筛查和监测改善存活结果,因为早期检测能够在癌症生长和扩散之前消除它。例如,在结直肠癌中,结肠镜检查在改善早期诊断方面起作用。遗憾的是,患者的依从率很低,并且由于程序的侵入性,筛查的进行低于建议的规律性。98.本文描述了用于基于在患有结肠细胞增殖性病症的对象中上调或过表达的mirna的表达谱或丰度来筛查或鉴定具有患上所述疾病的风险的对象的方法。本文还描述了用于获得对诊断对象(例如,人类对象)的结肠细胞增殖性病症有用的数据的方法。结肠细胞增殖性病症的非限制性实例包括结直肠癌、结直肠腺瘤或晚期结直肠腺瘤。99.如本文所用,术语“发展结肠细胞增殖性病症的高风险”是指与未患有结肠细胞增殖性病症的对象或在不久的将来发展结肠细胞增殖性病症的风险较低的对象相比,对象在不久的将来发展结肠细胞增殖性病症的风险增加。如本文所用,术语“不久的将来”是指约1个月至约2年、约6个月至约18个月或约1年的持续时间。100.结肠细胞增殖性病症可以是任何肿瘤阶段(例如,tx、t0、tis、t1、t2、t3、t4);任何区域淋巴结或远处转移期(例如,nx、n0、n1、m0、m1);任何阶段(例如,0期(tis、n0、m0)、ia期(t1、n0、m0)、iia期(t3、n0、m0)、iib期(t1-3、n1、m0)、iii期(t4、任何n、m0)或iv期(任何t、任何n、m1));可切除的;局部晚期(无法切除);或转移的。101.目前的筛查工具可能因假阳性和假阴性结果以及特异性和敏感性不够理想而面临挑战。理想的癌症筛查工具可以具有高阳性预测值(positivepredictivevalue,ppv),这将最大限度地减少不必要的检查(低假阳性),但可以检测出绝大多数癌症(低假阴性)。另一个关键的妥协是“检测敏感性”,区别于测试敏感性,检测敏感性一般是指基于大小检测肿瘤的下限。使肿瘤生长到足够的大小,释放出可检测水平的循环肿瘤标志物,这违背了早期检测和预防癌症进展的目的。因此,本公开满足了对高敏感性和有效的基于血液的结直肠癌早期诊断筛查的需求。102.循环肿瘤dna的检测也被称为“液体活检”,可以允许以非侵入性方式对肿瘤进行检测和信息调查。在这些液体活检中对肿瘤特异性突变的鉴定可用于诊断结肠癌、乳腺癌和前列腺癌。然而,由于循环中存在高背景的正常(例如非肿瘤来源的)dna,所以这些技术的敏感性可受到限制。因此,仍需要更敏感且更具特异性的筛查工具来检测早期或低肿瘤负荷的结直肠癌肿瘤标志物,以便在高危群体中进行复发筛查和一次筛查。103.本公开提供了涉及对与结肠细胞增殖性病症及其进展(例如,结直肠癌)相关的循环mirna进行谱分析的方法和系统。那些指示结肠细胞增殖性病症的存在或发展结肠细胞增殖性病症的高风险的mirna可以用于尽早诊断、治疗或预防结肠细胞增殖性病症的进展,例如,当对象只有结直肠病变时。本文还提供了用于诊断结肠细胞增殖性病症或评估(特别是当对象具有结直肠病变时)对象发展结肠细胞增殖性病症的风险的试剂盒和方法。104.mirna一般是指在植物和动物中所见的具有大约18-22个核苷酸的小型非编码rna。mirna可以通过结合至3'-非翻译区(3'-utr)中的特异性位点而在转录后调控mrna靶标,从而促进这些mrna靶标的降解或抑制其翻译。mirna可以促成多种生理细胞功能,诸如增殖、分化和凋亡。mirna的失调可以在癌症中起着至关重要的作用,因为mirna调控致癌基因和肿瘤抑制基因的表达。无细胞mirna(cfmirna)、循环肿瘤细胞(ctc)、循环肿瘤dna(ctdna)、肿瘤诱导的血小板(tep)和细胞外囊泡(ev)可有助于疾病状态的检测,并提供有关疾病状态的相关预后和预测信息。105.由真核的核dna编码的mirna可以通过与mrna分子内的互补序列进行碱基配对来发挥作用,通常经由翻译抑制或靶标降解造成基因沉默。mirna被rna聚合酶ii转录为称为pri-mirna的大rna前体。pri-mirna可以在细胞核中进一步加工以产生pre-mirna。pre-mirna的长度可以为约70个核苷酸,并折叠成不完美的茎环或“发夹”结构。然后,pre-mirna可以被输出到细胞质中,并经历额外的加工以生成成熟mirna。样品的mirna谱可以指示样品中各种mirna的表达水平。106.差异表达的mirna可以是相对于参考样品中的表达水平(例如,组织样品的测试细胞与对照细胞、或细胞或脱细胞液样品或参考表达水平(参考值)相比)在样品中过表达、上调、低表达或下调的mirna。参考表达水平可以反映相关群体(例如,流行病学相关群体)中的“正常”状态(例如,缺乏疾病)或相应的目标患病状态。107.在一些实施方案中,如果mirna在样品中的表达水平比对照样品或参考表达水平中的相应mirna高或低至少约1.8倍,或者所述样品与对照样品或参考表达水平的表达水平差异具有小于0.05的统计显著性(p值),则所述mirna被鉴定为“差异表达的”或“差异丰富的”。108.在一些实施方案中,如果mirna在样品中的表达水平比对照样品或参考表达样品中的相应mirna高或低约2倍、约3倍、约4倍、约5倍或大于5倍,则所述mirna被鉴定为“差异表达的”或“差异丰富的”。在一些实施方案中,表达水平是基于参考标准归一化的,诸如但不限于log2、每百万计数、归一化到合成spike-ins、或归一化到管家基因。109.差异表达的mirna可以是存在于样品中但很少在参考样品中观察到的mirna,或者可以是在样品中不存在但在参考样品中常见的mirna(例如,组织样品的测试细胞与对照细胞、或细胞或脱细胞液样品或参考表达水平(参考值)相比)。110.一方面,本文提供了使用mirna小组的方法,所述方法用于根据疾病状态区分来自对象的样品。在其他方面,本文提供了涉及使用mirna小组来检测、鉴别和区分结肠细胞增殖性病症的方法、测定和试剂盒。结肠细胞增殖性病症的非限制性实例包括腺癌、腺瘤、息肉、鳞状细胞癌、类癌瘤、肉瘤和淋巴瘤。111.在一些实施方案中,所述方法包括使用一个或多个mirna,选择其作为用于结肠细胞增殖性病症的鉴别、检测和区分的标志物。i.定义112.除非上下文另有明确指示,否则如说明书和权利要求书中所用,单数形式“一个/种(a/an)”和“所述(the)”包括复数个指示物。例如,术语“核酸”包括多个核酸,包括其混合物。113.如本文所用,术语“对象”一般是指具有可测试或可检测的遗传信息的实体或媒介。对象可以是个人、个体或患者。对象可以是脊椎动物,例如像哺乳动物。哺乳动物的非限制性实例包括人类、猿猴、农场动物、运动动物、啮齿动物和宠物。对象可以是患有癌症或疑似患有癌症的人。对象可以表现出指示对象健康、生理状态或状况的症状,诸如对象的癌症或其他疾病、病症或病状。作为替代,对象可以在这种健康或生理状态或状况方面无症状。114.如本文所用,术语“样品”一般是指获自或衍生自一个或多个对象的生物样品。生物样品可以是无细胞生物样品或基本上上无细胞生物样品,或者可以被加工或分级分离以产生无细胞生物样品。例如,无细胞生物样品可以包括无细胞核糖核酸(cfrna)、无细胞脱氧核糖核酸(cfdna)、无细胞胎儿dna(cffdna)、血浆、血清、尿液、唾液、羊水及其衍生物。可以使用乙二胺四乙酸(edta)收集管、无细胞rna收集管(例如,streckrnacompletebct)或无细胞dna收集管(例如,streckcell-freednabct)从对象中获得或衍生无细胞生物样品。无细胞生物样品可以通过分级分离(例如,通过差速离心)从全血样品中衍生。生物样品或其衍生物可以含有细胞。例如,生物样品可以是血液样品或其衍生物(例如,通过收集管或血滴收集的血液)。115.如本文所用,术语“核酸”一般是指任意长度的核苷酸的聚合形式,无论是脱氧核糖核苷酸(dntp)或核糖核苷酸(rntp),或其类似物。核酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。核酸的非限制性实例包括脱氧核糖核酸(dna)、核糖核酸(rna)、基因或基因片段的编码或非编码区、从连锁分析中定义的基因座(locus)、外显子、内含子、信使rna(mrna)、转移rna(trna)、核糖体rna(rrna)、短干扰rna(sirna)、短发夹rna(shrna)、微小rna(mirna)、核酶、cdna、重组核酸、支链核酸、质粒、载体、任意序列的分离dna、任意序列的分离rna、核酸探针和引物。核酸可以包含一个或多个修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。如果存在,则可以在核酸组装之前或之后赋予对核苷酸结构的修饰。核酸的核苷酸序列可以被非核苷酸组分中断。核酸可以在聚合后进一步被修饰,诸如通过缀合或与报告因子结合。116.如本文所用,术语“靶核酸”一般是指核酸分子群体中的核酸分子,所述核酸分子的核苷酸序列的存在、数量和/或序列或其中一个或多个的变化都需要被确定。靶核酸可以是任何类型的核酸,包括dna、rna及其类似物。如本文所用,“靶核糖核酸(rna)”一般是指作为rna的靶核酸。如本文所用,“靶脱氧核糖核酸(dna)”一般是指作为dna的靶核酸。117.如本文所用,术语“扩增(amplifying)”和“扩增(amplification)”一般是指增加核酸分子的大小或数量。核酸分子可以是单链的或双链的。扩增可以包括生成核酸分子的一个或多个拷贝或“扩增产物”。扩增可以例如通过延伸(例如引物延伸)或连接进行。扩增可以包括进行引物延伸反应以生成与单链核酸分子互补的链,并在一些情况下生成所述链和/或单链核酸分子的一个或多个拷贝。术语“dna扩增”一般是指生成dna分子或“扩增的dna产物”的一个或多个拷贝。术语“逆转录扩增”一般是指通过逆转录酶的作用,从核糖核酸(rna)模板生成脱氧核糖核酸(dna)。118.如本文所用,术语“无细胞核酸”或“cfna”一般是指生物样品中不包含在细胞中的核酸。cfna的非限制性实例包括无细胞rna(cfrna)和无细胞dna(cfdna)。cfna可以在体液中诸如在血流中自由循环。119.如本文所用,术语“无细胞样品”一般是指大体上缺乏完整细胞的生物样品。无细胞样品可以衍生自本身大体上缺乏细胞的生物样品,或者可以衍生自细胞已被去除的样品。无细胞样品的非限制性实例包括衍生自血液、血清、血浆、尿液、精液、痰液、粪便、导管渗出液、淋巴和回收灌洗液的那些样品。120.如本文所用,术语“循环肿瘤dna”或“ctdna”一般是指源自肿瘤的cfdna。121.如本文所用,术语“结肠细胞增殖性病症”一般是指包括结肠或直肠细胞的紊乱或异常增殖的病症或疾病。结肠细胞增殖性病症的非限制性实例包括腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。122.如本文所用,术语“健康”一般是指对象不患有结直肠细胞增殖性病症。虽然健康是一种动态状态,但如本文所用,所述术语指的是在特定陈述中所提及的缺乏疾病状态的对象的病理状态。在一个实例中,当提及能够对结直肠癌对象进行分类的特征小组时,健康个体、健康样品或来自健康个体的样品指的是缺乏结直肠癌(crc)、晚期腺瘤(aa)或良性腺瘤(naa)的个体。虽然在此对象中可能存在其他疾病或健康状态,但如本文所用,术语“健康”指示在具有与缺乏所讨论的疾病状态的对象之间缺乏用于比较或分类目的的所述疾病。123.术语“微小残留疾病”或“mrd”一般是指癌症治疗后对象体内的少量癌细胞。可以进行mrd检测,以确定癌症治疗的有效性,并指导进一步的治疗计划。124.如本文所用,术语“筛查”一般是指对处于患上结直肠癌或结直肠腺瘤风险下的对象群体进行检查或测试,目的是判别健康对象与患有未诊断的结直肠癌或结直肠腺瘤的对象或处于患上所述适应症的高风险下的对象。125.如本文所用,术语“结直肠癌”一般是指以小肠以下(例如大肠(结肠),例如盲肠、升结肠、横结肠、降结肠、乙状结肠和直肠)的肠道细胞癌变为特征的医学病状。126.如本文所用,术语“结直肠腺瘤”一般是指结肠腺瘤,也称为腺瘤性息肉,它是结直肠癌的良性和癌前阶段。结直肠腺瘤可以指示进展为结直肠癌的高风险。127.如本文所用,术语“晚期结直肠腺瘤”一般是指腺瘤大小为至少10mm或组织学上有高度异型增生或绒毛成分高于20%。128.如本文所用,术语“微创性生物样品”或“非侵入性样品”一般是指除用于从对象身上取血的细针外,不需要任何仪器从患者体内采集的任何样品。在一些实施方案中,微创性生物样品包括血液、血清或血浆样品。129.如本文所用,术语“上调”或“过表达”一般是指表达水平相对于给定的“阈值”或“截止值”增加了至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%或多于150%。130.如本文所用,术语“阈值”或“截止值”,在提及表达水平时,一般是指在给定的敏感性和特异性下,如果对象的表达水平高于所述阈值或截止或参考水平,则指示对象可能患有结直肠癌或结直肠腺瘤的参考表达水平。131.如本文所用,术语“试剂盒”不限于任何特定的装置并且可以包括适用于实现本公开的系统和方法的任何装置,诸如但不限于微阵列、生物阵列、生物芯片或生物芯片阵列。132.如本文所用,术语癌症“类型”和“亚型”在本文中一般是相对使用的,使得一种“类型”的癌症,诸如乳腺癌,可以是基于例如阶段、形态学、组织学、基因表达、受体谱、突变谱、侵袭性、预后和恶性特点的“亚型”。同样,“类型”和“亚型”可以应用在更细的层次上,例如,将一个组织学“类型”鉴别为“亚型”,例如,根据突变谱或基因表达来定义。癌症“阶段”也用来指代基于与疾病进展相关的组织学和病理学特点的癌症类型分类。133.如本文所用,术语“mirna”或“mir”或“微小rna”一般是指长度在17与25个核碱基之间的非编码rna,它与编码rna杂交并调控其表达。17-25个核苷酸的mirna分子可以通过自然加工途径(例如使用完整细胞或细胞溶解产物)或通过合成加工途径(例如使用分离的加工酶,诸如分离的dicer、argonaut或rna酶iii)从mir前体中获得。17-25个核苷酸的rna分子也可以通过生物或化学合成直接产生,而不需要从mir前体加工。134.如本文所用,术语“mirna分子”一般是指代表mirna的任何核酸分子。非限制性实例包括在核酸序列方面与自然形式相同的自然mirna分子、pre-mirna、pri-mirna和mirna分子,以及这些自然形式的核酸序列,其中一个或多个核酸已被一个或多个dna核苷酸和/或核酸类似物替换或由其表示。在一些情况下,mirna分子被称为编码mirna的核酸分子或简称为核酸分子。135.如本文所用,术语“mirna谱”一般是指多个mirna的表达水平或丰度的集合。mirna谱是对个别mirna表达水平或丰度的定量度量。在此,每个mirna都用数值表示。个别mirna的值越高,此mirna的表达水平越高。mirna谱是从生物样品的rna中获得的。可用于确定mirna谱的技术的非限制性实例包括微阵列、rt-pcr和下一代测序。rna、全rna或其任何级分都可以用作分析的起始材料。由mirna谱确定的多个mirna可以从一个选择到所有已知的mirna。136.如本文所用,术语“预先确定的mirna集”或“mirna特征”一般是指mirna的固定限定集,其能够鉴别条件1与另一种条件2。例如,条件1是结直肠癌,而条件2是正常对照。在这种情况下,相应预先确定的mirna集能够鉴别衍生自结直肠癌患者或正常对照患者的样品。可替代地,如果条件1是结直肠癌且条件2是晚期腺瘤,则相应预先确定的mirna集能够鉴别结直肠癌患者与晚期腺瘤患者。为了例如在可用于确定mirna谱的矩阵上进行样品分析,mirna的这些固定限定集用探针或由预先确定的mirna集定义的其他方法表示。可以使用靶标方法选择测序方法,例如转录组范围的mirna测序和dd/q-pcr方法。例如,当从健康对照中诊断结直肠癌的预先确定的mirna集由25个mirna组成时,必须实现能够检测这25个mirna的探针或方法来执行诊断分析。137.如本文所用,术语“普通mirna特征谱”一般是指mirna或非编码rna的非固定限定集,其能够鉴别条件1与另一种条件2。普通mirna或非编码rna特征谱是从存储在例如数据库中的多个mirna谱中动态计算的。能够鉴别一种条件与另一种条件2的普通mirna特征谱一旦在将与健康状态1或另一种条件2相关的新谱添加到数据库中,就会发生变化。就此而言,普通mirna特征谱不同于预先确定的mirna集。此外,生成普通mirna特征谱(例如,存储在数据库中的mirna谱)的基础是从例如在矩阵上的捕获探针生成的,所述矩阵代表尽可能多的不同捕获探针,以检测尽可能多的mirna。138.如本文所用,术语“非编码rna”或“ncrna”一般是指功能性rna分子,其未被翻译成蛋白质。在一些情况下,ncrna是指非蛋白编码rna(npcrna)、非信使rna(nmrna)、小的非信使rna(snmrna)或功能性rna(frna)。术语小rna(srna)通常用于细菌ncrna。非编码rna作为最终产物被转录出来的dna序列通常被称为rna基因或非编码rna基因。非编码rna基因包括高度丰富和功能上重要的rna,诸如转移rna(trna)和核糖体rna(rrna),以及rna,诸如snorna、微小rna、sirna和pirna及长ncrna,诸如xist和hotair。人类基因组内编码的ncrna的数量是未知的。然而,最近的转录组学和生物信息学研究表明,存在数以千计的ncrna。由于大多数新鉴定的ncrna还没有经过功能验证,因此许多ncrna可能是无功能的。ii.测定样品139.无细胞生物样品可以从人类对象中获得或衍生。无细胞生物样品在加工前可以储存在多种储存条件下,诸如不同温度(例如室温、冷藏或冷冻条件,例如25℃、4℃、-18℃、-20℃或-80℃)或不同悬液(例如,edta收集管、无细胞rna收集管或无细胞dna收集管)。140.无细胞生物样品可以从患有癌症的对象、疑似患有癌症的对象、或未患或未疑似患有癌症的对象中获得。141.无细胞生物样品可以在癌症对象的治疗前和/或后获得。在治疗或治疗方案期间,可以从对象中获得无细胞生物样品。可以从对象中获得多个无细胞生物样品,以监测随时间推移的治疗效果。无细胞生物样品可以从已知或疑似患有癌症的对象中获取,所述疑似患有癌症的对象无法通过临床测试得到明确的阳性或阴性诊断。样品可以从疑似患有癌症的对象获取。无细胞生物样品可以从出现以下无法解释的症状的对象获取,诸如疲劳、恶心、体重减轻、身体疼痛、虚弱或出血。无细胞生物样品可以从有解释的症状的对象获取。无细胞生物样品可以从因诸如家族史、年龄、高血压或高血压前期、糖尿病或糖尿病前期、超重或肥胖、环境暴露、生活方式风险因素(例如,吸烟、饮酒或吸毒)或存在其他风险因素的因素而有发作癌症的风险的对象获取。142.无细胞生物样品可以含有一种或多种能够被分析的分析物,诸如适用于分析以生成转录组数据的无细胞核糖核酸(cfrna)分子、适用于分析以生成基因组数据的无细胞脱氧核糖核酸(cfdna)分子、或其混合物或组合。一种或多种这样的分析物(例如,cfrna分子和/或cfdna分子)可以从对象的一个或多个无细胞生物样品中分离或提取,以便使用一种或多种合适的测定进行下游分析。143.从对象获得无细胞生物样品后,可以对所述无细胞生物样品进行加工,以生成指示对象的癌症的数据集。例如,在癌症相关基因组基因座小组上对无细胞生物样品的核酸分子进行存在、不存在或定量评估(例如,在癌症相关基因组基因座上对rna转录本或dna的定量度量)。对从对象获得的无细胞生物样品的加工可以包括:(i)将无细胞生物样品置于足以分离、富集或提取多个核酸分子的条件下;及(ii)分析所述多个核酸分子以生成数据集。144.在一些实施方案中,从无细胞生物样品中提取多个核酸分子,并对其进行测序以生成多个测序读数。核酸分子可包括核糖核酸(rna)或脱氧核糖核酸(dna)。核酸分子(例如rna或dna)可通过以下多种方法从无细胞生物样品中提取,诸如magmaxmirvana总rna分离试剂盒、qiaampccfdna/rna试剂盒、zymoquick-cfrnaserum&plasma试剂盒、mpbiomedicals的fastdna试剂盒方案、qiagen的qiaampdna无细胞生物迷你试剂盒、或norgenbiotek的无细胞生物dna分离试剂盒。提取方法可以从样品中提取所有的rna或dna分子。可替代地,提取方法可以选择性地从样品中提取一部分rna或dna分子。从样品中提取的rna分子可以通过逆转录(rt)转化为dna分子。145.测序可以通过任何合适的测序方法进行,诸如大规模并行测序(mps)、配对末端测序、高通量测序、下一代测序(ngs)、鸟枪法测序、单分子测序、纳米孔测序、半导体测序、焦磷酸测序、合成测序(sbs)、连接法测序、杂交测序和rna-seq(illumina)。146.测序可以包括核酸扩增(例如,rna或dna分子)。在一些实施方案中,核酸扩增是聚合酶链式反应(pcr)。可以进行适当轮数的pcr(例如pcr、qpcr、逆转录酶pcr、数字pcr等),以将初始量的核酸(例如rna或dna)充分扩增到所需的输入量,以便后续测序。在一些情况下,pcr可以用于靶核酸的整体扩增。这可以包括使用衔接子序列,所述衔接子序列可以首先连接到不同的分子,然后使用通用引物进行pcr扩增。pcr可以使用许多商用试剂盒中的任一种来进行,例如由lifetechnologies、affymetrix、promega、qiagen等提供的试剂盒。在其他情况下,核酸群内仅有某些靶核酸可被扩增。特异性引物(可能与衔接子连接相结合)可用于选择性扩增某些靶标以用于下游测序。pcr可以包括一个或多个基因组基因座的靶向扩增,诸如与癌症相关的基因组基因座。测序可包括使用同步逆转录(rt)和聚合酶链式反应(pcr),诸如由qiagen、neb、thermofisherscientific或bio-rad提供的onesteprt-pcr试剂盒方案。147.从无细胞生物样品中分离或提取的rna或dna分子可例如使用可鉴定的标签来标记,以允许多个样品的多路复用。任何数量的rna或dna样品都可以进行多路复用。例如,多路复用的反应可包含来自至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或多于100个初始无细胞生物样品的rna或dna。例如,可以用样品条形码标记多个无细胞生物样品,这样每个dna分子都可以追溯到dna分子起源的样品(和对象)。这种标签可以通过连接或引物pcr扩增连接到rna或dna分子上。148.在对核酸分子进行测序后,可对序列读数进行适当的生物信息学处理,以生成指示癌症的存在、不存在或相对评估的数据。例如,序列读数可与一个或多个参考基因组(例如,一个或多个物种的基因组,诸如人类基因组)比对。比对的序列读数可以在一个或多个基因组基因座上量化,以生成指示癌症的数据集。例如,对与癌症相关的多个基因组基因座相对应的序列进行量化,可以生成指示癌症的数据集。149.测定读出可以在一个或多个基因组基因座(例如,癌症相关基因组基因座)上量化,以生成指示癌症的数据。例如,与多个基因组基因座(例如,癌症相关基因组基因座)相对应的阵列杂交或聚合酶链式反应(pcr)的量化可生成指示癌症的数据。测定读出可以包括定量pcr(qpcr)值、数字pcr(dpcr)值、数字液滴pcr(ddpcr)值、荧光值等,或其归一化值。测定可以是配置为在家庭环境中进行的家庭用户检测。150.在一些实施方案中,多重测定可以用于同时处理对象的无细胞生物样品。例如,第一测定可以用于处理从对象获得或衍生的第一无细胞生物样品,以生成指示癌症的第一数据集;并且与第一测定不同的第二测定可以用于处理从对象获得或衍生的第二无细胞生物样品,以生成指示癌症的第二数据集。然后可以分析第一数据集和第二数据集的任何或所有数据集,以评估对象的癌症。例如,可以基于第一数据集与第二数据集的组合生成单个诊断指标或诊断评分。另一个实例是,可以根据第一数据集和第二数据集生成单独的诊断指标或诊断评分。iii.特征小组151.本公开提供了分析生物样品的方法和系统,以从样品中鉴定的与结肠细胞增殖性病症发展相关的mirna分子组合中获得可测量的特征。所鉴定的mirna分子的集合可以形成特征小组,其中所述特征是结肠细胞增殖性病症或其阶段所特有的。来自特征小组的特征可以使用训练过的算法(例如,机器学习模型)来处理,以创建分类器,所述分类器被配置来将对象群分层为患有结肠细胞增殖性病症或不患结肠细胞增殖性病症。所述方法可通过使用一个或多个具有特征小组中描述的mirna的核酸来表征。152.本文所述的mirna特征小组可使与结肠细胞增殖性病症相关的特异性mirna的快速和特异性分析成为可能。本文方法中描述和使用的特征小组可用于改进结肠细胞增殖性病症的诊断、预后、治疗选择和监测(例如治疗监测)。153.与目前的方法相比,所述特征小组和方法提供了显著的改进,因为需要使用标志物或特征小组以从诸如全血、血浆或血清的体液样品中检测早期结肠细胞增殖性病症。目前用于检测和诊断结肠细胞增殖性病症的方法可包括结肠镜、乙状结肠镜和粪便潜血结肠癌。与这些方法相比,本文提供的方法可比结肠镜的侵入性小得多,并且至少与乙状结肠镜、粪便免疫化学试验(fit)和粪便潜血试验(fobt)同样或更敏感。与目前使用的这些标志物相比,本文提供的方法可在敏感性和特异性方面具有显著优势,这是由于使用基因小组与高敏感性测定技术的有利组合。154.可以根据预期测定的目的选择包含信息mirna的特征小组。对于靶向方法,引物对可以基于预期的靶mirna集来设计。在一些实施方案中,mirna集包含至少一个、至少两个、至少三个或多于三个选自表1中列出的组的mirna。在一些实施方案中,mirna集包含表1中列出的所有区域。在一些实施方案中,与结直肠癌相关的mirna集选自表1中列出的组。表1155.在一些实施方案中,与结直肠癌相关的mirna集选自表2中列出的组。表26770-1、hsa-mir-382、hsa-mir-1843、hsa-mir-142和hsa-mir-485、hsa-mir-548ax、hsa-mir-548e、hsa-mir-548al、hsa-mir-548am、hsa-mir-590、hsa-mir-135a-2、hsa-mir-6770-3、hsa-mir-410、hsa-mir-376a-1、hsa-mir-377、hsa-mir-570、hsa-mir-381、hsa-mir-665、hsa-mir-758、hsa-mir-6511a-3、hsa-mir-376a-2、hsa-mir-155、hsa-mir-3140、hsa-mir-1277、hsa-mir-340和hsa-mir-548n、hsa-mir-518b、hsa-mir-654、hsa-mir-5581、hsa-mir-409、hsa-mir-628、hsa-mir-10399、hsa-mir-3184、hsa-mir-423、hsa-mir-548z、hsa-mir-374a、hsa-mir-548a-3、hsa-mir-6770-2、hsa-mir-1185-2、hsa-mir-6077、hsa-mir-3202-1、hsa-mir-548o-2、hsa-mir-3143、hsa-mir-5009、hsa-mir-548g和hsa-mir-656。161.在一些实施方案中,与具有发展结肠细胞增殖性病症的低风险的对象的相应样品相比,在具有发展结肠细胞增殖性病症的高风险的对象的样品中较高表达的mirna包含以下中的一个或多个:hsa-mir-889、hsa-mir-543、hsa-mir-376b、hsa-mir-335、hsa-mir-1185-1、hsa-mir-548k、hsa-mir-12135、hsa-mir-369、hsa-mir-190a、hsa-mir-6770-1、hsa-mir-382、hsa-mir-1843、hsa-mir-142和hsa-mir-485、hsa-mir-548ax、hsa-mir-548e、hsa-mir-548al、hsa-mir-548am、hsa-mir-590、hsa-mir-135a-2、hsa-mir-6770-3、hsa-mir-410、hsa-mir-376a-1、hsa-mir-377、hsa-mir-570、hsa-mir-381、hsa-mir-665、hsa-mir-758、hsa-mir-6511a-3、hsa-mir-376a-2、hsa-mir-155、hsa-mir-3140、hsa-mir-1277、hsa-mir-340和hsa-mir-548n、hsa-mir-518b、hsa-mir-654、hsa-mir-5581、hsa-mir-409、hsa-mir-628、hsa-mir-10399、hsa-mir-3184、hsa-mir-423、hsa-mir-548z、hsa-mir-374a、hsa-mir-548a-3、hsa-mir-6770-2、hsa-mir-1185-2、hsa-mir-6077、hsa-mir-3202-1、hsa-mir-548o-2、hsa-mir-3143、hsa-mir-5009、hsa-mir-548g和hsa-mir-656。162.在一些实施方案中,结肠细胞增殖性病症为晚期腺瘤。163.在一些实施方案中,与具有发展结肠细胞增殖性病症的低风险的对象的相应样品相比,在具有发展结肠细胞增殖性病症的高风险的对象的样品中较低表达的mirna包含以下中的一个或多个:hsa-mir-889、hsa-mir-543、hsa-mir-376b、hsa-mir-335、hsa-mir-1185-1、hsa-mir-548k、hsa-mir-12135、hsa-mir-369、hsa-mir-190a、hsa-mir-6770-1、hsa-mir-382、hsa-mir-1843、hsa-mir-142和hsa-mir-485、hsa-mir-548ax、hsa-mir-548e、hsa-mir-548al、hsa-mir-548am、hsa-mir-590、hsa-mir-135a-2、hsa-mir-6770-3、hsa-mir-410、hsa-mir-376a-1、hsa-mir-377、hsa-mir-570、hsa-mir-381、hsa-mir-665、hsa-mir-758、hsa-mir-6511a-3、hsa-mir-376a-2、hsa-mir-155、hsa-mir-3140、hsa-mir-1277、hsa-mir-340和hsa-mir-548n、hsa-mir-518b、hsa-mir-654、hsa-mir-5581、hsa-mir-409、hsa-mir-628、hsa-mir-10399、hsa-mir-3184、hsa-mir-423、hsa-mir-548z、hsa-mir-374a、hsa-mir-548a-3、hsa-mir-6770-2、hsa-mir-1185-2、hsa-mir-6077、hsa-mir-3202-1、hsa-mir-548o-2、hsa-mir-3143、hsa-mir-5009、hsa-mir-548g和hsa-mir-656。164.在一个实例中,mirna小组在晚期腺瘤对象的样品中的表达相对于无晚期腺瘤的健康对象的样品是增加的。在一个实例中,小组包含两个或更多个选自表6中列出的组的mirna。在其他实例中,小组包含3个或更多个、4个或更多个、5个或更多个、或6个或更多个列出的mirna。表6165.在另一个实例中,来自晚期腺瘤对象的样品中mirna小组的表达相对于来自无晚期腺瘤的健康对象的样品是增加的,所述小组包含两个或更多个选自表7中列出的组的mirna。在其他实例中,小组包含3个或更多个、4个或更多个、5个或更多个、或6个或更多个列出的mirna。166.在一些实施方案中,小组选自5个或更多个mirna,包括:a)hsa-mir-1273a、hsa-mir-17-5p、hsa-mir-20a-3p、hsa-mir-20b-5p;b)hsa-mir-3065-5p、hsa-mir-4785、hsa-mir-5096、hsa-mir-5189-5p;或c)hsa-mir-545-3p、hsa-mir-570-3p、hsa-mir-624-3p、hsa-mir-1181、hsa-mir-6073。表7hsa-mir-1273ahsa-mir-3065-5phsa-mir-545-3phsa-mir-6073hsa-mir-17-5phsa-mir-4785hsa-mir-570-3phsa-mir-20a-3phsa-mir-5096hsa-mir-624-3phsa-mir-20b-5phsa-mir-5189-5phsa-mir-1181167.在一个实例中,mirna小组在晚期腺瘤对象的样品中的表达相对于无晚期腺瘤的健康对象的样品是减少的。在一个实例中,小组包含两个或更多个选自表8中列出的组的mirna。在其他实例中,小组包含3个或更多个、4个或更多个、5个或更多个、或6个或更多个列出的mirna。表8168.在一个实例中,mirna小组在结直肠癌对象的样品中的表达相对于无结直肠癌的健康对象的样品是增加的。在一个实例中,小组包含两个或更多个选自表9中列出的组的mirna。在其他实例中,小组包含3个或更多个、4个或更多个、5个或更多个、或6个或更多个列出的mirna。表9169.在另一个实例中,来自结直肠癌对象的样品中mirna小组的表达相对于来自无结直肠癌的健康对象的样品是增加的,所述小组包含两个或更多个选自表10中列出的组的mirna。在其他实例中,小组包含3个或更多个、4个或更多个、5个或更多个、或6个或更多个列出的mirna。170.在另一个实例中,小组选自5个或更多个mirna,包括:a)hsa-mir-1250-5p、hsa-mir-1255a、hsa-mir-223-3p、hsa-mir-338-3p、hsa-mir-338-5p;b)hsa-mir-424-5p、hsa-mir-424-3p、hsa-mir-450a-5p、hsa-mir-450b-5p、hsa-mir-4772-3p;c)hsa-mir-4772-5p、hsa-mir-625-5p、hsa-mir-7847-3p、hsa-mir-1181、hsa-mir-3651、hsa-mir-6073;d)hsa-mir-6125、hsa-mir-7704、hsa-mir-19b-3p、hsa-mir-19a-3p、hsa-mir-3157-5p;e)hsa-mir-142-3p、hsa-mir-30c-5p、hsa-mir-6741-5p、hsa-mir-590-3p、hsa-mir-4685-5p;f)hsa-mir-3648、hsa-mir-331-3p、hsa-mir-1303、hsa-mir-6790-3p、hsa-mir-6867-5p、hsa-mir-942-5p;g)hsa-mir-378a-3p、hsa-mir-1287-5p、hsa-mir-4785、hsa-mir-324-3p、hsa-mir-550b-2-5p;h)hsa-mir-200c-3p、hsa-mir-200b-3p、hsa-mir-3679-5p、hsa-mir-550a-3-5p、hsa-mir-3187-3p;i)hsa-mir-181b-5p、hsa-mir-3138、hsa-mir-146a-5p、hsa-mir-6721-5p、hsa-mir-23b-3p、hsa-mir-28-5p;j)hsa-mir-320d、hsa-mir-940、hsa-mir-320d-1、hsa-mir-10a-5p、hsa-mir-340-5p;k)hsa-mir-320b、hsa-mir-335-5p、hsa-mir-320c、hsa-mir-501-3p、hsa-mir-548n;或l)hsa-mir-27a-3p、hsa-mir-3065-3p、hsa-mir-548aa@、hsa-mir-584-3p、hsa-mir-22-3p。表10171.在一个实例中,mirna小组在结直肠癌对象的样品中的表达相对于无结直肠癌的健康对象的样品是减少的。在一个实例中,小组包含两个或更多个选自表11中列出的组的mirna。表11hsa-mir-3135bhsa-mir-581172.在一些实施方案中,结肠细胞增殖性病症为晚期腺瘤。173.在一些实施方案中,结肠细胞增殖性病症为结直肠癌。174.在一些实施方案中,与单独使用mir-889、mir-543、mir-376b、mir-335和mir-1185-1相比,单独排除mir-889的生物标志物的某些特定组合从k倍交叉验证的频率、auc、敏感性和特异性值的方面来看为检测晚期结直肠腺瘤的存在或检测结直肠癌的存在都提供了更好的结果。175.在一些实施方案中,此类实例包括至少(mir-889)或至少(mir-889和mir-543)或至少(mir-889和mir-376b)、或至少(mir-889和mir-335)、或至少(mir-889和mir-1185-1)、或至少(mir-889、mir-543和mir-376b)、或至少(mir-889、mir-543和mir-335)、或至少(mir-889、mir-376b和mir-335)、或至少(mir-889、mir-543和mir-1185-1)、或至少(mir-889、mir-543和mir-548k)、或至少(mir-889、mir-543和mir-12135)、或至少(mir-889、mir-543、mir-376b、mir-335和mir-1185-1)在患有结直肠癌和晚期腺瘤的对象的血浆样品中显著上调。从这个意义上来说,如表1所示,至少(mir-889)或至少(mir-889和mir-543)或至少(mir-889和mir-376b)、或至少(mir-889和mir-335)、或至少(mir-889和mir-1185-1)、或至少(mir-889、mir-543和mir-376b)、或至少(mir-889、mir-543和mir-335)、或至少(mir-889、mir-376b和mir-335)、或至少(mir-889、mir-543和mir-1185-1)、或至少(mir-889、mir-543和mir-548k)、或至少(mir-889、mir-543和mir-12135)、或至少(mir-889、mir-543、mir-376b、mir-335和mir-1185-1)的组合。176.在一些实施方案中,本公开的方法可包括向有需要的对象施用治疗(例如,基于患有结肠增殖性病症)。由于结直肠腺瘤可被视为结直肠癌的前兆,因为已知的腺瘤-癌的顺序以及晚期结直肠腺瘤更容易转变为癌症的概念,因此可以对结直肠腺瘤(例如结直肠晚期腺瘤)进行治疗,例如通过结肠镜切除(可以进行后续监测)。结直肠癌的治疗取决于癌症被发现的阶段。早期结直肠癌可通过手术治疗。大约95%的i期和65-80%的ii期结直肠癌可以通过手术治愈。然而,直肠癌可需要额外的放射疗法,以降低复发的风险。晚期(iii期和iv期)治疗通常包括以下疗法的组合,包括:手术、化疗、抗体治疗、抗vegf/r疗法和放疗。结直肠癌对象的治疗可以由wolpin等人,“systemictreatmentofcolorectalcancer,”gastroenterology,第134卷,第5期,2008,第1296-1310.e1页,issn0016-5085来描述,所述文献通过引用整体并入本文。177.可以(例如,从多个可能的治疗选项中)选择治疗,并至少部分基于对象的mirna谱和/或对象的生物学性状集向对象施用治疗。生物学性状可以是测量、诊断、预后或预测(例如,使用训练过的机器学习分类器来确定)。178.在一些实施方案中,生物学性状包括恶性度。在一些实施方案中,生物学性状包括癌症类型。在一些实施方案中,生物学性状包括癌症阶段。在一些实施方案中,生物学性状包括癌症分类。在一些实施方案中,癌症分类包括癌症等级。在一些实施方案中,癌症分类包括组织学分类。在一些实施方案中,生物学性状包括代谢谱。在一些实施方案中,生物学性状包括突变。在一些实施方案中,突变是疾病相关突变。在一些实施方案中,生物学性状包括临床结果。在一些实施方案中,生物学性状包括药物应答。v.分类器、机器学习模型和系统179.在一些实例中,mirna测序特征被用作训练过的算法(例如,机器学习模型或分类器)的输入数据集,以寻找序列组成与对象组(例如患者组)之间的相关性。此类患者组的实例包括疾病或病状的存在或不存在、疾病或病状风险的升高或不升高、疾病或病状的阶段、疾病或病状的亚型、对治疗的应答者与对治疗的无应答者、以及进展者与无进展者。在一些实例中,生成特征矩阵以比较从具有已知条件或特点的对象中获得的样品。在一些实施方案中,样品从健康对象或不具有任何已知适应症的对象获得并且样品从已知患有癌症的患者中获得。180.如本文所用,关于机器学习和模式识别,术语“特征”一般是指被观察现象的单个可测量的特性或特点。“特征”的概念与统计技术中使用的解释变量的概念有关,例如但不限于线性回归和逻辑回归。特征可以是数字的或分类的(例如,结构特征诸如字符串和图表被用于句法模式识别中)。181.如本文所用,术语“输入特征”(或“特征”)一般是指训练过的算法(例如,机器学习模型或分类器)用来预测样品的输出分类(标签)的变量,例如条件、序列内容(例如突变)、建议的数据收集操作或建议的处理。变量的值可以确定为一个样品,并用于确定分类。182.对于多个测定,系统鉴定特征集以输入到训练过的算法(例如,机器学习模型或分类器)中。系统对每个生物样品进行分析,并从测量值形成特征向量。系统将特征向量输入到机器学习模型中,并得到生物样品是否具有指定特性的输出分类。183.在一些实施方案中,机器学习模型输出分类器,所述分类器能够区分对象的两个或更多个组或类别或对象群体中的特征或群体的特征。在一些实施方案中,分类器是训练过的机器学习分类器。184.在一些实施方案中,对癌症组织中生物标志物的信息基因座或特征进行测定,以形成谱。接受者操作特征(roc)曲线可以通过绘制特定特征(例如,本文所述的任何生物标志物和/或任何额外生物医学信息项)在区分两个群体(例如,对治疗剂有应答的个体和无应答的对象)时的表现来生成。在一些实施方案中,跨整个群体(例如,病例和对照)的特征数据是基于单个特征值按升序排序的。185.在一些实例中,指定的特性选自健康与癌症、升高与不升高的疾病风险、疾病亚型、疾病阶段、进展者与非进展者、以及应答者与非应答者。186.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。a.数据分析187.在一些实例中,本公开提供了一种系统、方法或试剂盒,其中数据分析可以在软件应用、计算硬件或这两者中实现。在一些实例中,分析应用或系统包括至少一个数据接收模块、一个数据预处理模块、一个数据分析模块(其可以对一种或多种类型的基因组数据进行操作)、一个数据解释模块或一个数据可视化模块。在一些实施方案中,数据接收模块可包括将实验室硬件或仪器与处理实验室数据的计算机系统连接起来的计算机系统。在一些实施方案中,数据预处理模块可包括硬件系统或计算机软件,其对数据执行操作,以备分析。可应用于预处理模块中的数据的操作的实例包括仿射转换、去噪操作、数据清理、重新格式化或子采样。数据分析模块可专门用于分析来自一个或多个基因组材料的基因组数据,例如,可以获取组装的基因组序列并执行概率和统计分析,以鉴定与疾病、病理、状态、风险、条件或表型相关的异常模式。数据解释模块可以使用分析方法,例如,从统计学、数学或生物学中提取的分析方法,以支持理解已鉴定的异常模式与健康状况、功能状态、预后或风险之间的关系。数据可视化模块可以使用数学建模、计算机图形学或渲染的方法来创建数据的可视化表示,以促进对结果的理解或解释。188.在一些实例中,应用机器学习方法来区分样品群体中的样品。在一些实施方案中,应用机器学习方法来区分健康与晚期疾病(例如腺瘤)样品。189.在一些实施方案中,用于训练预测引擎的一个或多个机器学习操作包括以下中的一个或多个:广义线性模型、广义加性模型、非参数回归操作、随机森林分类器、空间回归操作、贝叶斯回归模型、时间序列分析、贝叶斯网络、高斯网络、决策树学习操作、人工神经网络、循环神经网络、强化学习操作、线性或非线性回归操作、支持向量机、聚类操作和遗传算法操作。190.在一些实例中,计算机处理方法选自逻辑回归、多元线性回归(mlr)、维度减少、偏最小二乘(pls)回归、主成分回归、自编码器、变分自编码器、奇异值分解、傅立叶基、小波、判别分析、支持向量机、决策树、分类和回归树(cart)、基于树的方法、随机森林、梯度推进树、逻辑回归、矩阵分解、多维标度(mds)、维度减少方法、t-分布随机邻域嵌入(t-sne)、多层感知器(mlp)、网络聚类、神经模糊和人工神经网络。191.在一些实例中,本文公开的方法可以包括对来自对象或多个对象的样品的核酸测序数据的计算分析。b.分类器生成192.一方面,所公开的系统和方法提供了一种分类器,它是基于从cfrna生物样品的mirna序列分析衍生的特征信息生成的。分类器形成预测引擎的一部分,用于根据生物样品(诸如cfdna)中鉴定的序列特征在群体中区分各组。193.在一些实施方案中,通过以下步骤来创建分类器:将序列信息的相似部分格式化为统一的格式和统一的规模来对序列信息进行归一化;将归一化的序列信息存储在列式数据库中;通过对所存储的归一化序列信息应用一个或多个机器学习操作,预测引擎针对特定群体映射一个或多个特征的组合,来训练预测引擎;将预测引擎应用于所访问的字段信息,以鉴定与组相关的对象;以及将对象归为一个组。194.如本文所用的特异性一般是指“在没有患病的个体中,检测结果为阴性的概率”。它可以用检测结果为阴性的无病人数除以无病对象的总数来计算。195.在一些实例中,模型、分类器或预测检验具有以下特异性:至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。196.如本文所用的敏感性一般是指“在患病的个体中,检测结果为阳性的概率”。它可以用检测结果为阳性的患病对象数量除以患病对象的总数来计算。197.在一些实例中,模型、分类器或预测检验具有以下敏感性:至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。c.数字处理装置198.在一些实例中,本文所述的主题可以包括数字处理装置或其用途。在一些实例中,数字处理装置可以包括一个或多个执行装置功能的硬件中央处理单元(cpu)、图形处理单元(gpu)或张量处理单元(tpu)。在一些实例中,数字处理装置可以包括被配置用于执行可执行指令的操作系统。199.在一些实例中,数字处理装置可以任选地连接到计算机网络。在一些实例中,数字处理装置可以任选地连接到互联网。在一些实例中,数字处理装置可以任选选地连接到云计算设施。在一些实例中,数字处理装置可以任选地连接到内联网。在一些实例中,数字处理装置可以任选地连接到数据存储装置。200.合适的数字处理装置的非限制性实例包括服务器计算机、台式计算机、膝上型计算机、笔记本计算机、子笔记本计算机、上网本计算机、上网板计算机、机顶盒计算机、手持计算机、互联网电器、移动智能手机和平板计算机。合适的平板计算机可以包括例如具有小册子、笔记板和可转换配置的那些。201.在一些实例中,数字处理装置可以包括被配置用于执行可执行指令的操作系统。举例来说,操作系统可以包括软件,包括程序和数据,用于管理装置的硬件并为应用的执行提供服务。操作系统的非限制性实例包括ubuntu、freebsd、openbsd、linux、macosxwindows和合适的个人计算机操作系统的非限制性实例包括合适的个人计算机操作系统的非限制性实例包括macos和unix样操作系统,诸如在一些实例中,操作系统可由云计算提供,并且云计算资源可由一个或多个服务提供商提供。202.在一些实例中,装置可以包括存储和/或存储器装置。存储和/或存储器装置可以是用于暂时或永久地存储数据或程序的一个或多个物理设备。在一些实例中,装置可以是易失性存储器,并且需要电力来维持存储的信息。在一些实例中,装置是非易失性存储器,并且在数字处理装置不通电时保留所存储的信息。在一些实例中,非易失性存储器可以包括闪速存储器。在一些实例中,非易失性存储器可以包括动态随机存取存储器(dram)。在一些实例中,非易失性存储器可以包括铁电随机存取存储器(fram)。在一些实例中,非易失性存储器可以包括相变随机存取存储器(pram)。203.在一些实例中,装置可以是存储装置,包括例如cd-rom、dvd、闪速存储器装置、磁盘驱动器、磁带驱动器、光盘驱动器和基于云计算的存储。在一些实例中,存储和/或存储器装置可以是诸如本文公开的那些装置的组合。在一些实例中,数字处理装置可以包括向用户发送视觉信息的显示器。在一些实例中,显示器可以是阴极射线管(crt)。在一些实例中,显示器可以是液晶显示器(lcd)。在一些实例中,显示器可以是薄膜晶体管液晶显示器(tft-lcd)。在一些实例中,显示器可以是有机发光二极管(oled)显示器。在一些实例中,oled显示器可以是无源矩阵oled(pmoled)或有源矩阵oled(amoled)显示器。在一些实例中,显示器可以是等离子体显示器。在一些实例中,显示器可以是视频投影仪。在一些实例中,显示器可以是诸如本文所公开的那些装置的组合。204.在一些实例中,数字处理装置可以包括从用户接收信息的输入装置。在一些实例中,输入装置可以是键盘。在一些实例中,输入装置可以是定点装置,包括例如鼠标、轨迹球、轨迹板、操纵杆、游戏控制器或触控笔。在一些实例中,输入装置可以是触摸屏或多点触摸屏。在一些实例中,输入装置可以是麦克风,用于捕获语音或其他声音输入。在一些实例中,输入装置可以是摄像机,用于捕捉运动或视觉输入。在一些实例中,输入装置可以是诸如本文公开的那些的装置的组合。d.非暂时性计算机可读存储介质205.在一些实例中,本文所公开的主题可以包括一种或多种非暂时性计算机可读存储介质,所述存储介质用包含可由任选的网络数字处理装置的操作系统可执行的指令的程序编码。在一些实例中,计算机可读存储介质可以是数字处理装置的有形组件。在一些实例中,计算机可读存储介质可以任选地是可从数字处理装置移除的。在一些实例中,计算机可读存储介质可以包括例如cd-rom、dvd、闪速存储器装置、固态存储器、磁盘驱动器、磁带驱动器、光盘驱动器、云计算系统和服务等。在一些实例中,程序和指令可以永久地、大体上永久地、半永久地或非暂时性地编码在介质上。e.计算机系统206.本公开提供了被编程以实现本文所述的方法的计算机系统。图1示出了计算机系统101,它被编程或以其他方式配置以存储、处理、鉴定或解释患者数据、生物数据、生物序列和参考序列。计算机系统101可以处理本公开的患者数据、生物数据、生物序列或参考序列的各个方面。计算机系统101可以是用户的电子装置或位于电子装置远端的计算机系统。电子装置可以是移动电子装置。207.计算机系统101包括中央处理单元(cpu,本文中也称为“处理器”和“计算机处理器”)105,其可以是单核或多核处理器,或者用于并行处理的多个处理器。计算机系统101还包括存储器或存储位置110(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元115(例如,硬盘)、用于与一个或多个其他系统通信的通信接口120(例如,网络适配器)以及外围装置125,诸如高速缓存、其他存储器、数据存储和/或电子显示适配器。存储器110、存储单元115、接口120和外围装置125通过通信总线(实线)(诸如主板)与cpu105通信。存储单元115可以是用于存储数据的数据存储单元(或数据储存库)。借助于通信接口120,计算机系统101可以可操作地耦合到计算机网络(“网络”)130。网络130可以是因特网、互联网和/或外联网,或者与因特网通信的内联网和/或外联网。在一些实例中,网络130是电信和/或数据网络。网络130可以包括一个或多个计算机服务器,其可以实现分布式计算,诸如云计算。在一些实例中,借助于计算机系统101,网络130可以实现点对点网络,这可以使耦合到计算机系统101的装置表现为客户端或服务器。208.cpu105可以执行一系列机器可读的指令,这些指令可以体现在程序或软件中。指令可以存储在存储器位置(诸如存储器110)中。指令可以被引导到cpu105,其可随后编程或以其他方式配置cpu105以实施本公开的方法。由cpu105进行的操作的实例可以包括提取、解码、执行和写回。209.cpu105可以是电路(诸如集成电路)的一部分。系统101的一个或多个其他部件可以包括在电路中。在一些实例中,电路是专用集成电路(asic)。210.存储单元115可以存储文件,诸如驱动程序、库和保存的程序。存储单元115可以存储用户数据,例如,用户偏好和用户程序。在一些实例中,计算机系统101可以包括计算机系统101外部的一个或多个附加数据存储单元,诸如位于通过内联网或互联网与计算机系统101通信的远程服务器上。211.计算机系统101可以通过网络130与一个或多个远程计算机系统通信。例如,计算机系统101可以与用户的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式pc)、平板(slate/tablet)pc(例如,ipad、galaxytab)、电话、智能手机(例如,iphone、支持安卓的装置、)或个人数字助理。用户可以经由网络130访问计算机系统101。212.如本文所述的方法可以通过存储在计算机系统101的电子存储位置上(例如像,存储在存储器110或电子存储单元115上)的机器(例如,计算机处理器)可执行代码来实现。可以用软件的形式提供机器可执行或机器可读代码。在使用期间,代码可由处理器105执行。在一些实例中,代码可以从存储单元115中取回并存储在存储器110上以供处理器105访问。在一些实例中,可以排除电子存储单元115,而将机器可执行指令存储在存储器110上。213.代码可以被预编译和配置成与具有适于执行代码的处理器的机器一起使用,或者可以在运行时解释或编译。可以用编程语言提供代码,可以选择所述编程语言以使代码能够以预编译、解释或即时编译(as-compiled)的方式执行。214.本文提供的系统和方法的方面,诸如计算机系统101,可以在编程中体现。所述技术的各个方面可以被认为是“产品”或“制品”,通常是机器(或处理器)可执行代码和/或相关数据的形式,其被承载或包含在一种类型的机器可读介质中。机器可执行代码可以存储在电子存储单元诸如存储器(例如,只读存储器、随机存取存储器、闪速存储器)或硬盘上。“存储”类型的介质可以包括计算机、处理器等的任何或所有有形存储器或其相关模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,它们可以在任何时候为软件编程提供非暂时性存储。软件的全部或部分有时可以通过互联网或各种其他电信网络进行通信。例如,此类通信可以使得能够将软件从一台计算机或处理器加载到另一台计算机或处理器中,例如,从管理服务器或主计算机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一种类型的介质包括光、电和电磁波,诸如通过有线和光学陆线网络以及各种空中链路在本地装置之间的物理接口上使用的。携带此类波的物理元件,诸如有线或无线链路、光链路等,也可以被认为是承载软件的介质。如本文所用,除非限于非暂时性的、有形的“存储”介质,否则诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。215.因此,机器可读介质(诸如计算机可执行代码)可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如,光盘或磁盘,如任何一个或多个计算机等中的任何存储装置,诸如可以用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,诸如这种计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的电线。载波传输介质可以采取电信号或电磁信号的形式,或者声波或光波的形式,如在射频(rf)和红外(ir)数据通信期间产生的那些声波或光波。因此,计算机可读介质的常见形式包括例如:软盘、软磁盘、硬盘、磁带、任何其他磁介质、cd-rom、dvd或dvd-rom、任何其他光学介质、穿孔卡片纸带、具有孔图案的任何其他物理存储介质、ram、rom、prom和eprom、flash-eprom、任何其他存储芯片或盒式磁带、传输数据或指令的载波、传输这种载波的电缆或链路,或者计算机可以从中读取编程代码和/或数据的任何其他介质。这些形式的计算机可读介质中的许多可以涉及将一个或多个指令的一个或多个序列传送到处理器以供执行。216.计算机系统101可以包括电子显示器135或与电子显示器135通信,所述电子显示器135包括用户界面(ui)140,以用于提供例如核酸序列、浓缩的核酸样品、mirna谱、表达谱、以及rna表达谱的分析。ui的实例包括但不限于图形用户界面(gui)和基于网络的用户界面。217.本公开的方法和系统可以通过一种或多种算法来实现。算法可以在由中央处理单元105执行时通过软件来实现。例如,算法可以存储、处理、鉴定或解释患者数据、生物数据、生物序列和参考序列。218.在一些实例中,本文所公开的主题可以包括至少一个计算机程序或其用途。计算机程序可以是在数字处理装置的cpu、gpu或tpu中执行、被编写以执行指定任务的指令序列。计算机可读指令可被实现为执行特定任务或实现特定抽象数据类型的程序模块,诸如函数、对象、应用编程接口(api)、数据结构等。鉴于本文提供的公开内容,计算机程序能够以各种版本的各种语言编写。219.在各种环境中,可以根据需要对计算机可读指令的功能进行组合或分配。在一些实例中,计算机程序可以包括一个指令序列。在一些实例中,计算机程序可以包括多个指令序列。在一些实例中,计算机程序可以由一个位置提供。在一些实例中,计算机程序可以由多个位置提供。在一些实例中,计算机程序可以包括一个或多个软件模块。在一些实例中,计算机程序可以部分或整体地包括一个或多个网络应用、一个或多个移动应用、一个或多个独立应用、一个或多个网络浏览器插件、扩展项、加载项或附加项、或其组合。220.在一些实例中,计算机处理可以是统计学、数学、生物学或其任何组合的方法。在一些实例中,计算机处理方法包括维度减少方法,例如,包括逻辑回归、维度减少、主成分分析、自编码器、奇异值分解、傅立叶基、奇异值分解、小波、判别分析、支持向量机、基于树的方法、随机森林、梯度推进树、逻辑回归、矩阵分解、网络聚类和神经网络。221.在一些实例中,计算机处理方法是有监督的机器学习方法,包括例如回归、支持向量机、基于树的方法和网络。222.在一些实例中,计算机处理方法是无监督的机器学习方法,包括例如聚类、网络、主成分分析和矩阵分解。f.数据库223.在一些实例中,本文公开的主题可以包括一个或多个数据库,或使用所述数据库存储患者数据、生物数据、生物序列或参考序列的用途。参考序列可以从数据库中衍生。鉴于本文提供的公开内容,许多数据库可以适用于存储和检索序列信息。在一些实例中,合适的数据库可以包括例如关系数据库、非关系数据库、面向对象的数据库、对象数据库、实体-关系模型数据库、关联数据库以及xml数据库。在一些实例中,数据库可以是基于互联网的。在一些实例中,数据库可以是基于网络的。在一些实例中,数据库可以是基于云计算的。在一些实例中,数据库可以是基于一个或多个本地计算机存储装置。224.一方面,本公开提供了一种非暂时性计算机可读介质,其包括指导处理器执行本文公开的方法的指令。225.一方面,本公开提供了一种包括计算机可读介质的计算装置。226.在另一方面,本公开提供了一种用于对生物样品进行分类的系统,其包括:a)接收多个训练样品的接收器,所述多个训练样品中的每个具有多个类别的分子,其中所述多个训练样品中的每个包含一个或多个已知标记,b)特征模块,用于鉴定与测定相对应的可操作的特征集,以便为多个训练样品中的每个输入到机器学习模型中,其中特征集对应于多个训练样品中的分子特性,其中对于多个训练样品中的每个,所述系统可操作以使训练样品中的多个类别的分子进行多个不同的测定,以获得测量值集,其中每个测量值集都来自于对训练样品中的一类分子进行的一次测定,其中为多个训练样品获取多个测量值集,c)分析模块,用于对测量值集进行分析,以得到训练样品的训练向量,其中训练向量包括对应测定的n个特征集的特征值,每个特征值对应于一个特征并包括一个或多个测量值,其中训练向量使用来自与多个不同测定的第一子集相对应的n个特征集中的至少两个的至少一个特征而形成,d)标记模块,用于使用机器学习模型的参数通知系统关于训练向量的信息,以便为多个训练样品获取输出标记,e)比较器模块,用于将输出标记与训练样品的已知标记相比较,f)训练模块,用于基于将输出标记与训练样品的已知标记进行比较迭代搜索参数的最优值作为训练机器学习模型的一部分,以及g)输出模块,用于提供机器学习模型的参数和机器学习模型的特征集。vi.对群体中的对象进行分类的方法227.所公开的方法涉及通过在对象中所表达的mirna的分析来确定与结肠细胞增殖性病症相关的基因组dna表达的参数。所述方法用于改进结肠细胞增殖性病症的诊断、治疗和监测,更具体地说,是通过改进所述病症的阶段或亚类与所述病症的遗传易感性之间的鉴定和鉴别。228.在一些实施方案中,所述方法包括分析来自群体中对象的生物样品中的mirna的差异表达。229.本公开提供了一种用于检测结肠细胞增殖性病症的方法,其可应用于无细胞样品,例如,以检测有与没有结肠细胞增殖性病症的对象之间的差异表达的无细胞mirna。与没有结肠细胞增殖性病症的健康对象相比,所述方法利用mirna的检测作为结肠细胞增殖性病症信号的基本“阳性”或“阴性”。230.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。231.一方面,本公开提供了一种用于确定来自对象的生物样品的mirna谱的方法,所述方法包括:a)从生物样品中分离rna;b)在rna逆转录为cdna之前或之后,将rna衔接子连接到生物样品的核酸上;c)扩增步骤b)的cdna;d)确定cdna分子的核酸序列,以及e)将所述核酸分子的核酸序列与选自表1-11中列出的组的预先鉴定的mirna小组的参考核酸序列比对,以确定对象的mirna谱。232.在一些实施方案中,核酸测序文库在扩增之前制备。233.在一些实施方案中,衔接子连接包括c)之前的rna衔接子连接、衔接子阻断、衔接子环化以及二聚体去除。234.在一些实施方案中,所述参考核酸序列是人类基因组或人类转录组数据库的一部分。235.在一些实施方案中,确定对象的mirna谱包括生成所表达的mirna的计数表。236.在一些实施方案中,确定对象的mirna谱包括生成所表达的mirna的计数表,以鉴定差异丰富的mirna。237.在一些实施方案中,mirna谱与结肠细胞增殖性病症相关,并提供将对象分类为患有结肠细胞增殖性病症的分类。238.在一些实施方案中,从对象中获得的生物样品选自:体液、粪便、结肠排出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞及其组合。239.在一些实施方案中,所述方法包括将从对象测量的mirna特征小组与从健康对象测量的mirna特征小组的数据库进行对比,其中所述数据库存储在计算机系统中;通过测量到与健康对象的mirna状态相比在mirna特征小组中有至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的变化来确定所述对象患结肠细胞增殖性病症的风险增加。240.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。241.在一些实施方案中,结肠细胞增殖性病症选自1期结直肠癌、2期结直肠癌、3期结直肠癌和4期结直肠癌。242.在另一方面,本公开提供了一种用于检测对象中的结肠细胞增殖性病症的方法,所述方法包括:a)从生物样品中分离rna;b)将rna衔接子连接到生物样品的rna上,并将所述rna逆转录为cdna;c)扩增步骤b)的cdna;d)确定cdna分子的核酸序列,以及e)将选自表1-11中列出的组的预先鉴定的mirna小组的核酸序列进行比对以确定对象的mirna谱,以及f)将所述mirna谱输入到机器学习模型中,所述机器学习模型被训练为能够区分健康对象与患有结肠细胞增殖性病症的对象,以提供与存在结肠细胞增殖性病症相关的输出值,从而指示所述对象中结肠细胞增殖性病症的存在。243.在一些实施方案中,所述参考核酸序列是人类基因组或人类转录组数据库的一部分。244.在一些实施方案中,确定对象的mirna谱包括生成所表达的mirna的计数表。245.在一些实施方案中,确定对象的mirna谱包括生成所表达的mirna的计数表,以鉴定差异丰富的mirna。246.在一些实施方案中,将mirna谱输入到机器学习模型中,以获得能够判别两组对象(例如,健康与癌症、疾病阶段、晚期腺瘤与癌症)的分类器。247.在一些实施方案中,从对象中获得的生物样品选自体液、粪便、结肠排出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞及其组合。248.在一些实施方案中,所述方法包括将从对象测量的mirna特征小组与从健康对象测量的mirna特征小组的数据库进行对比,其中所述数据库存储在计算机系统中;通过测量到与健康对象的mirna状态相比在mirna特征小组的mirna表达中有至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%的变化来确定所述对象患结肠细胞增殖性病症的风险增加。249.在一些实施方案中,结肠细胞增殖性病症选自:腺瘤(腺瘤性息肉)、无蒂锯齿状腺瘤(ssa)、晚期腺瘤、结直肠发育不良、结直肠腺瘤、结直肠癌、结肠癌、直肠癌、结直肠癌、结直肠腺癌、类癌瘤、胃肠道类癌瘤、胃肠道间质瘤(gist)、淋巴瘤和肉瘤。250.在一些实施方案中,结肠细胞增殖性病症选自1期结直肠癌、2期结直肠癌、3期结直肠癌和4期结直肠癌。251.本文所述的训练过的机器学习方法、模型和判别分类器可以应用于各种医疗应用,包括癌症检测、诊断和治疗应答性。由于模型可以用对象元数据和分析物衍生的特征来训练,所以应用可以进行定制,以对群体中的对象进行分层,并相应地指导治疗决策。诊断252.本文提供的方法和系统可以使用基于人工智能的方法执行预测分析,以分析从对象(患者)获取的数据,从而生成对患癌(例如,结直肠癌,crc)对象的诊断输出。例如,所述应用可以对所获取的数据应用预测算法,以生成对患癌对象的诊断。预测算法可以包括基于人工智能的预测器,诸如基于机器学习的预测器,其被配置来处理所获取的数据,以生成对患癌对象的诊断。253.机器学习预测器可以使用数据集来训练,例如,使用本文所述的特征小组对来自一个或多个患癌患者队列集的对象生物样品进行rna测定生成的数据集作为输入,和对象的已知诊断(例如,分期和/或肿瘤分数)结果作为机器学习预测器的输出。254.训练数据集(例如,使用本文所述的特征小组对对象生物样品进行甲基化测定而生成的数据集)可以从例如具有共同特点(特征)和结果(标记)的一个或多个对象集生成。训练数据集可以包括与诊断相关的特征相对应的特征和标记集。特征可以包括一些特点,例如像cfrna测定测量的某些范围或类别,诸如从健康和疾病样品获得的生物样品中重叠或落在参考基因组的箱(基因组窗口)集的每个中的cfrna或其片段的计数。例如,在给定的时间点从给定的对象收集的特征集可以共同充当诊断特征,这可指示在给定的时间点对象患有已鉴定的癌症。特点还可以包括指示对象诊断结果(诸如一种或多种癌症)的标记。255.标记可以包括结果,例如对象的已知诊断(例如,分期和/或肿瘤分数)结果。结果可以包括与对象的癌症相关的特点。例如,特点可指示对象患有一种或多种癌症。256.训练集(例如,训练数据集)可以通过对与一个或多个对象集(例如,患有或未患有一种或多种癌症的回顾性和/或前瞻性患者队列)相对应的一个数据集的随机采样来选择。可替代地,训练集(例如,训练数据集)可以通过对与一个或多个对象集(例如,患有或未患有一种或多种癌症的回顾性和/或前瞻性患者队列)相对应的一个数据集的比例采样来选择。训练集可以在与一个或多个对象集(例如,来自不同临床地点或试验的患者)相对应的数据集之间进行平衡。可以对机器学习预测器进行训练,直到满足某些预先确定的准确性或性能条件,诸如具有与诊断准确性度量相对应的最小期望值。例如,诊断准确性度量可以对应于对对象的一种或多种癌症的诊断、分期或肿瘤分数的预测。257.诊断准确性度量的实例可以包括与检测或预测癌症(例如,结直肠癌)的诊断准确性相对应的敏感性、特异性、阳性预测值(ppv)、阴性预测值(npv)、准确性以及接受者操作特征(roc)曲线的曲线下面积(auc)。258.一方面,本公开提供了一种使用能够区分对象群体的分类器的方法,所述方法包括:a)测定生物样品中的rna,其中所述测定提供了代表生物样品中的rna的测量值集,b)鉴定与生物样品中的rna的特性相对应的特征集,以输入机器学习或统计模型中,c)从多个测量值集中的每个制备特征值的特征向量,每个特征值对应于所述特征集的一个特征并包括一个或多个测量值,其中所述特征向量包括使用所述多个测量值集中的每个集获得的至少一个特征值,d)将包括分类器的机器学习模型加载到计算机系统的存储器中,所述机器学习模型使用从以下中获得的训练向量来训练:训练生物样品、被鉴定为具有指定特性的训练生物样品的第一子集和被鉴定为不具有指定特性的训练生物样品的第二子集,e)将特征向量输入到机器学习模型中,以获得生物样品是否具有指定特性的输出分类,从而区分具有指定特性的对象群体。259.在另一方面,本公开提供了一种用于鉴定对象的癌症的方法,所述方法包括:a)从生物样品中分离rna;b)将rna衔接子连接到生物样品的rna上,并将所述rna逆转录为cdna;c)扩增步骤b)的cdna;d)确定cdna分子的核酸序列,以及e)将所述核酸分子的核酸序列与选自表1-11中列出的组的预先鉴定的mirna小组的参考核酸序列比对,以确定对象的mirna谱,f)将mirna谱输入到机器学习模型中,所述机器学习模型被训练为能够区分健康对象与患有结肠细胞增殖性病症的对象,以提供与存在结肠细胞增殖性病症相关的输出值,从而指示对象中结肠细胞增殖性病症的存在以生成所述对象患有所述癌症的可能性。260.在一些实施方案中,所述至少约10个不同的mirna包含至少约20个不同的mirna,所述至少约20个不同的mirna中的每个包含表1-11中列出的mirna的至少一部分。在一些实例中,所述至少约10个不同的mirna包含至少约30个不同的mirna,所述至少约30个不同的mirna中的每个包含表1-11中列出的mirna的至少一部分。261.一些实施方案提供了患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的高风险(特别是当对象具有胰腺病变时)的对象的样品中差异表达的mirna谱。在患有结肠细胞增殖性病症或具有发展结肠细胞增殖性病症的高风险的对象的样品中差异表达的mirna谱包括使用上调/过表达的mirna谱和下调或低表达的mirna谱。262.在一些实施方案中,用于检测对象中结肠细胞增殖性病症的存在或发展结肠细胞增殖性病症的高风险的方法包括:a)检测对象的样品中一个或多个mirna的表达水平;以及b)将检测到的表达水平与参考表达水平进行比较,其中与参考表达水平相比,样品中一个或多个mirna的差异表达分别指示存在结肠细胞增殖性病症或发展结肠细胞增殖性病症的风险较高,相对于不存在结肠细胞增殖性病症或发展结肠细胞增殖性病症的风险较低。263.与参考表达水平相比,样品中一个或多个mirna的差异表达可以指示结肠细胞增殖性病症的前兆。264.在一些实施方案中,样品是组织样品,并且所述一个或多个mirna属于与发展结肠细胞增殖性病症风险较低的对象的相应细胞相比在发展结肠细胞增殖性病症风险较高的对象的细胞中差异表达的mirna谱。265.在一些实施方案中,对象具有结直肠病变,并且所述一个或多个mirna属于与具有胰腺病变并且发展结肠细胞增殖性病症风险较低的对象的相应样品相比在具有结直肠病变并且发展结肠细胞增殖性病症风险较高的对象的样品中差异表达的mirna谱。266.一些方法可以用于检测样品中一个或多个mirna的表达水平。例如,mirna的测量可以通过基于条形码的测定、mirna微阵列分析(例如芯片)、数字聚合酶链式反应(pcr)、实时pcr、定量逆转录pcr(qrt-pcr)、半定量pcr、rna印迹或原位杂交进行。例如,成熟mirna是例如使用体外测定测量的。267.可以使用多种统计和数学方法来建立表达的阈值或截止水平。可以例如基于来自受试者工作特征(roc)绘图的数据(诸如在本公开的实施例和图中所述)来选择特定生物标志物的阈值或截止表达水平。在一些实施方案中,这些阈值或截止表达水平可以例如通过沿着特定生物标志物或其组合的roc绘图移动而变化,以获得不同的敏感性或特异性值,从而影响总体测定性能。例如,如果目标是从临床角度有一个可靠的诊断方法,则高敏感性应该优先考虑。然而,如果目标是有一个具有成本效益的方法,则高特异性应该优先考虑。最佳截止是指从roc绘图中获得的产生最佳敏感性和特异性的特定生物标志物的值。敏感性和特异性值在阈值(截止)范围内计算。因此,可以选择阈值或截止值以使得敏感性和/或特异性在至少60%被分析的患者群中或在至少65%、70%、75%或80%被分析的患者群中为至少约70%,并且可以为例如至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少100%。268.因此,本公开的一些实施方案可以通过以下步骤进行:确定从待诊断或筛查的对象分离的微创样品中先前引用的至少微小rna的表达水平,以及将所述微小rna的表达水平与预先确定的阈值或截止值进行比较,其中所述预先确定的阈值或截止值对应于所述微小rna的表达水平,所述表达水平在roc曲线中与所需敏感性下的最高特异性相关,所述roc曲线是基于在具有患结直肠癌或结直肠腺瘤风险的患者群体中确定的微小rna表达水平计算的,其中至少一种所述微小rna相对于所述预先确定的截止值的过表达以所述所需敏感性指示对象患有结直肠癌或结直肠腺瘤。269.作为另一个实例,这种预先确定的条件可以是预测结肠细胞增殖性病症的特异性具有以下值:例如,至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%。270.作为另一个实例,这种预先确定的条件可以是预测结肠细胞增殖性病症的阳性预测值(ppv)具有以下值:例如,至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%。271.作为另一个实例,这种预先确定的条件可以是预测结肠细胞增殖性病症的阴性预测值(npv)具有以下值:例如,至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%。272.作为另一个实例,这种预先确定的条件可以是预测结肠细胞增殖性病症的接受者操作特征(roc)曲线的曲线下面积(auc)具有以下值:至少约0.50、至少约0.55、至少约0.60、至少约0.65、至少约0.70、至少约0.75、至少约0.80、至少约0.85、至少约0.90、至少约0.95、至少约0.96、至少约0.97、至少约0.98、或至少约0.99。治疗应答性273.本文所述的预测分类器、系统和方法可以应用于对个体群体进行分类,以用于多种临床应用(例如,基于使用本文所述的特征小组对个体的生物样品进行rna测定)。此类临床应用的实例包括:检测早期癌症、诊断癌症、将癌症分类为特定的疾病阶段、确定对治疗癌症的治疗剂的应答性或抗性。274.本文所述的方法和系统可以应用于结肠细胞增殖性病症的特点,诸如等级和阶段。因此,在本系统和方法中可以使用分析物与测定的组合来预测不同组织中不同癌症类型的癌症治疗剂的应答性,并根据治疗应答性对对象进行分类。在一些实施方案中,本文所述的分类器能够将一组对象分层为治疗应答者与非应答者。275.在另一方面,本公开提供了一种用于监测先前针对疾病进行治疗的对象中的微小残留疾病的方法,所述方法包括:确定如本文所述的mirna谱作为基线mirna状态,并重复分析以确定在一个或多个预先确定的时间点的mirna谱,其中与基线相比的变化指示对象中基线处微小残留疾病的变化。276.在一些实施方案中,微小残留疾病选自对治疗的反应、肿瘤负荷、术后残留肿瘤、复发、二次筛查、一次筛查和癌症进展。277.在另一方面,提供了一种用于确定对治疗的反应的方法。278.在另一方面,提供了一种用于监测肿瘤负荷的方法。279.在另一方面,提供了一种用于检测术后残留肿瘤的方法。280.在另一方面,提供了一种用于检测复发的方法。281.在另一方面,提供了一种用作二次筛查的方法。282.在另一方面,提供了一种用作一次筛查的方法。283.在另一方面,提供了一种用于监测癌症进展的方法。284.本公开还提供了一种用于确定目标病状或疾病的药物靶标(例如,与特定类别相关或对于特定类别重要的基因)的方法,所述方法包括:评估从对象获得的样品中至少一种基因的基因表达水平;以及使用邻域分析程序,确定与样品分类相关的基因,从而确定一个或多个与分类相关的药物靶标。285.本公开还提供了一种用于确定被设计来治疗疾病类别的药物的功效的方法,所述方法包括:从患有所述疾病类别的个体获得样品;使样品经受药物作用;评估药物暴露样品中至少一种基因的基因表达水平;以及使用加权投票方案建立的计算机模型,根据样品相对于模型的相对基因表达水平的函数,将药物暴露样品分类为一类疾病。286.本公开还提供了一种用于确定被设计来治疗疾病类别的药物的功效的方法,其中个体曾经由所述药物的作用,所述方法包括从经由药物作用的个体获得样品;评估样品中至少一种基因的基因表达水平;以及使用加权投票方案建立的模型,将样品分类为一类疾病,包括与模型的基因表达水平相比评估样品的基因表达水平。287.本公开还提供了一种确定对象是否属于表型类别(例如,智力、对治疗的反应、寿命长短、病毒性感染或肥胖的可能性)的方法,所述方法包括:从对象获得样品;评估样品中至少一种基因的基因表达水平;以及使用加权投票方案建立的模型,将样品分类为一类疾病,包括与模型的基因表达水平相比评估样品的基因表达水平。288.一方面,本文所述的与基于治疗应答性对群体分类相关的系统和方法是指使用dna损伤剂、dna修复靶向疗法、dna损伤信号传导抑制剂、dna损伤诱导细胞周期阻滞抑制剂和间接导致dna损伤的过程抑制等类别的化疗剂治疗的癌症,但不限于这些类别。这些化疗剂中的每一种都可以被认为是“dna损伤治疗剂”,如本文使用的术语一样。289.基于患者的分析物数据,可以将患者分类为高风险和低风险患者组,诸如临床复发风险高或低的患者,并且结果可以用于确定治疗过程。例如,被确定为高风险患者的患者可以在手术后用辅助化疗进行治疗。对于被视为低风险患者的患者,手术后可以停止辅助化疗。因此,在一些方面,本公开提供了一种用于制备指示复发风险的结肠癌肿瘤的基因表达谱的方法。290.在一些实例中,本文所述的分类器能够在对治疗有应答者与无应答者之间对对象群体进行分层。291.在另一方面,本文公开的方法可以应用于涉及癌症检测或监测的临床应用。292.在一些实施方案中,本文公开的方法可以用于确定和/或预测对治疗的反应。监测结直肠癌293.在使用训练过的算法处理数据集后,可以在对象中鉴定或监测结直肠癌。所述鉴定可以至少部分基于结直肠癌相关mirna小组上的数据集序列读取的定量度量(例如,rna转录本的定量度量)。例如,监测可以包括在两个或更多个不同时间点中的每个处评估对象的结直肠癌。294.在一些实施方案中,本文公开的方法可以用于监测和/或预测肿瘤负荷。295.在一些实施方案中,本文公开的方法可以用于检测和/或预测术后残留肿瘤。296.在一些实施方案中,本文公开的方法可以用于检测和/或预测治疗后的微小残留疾病。297.在一些实施方案中,本文公开的方法可以用于检测和/或预测复发。298.一方面,本文公开的方法可以用作二次筛查。299.一方面,本文公开的方法可以用作一次筛查。300.一方面,本文公开的方法可以用于监测癌症发展。301.一方面,本文公开的方法可以用于监测和/或预测癌症风险。302.可以用以下准确性在对象中鉴定结直肠癌:至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更大。通过训练过的算法鉴定结直肠癌的准确性可以计算为独立测试样品(例如,已知患有结直肠癌的对象或结直肠癌临床测试结果为阴性的对象)被正确鉴定或分类为患有或未患有结直肠癌的百分比。303.可以用以下阳性预测值(ppv)在对象中鉴定结直肠癌:至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更大。使用训练过的算法鉴定结直肠癌的ppv可以计算为被鉴定或分类为患有结直肠癌的无细胞生物样品与真正患有结直肠癌的对象相对应的百分比。304.可以用以下阴性预测值(npv)在对象中鉴定结直肠癌:至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更大。使用训练过的算法鉴定结直肠癌的npv可以计算为被鉴定或分类为未患有结直肠癌的无细胞生物样品与真正未患有结直肠癌的对象相对应的百分比。305.可以用以下临床敏感性在对象中鉴定结直肠癌:至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%或更大。使用训练过的算法鉴定结直肠癌的临床敏感性可以计算为与存在结直肠癌相关的独立测试样品(例如,已知患有结直肠癌的对象)被正确鉴定或分类为患有结直肠癌的百分比。306.可以用以下临床特异性在对象中鉴定结直肠癌:至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%或更大。使用训练过的算法鉴定结直肠癌的临床特异性可以计算为与不存在结直肠癌相关的独立测试样品(例如,结直肠癌临床测试结果为阴性的对象)被正确鉴定或分类为未患有结直肠癌的百分比。307.在一些实施方案中,训练过的算法可以确定对象患结直肠癌的风险为至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更大。308.训练过的算法可以确定对象患结直肠癌的风险,准确性至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%或更大。309.在鉴定对象患有结直肠癌后,可以为对象任选地提供治疗性干预(例如,为对象开出治疗结直肠癌的适当治疗过程)。治疗性干预可以包括开出有效剂量的药物、对结直肠癌的进一步测试或评估、对结直肠癌的进一步监测或其组合。如果对象目前正在以一个治疗过程接受结直肠癌的治疗,则治疗性干预可以包括后续的不同治疗过程(例如,由于当前治疗过程无效而增加治疗功效)。310.治疗性干预可以包括建议对象进行二次临床测试,以确认结直肠癌的诊断。此二次临床测试可以包括成像测试、血液测试、计算机断层(ct)扫描、磁共振成像(mri)扫描、超声扫描、胸部x光、正电子发射断层(pet)扫描、pet-ct扫描、无细胞生物细胞学、fit测试、fobt试验或其任何组合。311.可以在一段时间内评估结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本的定量度量),以监测患者(例如,患有结直肠癌或正在接受结直肠癌治疗的对象)。在这种情况下,患者数据集的定量度量可以在治疗过程中发生变化。例如,对因有效治疗而降低结直肠癌风险的患者数据集的定量度量可以转向健康对象(例如,未患有结直肠癌的对象)的图谱或分布。相反,例如,由于治疗无效而导致结直肠癌风险增加的患者数据集的定量度量可以转向结直肠癌风险更高或更晚期结直肠癌的对象的图谱或分布。312.通过对治疗对象的结直肠癌的治疗过程的监测,可以监测对象的结直肠癌。监测可以包括在两个或更多个时间点评估对象的结直肠癌。所述评估可以至少基于在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括在两个或更多个时间点中的每个处确定的结直肠癌相关基因组基因座小组的定量度量。313.在一些实施方案中,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括在两个或更多个时间点之间确定的结直肠癌相关基因组基因座小组的定量度量的差异,可以指示一个或多个临床指示,诸如:(i)对象的结直肠癌诊断;(ii)对象的结直肠癌预后;(iii)对象患结直肠癌的风险增加;(iv)对象患结直肠癌的风险降低;(v)治疗对象的结直肠癌的治疗过程有效;以及(vi)治疗对象的结直肠癌的治疗过程无效。314.在一些实施方案中,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括在两个或更多个时间点之间确定的结直肠癌相关基因组基因座小组的定量度量的差异,可以指示对象结直肠癌的诊断。例如,如果对象在较早的时间点没有检测到结直肠癌,但在较晚的时间点检测到,则差异指示对象结直肠癌的诊断。临床行动或决定可以基于对象的结直肠癌诊断的这个指征作出,例如,为对象开出新的治疗性干预。临床行动或决定可以包括建议对象进行二次临床测试,以确认结直肠癌的诊断。此二次临床测试可以包括成像测试、血液测试、计算机断层(ct)扫描、磁共振成像(mri)扫描、超声扫描、胸部x光、正电子发射断层(pet)扫描、pet-ct扫描、无细胞生物细胞学、fit测试、fobt试验或其任何组合。315.在一些实施方案中,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括在两个或更多个时间点之间确定的结直肠癌相关基因组基因座小组的定量度量的差异,可以指示对象结直肠癌的预后。316.在一些实施方案中,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括在两个或更多个时间点之间确定的结直肠癌相关基因组基因座小组的定量度量的差异,可以指示对象患结直肠癌的风险增加。例如,如果对象在较早的时间点和较晚的时间点都检测到结直肠癌,并且如果差异是正性差异(例如,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量)从较早的时间点到较晚的时间点是增加的),则差异可以指示对象患结直肠癌的风险增加。临床行动或决定可以基于结直肠癌风险增加的这个指示作出,例如,为对象开出新的治疗性干预或转换治疗性干预(例如,结束当前治疗,并开出新的治疗)。临床行动或决定可以包括建议对象进行二次临床测试,以确认患结直肠癌的风险增加。此二次临床测试可以包括成像测试、血液测试、计算机断层(ct)扫描、磁共振成像(mri)扫描、超声扫描、胸部x光、正电子发射断层(pet)扫描、pet-ct扫描、无细胞生物细胞学、fit测试、fobt试验或其任何组合。317.在一些实施方案中,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括在两个或更多个时间点之间确定的结直肠癌相关基因组基因座小组的定量度量的差异,可以指示对象患结直肠癌的风险降低。例如,如果对象在较早的时间点和较晚的时间点都检测到结直肠癌,并且如果差异是负性差异(例如,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括结直肠癌相关基因组基因座小组的定量度量,从较早的时间点到较晚的时间点是降低的),则差异可以指示对象患结直肠癌的风险降低。临床行动或决定可以基于结直肠癌风险降低的这个指示作出,为对象(例如,继续或结束当前的治疗性干预)。临床行动或决定可以包括建议对象进行二次临床测试,以确认患结直肠癌的风险降低。此二次临床测试可以包括成像测试、血液测试、计算机断层(ct)扫描、磁共振成像(mri)扫描、超声扫描、胸部x光、正电子发射断层(pet)扫描、pet-ct扫描、无细胞生物细胞学、fit测试、fobt试验或其任何组合。318.在一些实施方案中,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括在两个或更多个时间点之间确定的结直肠癌相关基因组基因座小组的定量度量的差异,可以指示治疗对象的结直肠癌的治疗过程有效。例如,如果对象在较早的时间点检测到结直肠癌,但在较晚的时间点没有检测到,则差异可以指示治疗对象的结直肠癌的治疗过程有效。临床行动或决定可以基于治疗对象的结直肠癌的治疗过程有效的这个指示作出,例如,为对象继续或结束当前的治疗性干预。临床行动或决定可以包括建议对象进行二次临床测试,以确认治疗结直肠癌的治疗过程有效。此二次临床测试可以包括成像测试、血液测试、计算机断层(ct)扫描、磁共振成像(mri)扫描、超声扫描、胸部x光、正电子发射断层(pet)扫描、pet-ct扫描、无细胞生物细胞学、fit测试、fobt试验或其任何组合。319.在一些实施方案中,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括在两个或更多个时间点之间确定的结直肠癌相关基因组基因座小组的定量度量的差异,可以指示治疗对象的结直肠癌的治疗过程无效。例如,如果对象在较早的时间点和较晚的时间点都检测到结直肠癌,并且如果差异是正性或零差异(例如,在结直肠癌相关基因组基因座小组上数据集的序列读取的定量度量(例如,在结直肠癌相关基因组基因座上的rna转录本或dna的定量度量),包括结直肠癌相关基因组基因座小组的定量度量,从较早的时间点到较晚的时间点是增加的或保持在恒定水平),并且如果在较早的时间点指示有效治疗,则所述差异可以指示治疗对象的结直肠癌的治疗过程无效。临床行动或决定可以基于治疗对象的结直肠癌的治疗过程无效的这个指示作出,例如,为对象结束当前的治疗性干预和/或转换(例如,开出)新的不同的治疗性干预。临床行动或决定可以包括建议对象进行二次临床测试,以确认治疗结直肠癌的治疗过程无效。此二次临床测试可以包括成像测试、血液测试、计算机断层(ct)扫描、磁共振成像(mri)扫描、超声扫描、胸部x光、正电子发射断层(pet)扫描、pet-ct扫描、无细胞生物细胞学、fit测试、fobt试验或其任何组合。vii.试剂盒320.本公开提供了用于鉴定或监测对象癌症的试剂盒。试剂盒可以包括探针或引物,用于鉴定对象的无细胞生物样品中多个癌症相关基因组基因座中的每个上的序列定量度量(例如,指示存在、不存在或相对量)。无细胞生物样品中多个癌症相关基因组基因座中的每个上的序列定量度量(例如,指示存在、不存在或相对量)可以指示一种或多种癌症。探针可以对无细胞生物样品中多个癌症相关基因组基因座上的序列有选择性。试剂盒可以包括使用探针处理无细胞生物样品以生成数据集的说明书,所述数据集指示对象的无细胞生物样品中多个癌症相关基因组基因座中的每个上的序列定量度量(例如,指示存在、不存在或相对量)。321.试剂盒中的探针可以对无细胞生物样品中多个癌症相关基因组基因座上的序列有选择性。试剂盒中的探针可以被配置为选择性富集与多个癌症相关基因组基因座相对应的核酸(例如,rna或dna)分子。试剂盒中的探针可以是核酸引物。试剂盒中的探针可以与来自多个癌症相关mirna或其片段中的一个或多个的核酸序列具有部分或完全序列互补性。多个癌症相关mirna可以包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个或更多个不同的癌症相关mirna。多个癌症相关mirna可以包含选自表1-11中列出的mirna的一个或多个成员。322.试剂盒中的说明书可以包括使用对无细胞生物样品中多个癌症相关基因组基因座上的序列有选择性的探针来测定所述无细胞生物样品的说明书。这些探针可以是核酸分子(例如,rna或dna),与来自多个癌症相关基因组基因座中的一个或多个的核酸序列(例如,rna或dna)具有序列互补性。这些核酸分子可以是引物或富集序列。测定无细胞生物样品的说明书可以包括执行阵列杂交、聚合酶链式反应(pcr)或核酸测序(例如,dna测序或rna测序)以处理无细胞生物样品来生成数据集的说明书,所述数据集指示在无细胞生物样品中多个癌症相关mirna中的每个的定量度量(例如,指示存在、不存在或相对量)。无细胞生物样品中多个癌症相关mirna中的每个上的序列定量度量(例如,指示存在、不存在或相对量)可以指示一种或多种癌症。323.试剂盒中的说明书可以包括测量和解释测定读出的说明书,所述测定读出可以在多个癌症相关基因组基因座中的一个或多个处量化,以生成数据集,所述数据集指示无细胞生物样品中多个癌症相关基因组基因座中的每个上的序列定量度量(例如,指示存在、不存在或相对量)。例如,与多个癌症相关mirna相对应的阵列杂交或聚合酶链式反应(pcr)的量化可以生成指示无细胞生物样品中的mirna的定量度量(例如,指示存在、不存在或相对量)和具有已知生物特点的样品之间的差异表达的数据集。测定读出可以包括定量pcr(qpcr)值、数字pcr(dpcr)值、数字液滴pcr(ddpcr)值、荧光值等,或其归一化值。实施例实施例1:无细胞核酸中的mirna分析324.本研究前瞻性纳入总计276名对象:145名新诊断为散发性结直肠肿瘤的患者(39名患有crc,49名患有晚期腺瘤(aa),且57名患有非晚期腺瘤)和131名没有任何癌症个人病史且近期结肠镜检查确认无结直肠肿瘤病变的健康个体。aa患者的腺瘤大小为至少10mm或组织学上有高度异型增生或》20%绒毛成分。所有个体在内窥镜检查或手术前收集血液样品。2.表12提供了研究队列的描述,其显示了分类模型(按阶段、性别和年龄)中用于crc实验的健康和癌症样品的数量。表12325.对于276名个体中的每个,使用magmaxmirvana总rna分离试剂盒从100微升(ul)的血浆中提取rna。在提取过程中,将已知量的52个合成mirna作为spikein添加到每个血浆样品中。测序文库的构建a.文库构建326.将无细胞核酸样品经受文库制备,以用于下一代测序。对于本文所用的下一代测序方法,“文库制备”包括末端修复、加a尾、衔接子连接或对无细胞rna进行的任何其他制备,以允许后续的rna测序。在一些实例中,所制备的无细胞核酸文库序列含有连接到无细胞核酸样品分子上的衔接子、序列标签、索引条形码。可利用各种商购获得的试剂盒来帮助文库制备以用于下一代测序方法。下一代测序文库的构建包括使用一系列协调的酶促反应来制备核酸靶标,以产生特定大小的随机rna片段集合,用于高通量测序。新的文库制备技术的进展和发展扩大了下一代测序在诸如转录组学和表观遗传学的领域中的应用。327.在一些实例中,文库制备试剂盒可以选自nexteraflex(illumina)、ionampliseq(thermofisherscientific)、和genexus(thermofisherscientific)、agilentclearseq(agilent)、agilentsureselectcapture(agilent)、realseq(realseqbiosciences)、archerfusionplex(illumina)、biooscientificnextflex(perkinelmer)、idtxgen(illumina)、illuminatrusight(illumina)、smartersmrna-seq(takara)、nimblegeneseqcap(illumina)、qiaseq(qiagen)或qiagengeneread(qiagen)。328.(realseqbiosciences;旧称somagenics)是一种用于制备小rna测序文库的方法,大大减少了下一代测序(nsg)中的掺入偏差。这项技术解决了常用的测序文库制剂导致许多mirna检测不足的问题,有些甚至多达10,000倍。大多数偏差源于酶促连接反应中序列依赖性的可变性,所述酶促连接反应在测序文库制备过程中将两个衔接子连接到mirna/小rna的3'和5'端。通过使用新型单一衔接子和环化,大大减少了文库制备偏差。b.测序329.将测序文库稀释到2纳摩尔(nm)。将样品装载到illuminanextseq仪器上进行测序,测序深度为每个个体约1000万次读取。c.realseq分析总结330.使用截尾软件(诸如trimmomatic、skewer、seqpurge和atropos)截尾序列读取以去除realseq特异性衔接子及其他引物和衔接子。然后使用bowtie2比对软件将截尾过的读取与由成熟mirna序列、trna、rrna、线粒体rna、usnrna、yrna和合成spike-in序列构成的定制转录组进行比对。samtoolsidxstats用于对映射到每个特征的读取数进行计数。331.通过执行各种数据预处理步骤,使数据更具有分析的特征。数据预处理的目标是添加缺失值、聚集信息、用类别标记数据(数据分箱)及使轨迹平滑。更先进的技术像主成分分析和特征选择是用统计公式进行的,并应用于复杂的数据集。332.将具有小于300,000个映射到发夹序列的读取的样品从后续分析中去除。所有样品中计数《25的特征也被去除。比较了几种归一化策略,包括:比率均值归一化、m-值截尾均值、ruvseq和log2cpm。使用比率均值归一化法对数据进行归一化。333.使用定制脚本对序列进行截尾,以从mirna序列中去除illumina衔接子。然后使用bowtie将mirna序列映射到(1)人类基因组,(2)包含所有已知成熟人类mirna的定制转录组,和(3)发夹mirna序列的第二转录组,以及52个合成的、非人类衍生的mirna的列表。根据映射位置,从每个个体中生成mirna和mirna发夹两者的计数表。334.使用这些计数数据集,鉴定了在健康个体与结直肠癌或晚期腺瘤个体的血浆之间差异丰富的mirna。两个计数矩阵都使用以下多重方法进行归一化,包括:(1)m-值截尾均值,(2)比率均值,和(3)ruvseq。将这三种方法中的每一种在总rna文库上运行以生成归一化因子,并且在合成rnaspikein上运行以生成归一化因子的第二集。将每种方法的归一化计数单独用于生成模型,从而鉴定在健康状态之间显示显著不同的成熟mirna和mirna发夹丰度的序列。2种或更多种方法中p《0.05的发夹和mirna被认为是强有力的支持,并被鉴定为crc和/或aa的标志物。335.对于分类模型,在两个数据集(成熟mirna和mirna发夹)上使用相同的归一化,并添加combat作为第四种归一化方法。还针对已知的混杂因子调整归一化计数,包括血浆质量、年龄、性别和收集地点。从得到的计数数据集中,构建了k=8的k-best模型。将所述模型在500个独立种子上运行,每个种子将数据分成4个折叠,在3个数据折叠上进行训练,并在最后的第4个折叠上进行测试。然后将每个模型中鉴定的8个特征与差异丰富的mirna和发夹的列表进行比较。实施例2:生成结直肠癌和晚期腺瘤的分类特征336.所评估的机器学习方法包括一系列的转换,在一些情况下包括维度减少,然后是监督分类算法。337.在评估分类模型时,交叉验证(cv)过程的目的是评估模型在没有被用来构建模型的先前未见的新数据上的性能。目标是通过在不同的数据子集上重复训练模型并在训练过程中模型中未见的保留数据子集上测试来提供近似值。k-折叠交叉验证程序需要将整个数据集分成k个组。对于k个组(或折叠)中的每个组,使用其他k-1个折叠训练机器学习模型,并将保留折叠用作测试集。分层的k-折叠交叉验证在划分成折叠之前先将样品按类别进行分层,以使样品的近似比例在折叠之间大致相等。338.使用k-折叠交叉验证(k=5)训练多个模型;随后,使用额外的交叉验证程序对最佳性能模型进行评估。交叉验证期间,根据anovaf-统计量选择前10个特征。采用逻辑回归对样品进行分类。使用100个不同的随机种子将数据分成折叠,因此总共运行了500个模型(100个种子,每个种子5个折叠)。339.在特征选择期间选择mirna。种子的列数显示了在运行的500个模型的特征选择期间,mirna被选择的次数。hsa-mir-889的高数量(例如499)指示此mirna在500个模型中的499个中被选择。340.首先,离群值(定义为给定样品的特征值在所有训练样品中高于此特征的第99个百分位)被归为第99百分位值。每个特征随后在所有训练样品中通过减去平均值和除以标准差进行标准化。采用相同的离群值替换,利用训练集的均值和标准差,对测试集进行标准化。如果选择了维度减少的变形方法,则在训练集上进行训练,并应用于训练集和测试集两者中的所有样品上。本研究中使用的维度减少的变形是截断奇异值分解(svd)和主成分分析(pca)。341.在转换过的输入上训练两种可能的分类算法:逻辑回归和支持向量机(svm)。每种方法都考虑了多个超参数,每折叠随机搜索100次迭代,其中验证集包含随机选择的20%训练数据;选择与性能最佳验证集对应的超参数训练机器学习模型来评估测试折叠。逻辑回归有两个超参数:正则化强度的倒数和l1或l2罚值的选择。表13显示了在k-折叠交叉验证中,在无细胞核酸样品中鉴定为与结直肠癌个体相关的mirna集合,以及逻辑回归的相关平均系数值(例如,mirna被选择的种子数量的平均值)。表13342.总共发现了138种mirna与结直肠癌相关。为了区分健康个体与结直肠癌个体,并非所有鉴定出的mirna都需要纳入分类模型中。因此,一些区域似乎是所评估的各种类型癌症的一般指示。其他mirna在结直肠癌亚群中更为常见。在此测定和所检查的癌症类型的背景下,当在预测模型中训练样品序列时,某些mirna可被描述为“与结直肠癌中特别相关的”,其中在cv中出现频率更高并在特征中权重也更高。这些与结直肠癌相关的更高频率mirna被用于经训练以判别健康个体群体与crc个体群体的特定模型中。图2提供了直方图,示出了在特征选择期间所选择的mirna。柱状图表示选择mirna的模型的数量(最大=500)。图3提供了示出前10个最常选择的mirna的逻辑回归系数的图。343.虽然已经在本文中示出和描述了本发明的优选实施方案,但是对于本领域技术人员显而易见的是,此类实施方案仅通过举例方式提供。本发明不意在受限于本说明书内提供的具体实施例。虽然已经参考上述具体说明描述了本发明,但是对本文中实施方案的描述和示例说明不意在以限制性意义进行解释。在不脱离本发明的情况下,本领域技术人员现将想到多种变型、变化和替代方案。此外,应理解,本发明的所有方面不限于本文中所述的取决于各种条件和变量的具体的描绘、配置或相对比例。应理解,本文所述的本发明的实施方案的各种替代方案可以用于实施本发明。因此,设想本发明还应涵盖任何这样的替代方案、修改、变型或等同方案。所附权利要求意在界定本发明的范围并且由此涵盖处于这些权利要求的范围内的方法和结构及它们的等同方案。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1