用于心血管疾病的诊断和分类的生物标记物检验的制作方法

文档序号:6351924阅读:740来源:国知局
专利名称:用于心血管疾病的诊断和分类的生物标记物检验的制作方法
用于心血管疾病的诊断和分类的生物标记物检验相关_请的交叉引用本申请要求于2009年12月9日提交的美国临时专利申请No. 61/285,121的权益,以其整体通过引用并入。
背景技术
动脉粥样硬化心血管疾病(ASCVD)是全球范围的发病率和死亡率的主因。几乎60%的心肌梗塞(MI)在具有O或I风险因子的人们中发生。即,经历心脏事件的大多数人们处于通过目前方法评价的低-中级或中级危险类。遗传和环境因素的组合是造成疾病开始和发展(develop)的主要原因。动脉粥样硬化通常是无症状的并通过目前的诊断方法检测不出。事实上,对于许多人来讲,动脉粥样 硬化心血管疾病的第一个症状是心脏病发作和心脏性猝死。可正确预测并诊断心血管疾病及发展的检验和方法是非常令人期望的。

发明内容
本公开提供了用于评价人的心血管健康的方法、检验和试剂盒。在一种实施方式中,提供了用于评价人的心血管健康的方法,其包括a)从人获得生物样品;b)測定生物样品中的选自于表20中列出的miRNA的至少2种miRNA标记物的水平;c)获得包括每种miRNA标记物水平的数据集;d)将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;以及e)基于步骤d)的分类确定针对所述人的治疗方案;其中评价了所述人的心血管健康。ー种用于评价人的心血管健康的方法,其包括a)从人获得生物样品;b)測定生物样品中的选自下述组的至少3种蛋白标记物水平IL-16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子(Ε0ΤΑΧΙΝ)、脂联素、IL-18、TIMP. 4、TIMP. I、CRP、VEGF和EGF ;c)获得包括每种蛋白标记物水平的数据集;d)将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;以及e)基于步骤d)的分类确定针对所述人的治疗方案;其中评价了所述人的心血管健康。ー种用于评价人的心血管健康从而确定是否需要治疗方案或治疗方案的有效性的方法,其包括从人获得生物样品;测定生物样品中的选自于表20中列出的miRNA的至少2种miRNA标记物水平;測定生物样品中的选自下述组的至少3种蛋白标记物水平IL-16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、TIMP. 4、 ΜΡ. K CRP, VEGF和EGF ;获得包括各个miRNA标记物和蛋白标记物的水平的数据集;将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;并按照分类程序的输出对生物样品分类;并基于分类确定针对所述人的治疗方案。还在另ー实施方式中,提供了用于评价人的心血管健康以确定是否需要治疗方案或治疗方案的有效性的试剂盒,所述试剂盒包括检验装置,用于测定生物样品中的选自于表20中列出的miRNA的至少2种miRNA标记物水平和/或用于测定生物样品中的选自下述组的至少3种蛋白标记物水平IL-16、sFas、Fas配体、MCP_3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、HMP.4、HMP. I、CRP、VEGF和EGF ;说明书,用于(I)获得包括每ー种miRNA和/或蛋白标记物水平的数据集,(2)将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;以及(3)基于分类确定针对人的治疗方案。还在另ー实施方式中,用于评价人的心血管事件的风险,其包括a)从人获得生物样品山)测定样品中的选自IL-16、SFas、Fas配体、MCP_3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、HMP. 4、 ΜΡ. I、CRP、VEGF和EGF组成的组的三种或更多种蛋白标记物水平和/或表20中的2种或更多种miRNA水平;c)获得包括每种蛋白和/或miRNA生物标记物水平的数据集;d)将所述数据输进风险预测分析程序,以基于所述数据集測定心血管事件的风险;以及e)基于步骤d)中预测的心血管事件风险,确定针对所述人的治疗 方案;其中评价了人的心血管事件风险。附图简沭图I是描绘了基于逻辑回归方法的52个样品(26个病例和26个对照)集的期望的分类性能的图。期望的AUC和对应的95%置信区间从52个独立或合并样品的分类集的500个模拟中获得。误差棒上的开环表示使用合并的样品(每ー合井中5个样品)的期望值和置信区间,所述样品具有假设服从对数-正态分布的生物标记物浓度或评分值。实线误差棒上的开环表示使用来自相同分布的独立样品的期望值和置信区间。实心黑圆点表示理论結果。X-轴表示病例和对照生物标记物或评分分布的均值差异。图2是描绘了基于逻辑回归方法的52个样品(26个病例和26个对照)集的期望分类性能的图。期望AUC和对应的95%置信区间从52个独立或合并样品的分类集的500个模拟中获得。虚线误差棒上的开环表示使用合并的样品(每ー合井中5样品)的期望值和置信区间,所述样品具有假设服从正态分布的生物标记物浓度或评分值。实线误差棒上的开环表示使用来自相同分布的独立样品的期望值和置信区间。实心黑圆点表示理论结果。X-轴表示病例和对照生物标记物或评分分布的均值差异。图3是基于从44个miR物质的集中选择协变量的模型,对合并的样品分类的AUC值分布的图。AUC值的计算基于通过惩罚逻辑回归模型(具有LI惩罚)与数据拟合获得的100个预验证的分类评分向量。X-轴表示AUC和y-轴表示频率。如所显示的,平均AUC值是 O. 68。图4是基于从44个miR物种的集中选择的协变量的模型对独立样品分类的AUC值分布的图。AUC值的计算基于通过使惩罚逻辑回归模型(具有LI惩罚)与数据拟合获得的100个预验证的分类评分向量。如所显示的,平均AUC值是O. 78。图5是基于44个miR物质和47个蛋白生物标记物的集中选择的协变量的模型对独立样品分类的AUC值分布的图。AUC值的计算基于通过使惩罚逻辑回归模型(具有LI惩罚)与拟合数据获得的100个预验证的分类评分向量。如所显示的,平均AUC值是O. 75。图6是显示miR和蛋白之间相关性的分布的图,所述相关性包括通过垂直线指示的最闻负相关性和最闻正相关性。
图7是显示仅单独的miR之间的相关性分布的图。图8是显示了以基于単独的蛋白生物标记物数据计算的预验证评分(500次重复)为基础的AUC分布的图。图9是显示了相对于对照的均值和标准偏差标准化的蛋白生物标记物的单变量危险比。

图10是显示了蛋白生物标记物的调整危险比(HR)的图。调整基于传统风险因子(TRF):年龄、性別、心收缩血压(BP)、心舒张BP、胆固醇、高密度脂蛋白(HDL)、高血压、使用高血压药品、高脂血症、糖尿病和吸烟状況。图IlA和B是显示了最多5年随访的具有最高时间依赖性AUC和对应的值的标记物图。sFas、NT. proBNP、MIG、IL. 16、MIG 和 ANG2 的 AUC 在图 IlA 中显示,Fas 配体、SCD40L、脂联素、MCP. 3、瘦素和调节活化蛋白(rantes)在图IlB中显示。 图12是偏差下降的绝对值和标准误差作为Cox成比例危险回归模型中项的数目的函数的图。使用I-标准误差规则选择将包括在模型中的标记物的最佳数目。图13A和B是分别显示了对照和病例的在Marshfield样品集上的从4个Cox PH模型中获得的线性预测值的核密度估计图。图14A和B是分别显示了对照和病例的在MES样品集上的从4个Cox PH模型中获得的线性预测值的核密度估计图。发明详沭本公开提供了用于评价人的心血管健康,和特别是预测、诊断和监测人类中的动脉粥样硬化心血管疾病(ASCVD)的方法、检验和试剂盒。公开的方法、检验和试剂盒鉴定循环微核糖核酸(miRNA)生物标记物和/或蛋白生物标记物,用于评价人的心血管健康。在方法、检验和试剂盒的某些实施方式中,循环miRNA和/或蛋白生物标记物被鉴定用于评价人的心血管健康。在一种实施方式中,本公开提供了用于评价人的心血管健康以测定是否需要治疗方案或治疗方案的有效性的方法,所述方法包括从人获得生物样品;測定生物样品中的选自表20水平列表的组的至少2种miRNA标记物;获得包括每ー种miRNA标记物水平的数据集;将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;和按照分类程序的输出对生物样品分类并基于分类确定针对所述人的治疗方案。在某些实施方式中,公开了用于评价人的心血管健康以测定是否需要治疗方案或治疗方案的有效性的方法,所述方法包括从人获得生物样品;測定生物样品中的选自下述组的至少3种蛋白生物标记物水平IL-16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、HMP. 4,TIMP. K CRP, VEGF和EGF ;获得包括每种蛋白标记物水平的数据集;将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;和按照分类程序的输出对生物样品分类并基于分类确定针对所述人的治疗方案。在另ー实施方式中,提供了用于评价人的心血管健康的方法。在某些实施方式中,评价可用来测定是否需要治疗方案或治疗方案的有效性。方法包括从人获得生物样品;测定生物样品中的选自表20中列出的miRNA的至少两种miRNA标记物水平;测定生物样品中的选自下述组的至少三种蛋白生物标记物水平IL-16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、 ΜΡ. 4, TIMP. K CRP, VEGF和EGF ;获得包括各个miRNA标记物和蛋白生物标记物水平的数据集;将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;和按照分类程序的输出对生物样品分类并基于分类确定针对所述人的治疗方案。还在另ー实施方式中,公开了用于评价人的心血管事件风险的方法。方法包括从人获得生物样品;和测定样品中的(I)选自下述组的三种或更多种蛋白生物标记物IL-16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、TIMP. 4、 ΜΡ· K CRP, VEGF和EGF和/或(2)表20中的两种或更多种miRNA的水平。在所述方法中,获得了包括每ー种蛋白和/或miRNA生物标记物水平的数据集。数据被输入风险预测分析程序以基于数据集来预测心血管事件风险;和基于心血管事件预测风险确定针对所述人的治疗方案。可预测从获得和/或分析样品的日期起约I年、约2年、约3年、约 4年、约5年或更多年的心血管事件风险。如下文描述的,预测的心血管事件可以是动脉粥样硬化疾病、MI等等的发展。本公开通篇中术语“标记物”和“生物标记物”互換使用。在公开的方法中,被检测的且其水平被测定的miRNA标记物的数目可以是I或多于1,比如2、3、4、5、6、7、8、9、10或更多。在某些实施方式中,检测的miRNA标记物的数目是3或5或更多。被检测的且其水平被测定的蛋白生物标记物的数目可以是I或多于1,比如
2、3、4、5、6、7、8、9、10或更多。在某些实施方式中,1、2、3或5或更多种miRNA标记物被检测并且其水平被測定和1、2、3或5或更多种蛋白生物标记物被检测并且其水平被測定。该公开的方法用于诊断和监测动脉粥样硬化疾病。动脉粥样硬化疾病也称为动脉粥样硬化、动脉硬化、动脉粥样化血管疾病、动脉闭塞疾病或心血管疾病,其特征是在血管壁上的斑块累积和血管炎症。血管炎症是活动的动脉粥样硬化疾病、不稳定的斑块或易损斑块的标志。斑块由累积的胞内和胞外脂类、平滑肌细胞、结缔组织、炎症细胞和糖胺聚糖组成。某些斑块还含有钙。不稳定的或活动的或易损斑块富集有炎症细胞。通过例子的方式,本公开包括通过下述步骤产生在诊断和监测动脉粥样硬化疾病中有用的结果的方法获得与样品关联的数据集,其中所述数据集至少包括关于单独的已被鉴定能预示动脉粥样硬化疾病的miRNA标记物或与蛋白生物标记物组合的miRNA标记物的定量数据;并将数据集输进分析程序,所述分析程序使用数据集来产生在诊断和监测动脉粥样硬化疾病中有用的結果。该定量数据可包括DNA、RNA、蛋白表达水平及其组合。所公开的方法、检验和试剂盒还用于诊断和监测心血管疾病并发症,所述并发症包括心肌梗塞(MI)、急性冠脉综合征、中风、心カ衰竭和心绞痛。常见并发症的例子是MI,其是指通常由流至心肌部分的冠状动脉血流量突然減少而导致的缺血性心肌坏死。在患有急性MI的大多数患者中,通常与斑块破裂关联的急性血栓,使供应损坏区域的动脉堵塞。斑块破裂通常在先前被炎症细胞富集的动脉粥样硬化斑块部分阻塞的动脉中发生。常见动脉粥样硬化并发症的另一例子是心绞痛——由流至心脏的血流量不足而导致的具有胸痛或不舒服的症状的病(condition)。
本公开鉴定了炎症的生物标记物谱,所述生物标记物谱可用于对动脉粥样硬化心血管疾病诊断和分类以及在从给定个体抽取血液起的具体时期内对心血管事件(例如,MI)风险预測。本公开中检验的miRNA和蛋白生物标记物是使用学习算法鉴定的那些,所述学习算法能在不同的动脉粥样硬化分类(例如诊断、分期、预后、监测、治疗反应)之间区分和预测假性-冠状动脉钙化评分。用于动脉粥样硬化分类的其他数据,比如临床指标(例如,传统风险因子)也可以是用来产生用于动脉粥样硬化分类的结果的数据集的一部分。含有単独的或组合的本文公开的各种miRNA和蛋白生物标记物的定量数据和其他数据集组件(例如,DNA、RNA、临床指标的测量)的定量数据的数据集可被输入分析程序并用来产生結果。分析程序可以是具有确定參数的任何类型的学习算法,或换句话说,预测模型。通过将学习算法应用至适当类型的參照或对照数据,可开发针对多种动脉粥样硬化分类或风险预测的预测模型。通过适当个体采取适当行动方针,分析程序/预测模型的结果可被使用。例如,如果分类是“健康的”或“动脉粥样硬化心血管疾病”,那么结果可用来确定个体的适当临床疗程。
微RNA(本文中也称为miRNA、μ RNA、mi_R)是长度约17-27个核苷酸的单链RNA分子形式,其调节基因表达。miRNA由来自转录它们但miRNA未被翻译成蛋白的DNA的基因编码(即它们是非编码RNA);代替地,每个初级转录物(初级-miRNA)被加工为称为前-miRNA的短的莖-环结构并最终加工成功能miRNA。与炎症关联并用于评价人的心血管健康的miRNA标记物包括但不限干,miR_26a、miR-16、miR-222、miR-10b、miR-93、miR-192、miR-Ι5a、miR-125-a. 5p、miR_130a、miR_92a、miR-378、miR_20a、miR_20b、miR-107、miR-186、hsa. let. 7f、miR_19a、miR-150、miR_106b、miR_30c和let 7b的一种或多种。在某些实施方式中,miRNA标记物包括miR-26a、miR_16、miR-222、miR-10b、miR-93、miR-192、miR-Ι5a、miR-125-a. 5p、miR_130a、miR_92a、miR-378和let 7b的ー种或多种。特别地,表20中列出的miRNA用于评价人的心血管健康。与炎症关联并用于评价人的心血管健康的蛋白生物标记物包括但不限于,调节活化蛋白(RANTES)、TIMPU MCP-U MCP-2、MCP-3、MCP-4、嗜酸性粒细胞活化趋化因子(eotaxin)、IP-10、M-CSF, IL-3、TNFa, Ang_2、IL-5、IL-7、IGF-U sVCAM、sICAM-1、E-选择素、P-选择素、白细胞介素_6、白细胞介素-18、肌酸激酶、LDL、oxLDL、LDL颗粒尺寸、脂蛋白(a)、肌钙蛋白I、肌钙蛋白T、LPPLA2、CRP、HDL、甘油三酷、胰岛素、BNP、趋化因子(fractalkine)、骨桥蛋白、骨保护素、制瘤素_M、髓过氧化物酶、ADMA, PAI-I (纤溶酶原激活物抑制剂)、SAA(循环的淀粉样蛋白A)、t-PA(组织型纤溶酶原激活物抑制剂)、sCD40配体、纤维蛋白原、高半胱氨酸、D-ニ聚物、白细胞计数、心脏型脂肪酸结合蛋白、MMP1、纤维蛋白溶酶原、叶酸、维生素B6、瘦素(l印tin)、可溶性血栓调节蛋白、PAPPA、MMP9、MMP2、VEGF、PIGF、HGF、vWF和胱抑素C的ー种或多种。在某些实施方式中,蛋白生物标记物包括IL-16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素(adiponectin)、IL-18.TIMP. 4、 ΜΡ. K CRP, VEGF和EGF的ー种或多种。除了特殊的生物标记物之外,本公开还包括与示例的序列约90%、约95%或约97%同一的生物标记物变体。本文中使用的变体,包括多态性、剪接变体、突变等等。蛋白生物标记物可以多种方式检测。例如,可利用体内成像来检测心脏组织中动脉粥样硬化-关联的蛋白的存在。此类方法可使用,例如,对此类蛋白特异性的标记的抗体或配体。在这些实施方式中,对多肽特异性的可检测-标记的成分,例如,抗体、配体等等被施用给个体(例如,通过注射)并使用标准成像技术对标记的细胞定位,所述标准成像技术包括但不限于,磁共振成像、计算机断层扫描等等。检测可使用一种显像剂或显像剂的混合物(cocktail)。其他标记物可选自 ー种或多种临床指标,包括但不限于,年龄、性別、LDL浓度、HDL浓度、甘油三酯浓度、血压、体重指数、CRP浓度、冠状动脉钙化评分、腰围、吸烟状况、心血管疾病的过去病史、心血管疾病的家族史、心率、空腹胰岛素浓度、空腹葡萄糖浓度、糖尿病状况和使用的高血压药物。可使用本领域中已知的学习算法,比如线性判别分析、支持向量机器分类、递归特征去除、微阵列的预测分析、逻辑回归、CART、FlexTree, LART、随机森林、MART和/或存活分析回归(这些对本领域技术人员而言是已知的并在本文中进ー步描述)鉴定用于使得动脉粥样硬化分类的其他临床指标。本文公开的分析分类可包括使用预测模型。预测模型还包括用于分类的至少约O. 68或更高的质量度量(quality metric)。在某些实施方式中,用于分类的质量度量是至少约O. 70或更高。在某些实施方式中,质量度量选自曲线下面积(AUC)、危险比(HR)、相对风险度(RR)、再分类、阳性预测值(PPV)、阴性预测值(NPV)、准确度、敏感性和特异性、净重新分类指数、临床净重新分类指数。如本文中描述的可使用这些和其他度量。另外,可选择各种项目来提供质量度量。获得数据集的每个组件(component)的定量数据并输入具有预先确定參数的分析程序(预测模型)并接着用来产生結果。通过导致个体接收与样品关联的数据的任何技术,可获得数据。例如,通过由对本领域技术人员而言已知的方法产生个体自身的数据集,个体可获得数据集。可选择地,通过接收来自另ー个体或实体的数据集或ー种或多种数据值,可获得数据集。例如,实验室专业人员可产生某些数据值而其他个体,比如医学专业人员可将所有或部分数据集输入分析程序以产生結果。技术人员应当理解尽管本公开通篇中提到“样品”但定量数据可从许多特征(比如取得方法、取得时间、组织来源等等)变化的多个样品中获得。在产生用于动脉粥样硬化分类的结果的方法中,获得了本文中提供的蛋白标记物的血液、血清等等中的表达模式。与感兴趣的蛋白标记物关联的定量数据可以是允许用于动脉粥样硬化分类的结果产生的任何数据,所述数据包括与标记物关联的DNA或RNA水平的測量,但典型地是蛋白表达模式。可通过本领域技术人员而言已知的任何方法測量作为表达谱部分的蛋白水平,所述方法単独或经高通量方法产生定量測量。例如,得自血液的患者样品,例如血液、血浆、血清等等可被应用至特异性结合试剂或特异性结合试剂的组以测定感兴趣的蛋白标记物的存在与否和量。针对存在感兴趣的单独的miRNA标记物或与蛋白标记物组合的miRNA标记物的表达水平,检验血液样品或源自血液的样品例如血浆、血清等等。典型地,抽取血液样品并测试衍生产物比如血浆或血清。另外,样品可源自其他体液,比如唾液、尿、精液、奶或汗液。样品还可源自组织,比如来自血管,比如动脉、静脉、毛细血管等等。另外,当miRNA和蛋白生物标记物二者都被检验时,它们可源自相同或不同的样品。即,例如,miRNA生物标记物可在源自血液的样品中检验,而蛋白生物标记物可在组织样品中检验。
典型地,与感兴趣的miRNA和蛋白标记物关联的定量数据得到表达谱形式。表达谱组成了对应于评估的许多标记物的许多miRNA或蛋白产物的相对或绝对表达值的集。在多种实施方式中,产生了至少约2、3、4、5、6、7或更多种标记物的含有表达模式的表达谱。表达谱的每个差异表达组件成员的表达模式可提供关于用于例如诊断、预后、监测治疗等等的预测值的特别的特异性和敏感性。获得表达数据的许多方法是已知的并且这些技术的任何一种或多种单独地或组合地适于测定本公开的上下文中的表达模式和表达谱。例如,可通过northern分析、PCR、RT_PCR、Taq Man分析、FRET检测、监测一种或多种分子信标、与寡核苷酸阵列杂交、与cDNA阵列杂交、与多核苷酸阵列杂交、与液体微阵列杂交、与微电子阵列杂交、cDNA测序、克隆杂交、cDN片段指纹、基因表达系列分析(SAGE)、差减杂交、差异显示和/或差异筛选来评估DNA和RNA (mRNA、初级-miRNA、前-miRNA、miRNA、前体发夹结构RNA、微RNP等等)的表达模式。这些和其他技术对本领域技术人员而言是熟知的。 本公开包括核酸分子,优选地以分离的形式存在的核酸分子。当在本文中使用时,当核酸分子实质上与编码其他多肽的污染核酸分子分开时,核酸分子是将被“分尚的”。术语“核酸”被定义为编码和非编码RNA或DNA。在适当严格条件下与分子互补(即杂交)的并与分子保持稳定结合的核酸包括在本公开的范围内。此类序列展示了与本文公开的RNA至少50%、60%、70%或75%、优选地至少约80-90%、更优选地至少约92-94%和甚至更优选地至少约95^,98^,99%或更多核苷酸序列同一性并包括插入、缺失、摆动碱基、置換等等。其他考虑的序列是与本文公开的蛋白生物标记物序列共有至少约50^.60^.70%或75%、优选地至少约80-90%、更优选地至少约92-94%和最优选地至少约95%、98%、99%或更多同一性的序列。不管源自天然来源或是合成的,本公开的范围内特别考虑的是基因组DNA、cDNA、RNA (mRNA、初级-miRNA、前-miRNA、miRNA、发夹结构前体RNA、RNP,等等)分子以及基于可选主链或包括可选碱基的核酸。使用适于序列相似性搜索的程序blastp、blastn、blastx、tblastn和tblastx利用的算法、通过BLAST (Basic Local比对Search Tool)分析,测定核苷酸或氨基酸序列水平的同源性或同一性。通过BLAST程序使用的方法首先考虑在查询序列和数据库序列之间有和没有缺ロ的相似段,然后评估被鉴定的所有匹配的统计学显著性并最后仅总结满足预选的显著性阈值的那些匹配。直方图、摹状、比对、期望值(即,报告的对数据库序列匹配的统计学显著性阈值)、截止值、矩阵和滤器(低复杂度)的搜索參数在缺省设置下。柱状图、描述、比对、期望(即,数据库序列报告匹配的统计学显著性阈值)、截断值、矩阵和过滤值(低复杂度)的搜索參数为默认设置。通过blastp、blastx、tblastn和tblastx使用的缺省评分矩阵是BL0SUM62矩阵,推荐用于长度超过85个核苷酸或氨基酸的查询序列。对于blastn,评分矩阵是通过M(即,一对匹配残基的奖励分)与N(即,错配残基的罚分)的比率设置的,其中M和N的缺省值分别是5和-4。四个blastn參数被如下调整Q= 10 (缺ロ产生惩罚);R= 10 (缺ロ延伸惩罚);wink(字长增加量)=I (沿着查询在每个字长增加量的位置产生字击中);和缺ロ W= 16 (设置产生缺ロ比对的窗ロ宽度)。等同的Blastp參数设置是Q = 9 ;R = 2 ;wink = I ;和缺ロ w = 32。GCG包版本10. O中可得到的序列之间的最佳拟合比较使用DNA參数缺ロ= 50(缺ロ产生惩罚)和字长=3(缺ロ延伸惩罚)和蛋白比较中的等同设置是缺ロ = 8和字长=2。“严格条件”是下述那些⑴利用低离子强度和高洗涤温度,例如,在50°C下O. 015M NaCl/0. 0015M柠檬酸钠/0. 1% SDS或(2)杂交期间利用变性试剂,比如甲酰胺,例如,42°C下,50% (vol/vol)甲酰胺,具有O. I %牛血清白蛋白/O. I % Ficoll/0. I %聚维酮/50mM磷酸钠缓冲液(pH 6. 5),具有750mM NaCl、75mM柠檬酸钠。另ー个例子是42°C下在50% 甲酰胺、5 X SSC (O. 75M NaCl、0. 075M 柠檬酸钠)、50mM 磷酸钠(pH 6. 8)、0.1%焦磷酸钠、5XDenhardV s溶液、超声处理的鲑精DNA(50pg/ml)、0. 1% SDS和10%硫酸葡聚糖中杂交,42°C在O. 2 X SSC和O. 1% SDS中洗涤多次。技术人员可容易地测定并适当改变严格条件以获得清楚的可检测的杂交信号。本公开还提供了公开的核酸分子的片段。如本文中使用的,核酸分子的片段是指 编码或非编码序列的一小部分。通过期望的用途测定片段大小。例如,如果为了编码蛋白的活性部分而选择片段,片段需要足够大以编码蛋白的功能区(多个)。例如,编码对应于预测的抗原区的肽的片段可被制备。如果片段将被用作核酸探针或PCR引物,那么为了在探査/引发期间获得相对小数目的假阳性而选择片段长度。可通过提供定量测量并适于评估从样品中提取的多种标记物的对本领域技术人员而言已知的任何方法,评估蛋白表达模式,所述方法比如下述方法的ー种或多种=ELISA三明治(sandwich)检验、流式细胞计数、质谱检测、量热检验、结合蛋白阵列(例如,抗体阵列)或荧光活化细胞分选(FACS)。在一种实施方式中,方法包括在ELISA、抗体-标记的突光珠阵列、抗体阵列或FACS筛选中使用标记的亲和试剂(例如,抗体、小分子等等),所述亲和试剂识别ー种或多种蛋白产物的表位。用于产生和评估抗体的方法是本领域中熟知的。存在用于评估公开的生物标记物的表达模式和谱的许多合适的高通量格式(format)。典型地,术语“高通量”是指每天进行至少约100次检验或至少约500次检验或至少约1000次检验或至少约5000次检验或至少约10,000次检验或更多次检验的格式。当对检验计数时,检验的样品数目或标记物数目可被考虑。进行高通量表达分析的许多技术平台是已知的。通常,此类方法包括受试者样品或蛋白标记物或二者的逻辑或物理阵列。通常的阵列格式包括液相和固相阵列二者。例如,利用液相阵列,例如用于核酸杂交、抗体或其他受体与配体结合等等的检验,可在多孔或微量滴定板中进行。具有96、384或1536个孔的微量滴定板是广泛可得到的,具有甚至更多数目的孔,例如3456和9600个孔的微量滴定板可被使用。通常,通过用于样品制备和分析的方法和装置例如机器人操作和加载系统,确定微量滴定板的选择。示例性的系统包括,例如,来自 Luminex (Austin, TX)的 xMAP 技术、来自 Meso Scale Discovery (Gaithersburg,MD)的具有 MULT I-ARRAY 和 MULT I-SPOT 技术的 SECTOR 图像仪、来自 Beckman-Coulter,Inc. (Fullerton, Calif.)的 0RCA 系统和来自 Zymark Corporation (Hopkinton, MA)的ZYMATE 系统、miRCURY LNA 微 RNA 阵列(Exiq on, Woburn, MA)。或者,可有利地利用多种固相阵列,来測定在公开的方法、检验和试剂盒上下文中的表达模式。示例性格式包括膜或滤器阵列(例如,硝酸纤维素,尼龙)、插针阵列和珠阵列(例如,在液体“浆体”中)。典型地,对应于核酸或蛋白试剂的探针可被固定化,所述核酸或蛋白试剂与对应于候选库成员的表达产物特异性相互作用(例如与之杂交或与之结合),所述固定化例如通过与固体载体直接或间接交联来实现。可耐受进行具体的表达检验必要的试剂和条件的基本上任何固体载体都可以使用。例如,功能化玻璃、硅、ニ氧化硅、改良的硅、多种聚合物比如(聚)四氟こ烯、(聚)偏氟こ烯、聚苯こ烯、聚碳酸酯的任何一种或其组合都可用作固相阵列的底物。在一种实施方式中,阵列是“芯片”,芯片由例如上述提到的材料之ー组成。与侯选库的各个组件的表达产物特异性相互作用的多核苷酸探针(例如RNA或DNA比如cDNA)、合成的寡核苷酸等等或结合蛋白比如抗体或抗原-结合片段或其衍生物以逻辑顺序方式附着到芯片上,即在阵列中。另外,具有对标记物核苷酸序列(取决于标记的样品的设计)的有义或反义序列特异性亲和性的任何分子可被固定在阵列表面上而不会丧失对标记物的特异性亲和性,并且所述分子可被获得并产生,用于以阵列方式生产,例如,特异性识别标记物的特异性核酸序列的蛋白、核酶、肽核酸(PM)或具有特异性亲和性的其他化学品或分子。可通过用多种基于激光或CCD的扫描仪扫描微阵列并用很多软件包例如 IMAGENE (Biodiscovery) > 特征提取软件(Agilent)、扫描 LYZE (Stanford Univ.,Stanford, CA.)、GENEPIX (Axon Instruments)提取特征来检测微阵列表达。高通量蛋白系统包括从Ciphergen Biosystem, Inc. (Fremont, Calif.)商购的系统,比如PROTEIN CHIP 阵列和FASTQUANT 人类趋化因子蛋白微点阵列(S&S BioscencesInc. , Keene, N. H. , US)。可通过对本领域技术人员而言已知的方法,測定关于其他数据集组件比如临床指标、代谢测量和遗传检验的定量数据。由此获得的关于miRNA、蛋白标记物和其他数据集组件(即,临床指标等等)的定量数据经受具有先前使用学习算法測定的參数的分析程序,即,输入预测模型。分析程序的參数可以是本文公开的那些或使用本文中描述的指导得到的那些。学习算法比如线性判别分析、递归特征去除、微阵列的预测分析、逻辑回归、CART、FlexTree, LART、随机森林、MART或另ー机器学习算法被应用至适当參照或训练数据以测定适于多种动脉粥样硬化分类的分析程序的參数。用来产生结果(分类、存活/事件发生时间等等)的分析程序可以是能提供用于对样品分类的结果的任何类型的程序,例如,获得的数据集与參照数据集的比较、线性算法、二次算法、决策树算法或表决算法。本文中描述了获得用于制造动脉粥样硬化分类结果的各种分析程序,但是,本领域技术人员容易理解任何合适类型的分析程序在本公开范围内。输入分析程序之前,通过通常一式两份或一式三份或多次重复测量每ー标记物的值,收集每ー数据集中的数据。数据可被处理,例如,使用标准曲线,原始数据可被变换,且重复测量的平均值用来计算每一患者的平均值和标准偏差。这些值在用在模型中之前可被变换,例如对数-变换、Box-Cox变换等等。这些数据可接着被输入具有确定參数的分析程序。分析程序可设置阈值,用于测定样品属于给定种类的概率。概率优选地是至少50%或至少60%或至少70%或至少80%、至少90%或更高。
在其他实施方式中,分析程序测定获得的数据集和參照数据集之间的比较是否产生统计学上显著差异。假如这样的话,那么从中获得数据集的样品被归类为不属于參照数据集种类。相反地,如果该比较不是统计学上显著不同于參照数据集,那么从中获得数据集的样品被归类为属于參照数据集种类。通常,分析程序是通过统计学分析方法(比如下文描述的那些)产生的模型形式。此类分析程序的例子可包括线性算法、二次算法、多项式算法、决策树算法、表决算法。线性算法可具有形式/ = Co + y ClXi其中R是获得的有用的結果。Ctl是可以是零的常数。Ci和Xi分别是常数和可应用的生物标记物或临床指标的值并且N是标记物总数。二次算法可具有形式 (V只=Cj)+-其中R是获得的有用的結果。Ctl是可以是零的常数。Ci和Xi分别是常数和可应用的生物标记物或临床指标d值并且N是标记物总数。多项式算法是线性或二次算法的更为一般的形式,其可具有形式ぱ其中R是获得的有用的結果。Ctl是可以是零的常数。Ci和Xi分别是常数和可应用的生物标记物或临床指标的值ホ是Xi的幂且N是标记物总数。使用任何合适的学习算法,适当的參照或训练数据集可用来测定将被用于分类的分析程序的參数,即,开发预测模型。将被使用的參照或训练数据集会取决于将被測定的期望的动脉粥样硬化分类。数据集可包括来自两个、三个、四个或更多种类的数据。例如,为了使用监瞀学习算法来測定用来诊断动脉粥样硬化的分析程序的參数,包含对照和疾病样品的数据集用作训练集。可选择地,如果监瞀学习算法将被用来开发用于动脉粥样硬化分期的预测模型,那么训练集可包括心血管疾病的各个阶段的每ー阶段的数据。下述是本领域技术人员已知的统计学分析方法类型的例子,用以帮助所公开的方法、检验和试剂盒的实施。可针对两个任务中的ー个或二者应用统计学分析。首先,这些和其他统计学方法可用来鉴定会形成优选数据集的标记物和其他指标的优选子集。另外,这些和其他统计学方法可用来产生分析程序,所述分析程序将使用数据集来产生結果。本文中列出的若干种统计学方法或本领域中以其他方式可得到的统计学方法将进行这两个任务并产生适于用作本文公开的方法实施的分析程序的模型。本文中鉴定了生物标记物,其对应的特征值(例如,浓度、表达水平)例如能区分健康和动脉粥样硬化。这些标记物和其对应的特征(例如,浓度、表达水平)可用来开发分析程序或多个分析程序,所述程序区分患者的种类。下文的例子阐明了数据分析算法可怎样用来构建许多此类分析程序。在例子中描述的数据分析算法中的每ー个使用贯穿包括健康和动脉粥样硬化患者的训练群的本文中鉴定的标记物子集的特征(例如,表达值)。用于建立在本文公开的受试者之间区别的分析程序或多个分析程序的具体的数据分析算法将在下文分部中描述。一旦使用这些示例性数据分析算法或本领域中已知的其他技术建立了分析程序,分析程序可用来将测试受试者归类为两种或多种表型种类(例如,健康或动脉粥样硬化患者)之一和/或预测存活/事件发生时间。这是通过将ー种或多种分析程序应用至从测试受试者获得的一种或多种标记物谱实现的。此类分析程序因此具有作为诊断指标的巨大价值。在ー个方面中,公开的方法、检验和试剂盒提供了针对从训练群获得的标记物谱对来自测试受试者的一种或多种标记物谱的评估。在一些实施方式中,从训练群的受试者以及测试受试者获得的每ー标记物谱包含多种不同标记物的每ー种的特征。在一些实施方式中,该比较是通过下述实现的(i)使用来自训练群的标记物谱开发分析程序,和(ii)将分析程序应用至来自测试受试者的标记物谱。像这样,在本文公开的方法的一些实施方式中应用的分析程序用来測定测试受试者是否患有动脉粥样硬化。在可选择的实施方式中, 本文公开的方法测定受试者是否经历MI和/或可预测事件发生时间(例如MI和/或存活)。在本文公开的方法的一些实施方式中,当分析程序应用的结果表示受试者将有可能经历MI,受试者被诊断/归类为“MI”受试者。或者,如果,例如,分析程序的结果表示受试者将可能发展动脉粥样硬化,受试者被诊断为“动脉粥样硬化”受试者。如果分析程序应用的结果表示受试者将不会发展开发动脉粥样硬化,受试者被诊断为健康的受试者。因此,在一些实施方式中,上述的ニ元决策情形的结果具有四个可能的后果(i)真正的动脉粥样硬化,其中分析程序表示受试者将发展动脉粥样硬化并且受试者事实上在确定时间段期间的确发展了动脉粥样硬化(真阳性,TP) ;(ii)假性动脉粥样硬化,其中分析程序表示受试者将发展动脉粥样硬化并且受试者事实上在确定时间段期间没有发展动脉粥样硬化(假阳性,FP)真正健康的,其中分析程序表示受试者将不会发展动脉粥样硬化并且受试者事实在确定时间段期间没有发展动脉粥样硬化(真阴性,TN);或(iv)假性健康的,其中分析程序表示受试者将不发展动脉粥样硬化并且受试者事实上在确定时间段期间的确发展了动脉粥样硬化(假阴性,FN)。应该意识到,可对TP、FP、TN、FN做其他定义。同时所有这些可选择的定义在公开的方法、检验和试剂盒的范围内,为了易于理解,除非另外指出,通过上文定义(i)至(iv)给出的TP、FP、TN和FN的定义将在本文中使用。如将被本领域技术人员意识到的,许多定量标准可用来传达测试标记物谱和參照标记物谱之间做出的比较(例如,分析程序应用至来自测试受试者的标记物谱)。这些包括阳性预测值(PPV)、阴性预测值(NPV)、特异性、敏感性、准确度和确定性。另外,诸如接受者操作曲线(ROC)的其他构建可用来评估分析程序性能。本文中使用=PPV = TPバTP+FP)、NPV=TN/(TN+FN)、特异性=TN/(TN+FP)、敏感性=TP/(TP+FN)和准确度=确定性=(TP+TN)/N0这里,N是被比较的样品的数目(例如,寻求测定动脉粥样硬化或健康的测试样品的数目)。例如,考虑其中有十个寻求分类的受试者。针对十个测试受试者的每ー个,构建标记物谱。然后,通过应用分析程序,评估标记物谱的每ー个,其中基于获得自训练群的标记物谱开发分析程序。在该例子中,来自上述方程的N等于10。典型地,N是许多祥品,其中每ー样品收集自群的不同的成员。该群事实上是两个不同的类型。在一个类型中,群体包括其样品和表型数据(例如,受试者是否发展动脉粥样硬化的标记物和指示的特征值)用来构建或改进分析程序的受试者。该群体在本文中被称作训练群。在另ー类型中,群体包括不是用来构建分析程序的受试者。该群体在本文中被称作验证群。除非另外指出,由N表示的群或者是排他的训练群或者是排他的验证群,这与两个群体类型的混合群相反。应当意识到,当它们基于相对验证群的训练群时,分数比 如准确度会更高(接近于统一)。然而,除非在本文中另外明确指出,用来评价分析程序(或评估来自测试受试者的生物标记物谱的其他形式)的性能(包括确定性(准确度))的所有标准是指下述标准,所述标准是通过将对应于标准的分析程序或者应用至训练群或者验证群测量的。在一些实施方式中,N多于I、多于5、多于10、多于20、在10和100之间、多于100或少于1000个受试者。在一些实施方式中,针对训练群或验证群,分析程序(其他比较形式)可具有至少约99%的确定性或甚至更高的确定性。在其他实施方式中,针对训练群或验证群,确定性至少约97%、至少约95%、至少约90%、至少约85%、至少约80%、至少约75 %、至少约70 %、至少约65 %或至少约60 %。取决于具体的方法,可改变有用的确定性程度。本文中使用的,“确定性”表示“准确度”。在一种实施方式中,针对训练群或验证群,敏感性和/或特异性是至少约97%、至少约95%、至少约90%、至少约85%、至少约80%、至少约75%或至少约70%。在一些实施方式中,这种分析程序是用来预测动脉粥样硬化的发展,具有所述的准确度。在一些实施方式中,这种分析程序用来诊断动脉粥样硬化,具有所述的准确度。在一些实施方式中,这种分析程序是用来测定动脉粥样硬化的阶段,具有所述的准确度。可被分析程序使用从而以足够的确定性对测试受试者分类的特征的数量是2个或更多个。在一些实施方式中,其是3个或更多个、4个或更多个、10个或更多个或在10个和200个之间。但是,取决于寻求的确定性程度,分析程序使用的特征数量可更多或更少,但在所有的情况下至少是2个。在一种实施方式中,可被分析程序使用来对测试受试者分类的特征数量被优化以允许具有高的确定性的测试受试者分类。在某些实施方式中,分析程序用于预测存活。存活分析包括模拟事件发生时间数据。成比例危险模型是统计学中的一类存活模型。存活模型使一些事件发生之前经过的时间与可与数量关联的一个或多个协变量相关。在成比例风险模型中,协变量中单位增加的独特作用是关于危险比倍増的。存活模型可视为由两部分组成潜在的危险函数,通常表示为Λ O (t),其描述在协变量的基线水平下危险(风险)如何随着时间变化;和效应參数,其描述危险如何响应解释协变量而变化。典型的医学例子可包括协变量比如治疗任务,以及患者特征(比如年龄、性别和存在其他疾病),以降低可变性和/或控制混淆。成比例危险假设是协变量乘危险的假设。在固定系数的最简单情况下,例如,用药物治疗可比方说,在任何给定的时间t下等分受试者的危险,同时基线危险可变化。但是,注意协变量不限于ニ元预测值;在连续协变量X的情况下,危险成对数响应的每个单位的增加导致危险成比例増加。典型地在全常规Cox模型下,基线危险从考虑中“整体排除”或试探性地去除,并且剩余的偏似然(partial likelihood)被最大化。通过任何成比例的危险模型评估的协变量的作用可因而报告为危险比。Cox模型假设,如果成比例危险假设成立,估计效应參数而不考虑危险函数是可能的。开发分析程序的相关数据分析算法包括但不限于,判别分析包括线性、逻辑性和更多灵活的区别技术;基于树的算法比如分类和回归树(CART)和变体;广义可加模型;ネ申经网络、惩罚回归方法等等。在一种实施方式中,将测试受试者的标记物谱与获得自训练群的(ー个或多个)标记物谱进行比较,并包括应用分析程序。使用数据分析算法,比如计算机模式识别算法构建分析程序。构建分析程序的其他合适的数据分析算法包括但不限于,逻辑回归或非參数算法,其检测特征值分布的差异(例如,Wilcoxon符号等级测试(未调整的和调整的))。对应于来自I、2、3、4、5、10、20或更多个标记物的测量的可观察量,分析程序可基于2、3、4、
5、10、20或更多个特征。在一种实施方式中,分析程序是基于数百个特征或更多。分析程 序也可使用分类树算法建立。例如,来自训练群的每个标记物谱可包含至少3个特征,其中特征是分类树算法中的预测值。分析程序预测群(或类)中的从属关系,准确度为至少约70 %、至少约75 %、至少约80 %、至少约85 %、至少约90 %、至少约95 %、至少约97 %、至少约98%、至少约99%或约100%。本领域中已知合适的数据分析算法。在一种实施方式中,本公开的数据分析算法包括分类和回归树(CART)、多重累计回归树(MART)、微阵列的预测分析(PAM)或随机森林分析。这种算法将来自生物材料,比如血液样品的复杂谱分类,以区分受试者为正常的或具有特定疾病状态的生物标记物水平特征。在其他实施方式中,本公开的数据分析算法包括ANOVA和非參数化等价、线性判别分析、逻辑回归分析、最近邻分类分析、神经网络、主成分分析、二次判别分析、回归分类和支持向量机器。虽然这种算法可用于构建分析程序和/或提高分析程序应用的速度和效率并避免调查人员的偏见,但本领域普通技术人员可认识到基于计算机的算法对于执行本公开的方法不是必须的。不管用于产生标记物谱的方法如何,分析程序可用来评估生物标记物谱。例如,合适的分析程序可用来评估使用气相色谱产生的标记物谱、通过静态飞行时间二次离子质谱(TOF-SIMS)获得的谱,使用MALDI-T0F-MS和液相色谱-电喷雾离子化质谱(LC/ESI-MS),通过MALDI-T0F-MS谱分析以高确定性(79-89%正确分类比率)区分菌株,以便在复杂生物样品中对生物标记物谱分类。开发使用本文公开的标记物表达水平的分析程序的ー种方法是最近中值距离分类器(nearest centroid classifier)。这种技术针对姆类(例如,健康的和动脉粥样硬化的)计算该类中标记物平均表达水平给出的重心,并接着将新的样品分配到最接近重心的类。除了聚类(cluster)被已知的类替换,该方法与k-平均聚类相似。当使用许多标记物时,该算法可对噪声灵敏。对该技术的增强使用收缩对于每ー标记物,如果种类质心之间的差异被认为可能是由于偶然,种类质心之间的差异设为零。该方法在微阵列预测分析或PAM中实施。收缩被阈值控制,低于所述阈值的差异被认为是噪声。在噪声水平之上未显示差异的标记物被去除。可通过交叉验证选择阈值。随着阈值降低,更多标记物包括在内并且估计的分类错误降低,直到它们达到底部并由于噪声标记物开始再次攀升——这种现象称为“过拟合”。多重累计回归树(MART)代表构建分析程序的另ー种方式,其可用于本文中公开方法中。MART的常规算法是I.初始化
权利要求
1.用于评价人的心血管健康的方法,其包括a)从人获得生物样品;b)测定生物样品中的选自表20中列出的miRNA的至少2种miRNA标记物水平;c)获得包括每种miRNA标记物水平的数据集;d)将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;和e)基于步骤(d)中的分类确定针对所述人的治疗方案; 其中所述人的心血管健康被评价。
2.根据权利要求I方法,其中所述至少2种miRNA标记物选自下述组miR_378、miR-497、miR-21、miR_15b、miR_99a、miR_29a、miR-24、miR_30b、miR_29c、miR-331. 3p、miR_19a、miR-22、miR-126、let_7b、miR-502. 3 和 miR-652。
3.根据权利要求2的方法,其中所述至少2种miRNA标记物选自下述组:miR_378、miR-497、miR-21、miR-15b、miR_99a 和 miR-652。
4.根据权利要求I的方法,其中所述动脉粥样硬化心血管疾病分类选自下述组冠状动脉疾病、心肌梗塞和不稳定型心绞痛。
5.根据权利要求I的方法,还包括使用所述分类用于测定动脉粥样硬化诊断、动脉粥样硬化分期、动脉粥样硬化预后、血管炎症水平、动脉粥样硬化发展程度、监测治疗响应、预测冠状动脉钙化评分、将动脉粥样硬化疾病的稳定与不稳定表现区分开、和它们的组合。
6.根据权利要求I的方法,其中所述数据集还包括一个或多个临床指标的数据。
7.根据权利要求6的方法,其中所述ー个或多个临床指标选自下述组年龄、性別、LDL浓度、HDL浓度、甘油三酯浓度、血压、体重指数、CRP浓度、冠状动脉钙化评分、腰围、吸烟状况、心血管疾病的过去病史、心血管疾病的家族史、心率、空腹胰岛素浓度、空腹葡萄糖浓度、糖尿病状况、使用的高血压药物及其组合。
8.根据权利要求7的方法,其中选择的所述临床指标是年龄、性別、糖尿病和MI家族史。
9.根据权利要求I的方法,其中所述生物样品包含血液、血清、血浆、唾液、尿、汗液、母乳及其组合。
10.根据权利要求I的方法,还包括測定所述生物样品中的至少ー种蛋白生物标记物水平。
11.根据权利要求10的方法,其中所述至少ー种蛋白生物标记物选自下述组IL-16、sfas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、TIMP. 4、TIMP. I、CRP、VEGF 和 EGF。
12.根据权利要求11的方法,其中所述至少ー种蛋白生物标记物选自下述组IL-16、嗜酸性粒细胞活化趋化因子、Fas配体、CTACK, MCP-3、HGF和sFAS。
13.根据权利要求11的方法,其中测定了三种或更多种蛋白生物标记物水平。
14.根据权利要求I的方法,其中所述分析分类程序包括使用预测模型。
15.根据权利要求I的方法,其中所述分析分类程序包括将获得的数据集与參照数据集比较。
16.根据权利要求13的方法,其中所述预测模型包括用于分类的至少O.68的至少ー个质量度量。
17.根据权利要求15的方法,其中所述质量度量是选自AUC和准确度。
18.根据权利要求I的方法,其中所述分析分类程序包括使用选自下述组的一种或多种线性判别分析模型、支持向量机器分类算法、递归特征去除模型、微阵列模型的预测分析、逻辑回归模型、CART算法、flex tree算法、LART算法、随机森林算法、MART算法、机器学习算法、惩罚回归方法及其组合。
19.根据权利要求18的方法,其中所述分析分类程序包括选择 的项目以提供至少O.68的质量度量。
20.根据权利要求18的方法,其中所述分析分类程序包括选择的项目以提供O.70的质量度量。
21.根据权利要求18的方法,其中所述分析分类程序包括用于分类的至少O.70的至少一个质量度量。
22.根据权利要求I的方法,其中所述治疗方案包括选自下述组的ー种或多种进ー步测试、药理学干预、不治疗及其组合。
23.用于评价人的心血管健康的方法,其包括a)从人获得生物样品;b)测定生物样品中的选自下述组的至少3种蛋白标记物水平IL_16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18.TIMP. 4、 ΜΡ. K CRP, VEGF和 EGF ;c)获得包括每种蛋白标记物水平的数据集;d)将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;和e)基于步骤(d)中的分类确定针对所述人的治疗方案;其中所述人的心血管健康被评价。
24.根据权利要求23的方法,其中所述至少3种蛋白标记物选自下述组IL-16、嗜酸性粒细胞活化趋化因子、Fas配体、CTACK, MCP-3、HGF和sFAS。
25.根据权利要求23的方法,其中所述数据集还包括选自下述组的一个或多个临床指标的数据年龄、性别、LDL浓度、HDL浓度、甘油三酯浓度、血压、体重指数、CRP浓度、冠状动脉钙化评分、腰围、吸烟状况、心血管疾病的过去病史、心血管疾病的家族史、心率、空腹胰岛素浓度、空腹葡萄糖浓度、糖尿病状况、使用的高血压药物及其组合。
26.用于评价人的心血管健康以测定是否需要治疗方案或治疗方案的有效性的方法,其包括从人获得生物样品;测定生物样品中的选自表20中列出的miRNA的至少2种miRNA标记物水平;测定生物样品中的选自下述组的至少3种蛋白生物标记物水平IL_16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、TIMP. 4、TIMP. I、CRP、VEGF 和 EGF ;获得包括各个miRNA标记物和蛋白生物标记物水平的数据集;将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;和根据分类程序的输出对生物样品分类并基于所述分类确定针对所述人的治疗方案。
27.根据权利要求26的方法,其中所述miRNA标记物选自下述组miR_378、miR-497、miR-21、miR_15b、miR_99a、miR_29a、miR-24、miR_30b、miR_29c、miR-331. 3p、miR_19a、miR-22、miR-126、let_7b、miR-502. 3 和 miR-652。
28.根据权利要求26的方法,其中所述蛋白生物标记物选自下述组IL-16、嗜酸性粒细胞活化趋化因子、Fas配体、CTACK、MCP-3、HGF和sFAS。
29.用于评价人的心血管健康以测定是否需要治疗方案或治疗方案的有效性的试剂盒,其包含检验装置,用于测定生物样品中的选自表20中列出的miRNA的至少2种miRNA标记物水平;说明书,用于获得包括各个miRNA标记物水平的数据集,将所述数据输进分析分类程序,所述程序使用所述数据对生物样品分类,其中分类选自由动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类组成的组;和按照分类程序的输出对生物样品分类并基于分类确定针对人的治疗方案。
30.根据权利要求29的试剂盒,还包括检验装置,用于测定生物样品中的选自下述组的至少3种蛋白生物标记物水平IL-16、sFas、Fas配体、MCP_3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、TIMP. 4、TIMP. I、CRP、VEGF和EGF ;和说明书,用于获得包括各个蛋白标记物水平的数据集,将miRNA和蛋白标记物的数据输入分析分类程序,所述程序使用所述数据对生物样品分类,其中分类是选自下述组动脉粥样硬化心血管疾病分类、健康分类、药物暴露分类、非药物暴露分类;和按照分类程序的输出对生物样品分类并基于所述分类确定针对人的治疗方案。
31.用于评价人的心血管事件风险的方法,其包括a)从人获得生物样品;b)测定生物样品中的选自表20中列出的miRNA的至少2种miRNA标记物水平;c)获得包括每种miRNA标记物水平的数据集;d)将所述数据输入风险预测分析程序以基于所述数据集測定心血管事件风险;和e)基于步骤(d)中预测的心血管事件风险确定针对所述人的治疗方案;其中评价了人的心血管事件风险。
32.根据权利要求31的方法,其中针对选自下述组的时期測定所述心血管事件风险从获得样品的日期起约I年、约2年、约3年、约4年和约5年。
33.根据权利要求31的方法,还包括測定所述生物样品中的3种或更多种蛋白生物标记物水平。
34.根据权利要求33的方法,其中所述3种或更多种蛋白生物标记物选自下述组IL-16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18、TIMP. 4、TIMP. I、CRP、VEGF 和 EGF。
35.根据权利要求34的方法,其中所述三种或更多种蛋白生物标记物选自下述组IL-16、嗜酸性粒细胞活化趋化因子、Fas配体、CTACK、MCP-3、HGF和sFAS。
36.评价人的心血管事件风险的方法,其包括a)从人获得生物样品;b)测定样品中的选自下述组的多种蛋白生物标记物水平IL_16、sFas、Fas配体、MCP-3、HGF、CTACK、嗜酸性粒细胞活化趋化因子、脂联素、IL-18.TIMP. 4、 ΜΡ. I、CRP、VEGF和 EGF ;c)获得包括每ー蛋白生物标记物水平的数据集;d)将所述数据输入风险预测分析程序以基于所述数据集測定心血管事件风险;和e)基于步骤(d)中的心血管事件预测风险确定针对所述人的治疗方案;其中评价了人的心血管事件风险。
37.根据权利要求36的方法,其中针对选自下述组的时期測定心血管事件风险从获得样品的日期起约I年、约2年、约3年、约4年和约5年。
全文摘要
本文公开的方法、检验和试剂盒可以鉴定用于评价人的心血管健康的生物标记物,特别是miRNA和/或蛋白生物标记物人的心血管健康。在某些实施方式、方法、检验和试剂盒中,鉴定了循环miRNA和/或蛋白生物标记物,用于评价人的心血管健康。
文档编号G06F19/18GK102762743SQ201080063521
公开日2012年10月31日 申请日期2010年12月9日 优先权日2009年12月9日
发明者布鲁斯·菲尔普斯, 艾万格罗斯·海托普洛斯, 道格·哈林顿 申请人:阿维埃尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1