用于评价临床不育的方法和系统的制作方法

文档序号:6594597阅读:144来源:国知局
专利名称:用于评价临床不育的方法和系统的制作方法
用于评价临床不育的方法和系统交叉引用本申请要求2008年7月1日提交的美国临时专利申请号61/077,439和2008年7 月17日提交的美国临时专利申请号61/081,596的权益,这些申请通过引用全文并入本文。政府权益本发明在美国国家卫生研究院给予的联邦政府拨款第ROl GM067250和ROl HD057970号的政府支持下进行。美国政府对本发明有某些权利。
背景技术
生殖失败是严重的问题,临床上已通过各种辅助的生殖技术包括体外受精(IVF) 和胚胎移植(ET)来解决。由于体外受精提供了在形态学水平表现正常的胚胎用于移植到 完全易感的接受者,可能预料这些程序产生极其高的受孕率。尽管有这些努力,IVF/ET的成 功率低于理想。在1994年美国和加拿大公布的IVF/ET数据中,开始了 26,961个标准IVF 周期。其中,86. 2%达到采集,其中的90. 2%达到移植。然而,在临床妊娠方面,总成功率是 每个开始的周期22. 7%,每次移植29. 的妊娠率。另外,在体外受精之后似乎有早期妊娠丢失的高发生率,生化妊娠率是18%,自然 流产率是27%。因此,看起来IVF技术已被充分优化,但植入失败可能是进行ET的大量丢 失的原因,这种围植入丢失是可能改进的领域。各种辅助的生殖技术的成功率的关键因素 是子宫内膜容受性,这是一种必须与胚胎发育至植入_感受态的胚泡协调的过渡态。IVF是一种昂贵的程序,对于患者来说在心理学上可能是创伤性的。需要外科手 术来从IVF的女性收集卵子,在受精之后,需要进一步的外科手术来在子宫中植入受精卵。 然后接受者必须等待一段时间才能确定是否已建立起妊娠。在一些病例,可能尽管重复多 次努力而不能实现妊娠,这些病例可能对患者和社会在财务和人力两方面造成相当大的花 费。因此,尽管可改进IVF的成功率,可能期望的是能够在治疗前鉴定IVF不太可能成 功的接受者,从而使这些患者能够避免以上提到的IVF程序的花费和创伤。本发明解决了这些需要。发明概述提供了用于便于评价临床不育的方法和基于计算机的系统。可实施所述方法和系 统以,例如,便于为体外受精治疗周期评价受治疗者,包括确定活产事件概率。可实施所述 方法和系统以,例如,便于确定胚胎的成功植入、选择将移植的胚胎的最佳数目、确定在不 成功的治疗周期之后随后体外受精治疗周期的成功。本领域技术人员阅读以下更完全地描述的本发明细节之后,本发明的这些和其它 目标、益处和特征将变得明显。附图简述当结合附图阅读时,最佳地从以下详述理解本发明。需要强调的是,根据一般实 践,图的各个特征不是按比例的。相反,为了清楚,各个特征的大小是任意放大或缩小的。附 图中包括以下各图。


图1显示数据的来源。图A显示在2005年进行的IVF周期。图B显示在665个 新的、非供体IVF周期中卵母细胞和胚胎的利用。图A中的所有数目表示周期的数目,图B 中的数目表示卵母细胞或胚胎的数目。新的周期由在同一周期中进行的促性腺素卵巢刺激 和胚胎移植来界定;冷藏周期利用从之前的周期获得和冷藏的胚胎;“全冷冻”是其中由于 医学或非医学原因,在同一周期中进行卵巢刺激,但胚胎被冷藏而不是被移植回的周期。由 于多种医学和非医学原因未达到新鲜胚胎移植,从分析中去除157个周期。图2显示根据在第3天的细胞数目,来自665个新的、非供体IVF病例的所有胚胎 的分布。图3显示变量和其在确定A)8细胞胚胎数(图A)、第3天FSH(图B)和胚胎总数 (图C)时的相对重要性。图4显示细胞周期蛋白A2被CCna2-M0翻译阻滞,导致胚胎在2-细胞期停滞。图A 显示通过RT-PCR在1-至2-细胞胚胎中的CCna2表达。图B显示核细胞周期蛋白A2定位 在83. 4士6. 0% CCna2-M0-注射的胚胎中不存在,但在所有未注射胚胎中存在;ρ < 0. 01)。 图C显示 50kD细胞周期蛋白A2蛋白在CCna2-M0-注射的胚胎中未检测到。图5,图A显示与对照相比,CCna2-M0诱导更高比率的2-细胞期停滞(ρ < 0. 01)。 图B显示只有1. 8士 1. 8% Ccna2-M0-注射的胚胎达到胚泡期(与Ccna2-MM相比ρ = 0. 06)。 图C显示2-细胞期停滞比率随着Ccna2-M0浓度减少(0. 5mM的ρ = 0. 05 ;0. 25mM Wp = 0.01)。图D显示在0. 25mM比在0. 75mM胚泡发育比率更高(ρ < 0. 001)。所有的柱和误差 棒代表分别来自至少3个独立实验组的平均值士 s. e.m.。比例尺是40 μ m。参见表1使用 的所有MO的靶向序列,表7是在每组实验中检验的胚胎总数。图6显示在最早阶段调节哺乳动物胚胎发育的机制。在野生型(+/_)胚胎中,在 胚胎基因组激活(EGA)之前存在母体转录物,而在母体-胚胎过渡阶段存在母体转录物和 胚胎转录物,这二者导致产生正常基因产物(图A)。在从对无效突变杂合(+/_)的母体产 生的纯合无效突变(-/_)胚胎中,持续的母体转录物和/或蛋白可能“拯救”或延迟表型出 现(图B)。相反,在从纯合突变女性或带有卵母细胞_特异性基因缺失的女性产生的纯合 无效突变胚胎中,观察到的缺陷可能反映卵母细胞缺陷,而不是早期胚胎中的特异性基因 需求(图C)。因此,当母体和早期胚胎转录物二者可能同时存在时,这些策略不解决特异 性基因在EGA尖点或在EGA期间的精确作用。在EGA时或EGA之前细胞质微注射反义吗啉 代寡核苷酸(MO)到野生型胚胎中导致母体和胚胎基因转录物二者的特异性翻译阻滞(图 D)。因为MO持续至少数个细胞分裂周期,基因_特异性翻译阻滞可能直到桑葚胚_胚泡期 都有效。在这些发育阶段期间基因产物的不存在将揭示关键的基因功能和暴露早期表型, 这是在常规基因-靶向策略中通过同源重组和基因转置可能不可检测的。尽管在其它物种 中已充分建立此模型,其将示例从考察胚胎基因的功能转化为考察基因产物的功能而不论 其母体或胚胎来源。图7显示实验策略。从野生型交配收集在2前核(2PN)或1_细胞期的胚胎,并注 射设计为靶向特定基因的反义吗啉代寡聚物(MO)。MO结合于5’ UTR或转录起始位点并通 过空间位阻阻滞翻译。体外培养微注射的胚胎和未注射的对照胚胎,观察发育表型诸如在 2-细胞、4-细胞、多细胞或桑葚胚阶段碎裂或停滞。如果基因-特异性MO —致地产生相同 表型,而错配对照MO允许正常发育,则目标基因的敲低由免疫细胞化学和/或免疫印迹法验证。基因功能的机制通过从在mid-2-细胞期(HCG后43小时)的注射和对照胚胎获得 全体基因表达谱而进一步研究。检验候选下游基因在早期胚胎中的差异表达和基因功能。图8显示通过单胚胎RT-PCR在小鼠合子中的0ct4表达。图9显示在形成胚泡之前早期胚胎发育需要0ct4。图A显示0ct4-M0_注射的胚胎 在多细胞期停滞,而对照达到胚泡期。图B显示0ct4敲低诱导在1-至多细胞期更高的停滞 比率;P <0.01。图C显示0ct4-M0-注射的胚胎都不发育为胚泡。图D显示随着0ct4-M0 浓度,在1-至多细胞期停滞比率减少(P < 0. 01)。图E显示随着减少浓度的0ct4-M0,有 更高比率胚泡发育的非显著趋势。图10显示在0ct4-M0_注射的胚胎中在4_细胞期之前减少的0ct4表达是明显 的。0ct4信号在注射0ct4-M0的胚胎中不存在,但其核定位在未注射的对照和错配对照中 存在。比例尺是40 μ m。图11,图A显示核0ct4表达在0ct4-M0_注射的胚胎中不存在(上图),但在 0ct4-MM-注射的胚胎和未注射的胚胎中存在。图B显示与没有共注射或mEYFP mRNA共注射 相比,共注射36或3. 6ng/μ L 0ct4 mRNA通过具体地减少在1-至多细胞期的停滞比率而导 致部分拯救0ct4-M0诱导的表型,这导致更高比率的胚泡发育(ρ <0.01)。图C显示过表 达0ct4 mRNA以剂量依赖性方式诱导更高的发育停滞,以使注射36或90ng/ μ L 0ct4mRNA 后与过表达mEYFP相比胚泡比率显著降低(ρ < 0. 01)。基因过表达通过q_PCR或免疫细胞 化学验证(数据未显示)。(比例尺是=40 μ m)。图12显示0(^4-| -注射的胚胎中在多细胞期减少的0(^4表达。只有6.4士3.2% 0ct4-M0-注射的胚胎显示核0ct4信号,而88. 9士 11. 1 % 0ct4-MM-注射的胚胎和 82. 7士 10. 9%未注射的对照胚胎在多细胞期显示明确的核0ct4表达;ρ < 0. 05。图13显示由0ct4E4_M0证实在早期胚胎发育中需要0ct4,0ct4E4_M0是靶向0ct4 的外显子4的剪接位点的反义吗啉代。图A显示由两种吗啉代0ct4-M0和0ct4E4-M0靶向 的位点。0ct4-M0靶向开始于ATG起始位点的25个核苷酸,而0ct4E4_M0靶向在第4个外显 子(E4)的内含子(I)-外显子(E)边界的剪接位点。预期去除E4会产生一种缺少DNA-结 合和活化结构域的蛋白产物。图B显示注射0ct4E4-M0的64. 6士 19. 9%的胚胎在2-细胞 期停滞,而注射错配对照0ct4E4-MM的胚胎都不在2-细胞期停滞。图C显示与错配对照 0ct4E4-MM相比,注射0ct4E4-M0之后胚泡发育严重受损。图14和15显示0ct4的基因调节。图14,图A显示3种0ct4敲低、3种Ccna2 敲低和6种未注射的(Ni)汇集的胚胎样品的无监督聚类(unsupervised clustering),以 及增加(红色)和减少的(蓝色)基因表达。标尺是标准偏差。图14,图B显示差异表达 的基因在0ct4和CCna2敲低胚胎中的交叉。图14,图C和图15显示通过单胚胎q_PCR的 0ct4敲低相对表达,图14,图C是过表达的基因(对Hes5p < 0. 05),图15是下调的基因 (*p << 0. 001,**p < 0. 05,***p < 0· 1)。TR 是翻译阻遏。误差棒表示 s. e. m.。图16显示0ct4功能在1-至2-细胞期的模型。图A显示绝对(Δ Ct)(红色)大于 其s.e.m.(蓝色)的基因,基于递增的s. e.m.顺时针地排列(对数标尺)。图B显示0ct4 经由转录和转录后机制对各模块提议的调节。图17显示活产分析的数据来源概述。框中的数目表示在Stanford IVF中心经 2003-06进行的新周期的数目。未包括的周期是关于代孕母亲(gestational carriers),冷冻ET或冷藏胚胎移植(利用冷冻胚胎的周期,不论周期是在Stanford还是外面进行)、 供体卵母细胞(非自身卵母细胞)、接受者周期和其中不注射促性腺素的周期。因为重复的 条目和未知结果,从分析排除9个周期。取决于患者为了新的IVF周期返回的次数,分析的 周期进一步分为周期1、2、3或超过。图18显示活产结果的概述。不同的框代表Cl (第一-IVF周期)、C2(第二-IVF 周期)和C3(第三-IVF周期)。每个框显示具有活产(LB+)或无活产(LB-)结果的周期数 目、分析的周期总数目(N)的百分比以及退出并没有返回的患者数目。图19是显示胚胎关于发育阶段的分布的图。来自所有三个周期的2969个新的、非 供体IVF病例根据在体外培养第3天的细胞数目的分布。每个胚胎的细胞数目和具有8个 细胞的胚胎的最大数目( 40%)在周期Cl (无填充图案)、C2(水平填充图案)和C3(垂 直填充图案)之间相似。图20显示预测模型和它们与典型IVF周期的时间关系。IVF周期包括利用口服 避孕药(OCP)下调内源促性腺素和月经周期、定期FSH注射、和以带有或不带有血清雌二醇 的超声波监控周期、然后是hCG注射以模拟内源LH波动、卵母细胞采集、由IVF或ICSI受 精、体外胚胎培养、胚胎移植、和低温储存多余胚胎。三个黑色星形代表患者可获取关于进 一步治疗选择和是否继续治疗的知情决定的时间点。Pre-IVF模型继续直到治疗开始日。 Pre-OR(卵母细胞采集)模型继续直到hCG注射。Post-IVF模型包括直到胚胎移植的所有 变量。图21A、2IB禾P 2IC显示三个分析组的树模型=Pre-IVF(2ΙΑ), Pre-OR(21B)和 Post-IVF(21C)。饼图显示活产(LB)在分析的周期总数目(N)中的百分比。最终人群标为 群l(Pop 1)等等,并标出其活产率。图22显示2007年数据集的纳入和排除标准。图23显示Pre-IVF、Pre-OR和Post-IVF模型鉴定具有不同活产率的不同群。图 24A、24B 和 24C 显示 Pre-IVF (图 23A)、Pre-OR-(图 23B)、Post-IVF 模型和基 于年龄的对照模型之间活产率的比较。图25显示Post-IVF模型Cl群分配预测在C2中的不同活产率和在随后周期(C2 和C3)中的累计活产率。图26显示在1-细胞期进行的基因芯片实验结果。图27显示在4-细胞期进行的基因芯片实验结果。图28显示在8-细胞期进行的基因芯片实验结果。图29显示两个基因芯片实验的关联,显示一组基因在不同细胞期的表达。图30显示两个基因芯片实验的关联,显示一组基因在不同细胞期的表达。在描述本发明的实施方案之前,要理解的是,本发明不限于所描述的具体实施方 案,因为这些当然可以变化。还需要理解的是,在本文使用的术语仅用于描述特定实施方案 的目的,不意为限制性的,因为本发明的范围将仅由附随的权利要求书限定。当提供数值的范围时,要理解的是,除非上下文明确地相反说明,否则在所述范围 的上限和下限之间的每个中间值,直到所述下限的单位的十分之一,也具体地公开了。在提 及的范围内任何提及的值或中间值与在提及的范围内任何其它提及的值或中间值之间的 每个更小的范围包含于本发明的范围内。这些更小的范围的上限和下限可以独立地包括或排除在所述更小的范围之内,且上限和下限的之一、无一或二者包括在所述更小的范围之 内时的范围也包含于本发明的范围内,并受在所提及的范围内特别排除任何值的限制。当 提及的范围包括两个限值之一或二者时,排除了所包括的限值之一或两者的范围也包括在 本发明的范围之内。除非另外定义,否则本文使用的所有技术术语和科学术语与本发明所属技术领域 普通技术人员通常所理解的含义相同。尽管类似于或等同于在本文描述的任何方法和材料 可以用于本发明的实践或试验,但现在描述了一些可能的和优选的方法和材料。在本文中 提及的所有出版物在此通过引用并入本发明,来公开和描述与所述出版物所引用的相关的 方法和/或材料。应理解的是,当本发明公开与并入的出版物的任何公开存在矛盾时,以本 发明公开为准。必须注意的是,在本文使用的和在附随的权利要求书中,除非上下文中有明确的 相反说明,否则单数形式“一(a)”、“一(an)”和“该(the) ”包括了复数的指称对象。因此, 例如,提及“一个细胞”包括多个这样的细胞,提及“该化合物”包括提及一种或多种化合物 和本领域技术人员已知的其等价物,等等。进一步注意,权利要求可以撰写成排除任何任选的元素。因而,这一声明旨在充当 先行的基础,用于与权利要求元素的叙述一起来使用排他性术语如“单独地”、“仅”等等,或 用于“否定的”限制。本文讨论的出版物仅为了其在本申请提交日之前的公开而被提供。此处不应解释 为一种承认,即承认本发明没有权利凭借在先发明而先于上述出版物。进一步的,所提供的 出版物的日期可能不同于实际的出版日期,其可能需要被独立地确认。定义术语“受治疗者”、“个体”和“患者”在本文可互换地使用,指被评价治疗和/或正 被治疗的哺乳动物。在一个实施方案中,哺乳动物是人类,诸如女人。因此,术语“受治疗 者”、“个体”和“患者”涵盖需要评价临床不育的个体,包括已经经历体外受精周期或正候选 体外受精周期的个体。本文所用的术语“相关”或“与...相关”和类似术语是指两次事件的实例之间统 计相联,其中事件包括数目、数据集等等。例如,当事件包括数目时,正相关(在本文还称为 “直接相关”)表示当一个增加时,另一个也增加。负相关(在本文还称为“逆相关”)表示 当一个增加时,另一个减少。“生物样品”涵盖从个体获得的多种样品类型。该定义涵盖血液和生物来源的其它 液体样品、实体组织样品诸如活检样本或来源于其的组织培养物或细胞及其后代。该定义 还包括在取得后已通过任何方式操纵的样品,诸如通过试剂处理;洗涤;或富集某些细胞 群诸如癌细胞。该定义还包括已经富集特定类型分子如核酸、多肽等等的样品。术语“生物 样品”涵盖临床样品,并还包括通过外科切除获得的组织、由活检获得的组织、培养的细胞、 细胞上清液、细胞裂解物、组织样品、器官、骨髓、血液、血浆、血清等等。“生物样品”包括从 患者子宫获得的样品,包括胚胎培养物。术语“基因产物”和“表达产物”在本文提及基因时可互换地使用,是指基因的RNA 转录产物(转录物),包括mRNA和这种RNA转录物的多肽翻译产物,无论所述产物是否在翻 译后被修饰。术语“基因产物”和“表达产物”在本文提及RNA,特别是mRNA时可互换地使用,是指这种RNA的多肽翻译产物,无论所述产物是否在翻译后被修饰。基因产物可以是, 例如,未剪接的RNA、mRNA、剪接变体mRNA、多肽、翻译后修饰多肽、剪接变体多肽等等。本文所用的术语“标准化的表达水平”是指响应指示基因相对于参考基因的表达 产物水平的表达水平。本文所用的术语“标记”和“检测标记”是指能够被检测的分子,其中所述分子包 括但不限于,放射性同位素、荧光剂(荧光团)、化学发光剂、生色团、酶、酶底物、酶辅因子、 酶抑制剂、生色团、染料、金属离子、金属溶胶、配体(如,生物素、亲和素、链霉亲和素或半 抗原)、嵌入染料及类似物。术语“荧光剂”或“荧光团”是指能够在可检测的范围表现荧光 的物质或其部分。本文所用的术语“靶核酸区”或“靶核酸”是指带有将被检测(如,在包括核酸杂交 和/或扩增的方法中)的“靶序列”的核酸。靶核酸可以是单链或双链的,可以包括或不包 括靶序列以外的其它序列(如,靶核酸可以包括或不包括上游的核酸序列或5’侧翼序列, 可以包括或不包括下游或3’侧翼序列。当检测是通过扩增时,靶序列以外的这些其它序列 可与靶序列一起扩增或不与靶序列一起扩增。本文所用的术语“引物”或“寡核苷酸引物”是指当放置在其中诱导引物延伸产物 合成的条件下时,作用为起始互补核酸链合成的寡核苷酸,如,在存在核苷酸和聚合诱导剂 诸如DNA或RNA聚合酶并在合适温度、pH、金属离子浓度和盐浓度时。引物通常为与其在合 成引物延伸产物中的用途相适合的长度,长度可以在约8个核苷酸至约100个核苷酸(nt) 的范围,诸如约IOnt至约75nt、约15nt至约60nt、约15nt至约40nt、约18nt至约30nt、 约20nt至约40nt、约2Int至约50nt、约22nt至约45nt、约25nt至约40nt、等等,如,长度 在约18nt至约40nt、约20nt至约35nt、约21至约30nt的范围(包含性)、和在所提出范 围之间的任何长度。引物可以在长约10-50个核苷酸的范围,诸如约15-45、约18-40、约 20-30、约21-25nt、等等、和在所提出范围之间的任何长度。在一些实施方案中,引物长度不 超过约 10、12、15、20、21、22、23、24、25、26、27、28、四、30、;35、40、45、50、55、60、65 或 70 个核 苷酸。在这样的上下文中,术语“约”可以解释为表示从5’或3’任一端或从两端多1、2、3、 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19 或 20 个核苷酸。在许多实施方案中,为了扩增的最大效率,引物是单链的,但可选地可以是双链 的。如果是双链,在许多实施方案中,在被用于制备延伸产物之前,引物首先被处理以分开 其各链。这一变性步骤通常通过加热实现,但可选地可以利用碱,随后中和来实现。从而, “引物”与模板互补,通过氢键合或杂交与模板复合,获得引物/模板复合体以起始由聚合酶 的合成,通过在其3’端共价加入碱基来延伸。本文所用的“引物对”是指具有适于基于核酸扩增靶核酸的核酸序列的第一引物 和第二引物。这样的引物对通常包括具有与靶核酸第一部分相同或相似的序列的第一引 物、和具有与靶核酸第二部分互补的序列的第二引物,以提供靶核酸或其片段的扩增。除非 另外特别指明,否则本文提及“第一”和“第二”引物是随机的。例如,第一引物可设计为“正 向引物”(起始从靶核酸5’端的核酸合成)或为“反向引物”(起始从正向引物起始的合成 产生的延伸产物5’端的核酸合成)。类似地,第二引物可设计为正向引物或反向引物。本文所用的术语“探针”或“寡核苷酸探针”在本文可交换使用,是指包括如上定义 的多核苷酸的结构,含有与靶核酸分析物(如,核酸扩增产物)中存在的核酸序列互补的核酸序列。探针的多核苷酸区域可包括DNA、和/或RNA、和/或合成的核苷酸类似物。探针 的长度通常与其在特异性检测靶核酸的靶序列的所有或部分中的用途相适应,在许多实施 方案中,长度在约8nt至约IOOnt的范围,诸如约8至约75nt,约10至约7^t,约12至约 72nt,约15至约60nt,约15至约40nt,约18至约30nt,约20至约40nt,约21至约50nt, 约22至约45nt,约25至约40nt,等等,如,长度在约18_40nt,约20_35nt或约21_30nt的 范围,和所指范围之间的任何长度。在一些实施方案中,探针长在约10-50个核苷酸的范 围,诸如约15-45,约18-40,约20-30,约21-28,约22-25,等等,和所指范围之间的任何长 度。在一些实施方案中,引物长度不超过约10、12、15、20、21、22、23、M、25J6、27J8、29、 30、35、40、45、50、55、60、65或70个核苷酸。在这一上下文中,术语“约”可解释为表示在5, 或 3,的任一端或两端多 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19 或 20 个核 苷酸。当表示核酸杂交于所指核酸序列时,杂交是在严格条件下。严格杂交条件的一个 实例是在50°C或更高温度和0. lXSSC(15mM氯化钠/1. 5mM柠檬酸钠)杂交。严格杂交条 件的另一实例是在42°C在以下溶液中过夜培养50%甲酰胺、5XSSC(150mM NaCl、15mM柠 檬酸三钠)、50mM磷酸钠(pH7. 6) ,5 XDenhardt溶液、10%葡聚糖硫酸酯和20 μ g/ml变性 的、修剪的鲑精DNA,随后在约65°C在0. IXSSC中洗涤滤器。严格杂交条件是至少与上述 代表性条件同样严格的杂交条件,其中如果条件与以上具体严格条件至少约80%地同样严 格,如,至少约90%地同样严格,则认为条件是至少同样严格的。发明详述如上所述,提供了用于便于评价临床不育的方法和基于计算机的系统。可实施所 述方法和系统以,例如,便于为体外受精治疗周期评价受治疗者,包括确定活产事件概率。 可实施所述方法和系统以,例如,便于确定胚胎的成功植入、选择将移植的胚胎的最佳数 目、确定在不成功的治疗周期之后随后体外受精治疗周期的成功。在某些实施方案中,所述方法包括从女性受治疗者获得信息项以提供所述女性受 治疗者的谱,其中每个信息项与预选的患者变量有关,利用基于所述预选的患者变量的算 法比较所述女性受治疗者的所述谱与已知指示对体外受精程序的响应度的已知谱图的文 库,其中所述比较提供为体外受精程序对所述女性受治疗者的评价。在某些实施方案中,所 述体外受精程序是所述女性受治疗者的至少第二次体外受精程序。各信息项可由女性受治疗者基于书面或电子的调查问卷提供,或可在医学评价期 间或与医学评价同时由医疗从业者诸如医生、护士、技术员等等请求、抄写或以其它方式记 录,医学评价可任选地伴有对经历第一或随后的体外受精周期的确定。关于预选的患者变量的示例信息项包括但不限于患者特征,诸如年龄、此前的不 育史、临床诊断;临床治疗信息,诸如药物类型、刺激天数、卵母细胞数目、等等;常规胚胎 形态学数据,诸如胚胎数目、发育阶段、等级等等。在一些实施方案中,信息包括年龄、胚胎 总数、分裂停滞率、8细胞胚胎数、第3天促卵泡激素(FSH)水平和移植的8细胞胚胎数。在某些实施方案中,所述体外受精程序在所述体外受精程序之后提供活产事件。 在所述实施方案中,方法至少部分基于女性受治疗者的信息项,提供第一或随后的体外受 精周期导致的活产事件概率。在一些实施方案中,所述女性受治疗者是体外受精前(pre-IVF)程序患者。在某些实施方案中,有关预选的患者变量、用于为pre-IVF程序患者确定活产事件概率的信息 项可包括年龄、卵巢储备下降(diminished ovarian reserve)、第3天促卵泡激素(FSH)水 平、体重指数、多囊卵巢病、季节、原因不明的女性不育、自然流产次数、年份、女性不育的其 它原因、此前妊娠次数、此前足月分娩次数、子宫内膜异位症、输卵管病、输卵管结扎、男性 不育症、子宫肌瘤、输卵管积水和男性不育症原因。在一些实施方案中,所述女性受治疗者是外科手术前(pre-OR)程序患者(pre-OR 在本文还称为卵母细胞采集前)。在某些实施方案中,有关预选的患者变量、用于为pre-OR 程序患者确定活产事件概率的信息项可包括年龄、子宫内膜厚度、卵母细胞总数、施用促性 腺素的总量、洗涤后活动精子总数、洗涤前活动精子总数、第3天促卵泡激素(FSH)水平、体 重指数、采精、配偶年龄、季节、自然流产次数、原因不明的女性不育、此前足月分娩次数、年 份、此前妊娠次数、女性不育的其它原因、子宫内膜异位症、男性不育症、输卵管结扎、多囊 卵巢病、输卵管病、来自供者的精子、输卵管积水、子宫肌瘤和男性不育症原因。在一些实施方案中,所述女性受治疗者是体外受精后(post-IVF)程序患者。在 某些实施方案中,有关预选的患者变量、用于为pre-IVF程序患者确定活产事件概率的信 息项可包括胚泡发育速度、胚胎总数、施用促性腺素的总量、子宫内膜厚度、短方案(flare protocol)、每个胚胎的平均细胞数、所用导管类型、移植的8细胞胚胎百分比、第3天促卵 泡激素(FSH)水平、体重指数、洗涤前活动精子数、洗涤后活动精子数、胚胎平均等级、胚胎 移植日、季节、自然流产次数、此前足月分娩次数、口服避孕药、采精、未受精卵百分比、在4 细胞期停滞的胚胎数、移植后第3天的紧密化、正常受精百分比、异常受精卵百分比、正常 和成熟卵母细胞百分比、此前妊娠次数、年份、多囊卵巢病、原因不明的女性不育、输卵管 病、仅男性不育症、男性不育症原因、子宫内膜异位症、女性不育的其它原因、子宫肌瘤、输 卵管结扎、来自供者的精子、输卵管积水、ICSI表现或辅助孵化。另外的参数实例在实施例部分提供,包括例如表13和表15。在某些实施方案中,所述方法包括获得有关至少两个预选的患者变量或更多的信 息项。如此,在其它实施方案中,方法包括获得关于3个或更多个预选的患者变量的信息 项,包括4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更 多个、10个或更多个、12个或更多个、15个或更多个、17个或更多个、20个或更多个、等等。在某些实施方案中,所述方法包括对每个预选的患者变量分配相对于其它预选的 患者变量的加权相对重要性。例如,在I^re-IVF模型受治疗者的分析中,对年龄和卵巢储备 下降的预选的患者变量给予比其它预选的患者变量更高的相对重要性值,其它预选的患者 变量诸如例如,体重指数、输卵管病(tubular disease)和子宫内膜异位症。在所述实施方 案中,每个预选的患者变量的相对重要性总和将等于100。在另一实施方案中,在模型受治疗者的分析中,对促性腺素总量、子宫内 膜厚度和年龄的预选的患者变量给予比其它预选的患者变量更高的相对重要性值,其它预 选的患者变量诸如例如,此前妊娠次数、输卵管结扎和自然流产次数。在所述实施方案中, 每个预选的患者变量的相对重要性总和将等于100。在另一实施方案中,在Post-IVF模型受治疗者的分析中,对胚泡发育速度、胚胎 总数、施用促性腺素的总量和子宫内膜厚度的预选的患者变量给予比其它预选的患者变量 更高的相对重要性值,其它预选的患者变量诸如例如,体重指数、洗涤前活动精子数、洗涤后活动精子数、胚胎平均等级和胚胎移植日。在所述实施方案中,每个预选的患者变量的相 对重要性总和将等于100。在一些实施方案中,所述比较包括应用判定规则。在一些实施方案中,所述数据 分析算法包括使用分类树。在其它实施方案中,所述数据分析算法是非参数的,诸如使用 Wilcoxon符号秩检验(Wilcoxon Signed Rank Test) 0在某些实施方案中,所述数据分析 算法检测特征值分布的差异。在一些实施方案中,所述数据分析算法包括使用多重累计回 归树。在一些实施方案中,所述数据分析算法是逻辑回归。在进一步实施方案中,方法包括评价来自女性受治疗者的停滞胚胎的基因表达 谱。例如,检测已经停滞的胚胎,例如在体外受精后第3天具有少于约5个细胞的胚胎对于 胚胎发育关键的一组基因的相对表达水平。然后将基因表达谱与对照基因表达谱比较。其标准化的表达水平与不育或体外受精周期的成功或失败可能性相关(正相关 或负相关)的任何基因适于用于本发明方法。示例性的基因包括但不限于,0ct4、Eif3c、 Papola、Piwil2、Eif3b、Eif4b、Rbm3、Cpsf4和发现当敲低0ct4或敲低编码多能调节子的 另一基因(如&1114)时被下调或上调的其它基因。其它示例性基因包括列在附录A-D中 表8A、8B、9A和9B、以及表12中的基因。这些基因产物在本文称为“不育指示基因产物”; 编码响应指示基因产物的基因称为“不育指示基因”。可确定一种或多种这些不育指示基因 的标准化的表达水平来评价女性患者的体外受精治疗周期。不育指示基因如以下实施例中 详述地鉴定。适于用在分析中的其它基因可利用本文在实施例部分描述的方法鉴定。在进行所述评价时,检测包含不育指示基因的样品的不育指示基因产物水平。当 被检测的基因产物是核酸时,核酸样品(如,包含核酸的样品)从胚胎细胞获得。当被检测 的基因产物是蛋白时,多肽样品(如,包含多肽的样品)从胚胎获得。核酸(包括mRNA)和/或多肽不育指示基因产物可利用标准方法从包括卵母细胞 的胚胎获得,诸如停滞的胚胎或卵母细胞(如,在受精后约第3天具有少于约8个细胞的胚 胎或卵母细胞,包括约7个细胞、约6个细胞、约5个细胞、约4个细胞、约3个细胞、等等)。 核酸和/或多肽基因产物的水平可利用多种已知方法的任一种测量,包括在以下实施例中 描述的方法。响应指示基因的表达水平相对于参考基因表达产物的水平标准化。评价不育可能 性通过比较标准化的表达水平与胚胎细胞中该基因产物的标准化的表达水平的一定范围 的值来进行。可进行一种或多种不育指示基因的标准化的表达水平来评价患者将正或负响应 体外受精治疗周期的可能性。可进行单个不育指示基因的标准化的表达水平来评价患者将 正或负响应体外受精治疗周期的可能性。此外,可进行两种或多种不育指示基因的标准化 的表达水平来评价患者将正或负响应体外受精治疗周期的可能性。分析可以更严格,如,移 植到女性患者的胚胎的最佳数目以使活产结果的可能性最大同时使多胎妊娠的可能性最 小。分析可以较不严格,如,患者将表现对体外受精治疗周期有益响应的可能性。在一些实施方案中,分析包括确定移植胚胎的最佳数目以使受治疗者多胎妊娠事 件的概率最小。在所述实施方案中,首先鉴定受治疗者为具有多胎妊娠事件高概率的受治 疗者。然后分析受治疗者以确定移植胚胎的最佳数目以在体外受精周期后提供单活产事 件。
应理解的是,评价患者将正或负响应体外受精治疗周期的可能性可通过确定两种 或更多不育指示基因(如,1、2、3、4、5、6、7、8、9、10或更多种不育指示基因)或一组或多组 不育指示基因的任意组合的标准化的表达水平来进行。评价可包括分析不育指示基因组 合的表达水平,并确定不育指示基因组合的标准化的表达水平,其中不育指示基因产物可 包括与体外受精治疗周期正相关的基因产物和与体外受精治疗周期负相关的基因产物。例 如,可确定与体外受精治疗周期正相关的第一基因的标准化的水平,和与体外受精治疗周 期负相关的第二基因的标准化的水平。确定基因产物的标准化水平如上所述,不育指示基因的表达水平被标准化,从而提供标准化值。不育指示基因 的表达水平相对于参考基因表达产物的水平标准化。例如,不育指示基因的表达水平可相对于两种或更多参考基因的基因产物的平均 水平标准化。例如,不育指示基因的表达水平可相对于所有检验的基因或检验的基因的亚 组的基因产物的平均水平标准化,其中检验的基因的亚组可包括3、4、5、6、7、8、9或更多种 检验的基因。适合的参考基因包括但不限于,甘油醛-3-磷酸脱氢酶(GAPDH)(参见如,GenBank 登录号NM_002046 ;磷酸甘油酸酯激酶1(参见如,GenBank登录号NM_00(^91);乳酸脱 氢酶A(参见如,GenBank登录号NM_005566);核糖体蛋白L32(参见如,GenBank登录号 NM_000994);核糖体蛋白S18(参见如,GenBank登录号NM_022551);微管蛋白β多肽 (TUBB)(参见如,GenBank登录号ΝΜ_001069);和β肌动蛋白(参见如,GenBank登录号 NM_001101)。参见如,Eisenberg 禾口 Levanon (2003) Trends in Genetics 19:362,另外的合 适参考基因的列表。TaqMan RT-PCR测量的RNA转录物水平是指循环阈值(Ct)。Ct越低,样品中 存在mRNA的量越大。RNA转录物在样品中的表达值是标准化的,如,通过首先确定指定参考 基因在样品中的Ct平均表达值(Ct#if)。然后计算基因的标准化的表达值(Ctaffl)为Cts H-Ct Ct#ifo任选地,可调整所有基因的标准化的表达值,如,以使所有调整后的标准化的 Ct具有> 0的值。确定有益响应的概率对个体患者确定的不育指示基因产物的标准化水平可与在已知临床结果的患者 群体中确定的不育指示基因标准化的表达水平值比较,以确定个体患者有益响应于体外受 精治疗周期的概率。可使用与概率相关的标准化的表达水平值(如,表示为Ct)。例如,可 图解地比较响应指示基因产物的标准化的水平,以确定有益响应于体外受精治疗周期的概率。可进行本文关于评价响应可能性的所述方法描述的分析和确定而不需要评价响 应指示基因水平随时间的任何变化。分类树分析分析这一数据的一种方法是使用搜寻大数据集中的模式和关系的分类树算法。 “分类树”是一种利用一组问题为体外受精程序评价女性受治疗者的递归分割,这些问题设 计为将患者准确地归为一类。每个问题询问患者的情况是否满足一个给定预测值,每个回 答被用来指导用户沿着分类树向下,直到可确定患者落入的类。本文所用的“预测值”是特征的值的范围,所述特征诸如例如,年龄、胚胎总数、分裂停滞率、8细胞胚胎数、第3天促卵 泡激素(FSH)水平和移植的8细胞胚胎数。多重累计回归树利用多重累计回归树(MART)的自动、灵活的建模技术也可用于将特征组分类为 属于两个群体之一。MART模型利用起始补偿,这指明施加到所有预测值的常数,然后是一系 列回归树。其拟合由每个树中决定点数目、待拟合的树数目、和指明具体的树如何根本地影 响MART模型的“粒度常数”指明。对于每次迭代,拟合回归树以估计拟合标准的最速下降 的方向。在该方向采取具有由粒度常数指明的长度的步长。随后MART模型由起始补偿加 上回归树提供的步长构成。重新计算观察值与预测值之间的差,再次继续该循环,导致预测 值的渐进性细化。该过程继续预定数目的循环,或直到触发了一些终止规则。每个树中分叉数目是尤其有意义的拟合参数。如果每个树仅具有一个分叉,模型 看起来只有一个特征,不具有组合两个预测值的能力。如果每个树具有两个分叉,模型可容 纳特征间双向的相互作用。如果有三个树,模型可容纳三向的相互作用,等等。预测类状态时的特征组的值对具有特征和已知类状态的数据集确定。MART提供单 个特征对分类判定规则的贡献或重要性的量度。具体地,可测量单个特征对在给定树分叉 选择时的判定规则贡献的程度以提供特征在其确定最终判定规则中的重要性的分级。对同 一数据集重复MART分析可能产生对特征略微不同的分级,尤其是关于在确立判定规则时 较不重要的那些特征。因此,可用于本发明的预测特征和其相应的生物标记可能与本文所 列的那些略微不同。MART技术的一种示例性实现见于R统计编程环境的模块或“包”(参见Venables 等人,Modern Applied Statistics with S,第 4版· (Springer, 2002)中;www. r-project. org)。这一文献里报道的结果利用R 1. 7. 0和1. 7. 1版本计算。Dr. Greg Ridgeway编写的 实现MART的模块称为“gbm”,也可下载获得(参见誦.r-project. org)。MART算法服从 十倍交叉验证。粒度参数设为0.05,gbm包的内部终止规则是基于在每个标出的迭代排除 20%的数据情形。相互作用程度设为一,所以认为各特征之间没有相互作用。gbm包基于百 分比估计各特征的相对重要性,生物标记谱的所有特征累加等于100%。一起占总重要性 的至少90%的具有最高重要性的特征,报告为可能具有预测值。注意,拟合每个MART模型 时的终止规则对模型拟合和特征选择贡献随机分量。因此,基于同样数据运行的多个MART 建模可能选择略微或甚至可能完全不同的特征组。这样的不同组传递相同的预测信息;因 此,所有组在本发明中有用。拟合MART模型时,预计足够的次数产生谱中所有可能的预测 特征组。因此,公开的预测值组仅仅是可用于将个体分类为群体的特征组的代表。Wilcoxon符号秩检验分析在另一方法中,非参数的检验诸如Wilc0x0n符号秩检验可用于鉴定感兴趣的单 独生物标记。对生物标记谱中的特征指定“P-值”,这表示生物标记可用于将个体分类为属 于具体参考群体的确定性程度。通常,具有预测值的P-值低于约0.05。具有低P-值的生 物标记本身可用于分类个体。可选地,两个或更多生物标记的组合可用于分类个体,其中基 于生物标记的相对P-值选择组合。一般,对于给定信息项组合,具有较低P-值的生物标记 是优选的。至少三个、四个、五个、六个、10、20或30或更多生物标记的组合也可用于以这种 方式分类个体。技术人员将理解,取决于参考群体的大小,任何给定生物标记的相对P-值可能变化。分析结果报告如上讨论的,为了体外受精程序评价女性受治疗者,包括确定活产事件概率,通过 以下进行获得来自女性受治疗者的信息项并利用基于所述预选的患者变量的算法比较来 自女性受治疗者的信息项与已知指示对体外受精程序的响应度的已知谱图的文库,任选地 评价一种或多种不育性响应基因的标准化的表达水平。在一些实施方案中,患者的评价在 报告中提供。因此,在一些实施方案中,方法进一步包括准备或生成包括关于患者体外受精 程序成功可能性的信息的报告的步骤。例如,所述方法可进一步包括生成或输出提供对患 者评价结果的报告的步骤,该报告可以电子介质(如,计算机显示器上的电子展示)或以有 形介质形式(如,印在纸或其它有形介质上的报告)提供。包括关于对患者评价的信息的报告提供给用户。评价可包括,例如,确定胚胎的成 功植入、选择将移植的胚胎的最佳数目、和确定在不成功的治疗周期之后随后体外受精治 疗周期的成功。报告生成者还可进行样品收集、样品处理和数据生成的一种或多种,如,报告生成 者还可进行以下一种或多种a)样品收集;b)样品处理;C)测量不育指示基因产物水平; d)测量参考基因产物水平;和e)确定不育指示基因产物的标准化水平。可选地,报告生成 者以外的机构可进行样品收集、样品处理和数据生成的一种或多种。应注意的是,为了清楚起见,术语“用户,,与“客户,,可互换使用,是指向其传送报 告的个人或机构,可以是进行以下一种或多种的同一个人或机构a)收集样品;b)处理样 品;c)提供样品或处理过的样品;和d)生成用于可能性评价的数据(如,响应指示基因产 物水平;参考基因产物水平;响应指示基因产物的标准化的水平)。在一些情况,提供样品 收集和/或样品处理和/或数据生成的个人或机构与接收结果和/或报告的人可以是不同 的人,但在本文都称为“用户”或“客户”以避免混淆。在某些实施方案中,如,当方法完全 在单个计算机上执行时,用户或客户提供数据输入和数据输出的评论。“用户”可以是保健 专业人员(如,临床医师、实验室技术员、内科医生(如,生殖内分泌专家)等等)。在用户仅执行一部分方法的实施方案中,在根据本发明方法计算机化数据处理 后,评论数据输出(如,在发布以提供完整报告之前的结果、完整、或评论“不完整”报告、提 供人工干预和完成解释性报告)的个体在本文称为“评论者”。评论者可以位于用户远端 (如,在设在用户位于的医疗机构以外的机构)。报告本文所述的“报告”是电子或有形文件,包括提供关于所述可能性评价和其结果的 目标信息的报告组成部分。所述报告至少包括对体外受精治疗周期的评价,如,便于确定胚 胎的成功植入、选择将移植的胚胎的最佳数目、和确定在不成功的治疗周期之后随后体外 受精治疗周期的成功。所述报告可完全或部分地电子生成。所述报告可进一步包括以下一 种或多种1)关于测试设备的信息;2)服务提供机构信息;3)患者数据;4)样品数据;5) 解释性报告,其可包含包括以下的多种信息a)适应症;b)测试数据,其中测试数据可任选 地包括一种或多种不育指示基因产物的标准化的水平;和6)其它特征。当适用政府法规或其它限制时(如,保健、治疗失当或责任保险的要求),完全或 部分电子生成的所有结果都在对用户发布之前经受质量控制程序。
测试设备信息报告可包括关于测试设备的信息,该信息与在其中进行样品收集和/或数据生成 的医院、诊所或实验室相关。数据生成可包括以下一种或多种a)测量基因产物(如,不育 指示基因产物、参考基因产物)水平;b)确定不育指示基因产物的标准化水平。这一信息 可包括关于以下的一种或多种详细资料例如,测试设备的名称和位置、进行检验和/或录 入输入数据的实验室技术员的身份、进行和/或分析检验的日期和时间、存储样品和/或结 果数据的位置、检验中使用的试剂(如,试剂盒等等)的批号、等等。带有这一信息的报告 区段一般可利用用户提供的信息来填充。服务提供机构信息报告可包括关于服务提供机构的信息,服务提供机构可以位于用户位于的医疗机 构之外或在医疗机构内。这种信息的实例可包括服务提供机构的名称和位置、评论者名称、 和当需要或期望时,进行样品收集和/或数据生成的个体名称。带有这一信息的报告区 段一般可利用用户输入的信息来填充,所述信息可选自预先写好的选项(如,使用下拉菜 单)。报告中的其它服务提供机构信息可包括关于结果和/或关于解释性报告的技术资料 的联络信息。患者数据患者数据可包括患者医疗史(可包括,如,关于之前或当前体外受精治疗周期的 数据)、个人史;患者管理数据(即,对可能性评价并非必要的数据),诸如确认患者的信息 (如,名字、患者生日O0B)、性别、邮寄地址和/或居住地址、病历号(MRN)、医疗机构中的房 间号和/或床位号)、保险信息等等)、患者的医生或提供响应可能性评价的其它保健专业 人员的名字、和在不同于提供评价的医生时,负责护理患者的护理医生的名字(如,主要护 理医师)。带有这一信息的报告区段一般可利用用户输入的数据来填充。典型的信息项包括但不限于患者特征,诸如年龄、此前的不育史、临床诊断;临 床治疗信息,诸如药物类型、刺激天数、卵母细胞数目、等等;常规胚胎形态学数据,诸如胚 胎数目、发育阶段、等级等等。在一些实施方案中,信息包括年龄、胚胎总数、分裂停滞率、8 细胞胚胎数、第3天促卵泡激素(FSH)水平、移植的8细胞胚胎数、年龄、卵巢储备下降、子 宫内膜厚度、胚泡比率、胚胎总数、卵母细胞总数、施用促性腺素的总量和活动精子总数。样品数据样品数据可提供关于可能性评价中分析的胚胎的信息,诸如受精后导致停滞的天 数、和收集的日期和时间。带有这一信息的报告区段一般可利用用户输入的数据来填充,其 中一些数据可以作为预先写好的选项提供(如,使用下拉菜单)。解释性报告报告的解释性报告部分包括如本文所述地处理数据后生成的信息。解释性报告可 包括为了体外受精程序对女性受治疗者的评价。解释性报告可包括,例如,利用基于所述预 选的患者变量的算法比较女性受治疗者的谱与已知指示对体外受精程序的响应度的已知 谱图的文库的分析结果,和任选地,不育指示基因的标准化水平(如,“不育指示基因的标准 化水平”)的结果;解释;和任选地,建议。报告的解释部分可包括建议。其中结果指示确定胚胎的成功植入、选择将移植的 胚胎的最佳数目、和确定在不成功的治疗周期之后随后体外受精治疗周期的成功。
容易理解的是,报告可包括以上所有或一些组成部分,条件是报告一般至少包括 足以提供用户要求的分析(如,可能性评价)的组成部分。其它特征还容易理解的是,报告可包括其它组成部分或修改的组成部分。例如,当是电子形 式时,报告可包含指向内部或外部数据库的超链接,其提供关于所选的报告组成部分更详 细的信息。例如,报告的患者数据组成部分可包括患者电子记录的超链接或访问所述患者 记录的网址,该患者记录保留在秘密数据库中。后一实施方案在住院系统或诊所环境可能 是感兴趣的。基于计算机的系统和方法本文描述的方法和系统可以多种方式实现。在特别感兴趣的一个实施方案中,方 法包括使用通信设施例如因特网。本发明的多种实施方案在以下讨论。还应理解的是,本发 明可以多种形式的硬件、软件、固件、处理器或其组合来实现。本文描述的方法和系统可以 作为硬件和软件的组合实现。软件可作为应用程序有形地在程序存储装置上体现而实现, 或软件的不同部分在用户的计算环境中实现(如,作为小应用程序)和在评论者的计算环 境实现,其中评论者可以位于连接的远端位置(如,在服务提供机构)。计算装置的不同部件,诸如输入装置,可以经由有线连接或无线连接与系统的其 它部件关联,所述无线连接包括例如,无线LAN连接、蓝牙连接协议、ZigBee连接协议、射频 连接协议或手机连接协议,包括码分多址(CDMA)或经由全球移动通信系统(GSM)。例如,在用户输入数据期间或之后,数据处理部分可在用户端计算环境中进行。例 如,可以对用户端计算环境编程以提供规定的测试码来表示可能性“分数”,其中分数作为 处理或部分处理的对评论者的计算环境的响应以测试码形式传送,随后执行一种或多种算 法以提供结果和/或在评论者的计算环境中生成报告。用于执行本文所述算法的应用程序可以上传到包含任何合适结构的机器,并被其 执行。一般,机器包括带有硬件诸如一个或多个中央处理器(CPU)、随机存取存储器(RAM) 和输入/输出(I/O)界面的计算机平台。计算机平台还包括操作系统和微指令码。本文描 述的各种处理和功能可以是由操作系统执行的微指令码的部分或应用程序的部分(或其 组合)。此外,各种其它外围设备可以连接到计算机平台,所述外围设备诸如另外的数据存 储装置和打印装置。作为计算机系统,系统一般包括处理器单元。处理器单元运转以接收信息,这一 般包括所述信息数据,诸如年龄、胚胎总数、分裂停滞率、8细胞胚胎数、第3天促卵泡激素 (FSH)水平、移植的8细胞胚胎数、年龄、卵巢储备下降、子宫内膜厚度、胚泡比率、胚胎总 数、卵母细胞总数、施用促性腺素的总量和活动精子总数。接收的这一信息可以至少临时存 储在数据库中,分析数据以生成如上所述的报告。输入和输出数据的部分或所有也可电子传送;某些输出数据(如,报告)可电子传 送或电话传送(如,通过传真,如,利用装置诸如传真回复)。示例性输出接收装置可包括 展示部件、打印机、传真装置等等。电子形式的传送和/或展示可包括电子邮件、交互电视 等等。在特别感兴趣的实施方案中,输入数据的所有或一部分和/或输出数据(如,通常至 少最终报告)的所有或一部分保持在网络服务器上用于用典型浏览器获取,优选地机密存 取。数据可以由保健专业人员如所需地获取或发送。输入和输出数据,包括最终报告的所有或一部分,可用于填充患者的病历,病历可在医疗机构的机密数据库中存在。用在本文所述方法中的系统通常包括至少一个计算机处理器(如,其中方法在单 个位置完整进行)或至少两个联网的计算机处理器(如,其中数据将被用户(在本文还称 为“客户”)输入并传送到远处位置的第二计算机处理器来分析,其中第一和第二计算机处 理器由网络连接,如,经由内部网或因特网)。系统还可包括用于输入的用户组件;和用于 评论数据、生成报告和人工干预的评论者组件。系统的其它组件可包括服务器组件;和用于 存储数据的数据库(如,如在报告组成部分的数据库中,如,解释性报告组成部分或可包括 由用户的数据输入和数据输出的相关数据库(RDB)。计算机处理器可以是通常见于以下中 的处理器个人台式计算机(如,IBM、Dell、Macintosh)、便携计算机、主机、微型计算机或 其它计算装置,诸如Smartphone装置,包括例如,Apple iPhone 装置。联网的客户/服务器体系结构可如所需地选择,可以是例如经典的两层或三层客 户服务器模型。相关数据库管理系统(RDMQ作为应用服务器组件的部分或作为独立的组 件(RDB器)为数据库提供界面。在一个实施方案中,体系结构作为数据库-中心客户/服务器体系结构提供,其中 客户应用通常请求来自应用服务器的服务,应用服务器对数据库(或数据库服务器)产生 请求来以如所需的报告组成部分填充报告,特别是解释性报告组成部分,尤其是解释文本 和警告。服务器(如,作为应用服务器的部分或独立的RDB/相关数据库器)响应于客户的 请求。输入客户组件可以是完整、独立的个人计算机,提供全范围的功率和特征来运行 应用。客户组件通常在任何期望的操作系统下操作,包括通信部件(如,调制解调器或用于 连接到网络的其它硬件)、一种或多种输入装置(如,键盘、鼠标、小键盘或用于传送信息或 命令的其它装置)、存储部件(如,硬盘或其它计算机可读的、计算机可写的存储介质)、和 展示部件(如,显示器、电视机、IXD、LED或向用户传达信息的其它展示装置)。用户经由输 入装置向计算机处理器输入命令。通常,用户界面是为网络浏览器应用编写的图形用户界 面(⑶I)。服务器组件可以是个人计算机、微型计算机或主机,并提供数据管理、客户之间的 信息共享、网络管理和安全。应用和使用的任何数据库可以在同一或不同服务器上。涵盖了用于客户和服务器的其它计算配置,包括在单个机器诸如主机、机器组合 或其它合适的构造上处理。一般,客户机器和服务器一起工作来实现本发明的处理。使用时,数据库通常连接于数据库服务器组件,可以是容纳数据的任何装置。例 如,数据库可以是用于计算机的任何磁性或光存储装置(如,CDR0M、内部硬盘、磁带机)。数 据库可位于服务器组件远处(经由网络、调制解调器等等可存取)或位于服务器组件当地。当在系统和方法中使用时,数据库可以是根据数据项之间的关系组织和存取的相 关数据库。相关数据库通常包括多个表格(实体)。表格的行代表记录(关于不同条目的 信息的集合),列代表区段(记录的具体特征)。以最简单的概念,相关数据库是由至少一 个共同区段彼此“相关”的数据条目的集合。装备有计算机和打印机的其它工作站可以在服务的地方使用以输入数据,且在一 些实施方案中,如果需要,生成适当的报告。计算机可具有快捷方式(如,在桌面上)以启 动应用来便于如所需地开始数据录入、传送、分析、报告收到等等。
计算机可读存储介质本发明还涵盖计算机可读存储介质(如⑶-ROM、记忆钥匙、闪存卡、软盘等等),其 中存储有程序,当在计算环境中执行该程序时,提供进行如本文所述的为了体外受精程序 评价受治疗者的分析方法的所有或一部分的算法的实现。当计算机可读介质包含用于进行 本文所述方法的完整程序时,程序包括用于收集、分析和生成输出的程序指令,且通常包括 与本文所述的用户交互、联合分析信息处理数据、并为用户生成独特的印刷或电子介质的 计算机可读码装置。当存储介质提供程序,该程序提供本文所述的方法的一部分的实现时(如,方法 的用户端方面(如,数据输入、报告收到能力等等)),程序提供用户输入数据向在远处计算 环境的传送(如,经由因特网、经由内部网等等)。处理或处理数据的完成在远处进行来生 成报告。评论报告,且完成为了提供完整的报告任何所需的人工干预后,然后将完整报告作 为电子文件或印刷文件(如,传真或邮寄的纸质报告)传送回用户。包含根据本发明的程 序的存储介质可与说明书(如,对于程序安装、使用等等)一起包装,所述说明书记录在合 适的基质或可以获取所述说明书的网址上。计算机可读存储介质还可与用于进行确定所述 信息数据的一种或多种试剂一起提供,如,用于确定分裂停滞率、8细胞胚胎数、第3天促卵 泡激素(FSH)水平和移植的8细胞胚胎数等等的材料。试剂盒用于本发明方法中的材料适于制备根据公知方案产生的试剂盒。因此本发明提供 包含试剂的试剂盒,所述试剂可包括可用于测定本文公开的基因表达和用于评价对体外治 疗周期响应可能性的基因-特异性或基因-选择性探针和/或引物。例如,所述试剂盒可包括特异性杂交于核酸不育指示基因产物的一种或多种核酸 探针。所述试剂盒可包括,如,一种或多种核酸探针,其中一种或多种探针的每种特异性杂 交于不同响应指示基因产物。例如,所述试剂盒可包括特异性杂交于不育指示基因的核酸 产物的探针,所述不育指示基因包括但不限于,0ct4、Eif3c、Papola、Piwil2、Eif3b、Eif4b、 Rbm3和Cpsf4。另一例子是,所述试剂盒可包括一组两个或更多核酸探针,其中所述组的每 个探针杂交于不同不育指示基因的核酸产物。例如,所述试剂盒可包括一组两个、三个、四 个、五个、六个、七个或更多核酸探针,其中所述组的每个探针杂交于一组不育指示基因的 不同成员的核酸产物。在一些情况,除了特异性杂交于不育指示基因的核酸产物的探针以外,所述试剂 盒包括特异性杂交于参考基因产物的一种或多种探针。所述探针可用于确定不育指示基因 的标准化表达水平。所述试剂盒可包括一种或多种核酸引物对,其中引物对当在聚合酶链式反应中作 为引物时,扩增靶核酸响应指示基因产物或核酸响应指示基因产物的靶区域。所述试剂盒 可包括多个不育指示基因的引物对。核酸引物和探针的示例性序列在本文所述的实施例中提供。本领域技术人员将容 易理解,其它探针和引物序列也是可能的,且基于不育指示基因的已知核苷酸序列和/或 基于参考基因的已知核苷酸序列容易获得。除了上述探针和引物以外,所述试剂盒可包括用于从单细胞胚胎,特别是固定的 石蜡包埋的组织样品提取和/或分离RNA的试剂、和/或用于制备mRNA的cDNA拷贝的试剂、和/或用于核酸扩增的试剂。示例性的试剂包括使用FLUIDIGM BIOMARK 48. 48动态阵列系统、相当的单细胞基因表达分析平台(RT-PCR)或新兴技术诸如下一代、 在单细胞水平的全转录组测序所需的试剂。引物和探针可基于不育指示基因的已知序列设计,并易于由标准技术合成,如,经 由亚磷酰胺化学反应的固相合成,公开在美国专利第4,458,066和4,415,732号,通过引 用并入本文;Beaucage 等人(1992)Tetrahedron48 :2223-2311 ;禾口 Applied Biosystems User Bulletin No. 13(1 Apr. 1987)。其它化学合成方法包括,例如,Narang 等人,Meth. Enzymol. (1979)68 90 描述的磷酸三酯方法和 Brown 等人,Meth. Enzymol. (1979)68 :109 公开的磷酸二酯方法。Poly(A)或poly (C)或其它非互补核苷酸延伸可以利用这些相同方 法掺入探针。六环氧乙烷延伸可以由本领域已知方法偶合于探针。Cload等人(1991)J.Am. Chem. Soc. 113 :6324-6326 ;Levenson 等人的美国专利第 4,914,210 号;Durand 等人(1990) Nucleic Acids Res. 18 :6353-6359 ;和 Horn 等人(1986) Tet. Lett. 27 :4705_4708。探针或引物可包括可检测标记。示例性的标记包括荧光染料,如异硫氰酸荧光素 (FITC)、罗丹明、德克萨斯红、藻红蛋白、别藻蓝蛋白、6-羧基荧光素(6-FAM)、2’,7’ - 二甲 氧基-4’,5’_ 二氯-6-羧基荧光素(JOE)、6-羧基-X-罗丹明(ROX)、6_羧基-2,,4,,7,,4, 7-六氯荧光素(HEX)、5-羧基荧光素(5-FAM)、N,N,N’,N’_四甲基-6-羧基罗丹明(TAMRA)、 Cy5、Cy3等等;和放射性标记(如,32p等等)。用于包含在所述试剂盒中的探针和引物包括可用于各种扩增和/或检测系统的 探针和引物。示例性的扩增和/或检测系统包括基于Sunrise 引物的系统、Molecular Beacons、Taqman 系统、基于Amplif luor 发夹引物的系统、Scorpions技术(如,包含共 价连接于探针元件的PCR引物元件的双功能分子),Light Upon Extension或基于LUX 的 系统、以及FLUIDIGM BIOMARK 48. 48动态阵列系统。其他示例性的检测系统包 括基于熔解曲线分析的那些、和利用嵌入染料诸如荧光素染料STOR绿的那些。试剂盒可任选地包括带有关于其在本发明方法中的使用的识别描述或标签或说 明书的试剂。试剂盒可包括容器(包括适于用在方法自动实现中的微量滴定板),其各带 有用在本发明方法中的一种或多种不同试剂(通常以浓缩形式),包括例如,预装配的微阵 列、缓冲液、适当的三磷酸核苷酸(如,dATP、dCTP、dGTP和dTTP ;或rATP、rCTP、rGTP和 UTP)、反转录酶、DNA聚合酶、RNA聚合酶、以及本发明的一种或多种探针和引物(如,连接于 与RNA聚合酶反应的启动子的适当长度的poly (T)或随机引物)。用于为体外受精治疗周期评价女性受治疗者,包括确定活产事件概率的数学算法 的使用说明书也可包括在所述试剂盒中。在所述实施方案中,试剂盒将进一步包括书面或 电子介质或说明书以获取如上所述的远程数据库来提供和/或获取信息,为了进行如上所 述的方法,所述信息包括所述信息数据,诸如年龄、胚胎总数、分裂停滞率、8细胞胚胎数、第 3天促卵泡激素(FSH)水平、移植的8细胞胚胎数、年龄、卵巢储备下降、子宫内膜厚度、胚泡 比率、胚胎总数、卵母细胞总数、施用促性腺素的总量和活动精子总数。
实施例列出以下实施例以对本领域技术人员提供如何制备和使用本发明的完整公开和 描述,不意为限制发明人认为是本发明的范围,也不意为代表以下实验是进行的所有或仅有的实验。已经努力确保关于使用的数字(如量、温度等等)的准确性,但应考虑到一些实 验误差和偏差。除非另外指明,否则部分是重量部分,分子量是重均分子量,温度是以摄氏 度,压力是大气压或接近大气压。材料和方法以下方法和材料用在以下实施例中。数据收集、纳入和排除标准关于从2003 年 1 月 1 日至 2006 年 12 月 31 日在 Stanford University Medical Center进行的所有IVF周期的临床诊断、IVF治疗方案和监测、胚胎学数据以及治疗结果 的数据从广泛使用的生育力数据库管理系统BabySentryPro (BabySentry Ltd, Limassol, Cyprus)检索,或从医学和胚胎学记录如所需地获得。回顾性数据收集、去身份识别和分 析按照斯坦福大学设施内伦理委员会批准的方案(Manford University Institutional Review Board-approved protocol)进行。数据分析的纳入标准是新的、刺激的、非供体的 卵母细胞IVF周期。在某些实验中,排除了因为任何原因未能导致胚胎移植的周期、对超过45岁的妇 女进行的周期、和对植入前遗传筛选进行的周期。其它实验中,我们没有排除在IVF治疗已开始后因为医学或非医学原因在任何时 间点取消的周期。我们排除了使用在不同IVF诊所已经受孕的胚胎的冷藏胚胎移植周期。定义周期数目我们按照以下方法重编号了所有IVF周期。对于每个患者,在这四年的数据集中 出现的第一个新的IVF周期称为“周期1”。利用新的或从周期1受孕的冷藏胚胎的所有胚 胎移植治疗的最终结果定义为周期1的结果。出现的第二个新的IVF周期定义为“周期2”, 等等。我们的数据库未能容纳在别处进行的IVF周期的数据。评价胚胎发育IVF治疗、受精、胚胎培养、胚胎评价、低温贮藏标准和临床结果的标准临床方案如 下所述。人类胚胎体外发育的正常进展特征是在授精后16-20小时出现2个前核作为第 1天受精的迹象,第O天是卵母细胞采集日。在第1天晚些时候,胚胎发育达到2-细胞期, 随后分别在第2天和第3天达到4-细胞和8-细胞期。在第4天和第5天,胚胎发育特征 是分别建立桑葚胚和胚泡期。所有胚胎在第3天可获得用于评价。胚胎移植日由在第3天 分裂球的数目确定。一般,如果存在4个或更多8-细胞胚胎,我们将建议延长胚胎培养到 第5天,此时伴有更高妊娠率,进行胚泡移植。如果存在少于四个8-细胞胚胎,胚胎移植将 在第3天进行。患者、IVF周期和胚胎参数分析了与IVF治疗结果有关的30个变量,如表1所列,在四个主要分类下患者特 征和临床诊断、IVF周期特征、胚胎组参数、和移植胚胎的参数。分裂停滞率定义为在体外 培养第3天一组中具有4或更少细胞的胚胎百分比。所有其它变量是自明的。结果的定义统计分析基于活产相对于无活产的二分结果进行。无活产包含所有其它结果诸如 阴性血清β-hCG或阳性血清β _hCG随后是生化妊娠、自发性流产和宫外孕。统计分析
因为一些患者在研究期间经历多于一个IVF周期,分析基于治疗周期而不是基于 患者进行。统计分析基于阴性血清β _hCG确定的无活产和阳性血清β-hCG确定的妊娠的 二分结果进行,并包括生化妊娠、临床妊娠、自发性流产和宫外孕。我们进行了每个变量与 结果的成对逻辑回归,确定了每对连续变量之间的Pearson相关系数。对于主要分析,由MART .构建提升的(boosted)分类树来识别非冗余预后变 量,进一步由CART分析非冗余预后变量来识别将其限定为分类变量的阈值。MART 是 用于识别预测结果的变量的交互结构的可靠方法。MART 中交叉验证、参数选择提升和 模型评价的使用还保留了简洁性并避免过度拟合。在构建MART 树时,将全数据集分为 10个亚组来实现对模型评价的10倍交叉验证。同样的10倍交叉验证重复1000次以进行 可靠预测率估计和识别在CART中具有最高预测率的树模型。尽管mart 从高度交互变 量大组选择非冗余预后变量是强有力的,CART分析导致简单的算法,和用在医学文献中的 更容易理解的“决定树” (Guznick 等人,N Engl J Med 345:1388-1393. (2001)) 因此,用 CART分析由MART 识别的赋予预测的非冗余、预后变量以进一步限定预后的阈值。在一些实验中,如果患者在研究期间经历多个新的IVF周期,仅分析前三个周期。 我们仅基于周期1 (Cl)数据生成模型。C2和C3的数据仅用于检验移植前模型的周期间验 证。在这样的实验中,我们进行了每个变量与结果的成对逻辑回归,确定了每对连 续变量之间的Pearson相关系数。我们基于在IVF治疗前(pre_IVF)、卵母细胞采集前 (pre-OR)、和胚胎移植后(post-IVF)的三个不同时间点可获得的数据生成三个模型。我 们通过利用MART 的R-软件实现梯度提升器(GBM)根据其相对影响来分级变量,然后以 Rpart软件利用最高级的变量构建回归树模型,来生成每个模型。MART 是用于识别预 测结果的变量的交互结构的可靠方法。MART 中交叉验证、参数选择提升和模型评价的 使用还保留了简洁性并避免过度拟合。在构建MART 树时,将全数据集分为10个亚组来 实现对模型评价的 ο倍交叉验证。同样的10倍交叉验证重复1000次以进行可靠预测率 估计和识别具有最高预测率的树模型。尽管MART 从高度交互变量大组选择非冗余预后 变量是强有力的。用于辅助生殖技术(ART)的治疗方案我们分析的IVF周期大多数是对具有差的卵巢储备、严重的男性因素不育、输卵 管性不育、排卵障碍或原因不明的病因学的患者进行。一般,每个治疗周期中使用三种刺激 方案之一下调黄体(长)方案用于大多数患者,微小剂量Iupron(短)方案和拮抗剂方 案主要用于推测具有卵巢储备下降或此前具有失败IVF周期历史的患者。长方案由以下构 成利用0. 5mg醋酸亮丙瑞林下调黄体,醋酸亮丙瑞林随着刺激减少到0. 25mg。在短方案 中,口服避孕药2-4周后开始微小剂量Iupron (0. 04mg s. c. bid)。在拮抗剂方案中,当前滤 泡(lead follicle)大小达到14mm时开始GnRH拮抗剂。在所有三种方案中,进行基线超 声检测以证明卵巢中不存在> 1.5cm的囊肿。当满足基线标准时,开始利用重组FSH与人 类更年期促性腺素的促性腺素治疗。通常利用每天给药每天共150-600IU实现刺激以使卵 泡募集最大化。在周期第7天开始,然后如所示地每1-3天进行卵泡生长的超声监测。如 所需地监测血清雌二醇水平。
当至少两个卵泡达到> 17mm的平均直径时施用10,000IU人类绒毛膜促性腺素的 剂量。经阴道以超声引导的卵母细胞采集在hCG施用后34-36小时以标准方式进行,并伴 有监测的麻醉护理。卵母细胞受精和胚胎培养卵母细胞在受精前成组培养在矿物油下大约125 μ 1 Sage Cleavage Medium (Cooper Surgical, Inc, Trumbull, CT)液滴(含有 10% 血清蛋白替代物(SPS, Irvine Scientific,Santa Ana, CA))中。预定常规IVF的卵母细胞5个1组培养,预定胞 质内精子注射(ICSI)的卵母细胞在剥离卵丘细胞后达20个1组培养。如果精液分析正常 且预计受精是正常的,以精子对卵母细胞授精。卵母细胞通常在采集后4-6小时授精。如果 精液分析异常或预计受精差,则使用ICSI对卵母细胞注射精子。受精的卵母细胞达20个1 组地在矿物油下大约 125 μ 1 Sage Cleavage Medium (Cooper Surgical, Inc, Trumbul 1, CT) 液滴(含有10% SPS)中在37°〇、5%02、5%0)2和90%队的潮湿环境中培养。授精或ICSI 后16 18小时进行受精检查。具有透明的两个前核的合子在Mge Cleavage Medium(含 有10% SPS)中培养另外48小时。具有单个前核(IPN)或三个或更多前核的卵母细胞认 为是异常受精的。如果指示第5天胚泡移植,在移植前在Quirm’ s Advantage胚泡培养基 (Cooper Surgical)(含有10% SPS)中进行延长的胚胎培养48小时。注意,在研究时间阶 段期间使用相同培养基。胚胎的分裂和分级在采集后第3天、收集卵母细胞后68至72小时,单独一组有经验的胚胎学家评 价胚胎。检查胚胎的分裂(细胞数目)和等级,包括胞浆碎裂。胚胎在第3天如下分级 1级,分裂球具有同样大小,没有胞浆碎裂;2级,分裂球具有同样大小,有较少胞浆碎裂, 牵涉< 10%的胚胎;3级,分裂球具有不同大小,碎裂牵涉10-20 %的胚胎;4级,分裂球 具有相同或不同大小,中度到严重的胞浆碎裂,牵涉20-50%的胚胎;和5级,分裂球少, 严重的碎裂,牵涉彡 50% 的胚胎(Veeck 等人,(1999)An Atlas of Human Gametes and Conceptuses. New York Parthenon Publishing. 47—50) 。
,月台中 的位置、不存在细胞核,胚胎中胞浆碎裂容易与分裂区分。相反,卵母细胞的胞浆碎裂不被 包括作为变量,因为其是尤其罕见的。我们的胚胎学家在第3天例行地注意到紧密性的存 在或不存在。因为在< 10%的胚胎观察到紧密性,我们在分析中未包括这一变量。辅助孵化我们的中心中,辅助孵化(AH)的适应症是高龄母亲、FSH水平升高、和/或辅助生 殖周期多次失败的历史。在胚胎移植日,将用于孵化的胚胎放置在含有10% SPS的磷酸缓 冲盐水(PBS)中。AH 通过利用 ZIL0S-tk 激光(Hamilton Thorne Biosciences, Beverly, ΜΑ)在分裂球之间的透明带区域中产生洞而实现。然后洗涤胚胎并放回培养基直到移植。胚胎移植和低温贮藏超声引导的胚胎移植利用Tefcat或Echotip Softpass导管(Cook 0b/Gyn, Spencer, IN)进行。对所有患者进行以阴道栓剂的黄体酮补充。对于在第3天具有胚胎移 植的患者,将具有多于五个分裂球的任何剩余胚胎放置在延长培养中另外2或3天。在第 5天或第6天将具有良好内细胞质和滋养外胚层的任何扩大中的、已扩大和孵化的胚泡冷 冻。此外,对多余胚胎、严重的卵巢过度刺激综合征和因为医学或社会原因的生育力保存进行低温贮藏。如果其质量不足以低温贮藏或如果患者出于非医学原因未选择胚胎低温贮 藏,通常丢弃未移植的多余胚胎。在植入前遗传诊断的情况,还丢弃检验为遗传疾病阳性或 非整倍性的胚胎。临床结果在胚胎移植后8-10天获得血清定量β -hCG水平,并连续进行直到通过经阴道超 声,妊娠囊的存在而进行临床妊娠的诊断。临床妊娠以外的结果包括1)无妊娠,如果血 清定量β-hCG是阴性;幻生化妊娠,定义为在经阴道超声观察到妊娠囊之前减少的血清定 量β-hCG水平;3)自发性流产,定义为在经阴道超声观察到妊娠囊之后的流产;和4)宫外 孕;以及5)其它异常妊娠诸如妊娠性滋养层疾病。活产结果通过作为常规临床护理的一部 分的随访患者而获得,但不在本研究中使用。回归树临床IVF数据,尤其当考虑卵母细胞和胚胎参数时,通常不适合于由多变量逻辑 回归进行有意义的分析。许多相关变量的高程度相互作用和多重共线性干扰常规的多变量 回归。在这些情况中,回归和分类树模型(CART)已广泛用于临床研究(Fonarow GC, Jama 293 :572-580(2005) ;Friedman J(1999)Greedy function approximation :A stochastic boosting machine ( ^ S 0 ^ τ ^ PI l/l l/l ). Technical Report, Department of Statistics, Stanford University ;Friedman J(1999)Stochastic gradient boosting(随机梯度提升)· Technical Report, Department of Statistics, Stanford University ;Friedman J (2002) Tutorial =Getting started with MART in R(指南开始 R 的 MART) · Department of Statistics, Stanford University ;Friedman 等人,Stat Med 22 :1365-1381 (2003) ;Guzick 等人,N Engl J Med 345:1388-1393(2001) ;Pilote 等人,N Engl J Med 335:1198-1205(1996))。在本文,我们使用多重累计回归树(MART ),这 是一种更强有力的统计方法,组合了 “提升”与CART来“提升”或增加CART方法准确度以 识别非冗余预后变量。一般,回归树具有多种关键益处1)能够考虑所有类型的临床IVF和胚胎学数据, 包括数字变量、顺序变量、二元变量和分类变量;幻能够充分基于“替代品”分裂技术操纵 缺失值而不需要归咎;3)能够产生对单调数据转化不变的结果,因此消除检验数据转化或 度量的不同方法的需要;4)能够生成不受极端值影响的树力)能够生成本身探测和识别变 量相互作用的树,否则变量相互作用将需要在多重逻辑回归中明确指出。最重要地,回归树 能够考虑大量的变量,包括可能证实是不相关的变量,即使只有小数目的变量对结果有显 著的统计影响。考虑许多变量的这一能力对于IVF结果分析是关键的,因为许多变量,诸如 8-细胞胚胎百分比、8细胞胚胎数、移植的8细胞胚胎百分比、和移植的8细胞胚胎数,可能 是高度交互的;因此,随意选择其中之一可能损害数据的完整性而引入偏倚,而包括其所有 可能导致常规的多变量回归崩溃。MART 的结果可能帮助识别能够以多变量逻辑回归再分析的变量。通常,它们 可识别阈值或“截止(CUt-OffS) ”,所述阈值或“截止”将用于产生分类变量以将情形分类 为亚组,用于由常规方法诸如t-检验、卡方分析或Wilcoxon秩和检验进行进一步组内特征 比较。例如,CART分析由Guzick等人使用来基于精子浓度、活动性和形态学的阈值将男性 分类为低生育力的、不确定生育力状态或有生育力的,例示了这一策略在不育研究中的效力(Guzick 等人,N Engl J Med 345:1388-1393(2001))。胚胎培养对3-5周大的野生型Fl(C57BL6xDBA/2)雌性(Charles River)通过腹膜内注 射5IU怀孕母驴的血清促性腺素(Sigma)、然后48小时后注射5IU人类绒毛膜促性腺素 (Sigma)来使排卵过度,并与野生型雄性交配过夜。在hCG注射后17小时通过颈脱位法 处死小鼠,从输卵管释出1-细胞胚胎。通过透明质酸酶(Sigma)治疗和吸取去除卵丘 细胞。从3-6个雌性回收处于两个前核阶段的植入前胚胎,汇集在M2培养基(Chemicon International)中,然后立即细胞质微注射,并在37°C在混合气体(90%氮气、5%氧气、 5% 二氧化碳;I^raxair)下培养在矿物油(Sigma)下的补充10 %血清的人类输卵管液 (In-Vitro Fertilization, Inc.)微滴中,并以每20 μ L滴十个胚胎培养。微注射反义吗啉代寡核苷酸特异性地靶向5’UTR或翻译起始位点的25-nt反义吗啉代寡核苷酸(MO)或在5nt 错配的对照购自Gene Tools, LLC.(参见表1的序列详情)。我们确定0. 6-0. 75mM是允许 胚泡发育正常速率的最大浓度(数据未显示)。因此,除非另外指明,否则在装备有液压显 微操作系统(IM300Microinjector,Narishige,Japan)的倒置显微镜(Olympus 1X70)上向 每个胚胎的细胞质注射5-10pL 0. 75mM Ccna2_M0(对于0ct4_M0,0. 60mM)。每个实验中使 用10个未注射的对照胚胎,每个实验进行至少三次。计算进展到每个发育阶段或在每个发 育阶段停滞的胚胎的平均百分比和平均值的标准误差(平均值士s. e.m.),统计显著性通 过利用2-尾Mudent t-检验计算ρ-值来确定。表1 靴向5’ UTR和/或起始位点中基因-特异性序列的反义吗啉代寡核苷酸
权利要求
1.一种为体外受精程序评价女性受治疗者的方法,包括从女性受治疗者获得信息项以提供所述女性受治疗者的谱,其中每个信息项与预选的 患者变量有关;利用基于所述预选的患者变量的算法比较所述女性受治疗者的所述谱与已知指示对 体外受精程序的响应度的已知谱图的文库,其中所述比较提供为体外受精程序对所述女性受治疗者的评价。
2.根据权利要求1所述的方法,其中所述体外受精程序是所述女性受治疗者的至少第 二次体外受精程序。
3.根据权利要求1所述的方法,其中所述体外受精程序包括确定用于植入的胚胎数。
4.根据权利要求1所述的方法,其中所述体外受精程序提供活产事件。
5.根据权利要求1所述的方法,其中所述女性受治疗者是体外受精前(pre-IVF)程序
6.根据权利要求5所述的方法,其中所述预选的患者变量包括年龄、卵巢储备下降、第 3天促卵泡激素(FSH)水平、体重指数、多囊卵巢病、季节、原因不明的女性不育、自然流产 次数、年份、女性不育的其它原因、此前妊娠次数、此前足月分娩次数、子宫内膜异位症、输 卵管病、输卵管结扎、男性不育症、子宫肌瘤、输卵管积水或男性不育症原因。
7.根据权利要求1所述的方法,其中所述女性受治疗者是外科手术前(pre-OR)程序患者ο
8.根据权利要求7所述的方法,其中所述预选的患者变量包括年龄、子宫内膜厚度、卵 母细胞总数、施用促性腺素的总量、洗涤后活动精子总数、洗涤前活动精子总数、第3天促 卵泡激素(FSH)水平、体重指数、采精、配偶年龄、季节、自然流产次数、原因不明的女性不 育、此前足月分娩次数、年份、此前妊娠次数、女性不育的其它原因、子宫内膜异位症、男性 不育症、输卵管结扎、多囊卵巢病、输卵管病、来自供者的精子、输卵管积水、子宫肌瘤或男 性不育症原因。
9.根据权利要求1所述的方法,其中所述女性受治疗者是体外受精后(post-IVF)程序
10.根据权利要求9所述的方法,其中所述预选的患者变量包括胚泡发育速度、胚胎总 数、施用促性腺素的总量、子宫内膜厚度、短方案、每个胚胎的平均细胞数、所用导管类型、 移植的8细胞胚胎百分比、第3天促卵泡激素(FSH)水平、体重指数、洗涤前活动精子数、洗 涤后活动精子数、胚胎平均等级、胚胎移植日、季节、自然流产次数、此前足月分娩次数、口 服避孕药、采精、未受精卵百分比、在4细胞期停滞的胚胎数、移植后第3天的紧密化、正常 受精百分比、异常受精卵百分比、正常和成熟卵母细胞百分比、此前妊娠次数、年份、多囊卵 巢病、原因不明的女性不育、输卵管病、仅男性不育症、男性不育症原因、子宫内膜异位症、 女性不育的其它原因、子宫肌瘤、输卵管结扎、来自供者的精子、输卵管积水、ICSI表现或辅 助孵化。
11.根据权利要求1所述的方法,其中所述方法包括获得有关至少两个预选的患者变 量的信息项。
12.根据权利要求1所述的方法,其中所述方法包括获得有关至少五个预选的患者变 量的信息项。
13.根据权利要求12所述的方法,其中预选的患者变量被提供相对于其它预选的患者 变量的加权相对重要性。
14.根据权利要求1所述的方法,其中所述预选的患者变量包括年龄、胚胎总数、分裂 停滞率、8细胞胚胎数、第3天促卵泡激素(FSH)水平、移植的8细胞胚胎数。
15.根据权利要求1所述的方法,还包括确定一种或多种不育指示基因的表达水平,并 比较所述表达水平与已知指示对体外受精程序的响应度的对照基因表达谱。
16.根据权利要求15所述的方法,其中所述不育指示基因包括0ct4、Eif3c、Papola, Piwil2、Eif3b、Eif4b、Rbm3 和 Cpsf4
17.根据权利要求15所述的方法,其中一种或多种不育指示基因的所述表达水平通过 使用BioMark 动态阵列、RT-PCR或全转录组测序进行。
18.根据权利要求15所述的方法,其中一种或多种不育指示基因的所述表达水平是对 胚胎确定。
19.根据权利要求18所述的方法,其中所述胚胎在受精后处于停滞发育。
20.根据权利要求15所述的方法,其中一种或多种不育指示基因的所述表达水平是对 卵母细胞确定。
21.根据权利要求20所述的方法,其中所述卵母细胞在受精后处于停滞发育。
22.根据权利要求1所述的方法,其中所述比较所述女性受治疗者的所述谱包括应用 判定规则。
23.根据权利要求1所述的方法,其中所述数据分析算法包括使用分类树。
24.根据权利要求1所述的方法,其中所述数据分析算法是非参数的。
25.根据权利要求M所述的方法,其中所述数据分析算法检测特征值分布的差异。
26.根据权利要求25所述的方法,其中所述非参数的算法包括使用Wilcoxon符号秩检验。
27.根据权利要求1所述的方法,其中所述数据分析算法包括使用多重累计回归树或 通过梯度提升器(GBM)。
28.根据权利要求1所述的方法,其中所述数据分析算法是逻辑回归。
29.一种为体外受精程序评价女性受治疗者的方法,包括从女性受治疗者获得信息项以提供所述女性受治疗者的谱,其中每个信息项与预选的 患者变量有关;确定一种或多种不育指示基因的表达水平;利用基于所述预选的患者变量的算法比较所述女性受治疗者的所述谱与已知指示对 体外受精程序的响应度的已知谱图的文库;和比较所述一种或多种不育指示基因的所述表达水平与已知指示对体外受精程序的响 应度的对照基因表达谱,其中所述比较所述女性受治疗者的所述谱与所述一种或多种不育指示基因的所述表 达水平提供为体外受精程序对所述女性受治疗者的评价。
30.根据权利要求四所述的方法,其中所述体外受精程序是所述女性受治疗者的至少 第二次体外受精程序。
31.根据权利要求四所述的方法,其中所述体外受精程序包括确定用于植入的胚胎数。
32.根据权利要求四所述的方法,其中所述体外受精程序提供活产事件。
33.根据权利要求四所述的方法,其中所述体外受精程序提供活产事件。
34.根据权利要求四所述的方法,其中所述女性受治疗者是体外受精前(pre-IVF)程 序患者。
35.根据权利要求34所述的方法,其中所述预选的患者变量包括年龄、卵巢储备下降、 第3天促卵泡激素(FSH)水平、体重指数、多囊卵巢病、季节、原因不明的女性不育、自然流 产次数、年份、女性不育的其它原因、此前妊娠次数、此前足月分娩次数、子宫内膜异位症、 输卵管病、输卵管结扎、男性不育症、子宫肌瘤、输卵管积水或男性不育症原因。
36.根据权利要求四所述的方法,其中所述女性受治疗者是外科手术前(pre-OR)程序患者。
37.根据权利要求36所述的方法,其中所述预选的患者变量包括年龄、子宫内膜厚度、 卵母细胞总数、施用促性腺素的总量、洗涤后活动精子总数、洗涤前活动精子总数、第3天 促卵泡激素(FSH)水平、体重指数、采精、配偶年龄、季节、自然流产次数、原因不明的女性 不育、此前足月分娩次数、年份、此前妊娠次数、女性不育的其它原因、子宫内膜异位症、男 性不育症、输卵管结扎、多囊卵巢病、输卵管病、来自供者的精子、输卵管积水、子宫肌瘤或 男性不育症原因。
38.根据权利要求四所述的方法,其中所述女性受治疗者是体外受精后(post-IVF)程 序患者。
39.根据权利要求38所述的方法,其中所述预选的患者变量包括胚泡发育速度、胚胎 总数、施用促性腺素的总量、子宫内膜厚度、短方案、每个胚胎的平均细胞数、所用导管类 型、移植的8细胞胚胎百分比、第3天促卵泡激素(FSH)水平、体重指数、洗涤前活动精子 数、洗涤后活动精子数、胚胎平均等级、胚胎移植日、季节、自然流产次数、此前足月分娩次 数、口服避孕药、采精、未受精卵百分比、在4细胞期停滞的胚胎数、移植后第3天的紧密化、 正常受精百分比、异常受精卵百分比、正常和成熟卵母细胞百分比、此前妊娠次数、年份、多 囊卵巢病、原因不明的女性不育、输卵管病、仅男性不育症、男性不育症原因、子宫内膜异位 症、女性不育的其它原因、子宫肌瘤、输卵管结扎、来自供者的精子、输卵管积水、ICSI表现 或辅助孵化。
40.根据权利要求四所述的方法,其中所述方法包括获得有关至少两个预选的患者变 量的信息项。
41.根据权利要求四所述的方法,其中所述方法包括获得有关至少五个预选的患者变 量的信息项。
42.根据权利要求41所述的方法,其中预选的患者变量被提供相对于其它预选的患者 变量的加权相对重要性。
43.根据权利要求四所述的方法,其中所述预选的患者变量包括年龄、胚胎总数、分裂 停滞率、8细胞胚胎数、第3天促卵泡激素(FSH)水平和移植的8细胞胚胎数。
44.根据权利要求四所述的方法,其中所述不育指示基因包括0ct4、Eif3c、Papola, Piwil2、Eif3b、Eif4b、Rbm3 和 Cpsf4
45.根据权利要求四所述的方法,其中一种或多种不育指示基因的所述表达水平通过使用BioMark 动态阵列、RT-PCR或全转录组测序进行。
46.根据权利要求四所述的方法,一种或多种不育指示基因的所述表达水平是对胚胎确定。
47.根据权利要求46所述的方法,其中所述胚胎在受精后处于停滞发育。
48.根据权利要求四所述的方法,其中一种或多种不育指示基因的所述表达水平是对 卵母细胞确定。
49.根据权利要求48所述的方法,其中所述胚胎在受精后处于停滞发育。
50.根据权利要求四所述的方法,其中所述比较所述女性受治疗者的所述谱包括应用 判定规则。
51.根据权利要求四所述的方法,其中所述数据分析算法包括使用分类树。
52.根据权利要求四所述的方法,其中所述数据分析算法是非参数的。
53.根据权利要求52所述的方法,其中所述数据分析算法检测特征值分布的差异。
54.根据权利要求52所述的方法,其中所述非参数的算法包括使用Wilcoxon符号秩检验。
55.根据权利要求四所述的方法,其中所述数据分析算法包括使用多重累计回归树或 通过梯度提升器(GBM)。
56.根据权利要求四所述的方法,其中所述数据分析算法是逻辑回归。
57.一种用于在为体外受精程序评价女性受治疗者中分析数据的系统,包括 计算环境;输入装置,所述输入装置与所述计算环境连接以从用户接收数据,其中接收的数据包 括来自女性受治疗者的信息项以提供所述女性受治疗者的谱,其中每个信息项与预选的患者变量有关,输出装置,所述输出装置与所述计算环境连接以向用户提供信息;和 计算机可读存储介质,其中存储至少一种算法以提供比较所述女性受治疗者的所述谱 与已知指示对体外受精程序的响应度的已知谱图的文库,其中所述系统提供可用于生成报告的结果,所述报告提供为体外受精程序评价女性受 治疗者的数据分析。
58.根据权利要求57所述的系统,其中所述计算环境包括用户本地的本地计算机和在 用户远程位置的远程计算机,其中所述本地计算机与所述远程计算机经由网络连接,且其 中所述计算机可读存储介质设在所述远程计算机上。
59.根据权利要求57所述的系统,其中所述输入装置是个人计算装置或Smartphone装置。
60.根据权利要求57所述的系统,其中输入装置与所述计算装置的所述连接是经由有 线连接或无线连接。
61.根据权利要求57所述的系统,其中所述无线连接是经由无线LAN连接、蓝牙连接协 议、ZigBee连接协议、射频连接协议或手机连接协议。
62.根据权利要求61所述的系统,其中所述手机连接是经由码分多址(CDMA)或经由全 球移动通信系统(GSM)。
63.根据权利要求57所述的系统,其中所述体外受精程序是所述女性受治疗者的至少第二次受精程序。
64.根据权利要求57所述的系统,其中所述体外受精程序包括确定用于植入的胚胎数。
65.根据权利要求57所述的系统,其中所述体外受精程序提供活产事件。
66.根据权利要求57所述的系统,其中所述体外受精程序提供活产事件。
67.根据权利要求57所述的系统,其中所述女性受治疗者是体外受精前(pre-IVF)程 序患者。
68.根据权利要求57所述的系统,其中所述预选的患者变量包括年龄、卵巢储备下降、 第3天促卵泡激素(FSH)水平、体重指数、多囊卵巢病、季节、原因不明的女性不育、自然流 产次数、年份、女性不育的其它原因、此前妊娠次数、此前足月分娩次数、子宫内膜异位症、 输卵管病、输卵管结扎、男性不育症、子宫肌瘤、输卵管积水或男性不育症原因。
69.根据权利要求57所述的系统,其中所述女性受治疗者是外科手术前(pre-OR)程序患者。
70.根据权利要求69所述的系统,其中所述预选的患者变量包括年龄、子宫内膜厚度、 卵母细胞总数、施用促性腺素的总量、洗涤后活动精子总数、洗涤前活动精子总数、第3天 促卵泡激素(FSH)水平、体重指数、采精、配偶年龄、季节、自然流产次数、原因不明的女性 不育、此前足月分娩次数、年份、此前妊娠次数、女性不育的其它原因、子宫内膜异位症、男 性不育症、输卵管结扎、多囊卵巢病、输卵管病、来自供者的精子、输卵管积水、子宫肌瘤或 男性不育症原因。
71.根据权利要求57所述的系统,其中所述女性受治疗者是体外受精后(post-IVF)程 序患者。
72.根据权利要求71所述的系统,其中所述预选的患者变量包括胚泡发育速度、胚胎 总数、施用促性腺素的总量、子宫内膜厚度、短方案、每个胚胎的平均细胞数、所用导管类 型、移植的8细胞胚胎百分比、第3天促卵泡激素(FSH)水平、体重指数、洗涤前活动精子 数、洗涤后活动精子数、胚胎平均等级、胚胎移植日、季节、自然流产次数、此前足月分娩次 数、口服避孕药、采精、未受精卵百分比、在4细胞期停滞的胚胎数、移植后第3天的紧密化、 正常受精百分比、异常受精卵百分比、正常和成熟卵母细胞百分比、此前妊娠次数、年份、多 囊卵巢病、原因不明的女性不育、输卵管病、仅男性不育症、男性不育症原因、子宫内膜异位 症、女性不育的其它原因、子宫肌瘤、输卵管结扎、来自供者的精子、输卵管积水、ICSI表现 或辅助孵化。
73.根据权利要求57所述的系统,其中所述方法包括获得有关至少两个预选的患者变量的信息项。
74.根据权利要求57所述的系统,其中所述方法包括获得有关至少五个预选的患者变 量的信息项。
75.根据权利要求74所述的系统,其中预选的患者变量被提供相对于其它预选的患者 变量的加权相对重要性。
76.根据权利要求57所述的系统,其中所述预选的患者变量包括年龄、胚胎总数、分裂 停滞率、8细胞胚胎数、第3天促卵泡激素(FSH)水平和移植的8细胞胚胎数。
77.根据权利要求57所述的系统,其中接收的数据还包括一种或多种不育指示基因的表达水平。
78.根据权利要求77所述的系统,其中所述不育指示基因包括0ct4、Eif3c、Papola, Piwil2、Eif3b、Eif4b、Rbm3 和 Cpsf4
79.根据权利要求77所述的系统,其中一种或多种不育指示基因的所述表达水平通过 使用BioMark 动态阵列、RT-PCR或全转录组测序进行。
80.根据权利要求77所述的系统,其中一种或多种不育指示基因的所述表达水平是对 胚胎确定。
81.根据权利要求80所述的系统,其中所述胚胎在受精后处于停滞发育。
82.根据权利要求77所述的系统,其中一种或多种不育指示基因的所述表达水平是对 卵母细胞确定。
83.根据权利要求82所述的系统,其中所述胚胎在受精后处于停滞发育。
84.根据权利要求57所述的系统,其中所述比较包括应用判定规则。
85.根据权利要求57所述的系统,其中所述数据分析算法包括使用分类树。
86.根据权利要求57所述的系统,其中所述数据分析算法是非参数的。
87.根据权利要求86所述的系统,其中所述数据分析算法检测特征值分布的差异。
88.根据权利要求86所述的系统,其中所述非参数的算法包括使用Wilcoxon符号秩检验。
89.根据权利要求57所述的系统,其中所述数据分析算法包括使用多重累计回归树或 通过梯度提升器(GBM)。
90.根据权利要求57所述的系统,其中所述数据分析算法是逻辑回归。
全文摘要
提供了用于便于评价临床不育的方法和基于计算机的系统。可实施所述方法和系统,例如,便于为体外受精治疗周期评价受治疗者,包括确定活产事件概率。可实施所述方法和系统,例如,便于确定胚胎的成功植入、选择将移植的胚胎的最佳数目、确定在不成功的治疗周期之后随后体外受精治疗周期的成功。
文档编号G06Q50/00GK102132311SQ200980133799
公开日2011年7月20日 申请日期2009年7月1日 优先权日2008年7月1日
发明者W·H·黄, 玛莲·W·M·姚 申请人:利兰·斯坦福青年大学托管委员会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1