一种番茄全基因组芯片及其应用

文档序号:30724553发布日期:2022-07-13 01:09阅读:279来源:国知局
一种番茄全基因组芯片及其应用
一种番茄全基因组芯片及其应用
1.技术领域
2.本发明属于全基因组基因芯片技术领域,特别涉及一种番茄全基因组芯片及其应用。


背景技术:

3.分子标记技术(molecular marker technology)是分子育种中的重要工具。传统分子标记,例如限制性片段长度多态性(restriction fragment length polymorphism,rflp)和简单序列重复(simple sequence repeat,ssr)在遗传育种领域中发挥着重要作用。但是,也存在一定局限性,例如在基因组分布数量少,以及操作过程繁琐、通量低,导致无法满足大规模商业化育种应用的需求。单核苷酸多态性(single nucleotide polymorphism,snp)指基因组单个核苷酸的变异,包括单个碱基对的转换、颠换、插入或缺失。snp作为基因组中分布更为广泛的遗传标记,具有密度高、遗传稳定性高和易于自动化分析等特点,已发展成为动物遗传变异研究中较为常见的分子标记。
4.目前,用于snp位点分型的基因芯片技术中,传统的固相芯片基于探针与dna序列的互补杂交,通过标记物的荧光显色信号进行分型。液相芯片基于重测序技术,对每个目标位点进行专一性捕获,并进行高深度的重测序,具有检测准确性高、通量大的优点。液相芯片一般包括根据dna互补原理,为每个待测位点设计的一条生物素(biotin)标记、覆盖目标snp的探针,这些探针在液态中与基因组目标区域杂交形成双链,可以利用链霉亲和素包衣的磁珠与带有生物素的分子的吸附作用,经洗脱、扩增、建库之后进行二代测序,最终还原目标位点及其周围snp的基因型状态。液相芯片目前在物种进化分析、种质资源评价与dna指纹鉴定、分子遗传图谱构建、基因/qtl定位和基因克隆、分子标记辅助选择、全基因组选择等方面已经有着较为成熟的应用(徐云碧,杨泉女,郑洪建,等;靶向测序基因型检测(gbts)技术及其应用;中国农业科学,2020,53(15):29833004)。
5.目前,动物育种中,牛90k芯片、绵羊illumina 50k芯片,山羊illumina 50k芯片、猪高密度芯片、鸡600k,玉米40k液相芯片和1k液相芯片,水稻40k液相芯片等已经被广泛用于进行大规模商业化育种,具体应用包括种质资源遗传多样性分析、遗传与进化分析、亲缘关系鉴定、全基因组关联分析和基因组选择。
6.但是现有的固相基因芯片,例如,牛90k固相芯片,在检测流程及应用中存在以下问题:首先,分型位点较多;其次,牛90k固相芯片只能对芯片上所包含的snp位点进行分型,对于这些位点周围的snp位点则无法分型,固相芯片一经设计,则所能检测到的位点就被固定下来,无法增删,灵活性较差;最后,固相芯片分型成本较高。


技术实现要素:

7.本发明之目的在于提供一种番茄全基因组芯片及其应用。
8.为实现上述目的,本发明提供如下技术方案:一种番茄全基因组芯片,该芯片的基因分型对象包括定位于番茄参考基因组sl2.50上的1377个snp位点和80个indel位点。
9.定位于番茄参考基因组sl2.50上的snp位点为1377个(具体由1004个新发现的snp位点和373个已知的snp位点组成),可提供进行国内外各个番茄品种性状相关基因的定位、遗传多样性分析、全基因组关联分析、基因组选择,以及品种鉴定、亲缘关系鉴定、种质资源改良与保护的snp分子标记组合;该芯片的基因分型对象包括80个indel位点,包括ny/t2471-2013番茄品种鉴定技术规程indel分子标记法的48个indel标记中的25个标记,和新发现的55个indel标记;使得芯片提供国家标准中部分indel标记的结果分析,用于番茄品种性状相关基因的定位、遗传多样性分析、全基因组关联分析、基因组选择,以及品种鉴定、亲缘关系鉴定、种质资源改良与保护的indel分子标记组合;定位于番茄黄化卷叶病毒(tylcv)、番茄花叶病毒(tmv),烟草花叶病毒(tomv)、番茄褐色皱纹果病毒(tobrfv)基因组上的snp位点8个(涉及的ncbi登录号分别为:nc_004005.1、nc_002692.1、nc_001367.1、mt018320,使得芯片可同时对番茄病毒病进行疾病诊断。
10.优选的,所述芯片为液相芯片。
11.本发明提供一种番茄全基因组芯片的应用,包括在番茄育种中的应用。
12.优选的,包括在番茄基因组选择、番茄性状相关基因的定位、番茄遗传多样性分析、番茄回交转育、番茄全基因组关联分析、番茄品种鉴定、番茄亲缘关系鉴定或番茄种质资源改良与保护中的应用。
13.优选的,在番茄育种中的应用采用的分子标记的检测方法为基于液相芯片的snp位点和indel位点的分型方法。例如,靶向捕获测序技术。
14.所述分子标记与番茄主要经济性状相关联,所述经济性状涉及果实颜色,果实硬度,单果重、耐裂性、坐果率、节间长度、第一穗花数量和节位、叶片颜色、长度、长势、植株类型。
15.优选的,所述1377个snp位点和80个indel位点中,与抗病性相关的59个分子标记位点包括:sl2.50ch01_1124825;sl2.50ch01_1125796;sl2.50ch01_1677737;sl2.50ch01_2078506;sl2.50ch01_3973295;sl2.50ch01_3974505;sl2.50ch02_34285108;sl2.50ch02_34285162;sl2.50ch03_64540483;sl2.50ch04_1813305;sl2.50ch04_1813331;sl2.50ch04_39555167;sl2.50ch05_6381569;sl2.50ch05_6404126;sl2.50ch06_2161990;sl2.50ch06_2162280;sl2.50ch06_2163925;sl2.50ch06_2354841;sl2.50ch06_34370002;sl2.50ch06_34370158;sl2.50ch06_34389411;sl2.50ch06_34389561;sl2.50ch06_35009157;sl2.50ch06_35009202;sl2.50ch06_35009232;sl2.50ch06_35009237;sl2.50ch06_35009245;sl2.50ch06_35009250;sl2.50ch06_35009260;sl2.50ch06_35009272;sl2.50ch06_35950028;sl2.50ch06_37186202;sl2.50ch07_63597481;sl2.50ch08_61642121;sl2.50ch09_56697;sl2.50ch09_57025;sl2.50ch09_4943007;sl2.50ch09_5090186;sl2.50ch09_13621583;sl2.50ch09_13621676;sl2.50ch09_13621682;sl2.50ch09_13621846;sl2.50ch09_71434430;sl2.50ch09_71436208;sl2.50ch09_72029144;sl2.50ch09_72029219;sl2.50ch09_72032340;sl2.50ch09_
72032691;sl2.50ch11_9317442;sl2.50ch11_54264376;sl2.50ch11_54531455;sl2.50ch11_54531515;sl2.50ch11_54897353;sl2.50ch11_54913693;sl2.50ch11_55071011;sl2.50ch11_55299325;sl2.50ch12_2941301;sl2.50ch12_3809589;sl2.50ch12_4543132。
16.优选的,所述1377个snp位点和80个indel位点中,与颜色相关的32个分子标记位点包括:sl2.50ch01_78745063;sl2.50ch01_78747579;sl2.50ch01_78747639;sl2.50ch01_78747668;sl2.50ch01_78747838;sl2.50ch01_78911282;sl2.50ch01_82203699;sl2.50ch01_82205102;sl2.50ch01_82207046;sl2.50ch02_45196896;sl2.50ch03_52152865;sl2.50ch03_52152879;sl2.50ch03_52152905;sl2.50ch03_52153104;sl2.50ch03_52153202;sl2.50ch03_52153309;sl2.50ch03_52153473;sl2.50ch03_52153858;sl2.50ch03_52154291;sl2.50ch03_52154481;sl2.50ch03_52154565;sl2.50ch03_52154574;sl2.50ch03_52154673;sl2.50ch03_52154825;sl2.50ch03_52155769;sl2.50ch03_52180873;sl2.50ch03_52182577;sl2.50ch03_52386476;sl2.50ch03_52406077;sl2.50ch03_65751759;sl2.50ch05_8998720;sl2.50ch05_9313748。
17.优选的,所述1377个snp位点和80个indel位点中,与醋栗番茄la2093背景相关的105个分子标记位点包括:sl2.50ch01_40124913;sl2.50ch01_53317722;sl2.50ch01_72488048;sl2.50ch01_77558637;sl2.50ch01_98247086;sl2.50ch02_29935554;sl2.50ch02_44944551;sl2.50ch04_978312;sl2.50ch04_4834961;sl2.50ch04_9633653;sl2.50ch04_53335117;sl2.50ch05_44420698;sl2.50ch05_54497816;sl2.50ch06_15767679;sl2.50ch06_37444105;sl2.50ch08_1381293;sl2.50ch08_23948349;sl2.50ch08_28887544;sl2.50ch08_44832241;sl2.50ch08_45610138;sl2.50ch08_49276668;sl2.50ch08_57714845;sl2.50ch08_58664027;sl2.50ch08_60599653;sl2.50ch08_61583858;sl2.50ch08_62573296;sl2.50ch08_63731190;sl2.50ch08_64621335;sl2.50ch08_65360761;sl2.50ch09_1468885;sl2.50ch09_5365363;sl2.50ch09_15147765;sl2.50ch09_37706150;sl2.50ch09_42531761;sl2.50ch10_10257147;sl2.50ch11_500493;sl2.50ch11_2795604;sl2.50ch11_4360855;sl2.50ch11_7764094;sl2.50ch11_8090264;sl2.50ch11_8297787;sl2.50ch11_8705537;sl2.50ch11_8764030;sl2.50ch11_8885924;sl2.50ch11_8990978;sl2.50ch11_9273987;sl2.50ch11_9679304;sl2.50ch11_9825111;sl2.50ch11_51503295;sl2.50ch11_55107953;sl2.50ch01_21006695;sl2.50ch01_97390074;sl2.50ch08_21514991;sl2.50ch08_21935647;sl2.50ch08_30124360;sl2.50ch08_33554881;sl2.50ch08_33572491;sl2.50ch08_38712700;sl2.50ch08_50888332;sl2.50ch08_51018195;sl2.50ch08_54478887;sl2.50ch08_56039111;sl2.50ch08_57456680;sl2.50ch08_58242820;sl2.50ch08_58416149;sl2.50ch08_60629674;sl2.50ch08_61189832;sl2.50ch08_62230910;sl2.50ch08_64423423;sl2.50ch08_65229257;sl2.50ch09_12741885;sl2.50ch09_15742079;sl2.50ch09_17741716;sl2.50ch09_29293428;sl2.50ch09_39342186;sl2.50ch09_43433842;sl2.50ch09_48527593;sl2.50ch11_10108015;sl2.50ch11_10261139;sl2.50ch11_11892235;sl2.50ch11_11964698;sl2.50ch11_
12358446;sl2.50ch11_12437087;sl2.50ch11_12527879;sl2.50ch11_13305592;sl2.50ch11_13816619;sl2.50ch11_16722717;sl2.50ch11_16910740;sl2.50ch11_1803553;sl2.50ch11_21561965;sl2.50ch11_21720369;sl2.50ch11_37251169;sl2.50ch11_37453090;sl2.50ch11_46447098;sl2.50ch11_4797112;sl2.50ch11_49374653;sl2.50ch11_50510190;sl2.50ch11_51447653;sl2.50ch11_54433869;sl2.50ch11_55446914;sl2.50ch11_8705656;sl2.50ch11_8830219;sl2.50ch12_41942023;sl2.50ch12_42437286;sl2.50ch12_60945631。
18.本发明的有益效果如下:本发明从大规模测序数据中挖掘番茄关键功能位点及品种特异位点,发现及筛选出可用于芯片设计的1377个snp位点和80个indel位点(即约1.5k),且其中有1004个新发现的snp位点和新发现的55个indel标记,利用设计的芯片可以实现基因分型,在番茄育种中的多个领域均具有较高的应用价值。
19.本发明所涉及的番茄液相芯片基于靶向捕获测序技术,不仅可以对目标位点进行分型,同时目标位点周围一定范围内的snp也可以被准确分型,因此可以得到比标记位点更多的snp分型信息;与传统固相芯片相比,灵活性较高,可以根据应用需要随时添加标记位点;同时,液相芯片依托二代测序平台,分型成本较低,为大规模分型提供技术手段。
附图说明
20.图1为本发明的snp标记在不同染色体的均匀分布情况图。
21.图2为本发明的snp位点的及基因组位置表。
22.图3为本发明的snp位点的及基因组位置图。
23.图4为本发明的参考基因组信息表。
具体实施方式
24.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.以下结合附图1-4和实施例对本发明作进一步详细说明,所述实施例仅用于解释本发明,而非对本发明的保护范围的限制。
26.(一)、番茄1.5k液相芯片的设计和制备本发明利用325份育种材料的重测序数据,首先进行了snp分析,对位点进行过滤后共获得65304324个snp位点用于后续的筛选。
27.本发明筛选的目标snp位点包括以下几类:番茄功能基因相关snp、醋栗番茄背景相关snp、番茄产量、植株形态、果实性状、开花习性、番茄品质等相关snp、番茄黄化卷叶病毒(tylcv)、番茄花叶病毒(tmv),烟草花叶病毒(tomv)、番茄褐色皱纹果病毒(tobrfv)基因组上的snp位点。这几类位点的具体筛选过程如下:1、背景标记中的903个snp标记在全基因重测序数据范围内以保留最小等位基因频率大于0.3(maf》0.3na《0.2ho《0.1)筛选,剩余:161,589snps,在上下游100bp最多3个snp
的标准筛选,剩余:59,639snps,blast去除重复序列(hsp一致性和覆盖率大于90位点超过两个的)剩余:25,075snps,每193kb随机选择一个snp,剩余:3,002snps作为的候选位点。
28.2、重要功能位点的确定:对于文献中已报道的与番茄产量、植株形态、果实性状、开花习性、番茄品质,抗病性等重要经济性状相关的功能基因,在这些基因的每个外显子上至少筛选一个候选snp位点,或者文献报道的根据全基因组关联分析得到的和番茄产量,颜色,品质相关的snp位点作为候选位点。
29.品质相关位点的标记数量63;国家标准indel的标记数量45;颜色相关位点的标记数量38;功能基因相关位点的标记数量42;抗病性相关位点的标记数量59;醋栗番茄背景相关的标记数量103;gwas分析相关的标记数量192;产量相关位点的标记数量14;背景标记的标记数量903。
30.3、根据番茄黄化卷叶病毒(tylcv)、番茄花叶病毒(tmv),烟草花叶病毒(tomv)、番茄褐色皱纹果病毒(tobrfv)基因组(涉及的ncbi登录号分别为:nc_004005.1、nc_002692.1、nc_001367.1、mt018320,以nt/nr库作为目标数据库进行blast选取8个位点作为候选位点。
31.4、snp位点的及基因组位置(position)。
32.5、根据这3,002个snp位点的位置及其两侧序列,和78个indel位点的位置及其两侧序列通过石家庄博瑞迪生物技术有限公司采用靶向捕获测序技术设计引物并进行探针合成,从而得到番茄1.5k液相芯片。
33.(二)、利用番茄1.5k液相芯片对番茄dna样品进行检测的流程番茄基因组dna的提取:从番茄幼苗上取样,使用ctab法或磁珠吸附法基因组提取试剂盒(天根生物科技有限公司,北京)进行dna的提取。
34.dna样品质量检测:用质量分数为1%~1.5%的琼脂糖凝胶电泳检测,用凝胶成像系统(geldocxrsystem,美国bio-rad公司)判断电泳结果,保证基因组完整性;用微量紫外分光光度计(q5000,美国quawell公司)或类似的核酸蛋白测定仪测量基因组dna的浓度,将dna浓度调整到工作浓度10~50ng/μl。
35.番茄液相芯片检测:按照番茄1.5k液相芯片检测标准流程操作(http://www.molbreeding.com/index.php/technology/genobaits.html)。
36.数据分析:获得的原始数据采用fastp软件(chens,zhouy,cheny,etal。fastp:anultra-fast all-in-onefastq preprocessor。bioinformatics,2018,34(17):i884-i90)进行质控,之后用bwa软件(lih。aligning sequence reads,clone sequences and assembly contigs with bwa-mem。arxiv preprint arxiv:13033997,2013。)将测序数据mapping到番茄参考基因组sl2.50上,采用gatk软件(van der auwera g a,carneiro m o,hartl c,etal。from fastq data to high-confidence variant calls:the genome analysis toolkit best practices pipeline。current protocols in bioinformatics,
2013,43(1):11。0。1-。0。33)的标准流程检测snp,进行基因分型。
37.(三)、番茄1.5k液相芯片在全基因组关联分析中应用(四)、番茄1.5k液相芯片在品种鉴定中应用(五)、番茄1.5k液相芯片的优点(1)相对于传统的固相芯片,本发明与具有相同数目探针的固相芯片相比,可以检测出更多的snp位点(4~10k)。并且设计灵活,后期可随时添加感兴趣的标记位点。
38.(2)相比于全基因组重测序,本发明有明显的价格优势,可以进行番茄材料进行大规模分型,进而促进番茄的育种工作。
39.(3)本发明包含了大量番茄功能基因相关位点,筛选了已有研究中与番茄产量、植株形态、果实性状、开花习性、番茄品质,抗病性等重要经济性状相关的功能基因显著相关的位点,增加了芯片进行基础研究的准确性。
40.(4)本发明用于设计芯片的样本来源于育种材料的重测序数据即具有更多栽培品种特有的中高频snp位点,更适合用于番茄育种的研究,有利于育种工作的开展以及对番茄种质资源的研究与利用。
41.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1