一种基于表型表现的育种筛选系统及方法

文档序号:35535641发布日期:2023-09-21 22:51阅读:29来源:国知局
一种基于表型表现的育种筛选系统及方法

本发明涉及植物育种,尤其涉及一种基于表型表现的育种筛选系统及方法。


背景技术:

1、自19世纪末孟德尔提出遗传规律以来,到20世纪中叶遗传育种理论得到空前发展,科学家开辟了以杂交育种为主的作物育种途径。进入生理生化、分子育种阶段后,目前的研究手段仍以亲本目标性状改良为主,并未跳出杂交育种的主线。

2、以禾本科植物为例,目前,水稻育种的优化步骤大体包含两种:

3、(一)选择父本和母本性状优良的后代,通过远缘杂交的方法构建育种群体,并在一代一代的筛选工作中获得优质的稳定保持高产的粮种;

4、(二)通过化学试剂、物理射线或太空诱导等方法,获得未知表型的突变体种子,通过在田间的一代筛选而获得部分疑似突变的水稻植株,并通过与其他稳定高产的品种(例如,日本晴)的水稻植株杂交而获得性状分离的f2代,通过性状分离的f2代选育期望的水稻植株。

5、专利号为cn102250873b的中国专利公开了提高突变频率和突变谱的植物诱变育种方法,其步骤如下:(1)诱变:对胚性细胞进行诱变处理,然后继代扩大培养,(2)诱导类减数分裂:对诱变处理、继代扩大培养得到细胞进行类减数分裂诱导,(3)自然加倍获得突变纯合体细胞,结合育种目标与突变性状筛选突变纯合体。现有技术中,突变处理后的植株会集中生长在田间或育种室内,需要对突变体植株的表型进行筛选,并将筛选到的疑似突变体进行分子生物学领域的研究,通过基因定位等手段进一步确认该植株是否为突变体植株。在研究过程中,突变体植株既能够作为母本/父本为种植资源提供帮助,还能够为科研人员提供功能基因研究的依据。

6、具体地,当获得突变体植株时,研究人员通过植株的通用引物定位突变基因。在进行功能基因的定位和研究的过程中,极可能在获得基因时发现筛选到的基因序列是被其他文章已发表的功能基因序列,造成了科学研究的浪费。

7、从表型到基因,从基因到表型,代表着不同研究思维,而针对从表型到基因的研究思维产生的研究成果冗余的问题,本发明提供一种基于表型表现的育种筛选系统。通过该筛选系统,在选择突变体植株时,研究人员能够基于系统提供的分析结果精准定位所需要的植株,减少冗余研究。

8、此外,一方面由于对本领域技术人员的理解存在差异;另一方面由于申请人做出本发明时研究了大量文献和专利,但篇幅所限并未详细罗列所有的细节与内容,然而这绝非本发明不具备这些现有技术的特征,相反本发明已经具备现有技术的所有特征,而且申请人保留在背景技术中增加相关现有技术之权利。


技术实现思路

1、植物突变体是指由于基因突变而引起植物激素或其他缺陷的突变体。诱发基因突变的方法有自然突变和人工诱发突变两种,人工诱发突变有物理因素诱变和化学因素诱发。

2、目前,在主要农作物的功能基因研究和突变体植株的筛选的过程中,最常使用的方法是将种子进行甲烷磺酸乙酯(ethyl methane sulfonate,ems)处理,以获得突变体种子。

3、ems是一种常用的化学诱变剂,能诱发产生高密度的系列等位基因点突变,具有效率高、负作用小、易操作等优点,目前已被广泛应用于植物的相关遗传研究和诱变育种工作中。在当前种质资源极为匮乏,基因资源日益枯竭的状况下,采用ems诱发突变技术创造有用基因资源具有极其重要的意义。ems诱变育种中,诱变材料不同,使诱变效率和筛选难度也有差异。一方面要保证诱变剂的有效渗入,另一方面也要使植物能够顺利生长和发育。不管诱变成功与否,突变体植株在田间的表现都是不可控的。

4、由于诱变后的植株可能会发生未知功能基因的突变,因此,通过ems诱变获得大批量的突变种子并建立突变体库的方法是目前用于研究植物基因功能的主要手段。

5、这类研究模式存在的最大问题是基因突变位置的未知和不可控性,研究人员需要对植株基因组进行大面积筛选才能够确定影响表型的突变位点,而在筛选过程中,由于主要作物(例如水稻、小麦、拟南芥)中的功能基因被22cn0559af定稿

6、may 19,2023

7、大量研究发现,研究人员在对筛选的突变体植株的突变基因进行定位时,结果极有可能与现有公开的基因相同,导致科研工作时间被大量浪费。

8、本发明提供一种基于表型表现的育种筛选系统,其包含:第一信息采集模块,包含采集植株图像的第一检测单元。基于所述第一信息采集模块采集的包含植株的表型数据,远程服务器将采集到的n个表型数据基于其数据特征进行分类,并生成对应的表型数据集合,其中,每个集合设置有其对应的类别标签;所述远程服务器包含基因数据库,其中,基于集合的类别标签,所述远程服务器关联所述基因数据库中存储的与植株表型相关的基因数据和集合的类别标签,并将关联性最高的至少一个基因作为第一优先级基因集合,以获得所述植株可能发生突变的基因。在本技术中,类别标签用于标记每个集合对应的异常类型。优选地,n能够为一个,或多个。关联性是指基因在分子层面参与植物的性状表达,以对植物的该表型的产生具有贡献。

9、本技术方案的有益效果:

10、1、相较于现有技术中随机观察突变体田中的突变体植株,或依靠自身经验选择突变体田中的突变体植株,本系统采集突变体植株在不同生理阶段的不同表型数据,并基于分类后的数据与现有公开的基因所参与的性状数据的关联性生成相关的推荐信息。所述推荐信息包含与突变体植株具有关联性的基因信息(例如基因的基因号)。研究人员能够基于推荐信息克隆突变体植株中的所述基因,并进行测序。通过比对所述基因的测序信息与所述基因的公开序列信息,研究人员能够确认突变体植株的所述基因是否发生突变。基于预先了解的基因突变信息,研究人员可判断该突变体植株的研究价值。

11、2、现有技术中,突变体植株的数据采集往往依赖人工,研究人员会对每一个单株在不同阶段进行测量。这一检测手段非常耗时间,尤其是在突变体库中的植株数量非常多时。同时,类似植株高度、籽粒大小等表型的检测,研究人员首先在田间依赖眼力判断是否需要摘取一部分组织带到实验室中进行精密测量,或携带精密仪器前往田间测量,而依赖眼力的筛选过程极容易出现误差,错误地判断部分突变体植株的表型信息。

12、根据一种优选实施方式,所述第一检测单元包含能够以第一分辨率或第二分辨率采集图像的第一组件,所述第一分辨率低于所述第二分辨率,其中,基于所述第一组件采集的第一分辨率的图像与存储于所述远程服务器的标22cn0559af定稿

13、may 19,2023

14、准植株图像的比对结果,所述远程服务器生成植株异常类型。

15、本技术方案的有益效果:

16、现有技术中,通过图像采集的植物特征并确定植物是否生长异常(例如,萎蔫、生病)的手段被广泛使用,但由于植物不同的生长状态所需要采集的数据种类不同,现有技术公开的系统往往采用单一的高精度摄像头,在采集过程中,这类摄像头采集的数据会形成大量的垃圾数据而被存储在处理器中。一方面,增加了处理器的工作负担,拉低了处理器的工作效率;另外一方面,由于大量的垃圾数据存储在处理器中,清理存储数据的频次增加且在历史记录中寻找异常生长的植株的相关数据的难度增加。

17、本技术方案基于植株的不同生长状态设置不同分辨率的摄像头,并在初期采用低分辨率的图像采集方式以在混杂有正常和突变体植株的突变体数据库中筛选所需要的筛选到的突变体植株。由于植株变异后的表型变化明显与正常的植株表型有区别,因此,低分辨率下即可锁定所需观察的植株,以此减少处理器在初期筛选数量较多时数据的运算量,增加处理器的工作效率。

18、根据一种优选实施方式,所述第一信息采集模块还包含能够测量植物组织长度的第二检测单元和检测植物颜色的第三检测单元,其中,基于植株异常类型,所述远程服务器生成开启第一检测单元、第二检测单元和/或第三检测单元的指令。

19、本技术方案的有益效果:

20、区别于现有技术中采用的单一检测路径,即高清图像测量所有植物表型,本技术方案在确定了异常的植株后,能够对该植株个体开展精确性的测量,从而提高数据采集的精度。这一手段在实验研究阶段尤为重要。植物的表型是判断植物是否突变的重要依据,但很多突变体的表型变化并不会发生夸张的改变,例如,株高不一定会从标准的70cm变化为120cm,而可能会变化为90cm。因此,采集数据的误差的降低也会增加实验研究的准确性或者说科学家判断植物是否发生突变的准确度。

21、本技术方案在基于低分辨率的图像特征比对后确认植物的异常类型,如株高、分蘖数增加或穗发芽等,并进一步基于异常类型选择高精度的采集方向。这样的数据采集方式既能够在数量较大的初期筛选中降低数据量,又能够在需要高精度采集的时候采用适应其表型的采集手段获得误差较小的数据。

22、根据一种优选实施方式,基于所述第一分辨率的图像,所述远程服务器能够按照植株组织部位提取图像特征,并与标准图像中对应的植株组织部位的图像特征进行比对,从而确定异常发生的组织部位。

23、本技术方案的有益效果:

24、本技术方案所采用的用于判断的异常发生的组织部位的方法能够为特征对比法。在初期筛选具有突变潜力的植株时,超出限定范围的异同是筛选的唯一条件,而特征对比则是基于该条件获得具有突变潜力的植株的最有效手段。

25、通过现有技术中已经广泛应用的特征比对方法,例如轮廓特征比对方法、特征提取比对方法等,本技术方案能够快速简单地获得正常植株和突变体植株的异常发生的组织部位,通过组织部位将各类的突变体进行分类。

26、突变体的功能基因分析方法中,用于确定基因功能的最主要手段既是转基因植株确定基因在宏观上影响的植物性状,而将基因功能分类的最主要方法也是其影响的性状的发生的组织部位。例如,在国家水稻数据库官网中,功能基因的查询的第一步是确定其发生的组织部位(例如,茎秆对应的株高、叶片对应的抗病性)。本技术方案以组织部位为分类基础,生成不同异常类型的集合,这样的分类方法加强了集合与其对应的功能基因的关联性,增加了基因与其对应的植株之间的匹配效率。

27、根据一种优选实施方式,所述植株组织部位至少包含根器官、茎器官、叶器官、果实器官和花器官。

28、根据一种优选实施方式,远程服务器接收第一组件传送的第一分辨率的图像。所述异常类型包含数量异常、长度异常以及颜色异常。优选地,第一组件为摄像头。

29、根据一种优选实施方式,远程服务器按照植株组织部位的分布对获得的第一分辨率的图像进行图像特征提取,并将各个植株组织部位与标准图像中的各个植株组织部位比对,以生成各个植株组织部位的判断信息。优选地,远程服务器包含储存数据库。当一个或多个植株组织部位处于标准范围内时,远程服务器将该数据存储于储存数据库,并确认该植株组织部位不会被其他检测单元再次检测。

30、22cn0559af定稿

31、may 19,2023

32、例如,当远程服务器判断所述植株的异常类型为数量异常时,所述远程服务器控制所述第一检测单元开启工作。基于所述远程服务器生成异常类型的植株组织部位为茎器官,所述第一检测单元的第一组件以第二分辨率采集所述植株的茎器官。所述远程服务器提取图像中茎器官数量的表型数据。

33、本技术方案的有益效果:

34、针对田间植物的表型检测,现有技术中往往采用检测单元大面积地进行植物图像扫描/拍摄。这样直接通过多个传感器进行无针对性的信息采集方式成本高昂且操作过程繁琐又耗时,尤其是设置在田间的检测单元,检测单元会摆动摄像头以尽可能多地拍摄高清晰度的图片以进行植株表型的识别,处于移动中的第一检测单元需要在多个不同的位置之间不断地调整焦距,以拍摄到能够用于图像识别的高清晰分辨率图片。高清晰分辨率图片的所占内存空间较大,远程服务器进行后续图像识别上述彩色图像所处理的数据量也是巨大的,而处理过程中远程服务器还需要处理其他传感器传送的信息,并将多种类信息结合生成判断,该过程会导致远程服务器对信息的处理速度变慢,这一点也导致远程服务器与设置在田间的第一信息采集模块之间需要较强的信号连接,以防止在传输数据过程中产生大量的信息传输错误。

35、本系统基于低分辨率的图像进行突变体植株表型的筛选,在确定发生异常的植株以及发生异常的植株组织部位后,第一检测单元能够聚焦在该植株的异常的组织部位上进行图像采集或其他对应的信息采集。一方面,通过低分辨率的图像筛选出需要着重进行信息采集的单株和组织部位能够降低前期的数据处理量,增加了数据处理效率;另一方面,相较于对每一个单株进行高分辨率的图像采集或其他信息采集,本系统能够进一步地针对植株的异常的组织部位进行高分辨率的图像采集或其他信息采集,增强了信息采集的准确性。

36、根据一种优选实施方式,本系统以设定的时间间隔重复本技术提出的数据采集步骤,即在经过一个时间间隔后,远程服务器触发第一检测单元以第一分辨率对植株进行图像采集。优选地,时间间隔的长度设定能够基于植株的生长阶段确定。例如,小麦的生长阶段主要分为三个阶段,分别为以吸收前期种子自身营养生长为主的发育阶段、从返青期开始到抽穗期的营养生长阶段、从抽穗到成熟的生殖生长阶段,其中,发育阶段时长在15~25天,养22cn0559af定稿

37、may 19,2023

38、生长阶段时长在40~70天,生殖生长阶段时长在50~100天。由于冬小麦和春小麦的生长差异,时间间隔是人工设置的。

39、本技术方案的有益效果:

40、针对不同品种的植株进行不同检测间隔的设置,尤其地,是针对植株生理阶段进行设置,使得本系统能够获得植株在各个生理阶段的突变表型。由于有些突变体植株仅仅是在生殖生长阶段展示或仅仅是在早期营养生长阶段展示,因此,对突变体植株的单次检测会漏掉很多已经发生或还未发生的表型变化数据。同时,由于突变体植株的表型主要是在每一个生理阶段的生长过程中可能会发生变化,因此,基于不同品种植株的生理阶段设置时间间隔既能够降低检测频率,减少重复检测次数,又能够确保每个发育过程中突变体植株可能出现的异常的表型都被捕捉到。

41、根据一种优选实施方式,将所述n个集合中的所有图像的图像特征划分为多个集合是指计算所述待匹配图像的特征与各个集合的中心差值,得到多个差值,将其中最小的差值所对应的集合确定为待匹配图像的特征所属的集合,其中,所述中心是指植物性状。

42、根据一种优选实施方式,响应于第一级基因集合的生成,远程服务器将对应的类别标签的图像特征标准化分类,其中,所述标准化分类是指基于所述植株的性状的标准化数值,远程服务器将相同类别标签的图像特征分为高于标准化数值的第一特征集和低于标准化数值的第二特征集。

43、根据一种优选实施方式,所述基因信息还包含其对应的表型信息与标准化数值之间的差值,第一优先级基因集合基于其对应的表型信息与标准化数值之间的差值分为正值第一优先级基因集合和负值第一优先级基因集合,其中,所述第一特征集归属于正值第一优先级基因集合,所述第二特征集归属于负值第一优先级基因集合。优选地,标准化数值是指正常植株的表型信息。例如,日本晴株高的标准化数值为50cm~70cm。

44、本技术方案的有益效果:

45、基于基因对植物性状的影响包含负调控和正调控,且正调控和负调控植物性状的突变体基因能够是不同的一个或几个基因,本系统基于该植株品种设定对应表型的基准范围或基准值,将突变体植株的一类表型表现归类为正值或负值,进一步为关联突变体基因提供精确的判别信息。

46、22cn0559af定稿

47、may 19,2023

48、根据一种优选实施方式,单株植株设置有识别标签,当所述科研人员确认所需要的第一优先级基因集合时,所述远程服务器能够提取对应特征集内的图像特征所对应的图像,并关联所述图像和其对应的植株的识别标签。优选地,识别标签能够包含单株植株在田间的位置。例如,第三行第四颗,或单株植物人工标记的标签。

49、本发明提供一种基于表型表现的育种筛选方法,包含以下步骤:

50、建立植物育种试验表型性状数据库,所述数据库用于存储植物性状信息、与所述形状相关的功能基因信息;

51、采集植物育种田间对应编号的植物的表型图像,并基于图像数据将所述植物表型性状进行分类;

52、基于所述数据库中存储的植物性状信息,将分类后的植物表型性状进行聚类,确认与处于当前生长期的植物最接近的基因。

53、本技术方案的有益效果:

54、表型和性状是有严格区分的。性状是指生物体所有特征的总和,由基因决定,必须是可以遗传的。而表型则是这些基因决定的性状在环境作用下的具体表现,与性状的概念有着本质区别,表型是不可遗传的。在本技术中,植株在生长过程中产生的外观特征为植株表型,而性状则是指根据历史基因库的统计而获得的与基因调控相关的植株表型的一类总和。例如,植株株高100cm为植物表型。植株株高或标准植株株高100cm为植物性状。基于此,性状能够是植株表型的上位概念,或能够作为个体植株表型的基准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1