小鼠Dnaic2基因序列的制作方法

文档序号:3559145阅读:432来源:国知局
专利名称:小鼠Dnaic2基因序列的制作方法
技术领域
本发明涉及的是一种基因工程技术领域的基因序列,更具体地说,是涉及 一种小鼠Dnaic2基因序列。
背景技术
动力蛋白复合体(dynein complex)是一种以微管为基础并在其上可以滑 动的复合物。这种复合体是由动力蛋白重链、中间链、中轻链以及一些轻链所组 成。有的动力蛋白复合体存在于胞桨中,而有的则存在于细胞的纤毛或是鞭毛中, 前者称为胞浆动力蛋白(cytoplasmic dyneins),后者称为纤毛轴动力蛋白 (axonemal dyneins)。胞浆动力蛋白主要的作用是沿着微管进行蛋白的运输, 而纤毛轴动力蛋白是纤毛或是鞭毛的重要组成部分动力臂(dyneinarms)。动 力蛋白复合体通过进行ATP依赖型反应可以使纤毛或鞭毛中邻近的周位微管相 互滑动,这种高协调性的分子运动从而导致了纤毛或鞭毛的运动,因此纤毛轴动 力蛋白是纤毛或鞭毛产生运动的能力来源。此外,动力蛋白复合体还被发现在许 多细胞活动或是发育过程中具有重要的作用,如细胞极性的形成(包括卵母细 胞极性的建立)、在胚胎发育中胚胎左右轴的确定等等。这些动力蛋白一旦发生 异常则将会导致疾病,如先天性纤毛运动异常症(PCD)、 Kartagener综合症 等。PCD患者具有慢性鼻窦炎、支气管扩张并伴有男性不育的症状。50%的患者 具有异位心脏,这是一种Kartagener综合症。这种疾病的产生主要就是由于纤 毛和鞭毛中动力臂的异常所导致的。结果使得呼吸道中的黏膜纤毛的传输功能发 生异常以及精子不能游动。此外,女性的生育力低下而且导致宫外孕也是PCD 疾病的症状之一。这可能是因为肌肉之间的收缩是卵细胞和受精卵的移动的原始 动力,而输卵管中纤毛至少在这一过程中具有一定的功能。卵细胞在输卵管中的 移动是靠黏膜纤毛提供原始动力的,具有Kartagener综合症的女性病人是能够 生育的,但是当这些黏膜纤毛出现病变而不能运动时,其生育能力就会有所下降。
现已经发现了几个与PCD疾病有关的基因。DNAI1基因(编码一种动力蛋白轻链
蛋白)的突变可以使得莱茵衣藻(一种具有两根鞭毛的单细胞衣藻,其鞭毛的结 构与人的呼吸道纤毛和精子鞭毛具有相似的结构)和人的纤毛或鞭毛缺失外动力
臂。而且几个具有相似的超微结构异常的家族中都发现了 DNAI1基因座位的缺 失。人的DNAI2基因也是编码外动力臂中的一个中间链蛋白,其在莱茵衣藻中的 同源基因为IC69,这个基因的突变使得莱茵衣藻因缺失外动力臂而丧失游动的 功能。
但是迄今为止,人们只是发现这几个基因与PCD疾病相关,而没有能建立 相关的动物研究模型以供对这一疾病的具体机理,这主要是因为这些基因都是人 类中的基因,难以建立相关研究模型。而且也没有见到利用这些基因进行对治愈 PCD疾病的药物及其他相关药物的开发研究的报道。本发明的Dnaic2基因是通 过实验手段从小鼠睾丸中克隆出的、与人的DNAI2基因具有高度同源性的基因, 能在小鼠体内编码一种动力蛋白中间链多肽。这个新基因的克隆将对于建立相关 的动物研究模型奠定基础,并在此基础上所进行的研究将对对人类PCD疾病、精 子获能的研究以及开发治愈PCD和不孕不育的相关药物都具有重要的作用。

发明内容
本发明的目的在于克服现有技术中的不足,提供一种小鼠Dnaic2蛋白编码 序列。以期能够建立相关的小鼠模型来满足人们对PCD疾病的致病机理的研究和 药物的研制,以及在治愈不育症和避孕药物开发等方面的研究要求,从而使本发 明在推动研究和治疗先天性纤毛运动异常症(PCD)以及开发相关药物方面作出 基础性的贡献。
本发明是通过以下技术方案实现的
本发明所分离出或纯化的、与人DNAI2基因具有高度同源性的小鼠Dnaic2 基因编码的核苷酸序列及其蛋白分子序列,所述的核苷酸序列,是指包括在已 经分离出或纯化的与人DNAI2基因具有高度同源性的小鼠核苷酸序列的DNA分 子,该分子与SEQ ID NO. 3中的从第385-2256位的核苷酸序列至少有70%的同 源性。
所述的基因,其mRNA全长为2871bp,其开放阅读框的启示密码子始于第
385位核苷酸,终于第2256位核苷酸,编码一条含623个氨基酸的多肽。或者 在中度严紧条件下,所述的核苷酸序列能与SEQ ID NO. 3中的从第385-2256位 的核苷酸序列杂交。较佳地是所述的核苷酸序列能编码与SEQ ID NO. 3所示的氨 基酸序列一致的多肽。更佳地是所述的核苷酸序列能与SEQ ID NO. 3中从第 385-2256位的核苷酸序列一致。这就包括SEQ ID NO. 3中的第385-2256位的核 苷酸序列、其简并序列及SEQ ID N0.3中的第385-2256位的核苷酸序列的变异 形式。简并序列是指SEQ ID NO. 3序列的第385-2256位核苷酸中有一个或多个 密码子被编码相同氨基酸的简并密码子所取代而产生的序列。该术语还指那些能 在中度严紧条件下、更佳地是能在高度严紧条件下与SEQ ID NO. 3中第385-2256 位的核苷酸序列杂交的核苷酸序列。SEQ ID NO. 3中的第385-2256位的核苷酸 序列的变异形式包括(但并不限于)若干个核苷酸的缺失、插入和/或取代(通常 为1-90个,较佳地为1-6 0个,更佳地为1-20个,最佳地为1-10个),以及在 5'和/或3'端添加数个核苷酸(通常为60个以内,较佳地为30个以内,更佳地为 IO个以内,最佳地为5个以内)。
上面所述的核苷酸序列或其片段可以采用PCR扩增法、重组法或人工合成等 方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开 放阅读框序列来设计引物,用市售的cDNA库或按本领域常规方法所制备的cDNA 库作为模板进行扩增而得到相关序列。当序列较长时,常常需要两次或多次PCR 扩增,然后把扩增出的片段按正确的次序拼接起来。 一旦获得了有关的序列,就 可以釆用各种方法进行大批量地获得该序列。通常是将其克隆入载体,再转入菌 株或是细胞,然后通过常规方法从增殖后的宿主中分离得到该序列。
所述的基因编码,具有SEQ ID N0.3所示的氨基酸序列的蛋白或多肽、其变
异形式、活性片段,或活性衍生物。
所述的蛋白或多肽,是指分离出的或纯化的与人DNAI2蛋白具有高度同源
性的小鼠蛋白或多肽,该多肽为具有SEQIDN0.3中的氨基酸序列的多肽、以及
利用上述蛋白或多肽的抗血清获得的多肽或蛋白。最佳地是该多肽的氨基酸序列
完全与SEQ ID N0.3氨基酸序列一致。其变异形式包括(但并不限于)若干个
氨基酸的缺失、插入和/或取代(通常为1-90个,较佳地l-60个,更佳地1-20
个,最佳地1-10个),以及在C末端和/或N末端添加一个或数个氨基酸(通常为
60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)。例 如,在本领域中,用性质相近或相似的氨基酸进行取代(称为保守性变异),通 常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基 酸通常也不会改变蛋白质的功能。其类似物与天然的小鼠Dnaic2多肽的差别可 以是不影响序列的修饰形式上的差异,也可以是氨基酸序列上的差异,或者兼而 有之。这些多肽包括天然或诱导的突变体。诱导突变体可以通过采用辐射或诱变 剂的方法产生,还可通过已知分子生物学的技术(如通过化学合成将突变引入 本发明蛋白序列中)产生。这些类似物还包括含有不同于天然L-氨基酸的残基
(如D-氨基酸)的类似物,以及含有非天然存在的氨基酸(如e、 y-氨基酸)的类
似物。修饰的形式包括体内或体外的多肽的化学衍生形式,如磷酸化、糖基
化、乙酰化或羧基化等。应该指出的是,本发明的多肽并不限于上述列举的代表 性多肽。
所述的分离出或纯化的DNA,是指在cDNA水平上,利用引物对该基因的扩增 和利用纯化试剂盒对扩增产物进行纯化。本发明所述的Dnaic2基因序列如SEQ ID NO. 3。上述基因编码的蛋白质分子序列如SEQ ID NO. 3。
上面所述的蛋白或多肽可采用重组法生产,也可用固相技术,人工直接合成。 例如,通过使用肽合成仪来自动合成肽。也可以分别合成本发明蛋白的各片段, 然后用化学方法加以连接而形成全长的分子。利用本发明的与人DNAI2蛋白具有 高度同源性的小鼠蛋白,进行各种实验方法,可筛选出与之发生相互作用的物质、 或者受体、抑制剂或拮抗剂等。
本发明提供了一种载体,它包含所述的DNA分子。在本发明中,可选用本领 域中已知的各种载体,如市售的载体,包括质粒、病毒载体、粘粒等。在生产本 发明的小鼠Dnaic2蛋白的多肽时,可以将小鼠的Dnaic2蛋白的编码序列可操作 地连于表达调控序列,从而形成小鼠Dnaic2蛋白表达载体,可用于后续对该基 因功能的研究或是构建该基因过量表达的模型。术语"可操作地连于"指DNA 连接完成后,编码该蛋白的DNA序列的活性能被与之位于同一线性DNA序列的其 他部分所影响。例如,如果信号肽DNA、启动子控制序列、核糖体结合位点等都 可操作地连于编码序列。
所述的核苷酸序列,对于可用作探针的核苷酸分子,该分子具有SEQIDN0.3 核苷酸序列中所示的第385-2256位核苷酸序列中10-600个连续核苷酸。较佳地 是具有100-500个连续核苷酸。该探针可用于检测样品中是否存在编码小鼠 Dnaic2蛋白的核酸分子。
本发明提供了检测样品中是否存在编码小鼠Dnaic2蛋白的核苷酸序列的方
法。它包括用上述的探针与样品进行杂交,然后检测探针是否能与之发生结合。 该样品可以是PCR扩增后的产物,其中PCR扩增引物对应于小鼠Dnaic2基因的 核苷酸序列,并可位于该序列的两侧或中间。引物长度一般为15-50个核苷酸。 在本发明中,可用Northern印迹法技术分析小鼠中与人DNAI2蛋白具有高度同 源性的基因产物的表达,即分析其RNA转录物在细胞中的存在与否和数量。
本发明提供的通过实验证实了的新的小鼠动力蛋白中间链的基因—— Dnaic2,弥补了在对动力蛋白功能研究方面的空白。有利于建立相关的动物研究 模型以供对与之有关的疾病的研究,同时也有利于对相关药物(如治疗不育或 是生育力低等的药物,或避孕药物)的开发。因此,本发明不仅具有理论研究价 值,而且也具有很大实际应用价值。


图l 5天与10天卵巢中的基因表达的差异显示分析(DDRT-PCR)示意图。 图2小鼠Dnaic2基因在小鼠中的表达谱分析(Northern Blot)示意图。 图3为Dnaic2基因在转有含Dnaic2开放阅读框的质粒的Lcell中(L+D)
与转有空载体的Lcell中(L+K)及未转有任何载体的Lcell中(L)的表达差异
分析(RT-PCR)示意图。
具体实施例方式
以下结合附图对本发明的实施例作详细说明本实施例在以本发明技术方 案为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限
于下述的实施例。下列实施例中未列出具体实验方法的,通常按照分子克隆实
验指南(New York: Cold Spring Harbor Laboratory Press, 2001)中所述的操 作方法,或按照制造厂商所建议的条件进行。 实施例1
小鼠Dnaic2基因的筛选及全长克隆
1. 取组织(isolation)
C57/昆明鼠的子一代5天、IO天母鼠,取卵巢,准备抽取RNA。
2. 提取RNA (RNA isolation)
取卵巢于1.5ml的EP管中,加入TRIzol试剂,用均桨器在冰中进行均浆, 然后室温放置5分钟,加入氯仿,剧烈混匀,并室温放置3分钟。然后4t)最大 速度离心15分钟,取水相。最后可采用无水乙醇进行浓縮。用分光光度计测定 RNA含量。
3. 克隆基因的全长(cloning offUll-lengthcDNA)
采用DDRT-PCR及RACE方法进行筛选并克隆与卵巢发育有关基因的cDNA 全长序列。
(1) DDRT-PCR (图1)
根据"Proc Natl Acad Sci USA 1994, 91:5456-5460,,中介绍的DDRT-PCR方法, 分析5天与10天卵巢中各基因mRNA的表达差异。所用的PCR引物对为DN001 (5'-AGTGAATGGC-3')+DN002 (5'-TuGA-3')或DN003 (5'-GAGGATCAGC-3') +DN004 (5'-TuGC-3'),结果见附图1。从中挑取了一条在5天与IO天卵巢中表 达有差异的cDNA片断(Dnaic2),进行进一步的克隆及研究。
(2) 3,-RACE及5,-RACE
根据Clontech公司的SMART RACE cDNA扩增试剂盒的说明书进行。然后 将各测序结果进行拼接,得到该基因的全长序列(SEQIDN0.3)。 BLAST的结 果表明这是小鼠的一个动力蛋白中间链多肽。
实施例2
Dnaic2的序列信息与同源性分析
本发明的小鼠Dnaic2基因的全长cDNA的长度为2871bp,详细序列见SEQ IDN0.3,其中开放阅读框位于385-2256位核苷酸(共1872个核苷酸)。根据全 长cDNA推导出基因Dnaic2的氨基酸序列,共623个氨基酸残基,分子量为 70968.01Da,等电点(pl)为4.81。详细序列见SEQIDN0.3。
将Dnaic2基因的全长cDNA序列及其编码蛋白质用BLAST程序在 Non-redundant GenBank禾P禾P Non-redundant GenBank CDS translations数据库中进 行核苷酸和蛋白质同源性检索,结果发现它与人的DNAI2基因在核苷酸水平上 具有85%的同源性(详见表l):
表l
85% identities in 1703bt overlap
Query 383 CC機GAGATCGTCTACGTGTACCTGMGMGCGCAGCGMTTTGGGMGCAATGCMCT 442 Sbjct 83 CC福GAGATTGTGTACGTGTACGTCMGMGCGCAGCGAGTTCGGGMGCAGTGCAATT 142
Query 443TCTCAGATCGCCAGGCTGAGCTGMCATCGACATCTTACCCMCCCCGAGCTGGCCGCA- 501
Sbjct 143TCTCGGACCGCCAGGCCGAGCTGMCATCGACATCATGCCCMCCCTGAGCTGGCCG-AG 201
Query 502 CTGTAT-GTGGAGCGGMTCCAGTAGACACAGGCATCCAGTGCTCCG-CCAGTATGTCGG 559 Sbjct 202CAGT-TCGTGGAGCGGMCCCAGTGGACACGGGCATCCAGTGCT-CGATCAGCATGTCGG 259
Query 560MCACGAGGCCMCACCGAGCGGTTCGAGATGGAGAGCTGTGGCGTTMTCATGTCGAGG 619
immiiimi i iimiii mmim i i 11 mil immm
Sbjct 260AACACGAGGCCMCTCAGAGCGGTTTGAGATGGAGACCCGGGGAGTTMCCATGTCGAGG 319
Query 620 GGGGCTGGCCCMGGATGTGMCCCCCAGGAGCTGGAGCAGACCATCCGTTTCCGGMGA 679 Sbjct 320GGGGCTGGCCCAAGGACGTGMCCCCCTGGAGCTGGAGCAGACCATCCGTTTCCGGMGA 379
Query 680 MGTGGAGMGGATGAGMCTACATCMCGCCGTCATGCAGCTGGGCTCGATCATGGAGC 739 Sbjct 380MGTGGAGAAAGATGAGAACTACGTTMCGCCATCATGCAGCTCGGCTCTATCATGGAGC 439
Query 740ACTGCATCMGCAGMCMCGCCATCGACATCTACGAGGMTACTTTGA-TGACGAGGAG 798
Sbjct 440ACTGCATCMGCAGMCMTGCCATTGACATCTATGMGAGTA-TTTCMTGACGAGGAG 498
Query 799 GCCGTGGAGGTGACTGMGMGC-CCCTTCGGCCMGACCATCMTGTCTTCAGGGACCC 857 Sbjct 499GCCATGGMGTGA-TGGAGGAGGACCCTTCAGCTAAAACCATCMTGTGTTCAGGGACCC 557
Query 858TCAGGAGATCMGCGGACAGCTACACACCTCTCCTGGCACCCTGATGGCMCAGGMGCT 917
Sbjct 558 Query 918 Sbjct 618 Query 977 Sbjct 677 Query 1035 Sbjct 735 Query 1094 Sbjct 794 Query 1154 Sbjct 854 Query 1214 Sbjct 914 Query 1274 Sbjct 974 Query 1331 Sbjct 1031 Query 1391 Sbjct 1091 Query 1450 Sbjct 1150 Query 1510
CCAGG嵐TCMGAGGGCTGCCACACACCTCTCCTGGCACCCCGATGGCMCAGGAAGTT 617
GGCAGTAGCCTATTCCTGCTTGMGTTCCAGCGCGCACCCATGAGCATGMCTA-CGACT 976 GGCAGTGGCATACTCCTGCTTGGATTTTCAGCGGGCACCTGTGGGCATGAGC—AGCGATT 676
CCTACATCTGGGACCTGGAAMCCCCMCC-GACCTGAGA-TTGCCCTGMGCCGTTGTC 1034 CATACATCTGGGACCTGGAAMCCCCMCMG-CCTGA-ACTTGCTCTGMGCCATCGTC 734
TCCTCTCGTCACCCTGGAGTACMCCCCMGGATTCCCACGTGCTCCTAGGG-GGCTGCT 1093
ill iim ii iiim iiiiimi Miimiiii mil ill iiiiiii
TCCACTCGTGACGTTGGAGTTCMCCCCAAAGATTCCCACGTACTCCT-GGGTGGCTGCT 793
ACMTGGGCAGATAGCCTGCTGGGATACCCGGMGGGCAGCCTGGTGGCAGAGCTGTCCA 1153 ACMTGGACAGATAGCCTGCTGGGACACCCGAAAGGGCAGCCTGGTGGCGGAGCTATCCA 853
CCATCGAGTTCAGCCACCGAGACCCAGTGTATGGCACCATCTGGCTGCAGTCAAAGACAG 1213 CCATTGAGTCCAGCCACCGAGACCCTGTGTATGGCACCATCTGGCTGCAGTCGMGACGG 913
GCACTGAGTGCTTCTCAGCATCCACTGATGGGCAGGTCATGTGGTGGGACATCCGCMGA 1273 GCACCGAGTGCTTCTCAGCTTCCACGGATGGGCAGGTCATGTGGTGGGACATCCG嵐GA 973
TCAGCGAGCCCA-TCGMGTTGTCAT-TATGGACATTTCCA-GAAAGGAGCAGCTGGAGA 1330 TGAGCGAGCCCACT-GMGTTGTGATCT-TGGACATCACCAAGAA-GGMCAGTTGGAAA 1030
ACGCCCTGGGCGCCATCTCCTTGGAGTTCGAGTCTACCTTGCCMCCMGTTCATGGTGG 1390 ATGCCTTGGGGGCCATCTCCCTGGAGTTCGMTCTACTTTGCCCACCAAGTTCATGGTGG 1090
GCACCGMCAGGGCATCGTCATCTCCTGCMCCGCAAGGCCMGACG-CAAGCAGAGAAG 1449 GGACCGAGCAGGGCATCGTCATCTCCTGCMCCGCMGGCCMGACGTCA-GCTGMAAG 1149
ATTGTTTGCACCTTTTATGGCCACCACGGCCCCATCTATGCCCTCCAGAGAAACCCCTTC 1509 ATTGTGTGCACCTTCCCGGGCCATCATGGCCCCATCTACGCCCTCCAGAG嵐CCCCTTC 1209
TACCCAMGMCTTTCTGACTGTTGGAGACTGGACAGCCCGCATCTGGTCTGAGGACAGT 1569 Sbjct 1210 TACCCGMGMCTTCCTGACGGTTGGCGACTGGACAGCCCGCATTTGGTCTGAAGACAGC 1269
Query 1570 CGGGAGTCATCGATCATGTGGACCMGTACCACATGGCTTACCTCTCCGATGGAGCCTGG 1629
Sbjct 1270 CGGGMTCGTCCATCATGTGGACCAAGTACCACATGGCTTACCTCACTGATGCTGCCTGG 1329
Query 1630 AGTCCTGTGAGACC-AGCCGTTTTCTTCACCACCMGATGGATGGGACCCTGGACATCTG 1688
Sbjct 1330 AGCCCCGTGAGGCCGA-CCGTTTTCTTTACCACCAGGATGGACGGMCCCTGGATATCTG 1388
Query 1689 GGACTTGGTGTTCMGCAGTGTGA-CCCTGCCCTCAGCCTMAGGTGTGTGATGAOCCA 1746
mm mil mmi 11 m mmii i iimiimi 11 11
Sbjct 1389 GGACTTCATGTTCGAGCAGTGCGATCCCA-CCCTCAGCTTGMGGTGTGTGACGAGGCC- 1446
Query 1747 CTCTTCTGCCTCCGGGTTCAGGACMCGGGTGTCTCATCGCGTGTGGCTCCGAGCTCGGG 1806
immmiiimi immi miiimimi 11 miim mi m
Sbjct 1447 CTCTTCTGCCTCCGGGTGCAGGACMTGGGTGTCTCATCGCCTGCGGCTCCCAGCTGGGG 1506
Query 1807 ACGACCACTCTGCTGGAGGTCTC-CA-GCAGTCTCTCCACTCTGCAGAGGMTGAGMGA 1864
ii mil mmmimi i i i mil 11 11 mimmimii
Sbjct 1507 ACMCCACCCTGCTGGAGGTCTCGCCTGG-G-CTCTCTACCCTCCAGAGGMTGAGMGA 1564
Query 1865 ACATAGCTTCTTCCATATTTGMCGTGAAACCCGGCGGGAMAGATCCTGGAGGCCAGGC 1924
Sbjct 1565 ACGTAGCCTCTTCCATGTTTGAGCGTGAGACCCGGCGAGAGMGATCCTGGAGGCCAGGC 1624
Query 1925 ACCGTGAGATGCGACTGMGGAGAAAGGCAAGGTGGAGGGC嵐GAGGATGACCAGMGG 1984 Sbjct 1625 ACCGGGAGATGCGGCTGMGGAGMGGGTMGGCGGAGGGCAGGGATGAGGAGCAGACCG 1684
Query 1985 AGGAGGAGGCAGCCC-TGGACCTTGATGAGCTAGTTGGCAAAGCAGAGGAGGAGTTCTTT 2043 Sbjct 1685 ATGAGGAG-CTGGCCGTAGACCTGGAGGCGCTGGTCAGCMGGCCGAGGAGGAGTTCTTC 1743
Query 2044 GA-AGTCATCTTCTCAGAGCTGMGAGGMGGAGGCAGAGGCC 2085
Sbjct 1744 GACA-TCATCTTCACAGAGCTGMGAAGMGGAGGCAGACGCC 1785
Query:小鼠Dnaic2的核酸序列
Sbjct: 人DNAI2的核酸序列(NM023036)
上述表1为本发明的小鼠Dnaic2与人DNAI2的核苷酸序列的同源比较(GAP)表。
在氨基酸水平上,它与人的DNAI2蛋白也有87。/。的同源性(详见表2)。
表2
87% identities in 578aa overlap
Query 1 MEIVYVYLKKRSEFGKQCNFSDRQAELNIDILPNPELMLYVERNPVDTGIQCSASMSEH 60
MEIVYVY+KKRSEFGKQCNFSDRQAELNIDI+PNPELA +VERNPVDTGIQCS SMSEH Sbjct 1 MEIVYVYVKKKSEFGKQCNFSDRQAELNIDIMPNPELAEQFVER磨DTGIQCSISMSEH 60
Query 61EANTERFEMESCGVNHVEGGWPKDVNPQELEQTIRFRKKVEKDENYINAVMQLGSIMEHC 120
EAN+ERFEME+ GVNHVEGGWPKDVNP ELEQTIRFRKKVEKDENY+NA+MQLGSIMEHC Sbjct 61EANSERFEMETRGVNHVEGGWPKDVNPLELEQTIRFRKKVEKDENYVNAIMQLGSIMEHC 120
Query 121 IKQNNAIDIYEEYFDDEEAVEVTEEAPSAKTINVFRDPQEIKRTATHLS冊PDGNRKLAV 180
IKQNNAIDIYEEYF+DEEA+EV EE PSAKTINVFRDPQEIKR ATHLS冊PDGNRKLAV
Sbjct 121 IKQNNAIDIYEEYFNDEEAMEVMEEDPSAKTINVFRDPQEIKRMTHLS冊PDGNRKLAV 180
Query 181 AYSCLKFQRAPMSMNYDSYITOLENPNKPEIALKPLSPLVTLEYNPKDSHVLLGGCYNGQ 240
AYSCL FQRAP+ M+ DSYITOLENPN+PE+ALKP SPLVTLE+NPKDSHVLLGGCYNGQ
Sbjct 181 AYSCLDFQRAPVGMSSDSYIWDLENPNKPELALKPSSPLVTLEFNPKDSHVLLGGCYNGQ 240
Query 241 IACWDTRKGSLVAELSTIEFSHRDPVYGTIWLQSKTGTECFSASTDGQVMWDIRKISEP 300
IACWDTRKGSLVAELSTIE SHRDPVYGTIWLQSKTGTECFSASTDGQVMWWDIRK+SEP
Sbjct 241 IACWDTRKGSLVAELSTIESSHRDPVYGTIWLQSKTGTECFSASTDGQVMWWDIRKMSEP 300
Query 301 IEVVIMDISKKEQLENALGAISLEFESTLPTKFMVGTEQGIVISCNRKAKTQAEKIVCTF 360
EVVI+DI++KEQLENALGAISLEFESTLPTKFMVGTEQGIVISCNRKAKT AEKIVCTF
Sbjct 301 TEVVILDITKKEQLENALGAISLEFESTLPTKFMVGTEQGIVISCNRKAKTSAEKIVCTF 360
Query 361 YG朋GPIYALQRNPFYPKNFLTVGDWTARIWSEDSRESSIMWTKYHMAYLSDGAWSPVRP 420
GHHGPIYALQRNPFYPKNFLTVGDWTARIffSEDSRESSIMWTKYHMAYL+D AWSPVRP
Sbjct 361 PG朋GPIYALQRNPFYPKNFLTVGDWTARIWSEDSRESSIMWTKYHMAYLTDMWSPVRP 420
Query 421 AVFFTTKMDGTLDIWDLVFKQCDPALSLKVCDDPLFCLRVQDNGCLIACGSELGTTTLLE 480
VFFTT+MDGTLDITO +F+QCDP LSLKVCD+ LFCLRVQDNGCLIACGS+LGTTTLLE
Sbjct 421 TVFFTTRMDGTLDIWDFMFEQCDPTLSLKVCDEALFCLRVQDNGCLIACGSQLGTTTLLE 480
Query 481 VSSSLSTLQRNEKNIASSIFERETRREKILEAR冊EMRLKEKGKVEGKEDDQKEEEMLD 540
VS LSTLQRNEKN+ASS+FERET舰KILEAR服EMRLKEKGK EG++++Q +EE A+D
Sbjct 481 VSPGLSTLQRNE丽ASSMFERET舰KILEAR冊EMKLKEKGKAEGRDEEQTDEELAVD 540
Query 541 LDELVGKAEEEFFEVIFSELKKKEAEALKKKPKPRKKS 578
L+ LV KAEEEFF++IF+ELK+KEA+A+K P P++ S Sbjct 541 LEALVSKAEEEFFDIIFTELKKKEADAIKLTPVPQQPS 578
Query: 小鼠Dnaic2的氨基酸序列
Sb jet: 人DNAI2的氨基酸序列(NP075462)
上述表2为本发明的小鼠Dnaic2与人DNAI2的氨基酸序列的同源比较 (FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出。 由此可见,小鼠的Dnaic2基因与人的DNAI2基因无论从核酸还是蛋白水平 上都存在较高的同源性。人的DNAI2基因(NM023036)已经有报道称与PCD 疾病有关,因此Dnaic2基因可能在小鼠中也有类似的作用,这为研究PCD疾病 的产生机理,以及PCD疾病的治疗都提供了很好的研究模型,同时由于不孕或 是怀孕率降低也是PCD疾病的症状之一,这表明其对于避孕药和治疗不育症药 物方面也具有较好的作用。 实施例3
小鼠Dnaic2基因在小鼠中的表达谱分析(图2)
l.RNA的提取取成年C57/昆明鼠的杂交后代的卵巢、睾丸、肝、心、肺 和脑等6种组织。利用TRIzol试剂提取各组织的RNA[参考《分子克隆实验指 南》有关RNA的制备章节(Sambrook等,2001)〗。
2. RNA的定量参考《分子克隆实验指南》(Sambrook等,2001),用分光 光度计湖!lOD26o; RNA含量计算1 OD260 = 40pg/ml。
3. 总RNA用甲醛变性胶电泳分离1)称取l.lg琼脂糖,加入到108.65ml无 菌水中,加热融化,转入55。C水浴中。2)取6.25111120*电泳缓冲液加入到55°(:的 凝胶溶液中,混匀。3)再于通风橱中取10.0ml甲醛,加入到55。C的凝胶溶液中, 混匀。4)迅速倒入制胶板中,室温水平放置30分钟,待胶凝固。5)将提取的 RNA(25pg)溶解于RNA变性溶液中,在65。C下加热5分钟,然后立即置于冰上。 6)在样品中加入2ul 10*上样缓冲液,混匀。7)在电泳液未盖过胶的条件下点样, 5V/cm电压电泳2-3小时左右。
4. RNA尼龙膜上转移1)转移之前,将尼龙膜用2(PSSC浸泡。2)电泳好的 胶先在浸胶液(50mM NaOH, lOmM NaCl)中浸泡20分钟,然后再在10mM Tris-HCl (pH-7.5)中浸泡20分钟,最后用2(^SSC浸泡20分钟。3)将湿润的膜准
确地盖在胶上,将三张与膜大小相同的滤纸置2(^SSC溶液中湿润,盖在膜上, 赶尽气泡。4)滤纸上放一叠与膜大小相同的吸水纸,在吸水纸上放一玻璃板和 一重物,水平放置,转移12-20小时。5)转移后,将膜于紫外交联仪中紫外交联 l分钟。
5.膜上杂交信号的检出1)将膜浸在Rapid-hyb缓冲液(Amersham Bioscienses )中,65°C下预杂交30分钟。2)将用NEBlot PhototopeTM Kit( New England BioLabs)标记的探针在沸水中变性5分钟,直接加入l)的杂交液中, 于65。C杂交3小时。3)取出膜,置于洗膜液I (2*SSC, 0.1%SDS)中,漂洗2 次,每次5分钟。然后,转入洗膜液II (0.1*SSC, 0.1%SDS)中于65°C漂洗 15分钟。4)用NEBlotTM PhototopeTM -Star Detection Kit for Nucleic Acids (New England BioLabs)使探针化学发光。5)用X光片压片30-90分钟,然后显影、定 影。
Northern杂交表明;小鼠Dnaic2在睾丸、卵巢和肺中都有较高的表达。而在 其他组织中却没有检测到其mRNA的表达。这与人的PCD病症发生的部位是一 致的。这说明小鼠Dnaic2与PCD疾病有很大的相关性,这对于研究人类PCD 疾病具有很大的帮助。
实施例4
小鼠中与人DNAI2蛋白具有高度同源性的基因的表达载体的构建及其蛋白 或多肽在Lcell细胞中进行真核细胞表达情况检测。
1. 含目的基因(小鼠Dnaic2基因)的表达载体的构建。
根据Dnaic2基因的全长序列(SEQ ID NO.3),设计扩增出完整的开放阅读框 的引物,并在上游和下游引物上分别引入限制性内切酶位点(这可视选用的载体 而定),以便构建表达载体[如DN005(SEQIDNO.l)+DN006(SEQIDNO.2)]。 以成年小鼠睾丸的mRNA做RT-PCR,经PCR扩增后,将小鼠中与人DNAI2蛋 白具有高度同源性的基因的cDNA克隆至表达载体(如pCDNA3.1)。经测序鉴 定开放阅读框正确的表达载体,可用于后续实验。
2. Dnaic2在Lcell细胞中的表达
根据Qiagen公司提供的试剂说明书,用该公司的Lipofect Transfection试剂际上把上述载体通过脂质体转入Lcell细胞中,然后用G418进行筛选得到稳定细胞 株。对这一稳定细胞株进行RT-PCR[DN007 (5'-GGA GAG CTG TGG CGT TAA TC-3') +DN008 (5'-TCCTTGGGGTTGTACTCCAG-3')]检观!l,表明转入上述 载体的Lcell细胞中Dnaic2的表达量比对照组(转有相应空载体的Lcell细胞) 有很大的提高(图3)。
本发明涉及的序列及记号分列如下
(1) SEQIDN0.1的信息
(i) 序列特征
(A) 长度25bp
(B) 类型核苷酸
(C) 链型单链
(D) 拓扑结构线性
(ii) 分子烈性寡核苷酸
(iii) 序列描述SEQIDNO.l GCAAGCTTCCATGGAGATCGTCTAC
(2) SEQIDN0.2的信息
(i) 序列特征
(A) 长度23bp
(B) 类型核苷酸
(C) 链型单链
(D) 拓扑结构线性
(ii) 分子烈性寡核苷酸
(iii) 序列描述SEQIDN0.2 CAGGATCCCTAGGTGGGCACATC
(3) SEQIDNO. 3的信息 〈110>上海交通大学
〈120〉小鼠Dnaic2基因序列
〈160〉 2 〈210〉 1 〈211〉 2871 <212>DNA
<213>小鼠(Musmusculus) <400> 1
agctcccagc cgtttaagct gcgctggagc tgtgtggcag gaggtgagcc aggataaggg aaga3gacct ggca犯3aga gggaaaagct aaatctcgga gaactgtcag gtgctggaat ccctgaatat tcttcaagct ccaggacctc ttctccacca ggccctgacc cgggctgtga tcagccgcgg tcacggtcgc cgccatggag gaatttggga agc已已tgcaa cttctcagat cccaaccccg agctggccgc actgtatgtg tgctccgcca gtatgtcgga acacgaggcc ggcgttaatc atgtcgaggg gggctggccc accatccgtt tccggaag已a agtggagaag ctgggctcga tcatggagca ctgcatcaag tactttgatg acgaggaggc cgtgg鄉tg aatgtcttca gggaccctca ggagatca^g g已tggcaaca ggaagctggc agtagcct已t agcatgaact acgactccta catctgggac ctgaagccgt tgtctcctct cgtcaccctg ctagggggct gctac犯tgg gc卿tagcc gcagagctgt ccaxxatcga gttcagccac cagtcaaaga caggcactga gtgcttctca gacatccgca agatc已gcgs gcccatcgaa cagctggaga acgccctggg cgccatctcc ttcatggtgg gcaccgaaca gggcatcgtc gcagagaaga ttgtttgcac cttttatggc aaccccttct acccaaagaa ctttctgact g鄉acagtc gggagtcatc gatcatgtgg ggagcctgga gtcctgtgag accagccgtt gacatctggg acttggtgtt caagc已gtgt gacccactct tctgcctccg ggttcaggac
tgggactggtcttgggcgcttctcctgggc60
gcgggcgtcct卿ggacgtccaagcccga120
ctcgagggtaataatcaeca3C8gtgC33g180
cagctcattctgetgeattaatcctcgctg240
ctcagcctccaagcaccttgccttctgcac300
cccggagtgggcgggacctctttctggctt360
atcgtctacgtgtacctgaagaagegcage420
cgcc鄉ctgagctgaacatcgacatctta480
gagcggaatccagtagacacaggcatccag540
ascaccgagcggttcg卿tggagagctgt600
鄉gatgtgaacccccaggagctggagcag660
gatgagaactacatcaacgccgtcatgcag720
cagaaca3cgccatcgacatctscgaggaa780
actgaagaagccccttcggccaagaccatc840
cggacagctacacacctctcctggcaccct900
tcctgcttgaagttccagcgcgcacccatg960
ctggaaaaccccaaccgscctgagattgee1020
gagtacaaccccaaggattcccacgtgctc1080
tgCtggg3t3cccggaagggcagcctggtg1140
cgagacccagtgtatggcaccatctggctg1200
gcatccactgatgggcaggtcatgtggtgg1260
gttgtcattatggacatttcc卿aaggeig1320
tt卿gttcgagtctaccttgcc犯ccaag1380
atctcctgcaaccgcaaggccaag3cgcaa1440
caccacggccccatctatgccctccagaga1500
gttgg卿ctggacagcccgcatctggtct1560
accaagtaccacatggcttacctctccgat1620
ttcttcaccaccaagatggatgggaccctg1680
gaccctgcccteagectaaaggtgtgtgat1740
認gggtgtcteatcgegtgtggctccgag1800
ctcgggacga ccactctgct ggaggtctcc agcagtctct ccactctgca gaggaatgag 1860 aagaacatag cttcttccat atttgaacgt gaaacccggc ggg犯aagat cctggaggcc 1920 鄉c獄gtg卿tgcgact g鄉g卿犯ggcaaggtgg鄉gcaa卿ggatgaccag 1980 卿g鄉鄉鄉cagccct ggaccttgat gagctagttg gca犯gc卿ggaggagttc 2040 tttgaagtca tcttctcaga gctgaagagg aaggaggcag sggccttgaa gaaga犯ccg 2100 aagcctagga犯aaatcaag tgtcaaggtg gaagccgaag aggaagtgga agaaaatgtt 2160 ggagaggagg aeLgaagcagg tggcataata ggtatagatg cagttgaaga catgagtgaa 2220 gaagcaggtg犯gagca3ga ggatgtgccc acctagggca gcctctgccc acggcactgt 2280 cccttcgtgc tcacggcttg gacttccact tgataccgtc tcatctgaaa agcgaaaagt 2340 tgagtttcct tcttcaataa ttattggtgg ggacagatca gggacaagtc actggcccac 2400 actgggccaa gccccgaatg cacccttctt tagggtggga aggggtaggg cttgtctctc 2站0 tgctaactcc cccggcctcg gcaaccctga ggcgaactca gattcagggc acacacacag 2520 ccttaagtca gactttagat gggaccctag attctgctta ttatgggtta tccaatgagt 2580 agttaccaag gcctttttcc agaagcttcc agagctcagc tgagctcacc tctgccccac 2640 aggggcctct ggagcgcctg cacaggggca agcttctctc tctctctttg tccatctgta 2700 aaaccttccc aagcaacccc ccagggggca tcttgaccts tggtcscacg gtggggggcg 2760 gggcgccccc aagtgtggag agtaggtagg taggatg犯c tggactctcc ctgtacacac 2820 gtggttttta ttgctttgct tcttataaca ttaaatcagt gataacaccc a 2871
<210> 2 <211> 623
<212> PRT <213> Dnaic2蛋白 <400> 2
MEIVYVYLKKRSEFGKQCNFSDRQAELNIDILPNPELAALYVERNPVDTGIQCSASMSEH60
EANTERFEMESCGVNHVEGGWPKDVNPQELEQTIRFRKKVEKDENYINAVMQLGSIMEHC120
IKQNNA皿YEEYFDDEEAVEVTEEAPSAKT丽FRDPQEIKRTATHLSWHPDGNRKLAV180
AYSCLKFQRAPMS画YDSYIWDLENPNRPEIALKPLSPLVTLEYNPKDSHVLLGGCYNGQ240
IACWDTRKGSLVAELSTIEFS服DPVYGTIWLQSKTGTECFSASTDGQVMWWD皿ISEP300
IEVVIMDISRKEQLENALGAISLEFESTLPTKFMVGTEQGIVISCNRKAKTQAEKIVCTF360
YG朋GPIYALQRNPFYPKNFLTVGDWTARIWSEDSRESSI丽T麵區YLSDGAWSPVRP420
AVFFTTKMDGTLDIWDLVFKQCDPALSLKVCDDPLFCLRVQDNGCLIACGSELGTTTLLE480
VSSSLSTLQRNEKNIASSIFERETRREKILEARHREMRLKEKGKVEGKEDDQKEEEAALD540
LDELVGKAEEEFFEVIFSELKRKEAEALKKKPKPRKKSSVKVEAEEEVEENVGEEEEAGG600
IIGIDAVEDMSEEAGEEQEDVPT62权利要求
1、一种小鼠Dnaic2基因序列,其特征在于,所分离出或纯化的、与人DNAI2基因具有高度同源性的小鼠Dnaic2基因编码的核苷酸序列及其蛋白分子序列,所述的核苷酸序列,是指包括在已经分离出或纯化的与人DNAI2基因具有高度同源性的小鼠核苷酸序列的DNA分子,该分子与SEQ ID NO.3中的从第385-2256位的核苷酸序列至少有70%的同源性。
2、 如权利要求l所述的小鼠Dnaic2基因序列,其特征是,所述的基因, 其mRNA全长为2871bp,其开放阅读框的启示密码子始于第385位核苷酸,终于 第2256位核苷酸,编码一条含623个氨基酸的多肽。
3、 如权利要求1所述的小鼠Dnaic2基因序列,其特征是,所述的核苷酸 序列,对于用作探针的核苷酸分子,该分子具有SEQIDN0.3核苷酸序列中所示 的第385-2256位核苷酸序列中10-600个连续核苷酸。
4、 如权利要求1所述的小鼠Dnaic2基因序列,其特征是,所述的基因编 码,具有SEQIDN0.3所示的氨基酸序列的蛋白或多肽、其变异形式、活性片段, 或活性衍生物。
5、 如权利要求3所述的小鼠Dnaic2基因序列,其特征是,所述的蛋白或 多肽,是指分离出的或纯化的与人DNAI2蛋白具有高度同源性的小鼠蛋白或多肽,该多肽为具有SEQ ID N0.3中的氨基酸序列的多肽。
6、 如权利要求4或者5所述的小鼠Dnaic2基因序列,其特征是,所述的蛋白或多肽,利用该蛋白或多肽的抗血清获得的。
全文摘要
一种基因工程技术领域的小鼠Dnaic2基因序列。本发明所分离出或纯化的、与人DNAI2基因具有高度同源性的小鼠Dnaic2基因编码的核苷酸序列及其蛋白分子序列,所述的核苷酸序列,是指包括在已经分离出或纯化的与人DNAI2基因具有高度同源性的小鼠核苷酸序列的DNA分子,该分子与SEQ ID NO.3中的从第385-2256位的核苷酸序列至少有70%的同源性。本发明涉及的基因主要表达在肺、睾丸、卵巢中,这正是人先天性纤毛运动异常症发生的部位。因此本发明涉及的基因对于研究先天性纤毛运动异常症这种疾病并开发新药方面具有重要的作用,同时也对于开发其它相关药品,如治疗不育或是生育能力低的药物、避孕药等,也具有推动作用。
文档编号C07K14/435GK101104853SQ20071004230
公开日2008年1月16日 申请日期2007年6月21日 优先权日2007年6月21日
发明者际 吴, 杨兆娟 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1