POU结构域改造蛋白对多能干细胞的高效诱导的制作方法

文档序号：12029118阅读：844来源：国知局

本发明涉及生物领域，具体地，本发明涉及多肽、核酸、构建体、改变细胞命运的方法和获得诱导多能干细胞的方法。

背景技术：

oct4/3，从1989首次发现它(scholer,1989)之后，至今已进行了27年的研究。它由人类第六号染色体上pouf51基因编码，是为维持细胞全能性中的关键转录因子，它的表达变化调节着生命体的发育(2014)。oct4具有保守的pou结构域，这个结构域由pou-specific(pous)和pou-homeo(pouh)亚结构域，中间由一段linker连接，分别结合atgc和(a/t)aat，同样它们能一起结合在八聚体的保守dna序列(atgcaaat)上。oct4不仅可以和自己相互组合后结合在poremotif和moremotif上，也能同别的蛋白组成复合体，如与sox2。在重编程的四个因子oct4、sox2、klf4、c-myc中oct4不同于其它因子，它不能被同家族的成员完全替换完成同等效率的重编程。

体细胞重编程是诱导成熟的体细胞变成多能诱导干细胞(ipsc)的过程。首次发现是体细胞在干细胞培养基的环境下过表达四个转录因子oct4、sox2、c-myc、klf4能逐渐变成多能诱导干细胞(ipsc)(kazutoshitakahashi,2006)，成功打破了细胞不能逆转的传统认识，也开辟了研究再生医学的新途径。但是这种方法并不能达到理想的效率，特别是在去掉c-myc之后会大大降低，为了解决这个问题有很多新方法诞生。一类是通过在培养基中加入化学小分子加速和提高重编程的效率，这种培养基非常昂贵比如icd1，有些类是通过融合重编程转录因子和强转录激活结构域，来实现体细胞重编程的速度和效率的提高。如针对于将单纯疱疹病毒vp16的转录激活结构域以不同的方式结合在oct4、sox2、nanog、将转录因子myod的转录激活结构域部分区域与oct4的n端连接、将转录osnk用辅助因子yes相关蛋白(yap)的转录激活结构域与重编程因子融合。然而，对转录因子诱导重编程过程机理的揭示进展依旧缓慢。

如何改变细胞命运尤其是促进体细胞的重编程，仍有待进一步研究。

技术实现要素：

本发明旨在至少在一定程度上解决上述技术问题之一。为此，本发明的一个目的在于提出一种能够有效改变细胞命运尤其是促进体细胞的重编程的方法。

需要说明的是，在本文中所使用的术语“细胞命运”是指从一种细胞类型向另一种细胞类型的转变，包括体细胞的重编程、转分化以及干细胞的分化。

在本发明的第一方面，本发明提出了一种分离的多肽。根据本发明的实施例，所述多肽的氨基酸序列具有下列特征的至少之一：与seqidno：1相比，所述多肽的第152位氨基酸由t突变为r(在申请中，该突变位点命名为t22r)；(2)与seqidno：1相比，所述多肽的第208位氨基酸由e突变为p(在本申请中，该突变位点命名为e78p)；(3)与seqidno：1相比，所述多肽的第230～256位氨基酸被替换为seqidno：14所示的氨基酸序列。根据本发明的实施例，体细胞中过表达上述多肽，体细胞发生去分化、重编程的效率显著提高。

maghlasdfafspppgggdgsaglepgwvdprtwlsfqgppggpgigpgsevlgispcppayefcggmaycgpqvglglvpqvgvetlqpegqagarvesnsegtssepcadrpnavklekveptpeesqdmkalqkeleqfakllkqkritlgytqadvgltlgvlfgkvfsqtticrfealqlslknmcklrpllekwveeadnnenlqeicksetlvqarkrkrtsienrvrwsletmflkcpkpslqqithianqlglekdvvrvwfcnrrqkgkrssieysqreeyeatgtpfpggavsfplppgphfgtpgygsphfttlysvpfpegeafpsvpvtalgspmhsn(seqidno:1)。

ievsvkgaleshflkcpkpsaqeitsl(seqidno:14)。

需要说明的是，本申请所述的多肽的氨基酸的数目不受特别限制，可以包括至少两个由肽键连接的氨基酸残基。

根据本发明的实施例，上述多肽还可以进一步包括如下附加技术特征至少之一：

根据本发明的实施例，所述多肽具有seqidno：2～7所示的氨基酸序列。

maghlasdfafspppgggdgsaglepgwvdprtwlsfqgppggpgigpgsevlgispcppayefcggmaycgpqvglglvpqvgvetlqpegqagarvesnsegtssepcadrpnavklekveptpeesqdmkalqkeleqfakllkqkrirlgytqadvgltlgvlfgkvfsqtticrfealqlslknmcklrpllekwveeadnnpnlqeicksetlvqarkrkrtsievsvkgaleshflkcpkpsaqeitsladslqlekevvrvwfcnrrqkgkrssieysqreeyeatgtpfpggavsfplppgphfgtpgygsphfttlysvpfpegeafpsvpvtalgspmhsn(seqidno:2)。

maghlasdfafspppgggdgsaglepgwvdprtwlsfqgppggpgigpgsevlgispcppayefcggmaycgpqvglglvpqvgvetlqpegqagarvesnsegtssepcadrpnavklekveptpeesqdmkalqkeleqfakllkqkrirlgytqadvgltlgvlfgkvfsqtticrfealqlslknmcklrpllekwveeadnnpnlqeicksetlvqarkrkrtsienrvrwsletmflkcpkpslqqithianqlglekdvvrvwfcnrrqkgkrssieysqreeyeatgtpfpggavsfplppgphfgtpgygsphfttlysvpfpegeafpsvpvtalgspmhsn(seqidno:3)。

maghlasdfafspppgggdgsaglepgwvdprtwlsfqgppggpgigpgsevlgispcppayefcggmaycgpqvglglvpqvgvetlqpegqagarvesnsegtssepcadrpnavklekveptpeesqdmkalqkeleqfakllkqkritlgytqadvgltlgvlfgkvfsqtticrfealqlslknmcklrpllekwveeadnnenlqeicksetlvqarkrkrtsievsvkgaleshflkcpkpsaqeitsladslqlekevvrvwfcnrrqkgkrssieysqreeyeatgtpfpggavsfplppgphfgtpgygsphfttlysvpfpegeafpsvpvtalgspmhsn(seqidno:4)。

maghlasdfafspppgggdgsaglepgwvdprtwlsfqgppggpgigpgsevlgispcppayefcggmaycgpqvglglvpqvgvetlqpegqagarvesnsegtssepcadrpnavklekveptpeesqdmkalqkeleqfakllkqkrirlgytqadvgltlgvlfgkvfsqtticrfealqlslknmcklrpllekwveeadnnenlqeicksetlvqarkrkrtsienrvrwsletmflkcpkpslqqithianqlglekdvvrvwfcnrrqkgkrssieysqreeyeatgtpfpggavsfplppgphfgtpgygsphfttlysvpfpegeafpsvpvtalgspmhsn(seqidno:5)。

maghlasdfafspppgggdgsaglepgwvdprtwlsfqgppggpgigpgsevlgispcppayefcggmaycgpqvglglvpqvgvetlqpegqagarvesnsegtssepcadrpnavklekveptpeesqdmkalqkeleqfakllkqkritlgytqadvgltlgvlfgkvfsqtticrfealqlslknmcklrpllekwveeadnnpnlqeicksetlvqarkrkrtsienrvrwsletmflkcpkpslqqithianqlglekdvvrvwfcnrrqkgkrssieysqreeyeatgtpfpggavsfplppgphfgtpgygsphfttlysvpfpegeafpsvpvtalgspmhsn(seqidno:6)。

maghlasdfafspppgggdgsaglepgwvdprtwlsfqgppggpgigpgsevlgispcppayefcggmaycgpqvglglvpqvgvetlqpegqagarvesnsegtssepcadrpnavklekveptpeesqdmkalqkeleqfakllkqkrirlgytqadvgltlgvlfgkvfsqtticrfealqlslknmcklrpllekwveeadnnenlqeicksetlvqarkrkrtsievsvkgaleshflkcpkpsaqeitsladslqlekevvrvwfcnrrqkgkrssieysqreeyeatgtpfpggavsfplppgphfgtpgygsphfttlysvpfpegeafpsvpvtalgspmhsn(seqidno：7)。

其中，seqidno：2是epou的氨基酸序列，seqidno：3是oct4_t22r_e78p的氨基酸序列，seqidno：4是oct4hbrn2(100-126)的氨基酸序列，seqidno：5是oct4_t22r的氨基酸序列，seqidno：6是oct4_e78p的氨基酸序列，seqidno：7是pouhbrn2/t22r氨基酸序列(参考图1d)。根据本发明的实施例，体细胞中过表达上述多肽，体细胞发生去分化、重编程的效率进一步显著提高。

在本发明的第二方面，本发明提出了一种获得前面所述多肽的方法。根据本发明的实施例，所述方法包括：(1)选取oct4的pou结构域的第7、21、18、22、78、151位的氨基酸，通过突变处理构建6个饱和突变文库多肽；(2)将oct1、oct6、brn2、oct4的pou结构域的pouh、linker、pous进行第一排列组合处理，构建嵌合体突变文库多肽；(3)保持c末端和n末端为oct4相应序列；(4)将所述突变文库多肽和所述嵌合体突变文库多肽分别同sox2、c-myc、klf4一同诱导体细胞，观察诱导多能干细胞的诱导效率，其中，所述多能干细胞的诱导效率大于1倍的野生型oct4的诱导效率是待筛选目标多肽的指标；(5)将所述目标多肽进行第二排列组合处理，构建待筛选文库多肽；(6)将所述待筛选文库多肽分别同sox2、c-myc、klf4一同诱导体细胞，观察诱导多能干细胞的诱导效率，其中，所述多能干细胞的诱导效率大于2倍的野生型oct4的诱导效率是目的多肽的指标。通过上述方法首次实现了通过定向进化实现对转录因子进行改造，所获得的改造后的oct4(epou)与多能干细胞诱导因子联合使用，加快了诱导多能干细胞的速率和提高了诱导多能干细胞的效率。

在本发明的第三方面，本发明提出了一种分离的核酸。根据本发明的实施例，所述核酸具有seqidno：8～13所示的核苷酸序列。

atggctggacacctggcttcagacttcgccttctcacccccaccaggtgggggtgatgggtcagcagggctggagccgggctgggtggatcctcgaacctggctaagcttccaagggcctccaggtgggcctggaatcggaccaggctcagaggtattggggatctccccatgtccgcccgcatacgagttctgcggagggatggcatactgtggacctcaggttggactgggcctagtcccccaagttggcgtggagactttgcagcctgagggccaggcaggagcacgagtggaaagcaactcagagggaacctcctctgagccctgtgccgaccgccccaatgccgtgaagttggagaaggtggaaccaactcccgaggagtcccaggacatgaaagccctgcagaaggagctagaacagttcgctaagctgctgaagcagaagaggatcaggttggggtacacccaggccgacgtggggctcaccctgggcgttctctttggaaaggtgttcagccagaccaccatctgtcgcttcgaggccttgcagctcagccttaagaacatgtgtaagctgcggcccctgctggagaagtgggtggaggaagccgacaacaatccgaaccttcaggagatatgcaaatcggagaccctggtgcaggcccggaagagaaagcgaacgtccatcgaggtgagcgtcaagggggctctggagagccatttcctcaaatgccctaagccctcggcccaggagatcacctccctcgcggacagcttacagctggagaaggaggtggtgcgagtatggttctgtaacaggcgccagaagggcaaaagatcaagtattgagtattcccaacgagaagagtatgaggctacagggacacctttcccagggggggctgtatcctttcctctgcccccaggtccccactttggcaccccaggctatggaagcccccacttcaccacactctactcagtcccttttcctgagggcgaggcctttccctctgttcccgtcactgctctgggctctcccatgcattcaaactga(seqidno：8)。

atggctggacacctggcttcagacttcgccttctcacccccaccaggtgggggtgatgggtcagcagggctggagccgggctgggtggatcctcgaacctggctaagcttccaagggcctccaggtgggcctggaatcggaccaggctcagaggtattggggatctccccatgtccgcccgcatacgagttctgcggagggatggcatactgtggacctcaggttggactgggcctagtcccccaagttggcgtggagactttgcagcctgagggccaggcaggagcacgagtggaaagcaactcagagggaacctcctctgagccctgtgccgaccgccccaatgccgtgaagttggagaaggtggaaccaactcccgaggagtcccaggacatgaaagccctgcagaaggagctagaacagttcgctaagctgctgaagcagaagaggatcaggttggggtacacccaggccgacgtggggctcaccctgggcgttctctttggaaaggtgttcagccagaccaccatctgtcgcttcgaggccttgcagctcagccttaagaacatgtgtaagctgcggcccctgctggagaagtgggtggaggaagccgacaacaatccgaaccttcaggagatatgcaaatcggagaccctggtgcaggcccggaagagaaagcgaactagcattgagaaccgtgtgaggtggagtctggagaccatgtttctgaagtgcccgaagccctccctacagcagatcactcacatcgccaatcagcttgggctagagaaggatgtggttcgagtatggttctgtaaccggcgccagaagggcaaaagatcaagtattgagtattcccaacgagaagagtatgaggctacagggacacctttcccagggggggctgtatcctttcctctgcccccaggtccccactttggcaccccaggctatggaagcccccacttcaccacactctactcagtcccttttcctgagggcgaggcctttccctctgttcccgtcactgctctgggctctcccatgcattcaaactga(seqidno：9)。

atggctggacacctggcttcagacttcgccttctcacccccaccaggtgggggtgatgggtcagcagggctggagccgggctgggtggatcctcgaacctggctaagcttccaagggcctccaggtgggcctggaatcggaccaggctcagaggtattggggatctccccatgtccgcccgcatacgagttctgcggagggatggcatactgtggacctcaggttggactgggcctagtcccccaagttggcgtggagactttgcagcctgagggccaggcaggagcacgagtggaaagcaactcagagggaacctcctctgagccctgtgccgaccgccccaatgccgtgaagttggagaaggtggaaccaactcccgaggagtcccaggacatgaaagccctgcagaaggagctagaacagttcgctaagctgctgaagcagaagaggatcaccttggggtacacccaggccgacgtggggctcaccctgggcgttctctttggaaaggtgttcagccagaccaccatctgtcgcttcgaggccttgcagctcagccttaagaacatgtgtaagctgcggcccctgctggagaagtgggtggaggaagccgacaacaatccgaaccttcaggagatatgcaaatcggagaccctggtgcaggcccggaagagaaagcgaacgtccatcgaggtgagcgtcaagggggctctggagagccatttcctcaaatgccctaagccctcggcccaggagatcacctccctcgcggacagcttacagctggagaaggaggtggtgcgagtatggttctgtaacaggcgccagaagggcaaaagatcaagtattgagtattcccaacgagaagagtatgaggctacagggacacctttcccagggggggctgtatcctttcctctgcccccaggtccccactttggcaccccaggctatggaagcccccacttcaccacactctactcagtcccttttcctgagggcgaggcctttccctctgttcccgtcactgctctgggctctcccatgcattcaaactga(seqidno：10)。

atggctggacacctggcttcagacttcgccttctcacccccaccaggtgggggtgatgggtcagcagggctggagccgggctgggtggatcctcgaacctggctaagcttccaagggcctccaggtgggcctggaatcggaccaggctcagaggtattggggatctccccatgtccgcccgcatacgagttctgcggagggatggcatactgtggacctcaggttggactgggcctagtcccccaagttggcgtggagactttgcagcctgagggccaggcaggagcacgagtggaaagcaactcagagggaacctcctctgagccctgtgccgaccgccccaatgccgtgaagttggagaaggtggaaccaactcccgaggagtcccaggacatgaaagccctgcagaaggagctagaacagttcgctaagctgctgaagcagaagaggatcaggttggggtacacccaggccgacgtggggctcaccctgggcgttctctttggaaaggtgttcagccagaccaccatctgtcgcttcgaggccttgcagctcagccttaagaacatgtgtaagctgcggcccctgctggagaagtgggtggaggaagccgacaacaatgagaaccttcaggagatatgcaaatcggagaccctggtgcaggcccggaagagaaagcgaactagcattgagaaccgtgtgaggtggagtctggagaccatgtttctgaagtgcccgaagccctccctacagcagatcactcacatcgccaatcagcttgggctagagaaggatgtggttcgagtatggttctgtaaccggcgccagaagggcaaaagatcaagtattgagtattcccaacgagaagagtatgaggctacagggacacctttcccagggggggctgtatcctttcctctgcccccaggtccccactttggcaccccaggctatggaagcccccacttcaccacactctactcagtcccttttcctgagggcgaggcctttccctctgttcccgtcactgctctgggctctcccatgcattcaaactga(seqidno：11)。

atggctggacacctggcttcagacttcgccttctcacccccaccaggtgggggtgatgggtcagcagggctggagccgggctgggtggatcctcgaacctggctaagcttccaagggcctccaggtgggcctggaatcggaccaggctcagaggtattggggatctccccatgtccgcccgcatacgagttctgcggagggatggcatactgtggacctcaggttggactgggcctagtcccccaagttggcgtggagactttgcagcctgagggccaggcaggagcacgagtggaaagcaactcagagggaacctcctctgagccctgtgccgaccgccccaatgccgtgaagttggagaaggtggaaccaactcccgaggagtcccaggacatgaaagccctgcagaaggagctagaacagttcgctaagctgctgaagcagaagaggatcaccttggggtacacccaggccgacgtggggctcaccctgggcgttctctttggaaaggtgttcagccagaccaccatctgtcgcttcgaggccttgcagctcagccttaagaacatgtgtaagctgcggcccctgctggagaagtgggtggaggaagccgacaacaatccgaaccttcaggagatatgcaaatcggagaccctggtgcaggcccggaagagaaagcgaactagcattgagaaccgtgtgaggtggagtctggagaccatgtttctgaagtgcccgaagccctccctacagcagatcactcacatcgccaatcagcttgggctagagaaggatgtggttcgagtatggttctgtaaccggcgccagaagggcaaaagatcaagtattgagtattcccaacgagaagagtatgaggctacagggacacctttcccagggggggctgtatcctttcctctgcccccaggtccccactttggcaccccaggctatggaagcccccacttcaccacactctactcagtcccttttcctgagggcgaggcctttccctctgttcccgtcactgctctgggctctcccatgcattcaaactga(seqidno：12)。

atggctggacacctggcttcagacttcgccttctcacccccaccaggtgggggtgatgggtcagcagggctggagccgggctgggtggatcctcgaacctggctaagcttccaagggcctccaggtgggcctggaatcggaccaggctcagaggtattggggatctccccatgtccgcccgcatacgagttctgcggagggatggcatactgtggacctcaggttggactgggcctagtcccccaagttggcgtggagactttgcagcctgagggccaggcaggagcacgagtggaaagcaactcagagggaacctcctctgagccctgtgccgaccgccccaatgccgtgaagttggagaaggtggaaccaactcccgaggagtcccaggacatgaaagccctgcagaaggagctagaacagttcgctaagctgctgaagcagaagaggatcaggttggggtacacccaggccgacgtggggctcaccctgggcgttctctttggaaaggtgttcagccagaccaccatctgtcgcttcgaggccttgcagctcagccttaagaacatgtgtaagctgcggcccctgctggagaagtgggtggaggaagccgacaacaatgagaaccttcaggagatatgcaaatcggagaccctggtgcaggcccggaagagaaagcgaacgtccatcgaggtgagcgtcaagggggctctggagagccatttcctcaaatgccctaagccctcggcccaggagatcacctccctcgcggacagcttacagctggagaaggaggtggtgcgagtatggttctgtaacaggcgccagaagggcaaaagatcaagtattgagtattcccaacgagaagagtatgaggctacagggacacctttcccagggggggctgtatcctttcctctgcccccaggtccccactttggcaccccaggctatggaagcccccacttcaccacactctactcagtcccttttcctgagggcgaggcctttccctctgttcccgtcactgctctgggctctcccatgcattcaaactga(seqidno：13)。

其中，seqidno：8是编码epou多肽的核酸的核苷酸序列，seqidno：9是编码oct4_t22r_e78p多肽的核酸的核苷酸序列，seqidno：10是编码oct4hbrn2(100-126)多肽的核酸的核苷酸序列，seqidno：11是编码oct4_t22r多肽的核酸的核苷酸序列，seqidno：12是编码oct4_e78p多肽的核酸的核苷酸序列，seqidno：13是编码pouhbrn2/t22r多肽的核酸的核苷酸序列(参考图1d)。上述分离的核酸编码上述分离的多肽，根据本发明的实施例，上述分离的核酸在体细胞中表达，体细胞发生去分化、重编程的效率显著提高。

对于本发明说明书和权利要求书中所提及的核酸，本领域技术人员应当理解，实际包括互补双链的任意一条，或者两条。为了方便，在本说明书和权利要求书中，虽然多数情况下只给出了一条链，但实际上也公开了与之互补的另一条链。例如，提及seqidno：8～13，实际包括其互补序列。本领域技术人员还可以理解，利用一条链可以检测另一条链，反之亦然。

本申请中的基因序列包括dna形式或rna形式，公开其中一种，意味着另一种也被公开。

在本发明的第三方面，本发明提出了一种构建体。根据本发明的实施例，所述构建体携带前面所述的核酸。将本发明实施例的构建体通过合适的方式导入受体细胞如体细胞中，进而上述多肽在受体细胞中表达，则细胞发生去分化的效率和速率相比于现有技术显著提高。

在本发明中所使用的术语“构建体”是指这样的一种遗传载体，其包含特定核酸序列，并且能够将目的核酸序列转入宿主细胞中，以获得重组细胞。根据本发明的实施例，构建体的形式不受特别限制。根据本发明的实施例，其可以为质粒、噬菌体、人工染色体、粘粒(cosmid)、病毒的至少一种，优选质粒。质粒作为遗传载体，具有操作简单，可以携带较大片段的性质，便于操作和处理。质粒的形式也不受特别限制，既可以是环形质粒，也可以是线性质粒，即可以是单链的，也可以是双链的。本领域技术人员可以根据需要进行选择。在本发明中所使用的术语“核酸”可以是任何包含脱氧核糖核苷酸或者核糖核苷酸的聚合物，包括但不限于经过修饰的或者未经修饰的dna、rna，其长度不受任何特别限制。对于用于构建重组细胞的构建体，优选所述核酸为dna，因为dna相对于rna而言，其更稳定，并且易于操作。

在本发明的第四方面，本发明提出了一种改变细胞命运的方法。根据本发明的实施例，包括：所述细胞过表达前面所述的多肽。利用根据本发明实施例的方法，细胞命运发生改变的效率和速率相比于现有技术显著提高。

根据本发明的实施例，上述方法还可以进一步包括如下附加技术特征至少之一：

根据本发明的实施例，所述细胞是体细胞。体细胞中过表达上述多肽，其发生去分化的效率和速率进一步提高。

根据本发明的实施例，进一步包括将所述体细胞在基础培养基或添加有vitaminc的培养基中进行培养。

根据本发明的再一具体实施例，所述培养的时间为至少3天。发明人发现，至少培养3天，上述多肽在体细胞的过表达效率高，体细胞重编程和去分化的效率显著提高。

根据本发明的实施例，所述细胞同时过表达sox、klf4和c-myc。发明人通过实验发现，体细胞中同时过表达sox、klf4、c-myc以及上述多肽，其诱导ipsc效率是现有未突变的oct4与转录因子sox、klf4、c-myc共同诱导ipsc效率的15倍。

根据本发明的实施例，所述细胞同时过表达sox、klf4，发明人通过实验发现，体细胞中同时过表达sox、klf4以及上述多肽，其诱导ipsc效率是现有未突变的oct4与转录因子sox、klf4共同诱导ipsc效率的15倍。

根据本发明的实施例，所述细胞同时过表达sox17ek、klf4和c-myc。发明人通过实验发现，当epou于sox17ek相结合后，其诱导多能干细胞的速度和诱导效率得到进一步提升，epou、sox17ek、klf4和c-myc诱导效率能达到7％，ipsc在总细胞中大约占48％。

根据本发明的实施例，所述细胞同时过表达sox11、klf4和c-myc。发明人发现，上述多肽联合sox11、klf4和c-myc，可实现体细胞的重编程，而现有技术中，野生型oct4联合sox11、klf4和c-myc不能实现体细胞的重编程。

根据本发明的实施例，所述细胞同时过表达sox2ke、klf4和c-myc。发明人发现，上述多肽联合sox2ke、klf4和c-myc，可实现体细胞的重编程，而现有技术中，野生型oct4联合sox2ke、klf4和c-myc不能实现体细胞的重编程。

根据本发明的实施例，所述细胞同时过表达klf4、c-myc。发明人发现，上述多肽联合klf4、c-myc，可实现体细胞的重编程，而现有技术中，野生型oct4联合klf4、c-myc不能实现体细胞的重编程。

根据本发明的实施例，所述细胞同时过表达sox2。发明人发现，上述多肽单独联合sox2，可实现体细胞的重编程，而现有技术中，野生型oct4单独联sox2不能实现体细胞的重编程。

根据本发明的实施例，所述细胞同时过表达sox17ek。发明人发现，上述多肽单独联合sox17ek，可实现体细胞的重编程，而现有技术中，野生型oct4单独联sox17ek不能实现体细胞的重编程。

在本发明的第三方面，本发明提出了一种获得诱导多能干细胞的方法。根据本发明的实施例，所述方法包括：所述细胞过表达前面所述的多肽。利用根据本发明实施例的方法，多能干细胞的获得效率相比于现有技术显著提高。

根据本发明的实施例，所述方法还可以进一步包括如下附加技术特征至少之一：

根据本发明的实施例，所述细胞是体细胞，体细胞中过表达上述多肽，其发生去分化进而获得诱导多能干细胞的效率进一步提高。

根据本发明的实施例，进一步包括将所述体细胞在基础培养基或添加有vitaminc的培养基中进行培养。

根据本发明的再一具体实施例，所述培养的时间为至少3天。发明人发现，至少培养3天，上述多肽在体细胞的过表达效率高，体细胞重编程和去分化的效率显著提高，进而可进一步有效获得诱导多能干细胞。

根据本发明的实施例，所述细胞同时过表达sox、klf4和c-myc。发明人通过实验发现，体细胞中同时过表达sox、klf4、c-myc以及上述多肽，其诱导多能干细胞(ipsc)的获得效率是现有未突变的oct4与转录因子sox、klf4、c-myc共同诱导获得ipsc效率的15倍。根据本发明的实施例，所述细胞同时过表达sox、klf4，发明人通过实验发现，体细胞中同时过表达sox、klf4以及上述多肽，其获得诱导多能干细胞的效率是现有未突变的oct4与转录因子sox、klf4共同诱导获得诱导多能干细胞效率的15倍。

根据本发明的实施例，所述细胞同时过表达sox11、klf4和c-myc。发明人发现，上述多肽联合sox11、klf4和c-myc，可获得诱导多能干细胞，而现有技术中，野生型oct4联合sox11、klf4和c-myc不能获得诱导多能干细胞。

根据本发明的实施例，所述细胞同时过表达sox2ke、klf4和c-myc。发明人发现，上述多肽联合sox2ke、klf4和c-myc，可获得诱导多能干细胞，而现有技术中，野生型oct4联合sox2ke、klf4和c-myc不能获得诱导多能干细胞。

根据本发明的实施例，所述细胞同时过表达klf4、c-myc。发明人发现，上述多肽联合klf4、c-myc，可获得诱导多能干细胞，而现有技术中，野生型oct4联合klf4、c-myc不能获得诱导多能干细胞。

根据本发明的实施例，所述细胞同时过表达sox2。发明人发现，上述多肽单独联合sox2，可获得诱导多能干细胞，而现有技术中，野生型oct4单独联合sox2不能获得诱导多能干细胞。

根据本发明的实施例，所述细胞同时过表达sox17ek。发明人发现，上述多肽单独联合sox17ek，可获得诱导多能干细胞，而现有技术中，野生型oct4单独联sox17ek不能获得诱导多能干细胞。

附图说明

图1是根据本发明实施例的得到epou的过程和验证结果，

其中，a是筛选和验证结果图；

b是将多个最有潜力的突变点组合和验证图；

c是突变点与pouhbrn2组合并验证结果图；

图2是根据本发明实施例的氨基酸序列图，

其中，a是epou的氨基酸序列和dna序列；

b是epou与oct4的pou结构域氨基酸序列比对；

图3a.是根据本发明实施例的epou/s/k/m、o/s/k/m、epou/sox17ek/k/m在培养13天中的ipsc阳性克隆数的增长图，b.是13天后epou/s/k/m和o/s/k/m的效率在12孔板整孔扫描gfp的结果图；其中，k表示klf4；s表示sox2；

图4是根据本发明实施例的在有无维生素c的mes培养基中，epou/s/k/m组合，epou/s/k组合诱导ipsc，与o/s/k/m和o/s/k相比的结果图，

其中，k表示klf4；s表示sox2，m表示c-myc，o表示oct4；

图5是根据本发明实施例的epou与sox17/k/m，sox11/k/m，k/m分别组合诱导ipsc的情况的结果图；

图6是根据本发明实施例的在荧光显微镜下检测epou与sox17/k/m，sox11/k/m，k/m产生的克隆的情况结果图；

图7是epou/sox17ek、epou/sox2、epou/soxek/k/m、epou/sox17ek/k、epou/sox2/k、epou/sox2/k/m、oct4/sox2/k/m、oct4/sox2/k的诱导组合在诱导13天后，通过流式细胞分析得到gfp阳性细胞在总细胞数中的百分比；

图8是根据本发明实施例的epou/sox17ek,epou/sox17ek/k,epou/sox17ek/k/m,o/s/k/m,o/s/k,o/s，从诱导第1天到13天产生gfp阳性克隆数的变化图；以及

图9是根据本发明实施例的epou/sox17ek,epou/sox17ek/k,epou/sox17ek/k/m,o/s/k/m,o/s/k,o/s在培养的不同天数中在荧光显微镜下光测的结果图。

具体实施方式

下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解，下面的实施例仅用于说明本发明，而不应视为限定本发明的范围。实施例中未注明具体技术或条件的，按照本领域内的文献所描述的技术或条件(例如参考j.萨姆布鲁克等著，黄培堂等译的《分子克隆实验指南》，第三版，科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品，例如可以采购自illumina公司。

本文中所述的“细胞”为任何可以获得的细胞，在以下的实施例中，选择小鼠胚胎成纤维细胞(mouseembryofibroblastcell，mef细胞)。

可以通过本领域已知的任何手段转染或感染细胞。

一、实验方法：

细胞培养

plat-e细胞培养基：10％fbs，1xdmem；

mef培养基：10％fbs，1xdmem，1xglutamax，1xneaa；

mes诱导培养基：15％fbs，1xdmem，1xglutamax，1xneaa，1mmsodiumpyruvate，0.055mmβ-mercaptoethanol，0.5xpenicillin/streptomycin，1,000u/mlleukemiainhibitoryfactor；

点突变文库构建

因为密码子具有简并性，通常的饱和突变文库构建会使用nnn或者nnk，它们不仅包含了终止密码子，不同的氨基酸所占的比例也有所不同，这样对文库的筛选带来了严重的困难，特别是将文库导入哺乳动物细胞中，通过高通量测序得到所有筛选细胞中文库基因的整合情况。所以采用正向ndc/vmg/atg/tgg，反向hnc/kbc/cat/cca来包含20个氨基酸，并且每个氨基酸突变出现的概率相等，分别对k7、q18、i21、t22、e78、s151分别设计了不同的四对引物。

分别将带有突变基因的引物正向引物f1到f4，反向引物r1到r4以12:6:1:1混合，以pmx-moct4为模板，配置pcr反应体系，所用高保真酶，在20μl反应体系中，使用提供的hfbuffer，0.2mmdntp，0.5μl引物，5ng模板，0.02u/μl的dna聚合酶。98℃1分钟，之后进行18次循环，98℃30秒，58℃30秒，72℃大约3.5分钟(2kb/min)退出循环，72℃持续延伸5分钟，保温16℃。取10μl的pcr产物，加入0.5μl的dpni酶，37℃孵育3-5小时，4℃保存，用于转化，保存时间不宜太长最好孵育之后直接转化。转化使用所购买的top10感受态细胞，在30μl感受态细胞中加入3μldpni消化后的产物，在冰上放置半小时，42℃热击1分钟，迅速放入冰上2分钟，加入1ml新鲜lb培养基在摇床中37℃培养45分钟，离心去掉800μl上清液，将菌全部涂在具有氨苄抗性的lb固体培养基上，在细菌培养箱中倒置37℃培养8-12个小时，挑取单克隆，送sanger测序(bgi)，所用测序引物是pmx载体的通用引物由公司提供。

嵌合突变文库构建

利用userec的方法构建嵌合体突变文库，是通过找到蛋白之间的同源区域中的a(n)4-8t设计特殊引物扩增出含有脱氧尿嘧啶的片段，因为密码子具有简并性，相同的氨基酸对应着不同的密码子，所以先用pcr扩增方法改变目的片段的末端序列，使相同的结构域的末端同源序列的核酸序列相同。pcr反应使用taqmastermix(thermo)，20μl的反应体系中，1xmastermix，0.3μm的引物，模板5ng分别为pmx-moct4、pmx-moct6、pentr-mbrn2、pentr-moct1,反应25个循环。含有脱氧尿嘧啶引物片段再扩增为了下一步利用user酶进行酶切，需要对获取的不同结构域的片段的两段引入a(n)4-8u，在上一步的pcr反应后已得到a(n)4-8t并且，在上一步后同种结构域末端大约14bp的片段已相同，所以对不同蛋白的pous、linker、pouh可用相同的一段含有u的短引物做进一步扩增，引物如表2.5。这一步使用一种特殊的dna聚合酶phusionuhotstardnapolymerase(thermofisher)进行扩增，20μi的反应体系中，1xhfbuffer(酶自带)，0.3μm的引物，模板500pg。反应程序是，98℃3分钟，进入25次循环，95℃30秒，40℃30秒，72℃30秒，退出循环，72℃5分钟，最终稳定在16℃直到取走产物。moct4的pou结构域外n端和c端的序列用带有bglii限制性酶切位点的正向引物和带有noti限制性酶切位点的反向引物，和带有脱氧尿嘧啶的引物扩增。在50μluser酶反应体系，1xt4dnaligasebuffer(neb)，5μluserenzyme，100μg混合的dna片段。在37℃20分钟，25℃10分钟，加入5μlt4连接酶(neb2000u)，25℃15分钟。取1μl的反应产物作为pcr模板，用p1bglii和p2noti进行扩增，利用琼脂糖凝胶进行检测是否成功并切胶回收纯化。对空载体pmx-flag各使用5μl限制性内切酶bamhi和noti消化质粒100ug，37℃1小时，凝胶纯化并浓度测定后保存。对目的片段使用限制性内切酶bglii和noti进行消化，同样的方法纯化和回收。

在20μlsolutioni反应体系中，10μlmix反应液，酶切并纯化后的载体骨架和插入片段按比例1:5加入，16℃连接过夜。取5μl加入50μltop10感受态细胞中，用热激法转化，具体方法可参考上一节内容，在有amp固体培养基上培养过夜，挑取部分克隆送到测序公司进行sanger测序，检测文库质量。

逆转录病毒的制备

胰酶消化培养中的plat-e细胞，计数之后按培养8x10^8个细胞plat-e于10cm皿中，培养大约24hr之后，细胞密度大约在70～90％时，在转染前前1小时将细胞培养基更换为opti-mem或者更新为新鲜plat-e细胞培养基；加入1ml的opti-mem于1.5mlep管中，加入10μg的质粒，再加入40μl的pei，震荡10s后室温放置15分钟；将dna与pei的混合液缓慢加入到plat-e细胞培养皿中；过了12hr更换新鲜plat-e培养基；转染48hr时观测，转入gfp的plat-e细胞的状态并拍照，用0.4μm的滤器过滤并收集病毒液，过24hr之后再次收集病毒液，用做第二次感染；1)将og2mef复苏并按5:3:1培养在6cm皿中，这代mef记为p0；

ipsc的诱导

og2mef复苏后12hr换液，之后24hr换一次液；将mef用0.5％的胰酶消化之后，接种1.5x10^4个细胞到12孔板中培养5-12hr，吸掉培养基，向已收集好的病毒液中加入polybrene，终浓度为8μg/ml，混匀之后加入到细胞中，不同培养皿中病毒液不同，24孔板中加入0.25ml，12孔板中加入0.5ml，6孔板中加入1ml，10cm皿中加入3ml，本实验均用12孔板，所以sox2、klf4、c-myc、oct4(或者突变文库或者epou)均加入0.5ml到mef细胞中；加入病毒液之后，培养24hr，在加入已混有polybrene的第二次收集的病毒液做第二次感染；24hr之后将培养基换做ips诱导培养基，记为第0天，之后每24hr换一次液，进行观察，在24hr后观测其gfp的表达情况可以判断这次的感染状况；之后每天的观察中会看到mef变圆成met细胞，之后长出克隆，最后出现有gfp的克隆，其为ipsc，选择所需的实验天数对产生的gfp阳性克隆基数；

ips细胞的培养

ips细胞克隆挑取后用胰酶消化，在0.1％gelatin的2i培养基中培养

2i培养基：neurobasal：dmem-f12＝1：1，1xglutamax，1xneaa，1mmsodiumpyruvate，0.055mmβ-mercaptoethanol，0.5xpenicillin/streptomycin，1,000u/mlleukemiainhibitoryfactor，1xn-2,，1xb-27，3umchir99021，1umpd0325901；

核型分析

在6cm皿中ips细胞培养到长满整个皿后，加入秋水仙素0.2％到中，37℃孵育1小时，使用胰酶消化后悬浮在0.075m的kcl中20分钟，对在低渗缓冲液中的细胞浸入甲醇：甲酸＝3:1的环境中放置于室温30分钟，把细胞放在干净的载破片上然后用giemsa染色，在显微镜下观察处于细胞中期的。

小鼠嵌合体和种系实验

从icr雌鼠中获取胚胎细胞，早ksom培养基中培养到囊胚期，将ips细胞注射到囊胚细胞中继续在ksom培养基中培养直到移植，将15到20个注射之后的囊胚细胞注射到假孕的雌鼠子宫内，在移植后的11天，在第13.5天取出胚胎的性腺观察oct4-gfp的情况，其他13个在19.5天观察毛色，在他们发育成熟进行种系实验。

四倍体补偿实验

将从icr雌鼠中获取胚胎两个胚胎细胞通过电击融合得到四倍体胚胎细胞在ksom培养基中培养，4到10个ips细胞注射到四倍体胚囊腔中，继续在ksom培养基中培养直到移植，15到20个注射后的四配体囊胚移植到假孕雌鼠子宫中，在第13.5天切开检查四配体胚胎的状态。

人多能诱导干细胞的诱导

逆转录病毒载体同pax2、vsv-g通过磷酸钙转染法一同转入293t细胞中，12小时候换入新鲜培养基，在转染第48小时后通过0.45um的滤膜过滤并收集病毒液。病毒液中加入4μg/mlpolybrene(sigma)感染人包皮纤维细胞(hff)，向感染后的hff加入doxycycline(sigma)到1μg/μl，在meffeeder细胞上培养诱导hes样细胞的产生。

免疫荧光分析

细胞通过4％的甲醛处理30分钟，然后使用h0.2％tritonx-100处理45分钟随后加入2％bsa，细胞在一抗中4℃处理过夜，二抗中室温处理1小时，针对不同的蛋白使用不同的荧光ssea1(santacruz),ssea4(r&d),nanog(chemicon),oct4(santacruz),sox2(r&d),tra-1-60(chemicon),tra-1-81(chemicon),foxa2(abcam),sox17(santacruz),sma(abbomax),brachyury(abcam),gfap(dako),β-tubulin(covance).

二、结果：

1、在筛选和严重中得到了大量诱导ipsc效率提高的突变体

6定点突变文库分别同s/k/m一同诱导ipsc，通过二代测序的方法在诱导产生的ipsc中得到了大量的具有潜力的突变体，通过鉴定在每个位点得到了其最强的突变体k7a,q18a,i21v,t22r,e78a,e78p和s151n(结果参见图1)。在嵌合体突变文库中，通过筛选和鉴定得到了最高效的突变体pouhbrn2。将得到的突变位点组合起来，得到了三突变体t22r/e78p/s151n，在只有点突变引入中诱导效率最高。将它们同pouhbrn2组合得到了诱导效率最高的突变体epou。k：klf4；s：sox2，m：c-myc2、epou相比于oct4具有非常强的诱导效率。

根据序列比对，epou与oct4相比有16个突变点，结果参见图2，其中有14个突变的引入是由一部分brn2的linker区和一部分的pouh替换，其他两个突变点为t22r和e78p。同s/k/m、s/k，并且在有无维生素c加入的情况下，诱导效率是oct4的15倍，结果参见图3和图4。k：klf4；s：sox2，m：c-myc。

2、epou具有特别的重编程功能

重编程因子组合o/s/k/m中，sox2可以被sox1替换，但是如果sox17、sox11、sox2ke替换后这些因子的组合能诱导重编程的进行，o/k/m也不具有重编程能力。但是epou替代oct4后能与sox17/k/m、sox11/k/m、k/m组合成功诱导细胞重编程，结果参见图5和图6。正常情况下，o/s组合并不能诱导重编程过程除非在昂贵的icd1培养基中，但是epou和sox2能在正常的mes培养基中完成重编程，如果sox2被sox17ek替换，诱导效率能得到非常理想的提升，结果参见图8。k：klf4；s：sox2，m：c-myc，o：oct4

3、新的诱导因子的组合能加快重编程速度和提升重编程效率

epou/sox17ek/k/m能实验7％的重编程效率，并且在诱导得到的细胞中有48％是gfp阳性细胞，结果参见图7和图9，首个gfp阳性细胞产生在第三天(感染时为第0天)，epou/sox17ek也能得到gfp细胞，使用这个方法可以实现无致癌基因的引入，产生理想的再生医学药物。k：klf4；m：c-myc

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

sequencelisting

<110>中国科学院广州生物医药与健康研究院

<120>pou结构域改造蛋白对多能干细胞的高效诱导

<130>pidc3170387

<160>14

<170>patentinversion3.3

<210>1

<211>352

<212>prt

<213>artificial

<220>

<223>野生型oct4的序列

<400>1

metalaglyhisleualaseraspphealapheserproproprogly

151015

glyglyaspglyseralaglyleugluproglytrpvalaspproarg

202530

thrtrpleuserpheglnglyproproglyglyproglyileglypro

354045

glysergluvalleuglyileserprocysproproalatyrgluphe

505560

cysglyglymetalatyrcysglyproglnvalglyleuglyleuval

65707580

proglnvalglyvalgluthrleuglnprogluglyglnalaglyala

859095

argvalgluserasnsergluglythrsersergluprocysalaasp

100105110

argproasnalavallysleuglulysvalgluprothrprogluglu

115120125

serglnaspmetlysalaleuglnlysgluleugluglnphealalys

130135140

leuleulysglnlysargilethrleuglytyrthrglnalaaspval

145150155160

glyleuthrleuglyvalleupheglylysvalpheserglnthrthr

165170175

ilecysargpheglualaleuglnleuserleulysasnmetcyslys

180185190

leuargproleuleuglulystrpvalgluglualaaspasnasnglu

195200205

asnleuglngluilecyslyssergluthrleuvalglnalaarglys

210215220

arglysargthrserilegluasnargvalargtrpserleugluthr

225230235240

metpheleulyscysprolysproserleuglnglnilethrhisile

245250255

alaasnglnleuglyleuglulysaspvalvalargvaltrpphecys

260265270

asnargargglnlysglylysargserserileglutyrserglnarg

275280285

gluglutyrglualathrglythrpropheproglyglyalavalser

290295300

pheproleuproproglyprohispheglythrproglytyrglyser

305310315320

prohisphethrthrleutyrservalpropheprogluglygluala

325330335

pheproservalprovalthralaleuglyserpromethisserasn

340345350

<210>2

<211>352

<212>prt

<213>artificial

<220>

<223>epou的氨基酸序列

<400>2

metalaglyhisleualaseraspphealapheserproproprogly

151015

glyglyaspglyseralaglyleugluproglytrpvalaspproarg

202530

thrtrpleuserpheglnglyproproglyglyproglyileglypro

354045

glysergluvalleuglyileserprocysproproalatyrgluphe

505560

cysglyglymetalatyrcysglyproglnvalglyleuglyleuval

65707580

proglnvalglyvalgluthrleuglnprogluglyglnalaglyala

859095

argvalgluserasnsergluglythrsersergluprocysalaasp

100105110

argproasnalavallysleuglulysvalgluprothrprogluglu

115120125

serglnaspmetlysalaleuglnlysgluleugluglnphealalys

130135140

leuleulysglnlysargileargleuglytyrthrglnalaaspval

145150155160

glyleuthrleuglyvalleupheglylysvalpheserglnthrthr

165170175

ilecysargpheglualaleuglnleuserleulysasnmetcyslys

180185190

leuargproleuleuglulystrpvalgluglualaaspasnasnpro

195200205

asnleuglngluilecyslyssergluthrleuvalglnalaarglys

210215220

arglysargthrserilegluvalservallysglyalaleugluser

225230235240

hispheleulyscysprolysproseralaglngluilethrserleu

245250255

alaaspserleuglnleuglulysgluvalvalargvaltrpphecys

260265270

asnargargglnlysglylysargserserileglutyrserglnarg

275280285

gluglutyrglualathrglythrpropheproglyglyalavalser

290295300

pheproleuproproglyprohispheglythrproglytyrglyser

305310315320

prohisphethrthrleutyrservalpropheprogluglygluala

325330335

pheproservalprovalthralaleuglyserpromethisserasn

340345350

<210>3

<211>352

<212>prt

<213>artificial

<220>

<223>oct4_t22r_e78p的氨基酸序列

<400>3

metalaglyhisleualaseraspphealapheserproproprogly

151015

glyglyaspglyseralaglyleugluproglytrpvalaspproarg

202530

thrtrpleuserpheglnglyproproglyglyproglyileglypro

354045

glysergluvalleuglyileserprocysproproalatyrgluphe

505560

cysglyglymetalatyrcysglyproglnvalglyleuglyleuval

65707580

proglnvalglyvalgluthrleuglnprogluglyglnalaglyala

859095

argvalgluserasnsergluglythrsersergluprocysalaasp

100105110

argproasnalavallysleuglulysvalgluprothrprogluglu

115120125

serglnaspmetlysalaleuglnlysgluleugluglnphealalys

130135140

leuleulysglnlysargileargleuglytyrthrglnalaaspval

145150155160

glyleuthrleuglyvalleupheglylysvalpheserglnthrthr

165170175

ilecysargpheglualaleuglnleuserleulysasnmetcyslys

180185190

leuargproleuleuglulystrpvalgluglualaaspasnasnpro

195200205

asnleuglngluilecyslyssergluthrleuvalglnalaarglys

210215220

arglysargthrserilegluasnargvalargtrpserleugluthr

225230235240

metpheleulyscysprolysproserleuglnglnilethrhisile

245250255

alaasnglnleuglyleuglulysaspvalvalargvaltrpphecys

260265270

asnargargglnlysglylysargserserileglutyrserglnarg

275280285

gluglutyrglualathrglythrpropheproglyglyalavalser

290295300

pheproleuproproglyprohispheglythrproglytyrglyser

305310315320

prohisphethrthrleutyrservalpropheprogluglygluala

325330335

pheproservalprovalthralaleuglyserpromethisserasn

340345350

<210>4

<211>352

<212>prt

<213>artificial

<220>

<223>oct4hbrn2(100-126)的氨基酸序列

<400>4

metalaglyhisleualaseraspphealapheserproproprogly

151015

glyglyaspglyseralaglyleugluproglytrpvalaspproarg

202530

thrtrpleuserpheglnglyproproglyglyproglyileglypro

354045

glysergluvalleuglyileserprocysproproalatyrgluphe

505560

cysglyglymetalatyrcysglyproglnvalglyleuglyleuval

65707580

proglnvalglyvalgluthrleuglnprogluglyglnalaglyala

859095

argvalgluserasnsergluglythrsersergluprocysalaasp

100105110

argproasnalavallysleuglulysvalgluprothrprogluglu

115120125

serglnaspmetlysalaleuglnlysgluleugluglnphealalys

130135140

leuleulysglnlysargilethrleuglytyrthrglnalaaspval

145150155160

glyleuthrleuglyvalleupheglylysvalpheserglnthrthr

165170175

ilecysargpheglualaleuglnleuserleulysasnmetcyslys

180185190

leuargproleuleuglulystrpvalgluglualaaspasnasnglu

195200205

asnleuglngluilecyslyssergluthrleuvalglnalaarglys

210215220

arglysargthrserilegluvalservallysglyalaleugluser

225230235240

hispheleulyscysprolysproseralaglngluilethrserleu

245250255

alaaspserleuglnleuglulysgluvalvalargvaltrpphecys

260265270

asnargargglnlysglylysargserserileglutyrserglnarg

275280285

gluglutyrglualathrglythrpropheproglyglyalavalser

290295300

pheproleuproproglyprohispheglythrproglytyrglyser

305310315320

prohisphethrthrleutyrservalpropheprogluglygluala

325330335

pheproservalprovalthralaleuglyserpromethisserasn

340345350

<210>5

<211>352

<212>prt

<213>artificial

<220>

<223>oct4_t22r的氨基酸序列

<400>5

metalaglyhisleualaseraspphealapheserproproprogly

151015

glyglyaspglyseralaglyleugluproglytrpvalaspproarg

202530

thrtrpleuserpheglnglyproproglyglyproglyileglypro

354045

glysergluvalleuglyileserprocysproproalatyrgluphe

505560

cysglyglymetalatyrcysglyproglnvalglyleuglyleuval

65707580

proglnvalglyvalgluthrleuglnprogluglyglnalaglyala

859095

argvalgluserasnsergluglythrsersergluprocysalaasp

100105110

argproasnalavallysleuglulysvalgluprothrprogluglu

115120125

serglnaspmetlysalaleuglnlysgluleugluglnphealalys

130135140

leuleulysglnlysargileargleuglytyrthrglnalaaspval

145150155160

glyleuthrleuglyvalleupheglylysvalpheserglnthrthr

165170175

ilecysargpheglualaleuglnleuserleulysasnmetcyslys

180185190

leuargproleuleuglulystrpvalgluglualaaspasnasnglu

195200205

asnleuglngluilecyslyssergluthrleuvalglnalaarglys

210215220

arglysargthrserilegluasnargvalargtrpserleugluthr

225230235240

metpheleulyscysprolysproserleuglnglnilethrhisile

245250255

alaasnglnleuglyleuglulysaspvalvalargvaltrpphecys

260265270

asnargargglnlysglylysargserserileglutyrserglnarg

275280285

gluglutyrglualathrglythrpropheproglyglyalavalser

290295300

pheproleuproproglyprohispheglythrproglytyrglyser

305310315320

prohisphethrthrleutyrservalpropheprogluglygluala

325330335

pheproservalprovalthralaleuglyserpromethisserasn

340345350

<210>6

<211>352

<212>prt

<213>artificial

<220>

<223>oct4_e78p的氨基酸序列

<400>6

metalaglyhisleualaseraspphealapheserproproprogly

151015

glyglyaspglyseralaglyleugluproglytrpvalaspproarg

202530

thrtrpleuserpheglnglyproproglyglyproglyileglypro

354045

glysergluvalleuglyileserprocysproproalatyrgluphe

505560

cysglyglymetalatyrcysglyproglnvalglyleuglyleuval

65707580

proglnvalglyvalgluthrleuglnprogluglyglnalaglyala

859095

argvalgluserasnsergluglythrsersergluprocysalaasp

100105110

argproasnalavallysleuglulysvalgluprothrprogluglu

115120125

serglnaspmetlysalaleuglnlysgluleugluglnphealalys

130135140

leuleulysglnlysargilethrleuglytyrthrglnalaaspval

145150155160

glyleuthrleuglyvalleupheglylysvalpheserglnthrthr

165170175

ilecysargpheglualaleuglnleuserleulysasnmetcyslys

180185190

leuargproleuleuglulystrpvalgluglualaaspasnasnpro

195200205

asnleuglngluilecyslyssergluthrleuvalglnalaarglys

210215220

arglysargthrserilegluasnargvalargtrpserleugluthr

225230235240

metpheleulyscysprolysproserleuglnglnilethrhisile

245250255

alaasnglnleuglyleuglulysaspvalvalargvaltrpphecys

260265270

asnargargglnlysglylysargserserileglutyrserglnarg

275280285

gluglutyrglualathrglythrpropheproglyglyalavalser

290295300

pheproleuproproglyprohispheglythrproglytyrglyser

305310315320

prohisphethrthrleutyrservalpropheprogluglygluala

325330335

pheproservalprovalthralaleuglyserpromethisserasn

340345350

<210>7

<211>352

<212>prt

<213>artificial

<220>

<223>pouhbrn2/t22r氨基酸序列

<400>7

metalaglyhisleualaseraspphealapheserproproprogly

151015

glyglyaspglyseralaglyleugluproglytrpvalaspproarg

202530

thrtrpleuserpheglnglyproproglyglyproglyileglypro

354045

glysergluvalleuglyileserprocysproproalatyrgluphe

505560

cysglyglymetalatyrcysglyproglnvalglyleuglyleuval

65707580

proglnvalglyvalgluthrleuglnprogluglyglnalaglyala

859095

argvalgluserasnsergluglythrsersergluprocysalaasp

100105110

argproasnalavallysleuglulysvalgluprothrprogluglu

115120125

serglnaspmetlysalaleuglnlysgluleugluglnphealalys

130135140

leuleulysglnlysargileargleuglytyrthrglnalaaspval

145150155160

glyleuthrleuglyvalleupheglylysvalpheserglnthrthr

165170175

ilecysargpheglualaleuglnleuserleulysasnmetcyslys

180185190

leuargproleuleuglulystrpvalgluglualaaspasnasnglu

195200205

asnleuglngluilecyslyssergluthrleuvalglnalaarglys

210215220

arglysargthrserilegluvalservallysglyalaleugluser

225230235240

hispheleulyscysprolysproseralaglngluilethrserleu

245250255

alaaspserleuglnleuglulysgluvalvalargvaltrpphecys

260265270

asnargargglnlysglylysargserserileglutyrserglnarg

275280285

gluglutyrglualathrglythrpropheproglyglyalavalser

290295300

pheproleuproproglyprohispheglythrproglytyrglyser

305310315320

prohisphethrthrleutyrservalpropheprogluglygluala

325330335

pheproservalprovalthralaleuglyserpromethisserasn

340345350

<210>8

<211>1059

<212>dna

<213>artificial

<220>

<223>编码epou多肽的核酸的核苷酸序列

<400>8

atggctggacacctggcttcagacttcgccttctcacccccaccaggtgggggtgatggg60

tcagcagggctggagccgggctgggtggatcctcgaacctggctaagcttccaagggcct120

ccaggtgggcctggaatcggaccaggctcagaggtattggggatctccccatgtccgccc180

gcatacgagttctgcggagggatggcatactgtggacctcaggttggactgggcctagtc240

ccccaagttggcgtggagactttgcagcctgagggccaggcaggagcacgagtggaaagc300

aactcagagggaacctcctctgagccctgtgccgaccgccccaatgccgtgaagttggag360

aaggtggaaccaactcccgaggagtcccaggacatgaaagccctgcagaaggagctagaa420

cagttcgctaagctgctgaagcagaagaggatcaggttggggtacacccaggccgacgtg480

gggctcaccctgggcgttctctttggaaaggtgttcagccagaccaccatctgtcgcttc540

gaggccttgcagctcagccttaagaacatgtgtaagctgcggcccctgctggagaagtgg600

gtggaggaagccgacaacaatccgaaccttcaggagatatgcaaatcggagaccctggtg660

caggcccggaagagaaagcgaacgtccatcgaggtgagcgtcaagggggctctggagagc720

catttcctcaaatgccctaagccctcggcccaggagatcacctccctcgcggacagctta780

cagctggagaaggaggtggtgcgagtatggttctgtaacaggcgccagaagggcaaaaga840

tcaagtattgagtattcccaacgagaagagtatgaggctacagggacacctttcccaggg900

ggggctgtatcctttcctctgcccccaggtccccactttggcaccccaggctatggaagc960

ccccacttcaccacactctactcagtcccttttcctgagggcgaggcctttccctctgtt1020

cccgtcactgctctgggctctcccatgcattcaaactga1059

<210>9

<211>1059

<212>dna

<213>artificial

<220>

<223>编码oct4_t22r_e78p多肽的核酸的核苷酸序列

<400>9