1.用于生成细胞类型特异性表达盒的方法,所述方法包括以下步骤:
a)提供目的细胞类型的基因表达谱,
b)提供所述目的细胞类型的基因组序列数据,
c)从所述基因表达谱中选择标签基因的集合,其中所述标签基因(i)与参考细胞类型相比受到差异调控,或(ii)根据基因表达水平选择,
d)在c)中选择的所述标签基因的集合中鉴定编码转录因子的基因,
e)从所述基因组序列数据中确定基因组区的集合,其中,每个基因组区包括编码在c)中鉴定的标签基因的序列和与编码所述标签基因的序列相邻的额外的基因组序列,
f)鉴定在e)中确定的所述基因组区的集合内的具有相当和有限大小、优选相等大小的多个基因组亚区,其中,所述基因组亚区包括在d)中鉴定的一个或多个转录因子的一个或多个结合位点,
g)从f)中确定的基因组亚区中选择基因组亚区的最小集合,优选2至10个之间,其中,选择所述基因组亚区的集合以包括在d)中鉴定的所有转录因子的预定百分比的转录因子结合位点,以及
h)生成包括与报道基因或效应基因可操作地偶联的在步骤g)中选择的所述基因组亚区的集合的细胞类型特异性表达盒,其中,将所述基因组亚区配置为调控所述报道基因或效应基因的表达。
2.根据前一权利要求所述的用于生成表达盒的方法,其中
-所述基因表达谱包括目的细胞类型中基因的表达水平,以及
o根据步骤c)(i)提供参考细胞类型的基因表达谱,所述基因表达谱包括所述参考细胞类型中基因的表达水平,并且通过鉴定与所述参考细胞类型中的表达水平相比被上调或下调的基因来选择差异调控的标签基因,优选选择在所述目的细胞类型中上调3至10倍的基因,或
o根据步骤c)(ii)根据所述目的细胞类型的基因的基因表达水平将所述目的细胞类型的基因排序,并且基于标签基因的预定水平或预定数量的表达,诸如所述目的细胞类型中100至1000个最高表达的或者100至1000个最低表达的基因,选择标签基因。
3.根据前述权利要求中任一项所述的用于生成表达盒的方法,
其中,
所覆盖的转录因子的预定百分比为30%或更多,优选40%或更多,最优选50%或更多。
4.根据前述权利要求中任一项所述的用于生成表达盒的方法,
其中,
在e)中确定的所述基因组区对应于包含差异调控的基因的拓扑相关结构域的基因组序列,其中,优选地拓扑相关结构域对应于两个ctfc结合位点之间的基因组序列,优选地位于所述标签基因的以及包括所述标签基因的编码区之外。
5.根据前述权利要求中任一项所述的用于生成表达盒的方法,
其中,
步骤f)中鉴定具有相等大小的基因组亚区通过对e)中确定的所述基因组区的滑动窗口算法来进行,
其中,优选地所述窗口具有的长度为500bp至5000bp、优选700bp至2000bp、更优选800bp至1200bp、最优选1000bp以及
所述滑动步长具有的长度为100bp至1000bp、优选120bp至300bp、更优选130bp至170bp、最优选150bp。
6.根据前述权利要求中任一项所述的用于生成表达盒的方法,
其中,
g)中的基因组亚区的集合的选择通过计算f)中鉴定的每个基因组亚区来进行:
-在基因组序列数据中根据d)的转录因子的结合位点的富集,以及
-存在结合位点的转录因子的多样性的得分,
-其中,根据存在结合位点的转录因子的累计百分比将所述基因组亚区排序,以及
-其中,选择基因组亚区的最小集合以包括d)中鉴定的所有转录因子的预定百分比的结合位点。
7.细胞类型特异性报道载体,所述细胞类型特异性报道载体包括通过根据前述权利要求中任一项所述的方法生成的表达盒。
8.细胞类型特异性报道载体,所述细胞类型特异性报道载体包括
合成调控区,所述合成调控区包括2至10个100bp至1000bp的基因组亚区,所述基因组亚区位置相邻,没有接头或具有小于100bp的接头序列位于所述亚区之间,其中所述亚区源自细胞类型的同一基因组中的分开(非相邻)的位置,其中所述亚区累计包括至少5个、优选至少10个、最优选至少20个转录因子的结合位点,以及
报道基因或效应基因,
其中,所述基因组亚区与所述报道基因或效应基因可操作地偶联,以调控所述报道基因或效应基因的表达。
9.根据前一权利要求所述的载体,
其中,
所述基因组亚区的每个具有的长度为120bp至300bp、更优选130bp至170bp、最优选150bp。
10.根据权利要求8或9中任一项所述的载体,
其中,
与所述报道基因或效应基因相邻的所述基因组亚区包括转录起始位点。
11.根据权利要求8至10中任一项所述的载体,
其中,
所述报道基因或效应基因编码选自由以下组成的组的蛋白:荧光蛋白、自杀基因、荧光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶、表面受体、蛋白标签,包括但不限于6xhis标签、v5标签、gfp标签,自加工核酶盒、甲羟戊酸激酶及其衍生物,生物素连接酶及其衍生物,包括但不限于bira,工程化过氧化物酶及其衍生物,包括但不限于apex2,内切核酸酶或位点特异性重组酶及其衍生物包括但不限于限制性酶、cre、flp、tn5、spcas9、sacas9、talens、矫正单基因疾病的基因。
12.根据权利要求8至10中任一项所述的载体,
其中,
所述载体包括根据seqidno1-6的核酸序列或与seqidno1-6的任何一个具有至少80%、优选至少90%的同一性的核酸序列。
13.根据权利要求8至12的载体用于在基因和病毒治疗、药物发现或验证中转化细胞和/或确定细胞特性优选细胞类型、状态或命运转变的用途。
14.用于确定细胞特性优选细胞类型、状态或命运转变的方法,所述方法包括以下步骤:
a.提供根据权利要求8至12的载体,
b.提供细胞,
c.用所述载体转导细胞,
d.测量指示报道基因的表达的信号,其中,所述信号的量对所述细胞的特性优选细胞类型、状态或命运转变有指导性。
15.一种用于确定合成基因座控制区(slcr)的序列的计算机实现的方法,所述方法包括根据权利要求1所述的步骤a)至g)。