构建基因文库分离目的基因 Gene library
想要从生物材料,尤其是从高等的真核生物基因组中分离特定的目的基因,如同大海捞针,难以下手。为此,在研究某一基因组时,通常构建基因文库(gene library或gene bank)作为筛选目的基因的。基因文库是指某一生物类型全部基因的集合,是通过克隆的方法将某一基因组的DNA或mRNA保存于适当的宿主菌中形成的转化子群。基因文库分为基因组文库(genomic library)和cDNA文库(cDNAlibrary)。构建基因文库的目的不仅是将生物的遗传信息以稳定的克隆形式储存起来,更重要的是为分离有用的目的基因提供了来源,同时为复杂基因组的作图提供了重要依据。
一个完备的基因文库应具备下列条件:
(1)基因文库的完备性,即从基因基因文库中筛选出某一目的基因的重组克隆的概率。基因文库的完备性与基因文中重组克隆的数目、重组子中DNA插入片段的长度以及生物单倍体基因组的大小等参数相关,可用Charke carbon 公式描述N=ln(1-P)/ln(1-f)。其中,N为构建基因文库的重组克隆数,P为某一基因被克隆的概率,f是克隆片段长度与生物单倍体基因组总长之比。由上述公式可以看出,某一基因文库所含有的重组克隆越多,其完备性越高。如果插入片段平均大小为 20 kb 某植物基因组大小为 4 x 106bp,P=0.99时,根据上式 N≈1 ×105。含 1×105个克隆的基因文库相当覆盖了 5倍的基因组,在片段随机分布时,从文库中找到任一序列的概率不低于0.99。
(2)重组克隆的总数不宜过大,以减轻筛选工作的压力。
(3)载体的装载量必须大于绝大多数基因的长度,以免基因被分割在不同克隆中。
(4)含有相邻DNA片段的重组克隆之间,必须具有部分序列的重叠,以利于基因文库各克隆的排序。
(5)克隆片段易于从载体分子上完整卸下且最好不带任何载体序列。
(6)重组克隆应能稳定保存、扩增及筛选。
上述条件的满足极大程度上依赖于基因文库的构建战略。
基因文库的构建
基因文库的构建通常采用鸟枪法和cDNA法两种方法。由鸟枪法构建的基因文库又称为基因组文库(genomic bank),理论上它含有某一生物染色体的所以DNA片段,包括基因编码区和间隔区DNA;由cDNA法构建的基因文库则称为cDNA文库(cDNAbank),它只含有生物体的全套蛋白质编码序列,一般不含有DNA调控序列,显然由cDNA文库筛选蛋白编码基因比从基因组文库中筛选要简捷得多。
基因组文库的构建过程:(1)细胞染色体大分子DNA的提取和大片段的制备;(2)载体DNA的制备;(3)载体与外源大片段连接;(4)体外包装及基因组DNA文库的扩增;(5)重组DNA的筛选和鉴定
cDNA文库的构建过程:(1)细胞总RNA提取并分离纯化出mRNA;(2)cDNA第一链的合成;(3)双链cDNA的合成;(4)双链cDNA与载体的连接;(5)噬菌体颗粒的包装及感染宿主菌等。
基因文库构建注意事项
(1)外源DNA和mRNA
为了最大限度的保证基因在克隆中的完备性,用于基因组文库构建的外源DNA片段有三个原则,第一,DNA片段之间存在重叠序列;第二,DNA片段大小均一;第三,外源DNA片段化后的长度尽可能大,这样含有不规则末端的DNA分子比例就越小,同时含有完整基因的概率就相应提高。
cDNA文库中基因克隆的完备性与mRNA的拷贝数相关,某种mRNA的拷贝数越多,意味着cDNA基因文库中贮存基因的概率越大,越容易分离出来。而在生物中,某种mRNA在不同组织、不同发育期细胞内的丰度是不同的。因此,为了获得高丰度的某种mRNA必须选择合适的材料。如分离种子贮藏蛋白相关的基因,应选择未成熟的种子;要获得珠蛋白基因,应选择血红蛋白细胞为提取材料。
(2)载体
对于基因组文库,出于压缩重组克隆的数目,用于基因组文库构建的载体通常选用装载量较大的λ-DNA、考斯质粒、酵母人工染色体或细菌人工染色体。对于构建一个完备性为0.99的人基因组文库,λ-DNA为载体,装载量为15kb,至少需要90万个克隆,而用考斯载体,装载量为40kb,只需要23万个克隆。
对于cDNA文库,由于绝大多数的真核生物基因蛋白编码序列小于5kb,因此较为理想的克隆载体是普通质粒,尤其是表达性质粒载体,这样可以直接利用目的基因表达产物的性质和功能筛选基因文库。
(3)受体细胞
用于基因文库构建的受体细胞在大多数情况下选用大肠杆菌,因为其繁殖迅速,易于保存,而且克隆操作方便,转化效率高。在某些情况下,如果为了使目的基因高效表达,也可选择相应的动植物细胞。
(4)DNA片段与载体连接
黏性末端连接效率要比平末端高,而定向连接则可以提高重组率。为了提高重组率,非定向连接载体的5′端通常脱磷酸以防止载体自身环化。
(5)初库的扩增
将上述DNA片段和载体构建的重组子转化到宿主细胞中,这样构建了基因文库的初库(primary bank)。初库经滴度(titer,即每μg载体获得的重组转化子的数目,一般为105~106为宜)测定符合筛选要求后,要经过扩增使拷贝数较少的DNA片段的克隆数增加,以提高筛选概率。经过扩增的初库形成终库。终库以噬菌体颗粒或转化细菌或酵母存放在-70℃的冰箱中保存备用,并定期扩增,以防含拷贝数较少的目的基因的重组转化子丢失。
基因组文库与cDNA文库的区别
cDNA文库与基因组文库相比的优越性表现在:(1)cDNA文库以mRNA为材料,特别适用于某些RNA病毒,例如流感病毒;因其不通过DNA中间体,所以研究其唯一的方法就是cDNA克隆;(2)cDNA基因文库的筛选比较简单易行;(3)由于每一个cDNA克隆都含有一种mRNA序列,这样在目的基因的选择中出现假阳性的概率比较低,而相比之下基因组文库克隆的选择较复杂,假阳性的概率就高;(4)cDNA克隆可用于在细菌中能进行表达的基因克隆,直接应用于基因工程操作。原因是:高等真核生物与原核生物在结构组成上的最大区别是前者含有内含子间隔序列,而后者没有。通过基因文库中筛选的目的基因难以在原核生物中表达。而cDNA是经过转录后得来的其内含子部分已被删除;(5)cDNA克隆还可以用于真核细胞mRNA的结构和功能的研究种特异的mRNA在细胞中往往占很小的比例,难以直接研究其序列、结构和功能,一般是通过比较基因组进行确定。
cDNA文库与基因组文库相比的缺点为:(1)受材料来源的影响;(2)遗传信息量有限;①文库构建时的信息供体是某一时空条件下的细胞总mRNA,它是在转录水平上反映该植物在某一特定发育时期,某一特定组织(或器官)在某种环境条件下的基因表达情况,并不能包括该植物有机体的全部基因。在某种意义上讲它可以表现基因组的功能信息。②cDNA文库只反映mRNA的分子结构。cDNA中不含有真核基因的间隔序列及调控区,确切说cDNA并不是真正意义上的基因;(3)构建的cDNA文库中高丰度的(含量) mRNA含量比低丰度的易得和分离,其实现在构建的cDNA基本上是高丰度的而低丰度的很少。
克隆的鉴定方法
基因文库构建完成后就可以从中筛选目的基因了。常用的筛选方法有核酸杂交法和免疫学筛选法。将构建的基因文库的终库铺平板,形成含有不同外源DNA分子的重组转化子菌落或噬菌斑。用菌落或噬菌斑原位杂交可以筛选出含目的基因的阳性克隆。杂交所用的核酸探针来源于已获得的部分目的基因片段,或目的基因表达蛋白的部分氨基酸序列反推得到的一群寡聚核苷酸,或其他物种的同源基因。如果构建了表达型cDNA文库,可采用免疫学方法筛选目的基因。由于筛选技术、探针及抗体等方面的原因,筛选得到的克隆还有一部分是假阳性克隆,需要进一步采用限制酶酶切、PCR和测序方法验证。