由于研究对象和研究目的的不同,目的基因可以来自原核细胞,也可以来自真核细胞。原核细胞基因组相对简单,较易获得目的基因;而真核细胞基因组庞大复杂,获得目的基因相对较困难。获得目的基因的方法很多,主要有人工化学合成法、逆转录制备cDNA、构建基因组文库或构建cDNA文库、PCR扩增基因等。本章主要讲述通过构建基因组文库或构建cDNA文库克隆目的基因。
6.1基因组DNA文库的构建
基因文库(gene library 或gene bank)是指某一生物体全部或部分基因的集合。人们可以通过基因文库的构建贮存和扩增特定生物基因组的全部或部分片段,同时又能够在需要时从基因文库中调出其中的任何DNA片段或目的基因。
基因文库可分为基因组文库和cDNA文库。基因组文库是指将某生物体的全部基因组DNA用限制性内切酶或机械力量切割成一定长度范围的DNA片段,再与合适的载体在体外重组并转化相应的宿主细胞获得的所有阳性菌落。而cDNA文库是将生物某一组织细胞中的总mRNA分离出来作为模板,在体外用反转录酶合成互补双链的cDNA,然后连接到合适的载体上,转入宿主细胞后形成的所有克隆。cDNA文库反映了特定组织(或器官)在某种特定环境条件下基因的表达谱,对研究基因的表达、调控及基因间互作是非常有用的。而基因组文库包含了基因的全部信息,如编码区及非编码区、内含子和外显子、启动子及其所包含的调控序列等。
构建基因文库所使用的载体主要有λ噬菌体、黏粒、质粒和酵母人工染色体。根据构建基因组文库所用的载体不同,可将基因组文库分为质粒文库、噬菌体文库、黏粒文库、人工染色体文库等。利用λ噬菌体为载体构建的文库形成的是在细菌培养平板上的一系列噬菌斑,每个噬菌斑含有特定DNA插入序列。利用黏粒和质粒为载体时,形成的是许多菌落,每个菌落包含一种插入有特定DNA序列的黏粒或质粒。酵母人工染色体是为构建高等真核生物基因文库而设计的。
6.1.1基因组文库的完备性
基因文库完备性是指从基因文库中筛选出含有某一目的基因的重组克隆的概率。从理论上讲,如果生物体的染色体DNA片段被全部克隆,并且所有用于构建基因文库的DNA片段均含有完整的基因,那么这个基因文库的完备性为100%。但在实际操作过程中,上述两个前提条件往往不可能同时满足,因此任何一个基因文库的完备性只能最大限度地趋近于100%,但不可能达到100%。尽可能高的完备性是基因文库构建质量的一个重要指标,它与基因文库中重组克隆数、重组子中DNA插入片段的长度以及生物单倍体基因组的大小等参数的关系可用Clarke‐Carbon 公式描述:
N=ln(1-P)/ln(1-f)
式中:N ——代表一个基因组文库所应该包含的重组克降个数;
P ——表示所期望的目的基因在文库中出现的概率;
f ——表示重组克隆平均插入片段的长度和基因组DNA总长的比值。
由上述公式可以看出,某一基因文库所含有的重组克隆越多,其完备性就越高,当完备性一定时,载体的装载量或允许克隆的DNA片段越大,所需的重组克隆越少。以大肠杆菌为例,其基因组大小约为4.6Mb,若P=99%,平均插入片段大小为20kb时,f=20kb/4600kb,则N=1057,即期望从一个平均插入片段为20kb 的大肠杆菌基因组文库中筛选到任意一个感兴趣的基因的概率达到99%,该基因组文库至少应包含1057个重组克隆。人类基因组核苷酸总长度为3×109bp,如果以同样要求来构建一个基因组文库,则需要克隆数N =6.9×105。
除了尽可能高的完备性外,一个理想的基因文库还应具备以下条件:①重组克隆的总数不宜过大,以减轻筛选工作的压力;②载体的装载量必须大于绝大多数基因的长度,以免基因被分隔在不同的克隆中;③含有相邻DNA片段的重组克隆之间,必须具有部分序列的重叠,以利于基因文库各克隆的排序;④克隆片段易于从载体分子上完整卸下且最好不带有任何载体序列;⑤重组克隆应能稳定保存、扩增及筛选。上述条件的满足极大程度上依赖于基因文库的构建策略。
在文库构建过程中通常采用以下两个策略来提高文库的完备性:一是采用部分酶切或随机切割的方法来打断染色体DNA,以保证克隆的随机性,保证每段基因组DNA在文库中出现的频率均等;二是增加文库的总容量,也就是重组克隆的数量,以提高覆盖基因组的倍数。
文库总容量由外源片段的平均长度和重组克隆的数量共同决定,外源片段的长度受所选用的载体系统限制。因此,选择合适的载体系统和挑取一定数量的阳性克降是构建基因组DNA文库时首先要考虑的问题。
6.1.2基因组DNA文库的构建
1.细胞染色体大分子DNA的提取和部分酶切
一般来说,提取的基因组DNA相对分子质量越大,所得到的重组克降的插入片段越大。
真核生物基因组DNA常规的提取方法如CTAB法可以提取100kb左右的DNA,基本可以满足构建各种小插入片段基因组文库的要求。
大相对分子质量基因组DNA提取方法很复杂,一般都利用了低熔点琼脂糖包埋固定的方法。将细胞固定在低熔点琼脂糖凝胶中,并浸泡在含有EDTA 的缓冲液中。在这种包埋状态下对细胞进行破壁、去除蛋白和杂质、清洗,之后进行酶切反应。大分子DNA提取有2个主要步骤:第一是将提供的材料制备成单个细胞的悬浮液;第二是将DNA包埋并且纯化出基因组DNA。
大分子DNA酶切后要经过分级分离,大片段基因组DNA文库主要是通过PFGE 法回收对应大小片段的DNA,小片段基因组DNA文库则常用蔗糖密度梯度离心法回收酶切的DNA。
2.载体DNA的制备
载体制备的好坏是影响文库成功与否的关键,制备的载体要求纯度高、去磷酸化效果好。
首先,载体去磷酸化是为了提高连接效率,在同一个连接组分中,载体自身连接速度远大于与外源片段的连接速度。如果载体去磷酸化不彻底,会出现大量不含外源片段的克隆,严重影响文库的质量。如果载体纯度不高,含有大量细菌基因组DNA,则会出现大量的插入片段为细菌基因组DNA的假阳性菌落,也影响文库的质量。如果使用取代型的噬菌体载体,要进行双链的制备,即除去λ基因组中央的非必需区段。
3.载体和外源DNA的连接转化或包装侵染
连接反应是将部分酶切后回收的DNA与载体在T4DNA连接酶的作用下连接在-起的过程。在连接体系中要注意载体和外源基因组DNA片段的分子数量比。在构建大片段基因组DNA文库时,大量连接前都要先使用小体系连接来寻找最适的比例。在转化和包装侵染过程中,最好选择转化效率高的感受态细胞和最佳的转化条件或效价高且质量稳定的包装蛋白。
4.文库的质量检测
文库质量是由文库所含克隆的数目、平均插入片段的长度、插入效率、基出组覆盖度和覆盖倍数等因素决定的。克隆数越多,平均插入片段越长,插入效率和基因组覆盖度越高,文库质量就越好。在文库的质量检测中,除了克隆子数目是确定的,其他值都是估算的。