对于大片段文库而言,平均插入片段大小是衡量文库质量的一个重要依据。对BAC文库,-般要求植物的片段在130kb左右,而动物的片段在150kb左右。插入效率表示有插入片段的克隆在所检测的克隆中所占的比例,也是通过此法检测的。
基因组覆盖度是指文库中的克隆覆盖基因组的范围,即选择一定数目的单拷贝基因作探针来筛选文库,如果所有探针都可从文库中检测到阳性克隆,则说明该文库覆盖度很高。每个探针筛选的克隆数目即为该基因位点的覆盖倍数。此外,文库的质量检测还包括其他的特殊要求,如植物基因组BAC文库。-般还需要检测叶绿体DNA在文库中所占的比例,其方法主要是利用叶绿体特异DNA作探针筛选文库,要求叶绿体DNA在文库中所占的比例小于5%。
6.2cDNA文库的构建
由于真核生物基因组大,结构复杂,含有大量的非编码区、基因间间隔序列和重复序列等,直接利用基因组文库有时很难分离到目的基因片段。mRNA是基因转录加工后的产物,不含内含子和其他调控序列,结构相对简单,且只在特定的组织器官、发育时期表达。因此,在某些情况下从cDNA文库分离基因比从基因组文库中分离基因更具优势。将来自真核生物的mRNA体外反转录成cDNA、与载体连接并转化大肠杆菌的过程,称为cDNA文库的构建。
6.2.1cDNA文库的构建
cDNA文库的构建共分4步:
1.细胞总RNA的提取和mRNA分离
mRNA是构建cDNA文库的起始材料。总RNA中绝大多数是tRNA和rBNA。真核生物mRNA的3′末端都含有一段poly(A)尾巴,这是真核生物mRNA的一个重要特征。目前纯化mRNA的方法都是在固体支持物表面共价结合一段由脱氧胸腺嘧啶核苷组成的寡聚核苷酸[oligo(dT)]链,oligo(dT)与mRNA的poly(A)尾巴杂交,将mRNA固定在固体支持物表面,进而可将mRNA从其他组分中分离出来。由于oligo(dT)链和po1y(A)都不长,杂交可形成的杂合双链在高盐离子浓度下可以保持,在低盐离子浓度下或较高温度下就会分开,利用这一性质从RNA组分中分离纯化出mRNA。
2.第一链cDNA合成
由mRNA到cDNA的过程称为反转录,由反转录酶催化。反转录酶是依赖RNA的DNA聚合酶,合成DNA时需要引物引导。常用的引物主要有oligo(dT)引物和随机引物。
oligo(dT)引物一般包含15~30个脱氧胸腺嘧啶核苷和一段带有稀有酶切位点的寡核苷酸片段。随机引物引导的cDNA合成是采用6~10个随机碱基的寡核苷酸短片段来锚定mRNA并作为反转录的起点。由于随机引物可能在一条mRNA链上有多个结合位点,所以可从多个位点同时发生反转录,比较容易合成特长的mRNA分子的5′端序列。
3.第二链cDNA合成
cDNA第二链的合成就是将上一步形成的mRNA‐cDNA杂合双链变成互补双链cDNA的过程。cDNA第二链合成的方法大致有自身引导合成法和引物衔接头合成法等。
自身引导法合成cDNA第二链时,首先用氢氧化钠消化杂合双链中的mRNA链,解离的第一链cDNA的3′末端就会形成一个发夹环,由发夹环引导DNA聚合酶合成第二链,再利用S1核酸酶将单链结构切断形成平端结构。但由于S1核酸酶的操作很难控制,经常导致cDNA的大量损失,故现在已经不常使用。
引物衔接头合成法是由引导合成法改进而来的。第一链cDNA合成后直接采用末端转移酶(TdT)在第一链cDNA的3′端加上一段poly (dC)的尾巴,然后用一段带接头序列的po1y(dG)短核苷酸链作引物合成互补的cDNA链,接头序列可以是适用于PCR扩增的特异序列或方便克隆的酶切位点序列。这-方法已经发展成PCR法构建cDNA文库的常用方法。
4.双链cDNA克隆进质粒或噬菌体载体并导入宿主细胞中繁殖如果双链cDNA的两端有适宜的限制性内切酶切点,经酶切后插入并连接到载体DNA的切点内,形成重组DNA分子。但一般情况下,很少有这样的匹配关系。因此,可以在双链cDNA与载体连接之前,要经过同聚物加尾、加接头等一系列处理,其中添加带有限制性酶切位点接头是最常用的方法。
双链cDNA在连接之前最好经过cDNA分级分离,回收大于500bp 的cDNA用于连接。
在未处理的双链cDNA中,有很多小于500bp 的分子,包括引物、接头以及反转录产生的各种不完整的cDNA产物,这些组分都会影响cDNA文库的质量,如造成很多假阳性的重组子、重组子的插入片段太小。
所谓均一化cDNA文库(normalized cDNAlibravy),是指通过一定的策略和方法,将构建好的独立cDNA文库进行一定的处理,降低高丰度和中等丰度基因在cDNA文库中的比例,从而使高丰度、中等丰度和低丰度基因在文库中出现的频率相对一致。经过均一化处理的cDNA文库,在EST测序和cDNA芯片的研究中,不仅可以大幅度降低成本,而且可以相对提高一些极低丰度基因出现的频率。
6.3DNA文库的保存
文库保存的方法与所使用的载体和宿主相关,不同载体的文库保存方法不同,但长期保存的温度都必须在-80℃。
对于DNA文库而言,长期使用的文库一般要求不经过文库的扩增过程,因为由于插入序列的关系,不同的克隆其生长速度会有差异,如果对文库进行扩增,在扩增过程中,那些生长快的克隆在文库中占有的比重加大,而生长速度慢的克隆在文库中所占的比重就会降低。
对于噬菌体基因文库,一般在筛选之前对文库进行一定的扩增和保存,从而达到多次利用的目的。以噬菌体或其衍生载体构建的DNA文库的保存方法非常简单,一般收集噬菌体液分装成小份,加入2%~3%的氯仿可在4℃下保存数月,添加7%的二甲基亚矾(DMSO)可在-80℃下保存数年。
文库阵列法(1ibrary arraying)保存大片段DNA文库是利用聚乙烯材料制作的无菌培养板来保存文库克隆。用手工或机器人将重组克隆挑至含抗冻液和抗生素的液体培养基的384孔或96孔板过夜培养。待培养液浑浊后,用384针或96针复制器制备多个拷贝,按编号保存于-80℃超低温冰箱。
由于文库反复冻融会影响细菌的活性,一般文库的原始拷贝留在超低温冰箱内不让其发生冻融,只取一个拷贝用于后续的操作,包括制备高密度点阵膜和质粒的抽提等,而且该拷贝使用一段时间后需淘汰,重新以上一拷贝为模板制作新的拷贝使用,这样可以将文库保存很长时间。
本章小结
基因文库可分为基因组文库和cDNA文库。根据构建基因组文库所用的载体不同,可将基因组文库分为质粒文库、噬菌体文库、黏粒文库、人工染色体文库等。
基因组DNA文库的构建包括:①细胞染色体大分子DNA的提取和部分酶切;②载体DNA的制备;③载体和外源DNA的连接转化或包装侵染;④文库的质量检测等过程。
cDNA文库的构建包括:①细胞总RNA的提取和mRNA分离;②第一链cDNA合成;③第二链cDNA合成;④双链cDNA克隆进质粒或噬菌体载体,并导入宿主细胞中繁殖等过程。
文库保存的方法与所使用的载体和宿主相关,不同载体的文库保存方法不同,但长期保存的温度都必须在-80℃。
思考题
1.基因组DNA文库有哪些类型? 其相关的特点是什么?
2.构建大片段基因组文库过程中需要注意哪些问题?
3.如何构建cDNA文库?
(叶子弘、邹克琴)