一个外源基因DNA进入细胞的几率非常低,在新的细胞内不能进行复制和表达,原因主要是外源DNA不带有新细胞的复制系统,也不具备宿主的功能表达调控系统,因此最终外源DNA会随着细胞分裂而丢失。在基因克隆中,需要借助于一种运载工具,其携带外源基因进入宿主细胞,并使外源基因持续稳定地复制表达,这种工具我们称之为载体(vector)。
基因工程载体根据来源和性质不同可分为质粒载体、噬菌体载体、黏粒载体、噬菌粒载体、病毒载体、人工染色体等。载体的本质是DNA复制子。目前使用得最多的载体是经过改造的质粒载体或噬菌体载体。根据功能和用途不同,基因工程载体又可分为克隆载体、表达载体、测序载体、穿梭载体等。克隆质粒载体是指专用于基因或DNA片段无性繁殖的质粒载体,而表达质粒载体是指专用于在宿主细胞中高水平表达外源蛋白质的质粒载体。穿梭质粒载体(shuttle plasmid vector)是指一类由人工构建的具有两种不同复制起点和选择标记,因而可在两种不同的宿主细胞中存活和复制的质粒载体。由于这类质粒载体可以携带着外源DNA序列在不同物种的细胞之间,特别是在原核和真核细胞之间往返穿梭,因此在基因工程研究工作中是十分有用的。常见的穿梭载体有大肠杆菌土壤农杆菌穿梭质粒载体、大肠杆菌枯草芽孢杆菌穿梭质粒载体、大肠杆菌酿酒酵母穿梭质粒载体等。根据受体细胞不同,基因工程载体又可分为原核生物载体、真核生物载体等。
作为基因工程的载体必须具备以下基本条件:①具有复制子,能在宿主细胞内进行独立和稳定的自我复制。②具有合适的限制性内切酶位点。在载体上每一种限制性核酸内切酶的酶切位点最好是单一的,这样可以将不同限制性核酸内切酶切割后的外源DNA片段准确地插入载体。③具有合适的选择标记基因。最常用的标记基因是抗药性基因,如抗氨苄青霉素、抗四环素、抗氯霉素、抗卡那霉素等抗生素的抗性基因。④具有较多的拷贝数,易与宿主细胞的染色体DNA分开,便于分离提纯。⑤具有较小的相对分子质量,易于操作。⑥具有较高的遗传稳定性。
3.1质粒载体
在自然界中,质粒分布广泛,无论是真核生物细胞还是原核生物细胞,都已经发现质粒的存在,它非常适合作为外源基因的载体在相应的宿主细胞中复制、表达,是基因克隆操作中非常重要的工具。
3.1.1质粒的基本特性
1.分子特性
质粒是染色体外能自我复制的小型DNA分子。它广泛存在于细菌细胞中,也存在于霉菌、蓝藻、酵母和少数动植物细胞中,甚至线粒体中都发现有质粒的存在。质粒的大小从1kb到200kb 以上不等。绝大多数质粒都是双链闭合环状DNA分子。除了酵母的杀伤质粒(killer plasmid)是一种RNA分子外,其他质粒都是DNA分子。
质粒DNA分子具有3种不同的构型:①共价闭合环状DNA(covalently closed circle DNA,cccDNA),其两条多核苷酸链均保持着完整的环状结构,这样的DNA通常呈超螺旋构型,即SCDNA。②开环DNA(open circle DNA,ocDNA),其两条多核苷酸链只有一条保持着完整的环状结构,另一条链出现一至数个切口,此即OC 构型。③线形DNA(liner DNA,LDNA),闭合环状DNA分子双链断裂成为线形DNA分子,此即L 构型。在体内,质粒DNA是以负超螺旋构型存在的。在琼脂糖凝胶电泳中,走在最前沿的是SCDNA,其后依次是LDNA和OCDNA。
2.复制特性
根据质粒DNA复制与宿主之间的关系或质粒在宿主细胞中拷贝数的多少,可将质粒分成两种不同的复制类型:严紧型和松弛型。严紧型质粒的复制受宿主染色体DNA复制的严格控制,两者紧密相关,因此,质粒在宿主细胞中拷贝数较少,一般只有1~3个拷贝。松弛型质粒的复制受宿主的控制比较松,在宿主细胞中质粒拷贝数较多,一般有10~200个拷贝,有时可达700个拷贝。因此,通常选用松弛型质粒作为基因工程载体,以期获得高产量的重组质粒。
3.质粒的不亲和性
在没有选择压力的情况下,两种不同质粒不能够在同一个宿主细胞系中稳定地共存的现象,称为质粒的不亲和性。原因可能是在细胞的增殖过程中,其中必有一种会被逐渐稀释、排斥掉。质粒的不亲和性只有在确实证明第二种质粒B 已经进入含有第一种质粒A 的宿主细胞,在没有选择压的情况下,这两种质粒不能长期稳定共存,在这种情况下认为A 和B 是不亲和性质粒。
彼此不相容的质粒属于同一个不亲和群(incompatibility group)。ColE1质粒和pMB1质粒及其派生质粒都是彼此不相容的,属于同一个不亲和群。pSC101、F 和RP4质粒,它们归属于不同的不亲和群,所以这些质粒或其派生的质粒载体,彼此能够在同一个细胞中稳定地共存。
4.质粒的转移性
质粒的转移性是指质粒从一个细胞转移到另一个细胞的特性。根据质粒是否携带控制细菌配对和质粒接合转移的基因,可将其分为接合型(conjugative)与非接合型(nonconjugative)两种。接合型质粒又叫自我转移质粒,如F 因子,其相对分子质量一般都较大,除了携带自主复制所必需的遗传信息之外,还带有一套控制细菌配对和质粒接合转移的基因,因此能从一个细胞自我转移到另一个细胞中,它们多属于严紧型质粒。非接合型质粒又叫不能自我转移质粒,如ColE1,其相对分子质量较小,虽然携带自主复制所必需的遗传信息,但不携带控制细菌配对和质粒接合转移的基因,因此不能从一个细胞自我转移到另一个细胞中。
从安全角度考虑,基因工程中所用的主要是非接合型质粒,这是因为接合型质粒不仅能够从一个细胞转移到另一细胞,而且还能够转移染色体。如果接合型质粒已经整合到细菌染色体的结构上,就会牵动染色体发生高频率的转移。在基因工程中所用的非接合型质粒载体缺乏转移所必需的mob 基因,因此不能发生自我迁移。
3.1.2质粒载体的必备条件
一般没有经过体外修饰改造的质粒称为天然质粒。常见可用于基因工程的天然质粒载体有pSC101、ColE1等。直接采用天然质粒用做载体存在一些缺陷,因此限制了它在基因工程中的使用。最早用于基因克隆的天然质粒是pSC101,其大小为9.09kb,是一个严紧型质粒。
每个宿主细胞中仅有1~2个拷贝,具有多个限制性核酸内切酶的单一酶切位点,但pSC101只有一个选择性标记Tetr,不能使用插入失活技术筛选重组子。此外,pSC101的相对分子质量较大,克隆外源DNA的能力有限,拷贝数低,使得分离提取质粒DNA的工作难度大。
另一个天然质粒载体是ColE1,它的唯一单酶切位点EcoR Ⅰ位于大肠杆菌素E1的编码基因内,插入外源基因后,引起插入失活,不能合成大肠杆菌素E1,因此可以根据对大肠杆菌素E1的免疫性选择重组子。但ColE1的克隆位点有限,并且大肠杆菌素E1的免疫筛选,在实际应用上比较麻烦。
一种理想的质粒载体一般应具备以下条件:①具有较小的相对分子质量和较高的拷贝数;②具有多个单一的限制性核酸内切酶的酶切位点。基因工程中所使用的载体一般有一个多克隆位点(multiple cloning site,MCS)。所谓多克隆位点(或称多接头),是指载体上人工合成的含有紧密排列的多种限制性核酸内切酶的酶切位点的DNA片段。它提供了各种各样可单独或联合使用的克隆靶位点,以便克隆由多种限制性核酸内切酶中任意一种或几种酶切割后产生的DNA片段。③具有两种以上的选择标记基因。④具有安全性。缺失mob 基因后质粒就不会从一个细胞转移到另一个细胞中,减少了基因工程体扩散的危险性。
3.1.3常用的质粒载体类型
目前常用的克隆质粒载体有pBR322、pUC 及其派生质粒载体。pBR322质粒及其派生质粒具有较小的相对分子质量,可以克隆大到6kb 的外源DNA片段,具有两种选择标记,可利用氨苄青霉素和四环素来筛选重组体,具有多种限制性核酸内切酶的单一酶切位点,其中H ind Ⅲ、BamHⅠ、Sal Ⅰ、EcoR Ⅴ、Sp h Ⅰ的酶切位点位于Tetr中,Pst Ⅰ的酶切位点位于A mpr中,在这些位点克隆外源基因可利用插入失活法筛选重组体。在宿主细胞内具有较高的拷贝数,而且经过氯霉素处理扩增后,每个细胞中可积累1000~3000个拷贝。
pUC系列的质粒载体通常是成对构建的,如pUC18/pUC19,两者的差别仅在于多克隆位点的方向相反。pUC系列的质粒载体除含有克隆载体的一般元件以外,还包括大肠杆菌乳糖操纵子的β半乳糖苷酶基因(lacZ)的启动子和β半乳糖苷酶氨基端头146个氨基酸片段的编码序列,此结构特称为lacZ′基因,表达产生α肽;当无外源基因片段插入时,质粒表达的α肽可与宿主菌上表达的β半乳糖苷酶的C 端片段融为一体,形成具有酶学活性的β半乳糖苷酶,产生lacZ+表型,实现了基因内互补,这种互补现象叫做α互补。
具有酶学活性的β半乳糖苷酶在诱导物异丙基βD 硫代半乳糖苷(IPTG)存在时,可以将生色底物5溴4氯3吲哚βD半乳糖苷(X gal)分解,形成蓝色产物,在平板上形成蓝色的菌落。当多克隆位点中插入外源DNA片段时,α互补作用遭到破坏,在含有IPTG和X gal的平板上将出现白色菌落。这种方法又称α筛选。当然,当插入的DNA片段较小,不破坏α肽的读码框时,重组子菌落可表现出浅蓝色。
在pBR322基础上构建的pUC 质粒载体,仅保留了氨苄青霉素抗性基因和复制起点,相对分子质量更小,如pUC8/pUC9为2750bp,pUC18/pUC19为2686bp,而且利用组织化学法筛选重组体,更方便省时。因此,pUC 系列质粒是目前最广泛使用的质粒载体。pUC18/19质粒载体。
pGEM系列质粒载体就是一类多功能载体,如pGEM3、pGEM4、pGEM3Z、pGEM4Z、pSP64、pSP65、pGEM 3Zf 等,都是由pUC 系列质粒载体派生而来的,含有T7及SP6RNA聚合酶的启动子及转录起始位点,它们分别位于lacZ′基因中多克隆位点的两侧,故在体外能转录出相应的mRNA。因为该质粒还具有Lac启动子调控区及α肽编码区,噬菌体F1的复制起始区以及正、反向序列分析引物的结合位点,所以能进行测序操作。
pBV221表达载体是我国科学家构建的胞内表达载体,其表达产物位于细胞质中。它利用λ噬菌体的PL、PR作为串联启动子,一个温度敏感的转录阻遏蛋白基因cI857位于其上游;在多克隆位点的下游区有一强转录终止序列rrnB;在多克隆位点与启动子之间有SD序列。
cI857阻遏蛋白是一个温度敏感的转录调控蛋白,在30℃时其与启动子紧密结合,阻止转录起始;当培养温度升到42℃时,阳遏蛋白失活并从启动子上解离,RNA聚合酶与启动子结合而起始转录,这种可诱导的启动子使得基因能高效表达。
pTA1529是分泌型表达载体,在启动子之后有一信号肽编码序列。外源基因插入到信号肽序列后的酶切位点,使外源基因的第一个密码子正好与信号肽最后一个密码子相接。外源基因连同信号肽基因一起转录,然后翻译成带有信号肽的外源蛋白。当蛋白质分泌到位于大肠杆菌细胞膜与细胞外壁之间的周质时,信号肽被信号肽酶所切割,得到成熟的外源蛋白。
pTA1529由大肠杆菌碱性磷酸酯酶基因启动子(PhoA)及其信号肽(由21个氨基酸组成)基因构建而成。在磷酸盐饥饿的状态下,外源蛋白得以表达并分泌到细胞周质中。大肠杆菌中常用介导分泌的信号肽除PhoA 的信号肽外,还有大肠杆菌外膜蛋白(Omp)类的信号肽等。
根据复制模式,可将酵母的质粒分成5种不同的类型:YIp、YRp、YCp、YEp和YLp。其中,除了线性质粒YLp之外,全能与大肠杆菌质粒构成穿梭载体。在动物体系中也已经发展出类似的穿梭质粒载体,最早是由大肠杆菌质粒载体和牛乳头状瘤病毒(bovine papillomavirus,BPV)构建而成的。例如,pBPV BV1就是一种典型的动物细胞系统穿梭质粒载体,它既可在大肠杆菌细胞中复制,亦可在动物细胞中复制。但是,目前还没有发展出适用的大肠杆菌植物细胞穿梭质粒载体。
3.2λ噬菌体载体
细菌质粒载体为基因克隆提供了方便,但是其克隆容量仅在10kb 左右,不能满足诸如构建基因组文库等的要求。因为需要找到一种克隆容量更大的载体,λ噬菌体载体便应运而生。