第1章厨房春潮的羞耻,亚洲欧美制服另类国产,丁香色欲久久久久久a片,乳房头被老嘴咬了肿了怎么办

當(dāng)前位置: 首頁 > CAS號數(shù)據(jù)庫 > 7240-90-6 > 7240-90-6/在大腸桿菌中高效表達外源蛋白的全攻略

手機掃碼訪問本站

微信咨詢

7240-90-6/在大腸桿菌中高效表達外源蛋白的全攻略

本世紀60至70年代對大腸桿菌的研究使之成為自然界中最普遍為人們所認識的生物體。大腸桿菌具有兩個顯著特征:操作簡單和能在廉價的培養(yǎng)基中高密度培養(yǎng),它的這些特征加上十多年外源基因表達的經(jīng)驗使其在大多數(shù)科研應(yīng)用中成為高效表達異源蛋白最常用的原核表達系統(tǒng)。盡管大腸桿菌有眾多的優(yōu)點,但并非每一種基因都能在其中有效表達。這歸因于每種基因都有其獨特的結(jié)構(gòu)、mRNA的穩(wěn)定性和翻譯效率、蛋白質(zhì)折疊的難易程度、宿主細胞蛋白酶對蛋白質(zhì)的降解、外源基因和E.coli 在密碼子利用上的主要差別以及蛋白質(zhì)對宿主的潛在毒性等等。但知識的大量積累還是有助于為表達方面某些特定的困難提供一般的解決方法。

大腸桿菌作為表達系統(tǒng)的主要障礙包括:不能象真核蛋白那樣進行翻譯后修飾、缺乏將蛋白質(zhì)有效釋放到培養(yǎng)基中的分泌機制和充分形成二硫鍵的能力。另一方面,許多真核蛋白在非糖基化的形式下能保留其生物學(xué)活性,因而也就可以用大腸桿菌來表達。如何實現(xiàn)外源基因在原核細胞中的有效表達,自60年代以來,對影響外源基因在其表達體系中表達效率的各個因素作了大量實驗研究,并有多篇歸納性綜述發(fā)表[1,2,3]。國內(nèi)針對外源基因在原核細胞中高效表達的關(guān)鍵因素,構(gòu)建了高效表達載體[4],并在此基礎(chǔ)上成功表達了一系列細胞因子的基因[5,6,7]。我們在分析了國內(nèi)外有關(guān)在原核系統(tǒng)中表達蛋白的實驗資料的基礎(chǔ)上,對在大腸桿菌中高效表達外源蛋白的策略所涉及的內(nèi)容進行全面的總結(jié),以期有助于我國在這方面的研究。

1.有效表達載體的構(gòu)型

構(gòu)建表達質(zhì)粒需要多種元件,需要仔細考慮它們的組合,以保證最高水平的蛋白質(zhì)合成 。E.coli 表達載體的基本結(jié)構(gòu)[8]。

在大腸桿菌中高效表達外源蛋白的全攻略

啟動子(以雜和的tac 啟動子為例)位于核糖體結(jié)合位點(RBS)上游10-100bp處,由調(diào)節(jié)基因(R)控制,調(diào)節(jié)基因可以是載體自身攜帶,也可以整合到宿主染色體 上。E.coli 的啟動子由位于轉(zhuǎn)錄起始位點上游約35bp的六核苷酸序列(-35區(qū))和一短序列隔開的另一六核苷酸序列(-10區(qū))組成[9,10,11]。有許多啟動子可用于在E.coli中的基因表達,包括來源于革蘭氏陽性菌和噬菌體的啟動子。理想的啟動子具有以下特性:作用強;可以嚴格調(diào)控;容易轉(zhuǎn)導(dǎo)入其他E.coli 以便篩選大量的用于生產(chǎn)蛋白的菌株,而且對其誘導(dǎo)是簡便和廉價的[12]。在啟動子下游是RBS,其跨度約為54個核苷酸,兩端限定在 -35(±2)和mRNA編碼序列的+19到+22之間[13]。Shine-Dalgarno(SD)位點[14,15]在翻譯起始階段與16S rRNA的3’端相互作用[16]。SD與起始密碼子間的距離約為5-13bp[17],而且此區(qū)的序列在mRNA轉(zhuǎn)錄物中應(yīng)避免出現(xiàn)二級結(jié)構(gòu),否則將會降低翻譯起始的效率[18]。在RBS的5’和3’端均為A豐富區(qū)[19]。轉(zhuǎn)錄終止子位于編碼序列的下游,作為轉(zhuǎn)錄終止的信號[20]和組成發(fā)卡結(jié)構(gòu)的保護性元件,阻止核酸外切酶對mRNA的降解,從而延長mRNA的半衰期[21]。

除了上述對基因表達的效率有直接影響的元件以外,載體還含有抗生素抗性基因,以方便質(zhì)粒的篩選和傳代。氨芐青霉素是最常用的抗性標記。但在生產(chǎn)人用治療性蛋白時,最好選擇其他抗性標記(如Tet)以避免可能發(fā)生的過敏反應(yīng)[22]。質(zhì)粒的拷貝數(shù)由復(fù)制起點決定。在特殊情況下,選用失控復(fù)制子能夠獲得大量的質(zhì)??截悢?shù)和較高產(chǎn)量的質(zhì)粒編碼蛋白[23,24]。但在另外一些情況下,選用超過pBR322的高拷貝質(zhì)粒似乎并沒有好處。而且已有資料表明,增加質(zhì)粒的拷貝數(shù)降低E.coli中胰酶的產(chǎn)量,在高拷貝質(zhì)粒中,強啟動子的存在嚴重影響了細胞的活性[25,26]。

轉(zhuǎn)錄水平調(diào)控

1.啟動子

能在E.coli中發(fā)揮作用的啟動子很多。這些啟動子必須具有適合高水平蛋白質(zhì)合成的某些特性。首先啟動子的作用要強,待表達基因的產(chǎn)物要占或超過菌體總蛋白的的10-30%;第二,它必須表現(xiàn)最低水平的基礎(chǔ)轉(zhuǎn)錄活性。若要求大量的基因表達,最好選用高密度培養(yǎng)細胞和表現(xiàn)最低活性的可誘導(dǎo)和非抑制啟動子。如果所表達的蛋白具有毒性或限制宿主細胞的生長,選用可抑制的啟動子則至關(guān)重要[27,28]。例如,輪狀病毒的VP7蛋白能有效地殺死細胞,因此必須在嚴格控制的條件下表達[29]。但在某些情況下,啟動子的嚴格性并不合理,因為即使最小量的基因產(chǎn)物也能由于其毒性而殺死細胞。如能滅活核糖體或破壞膜滲透壓的分子對細胞來說是致死性的[30]。對宿主的毒性并不僅限于外源基因,某種自身蛋白的過量表達也能造成同樣的結(jié)果。如編碼外膜磷脂蛋白的traT基因[31]。另外,不完全抑制的表達系統(tǒng)會造成質(zhì)粒的不穩(wěn)定,細胞生長速度的下降和重組蛋白產(chǎn)量的降低[32,33]。Lanzer和Bujard曾對常用的lac啟動子-操縱子系統(tǒng)進行了廣泛的研究,證明操縱子放在啟動子序列的不同位置會造成70倍差異的抑制。將17bp的操縱子置于-10和-35六聚體區(qū)之間所形成的抑制比將其放在-35區(qū)的上游或-10區(qū)的下游要高50-70倍[34]。啟動子的第三個特性是其簡便和廉價的可誘導(dǎo)性。大量生產(chǎn)蛋白質(zhì)最常用的啟動子是熱誘導(dǎo)(λPL)和化學(xué)誘導(dǎo)(trp)啟動子。異丙基硫代-β-D-半乳糖苷(IPTG)誘導(dǎo)的雜交啟動子tac[35]或trc[36]都是強啟動子,在基礎(chǔ)研究中應(yīng)用很廣。但在大量生產(chǎn)人用治療性蛋白時用IPTG做誘導(dǎo)劑是不可取的,因為IPTG具有毒性而且價格昂貴[37]。IPTG的這些不足至今仍限制tac或trc強啟動子在大量生產(chǎn)人用治療性蛋白中的應(yīng)用。編碼熱敏lac阻遏蛋白[38]的突變lacI(Ts)基因的出現(xiàn)使得目前能夠?qū)@些啟動子進行熱誘導(dǎo)[39,40]。另外,還出現(xiàn)了一些新型載體,它們允許在30℃對trc啟動子進行嚴緊調(diào)節(jié)。最近還報道了兩種不同的lac阻遏蛋白突變體,能夠同時允許熱誘導(dǎo)和IPTG誘導(dǎo)[41,42]。盡管野生型lacI基因也能熱誘導(dǎo),但不能對其進行嚴緊型調(diào)節(jié),且不能用于lacIq 菌株,因為溫度的變化不能遏制由lac阻遏蛋白的過量表達所造成的嚴緊性抑制[43]。因此,該系統(tǒng)只能用用于生產(chǎn)對宿主菌無害的一些蛋白。

冷反應(yīng)啟動子盡管不象其他啟動子那樣得到廣泛的研究,但已經(jīng)被證明能在低溫條件下進行有效的基因表達。噬菌體λPL啟動子的活性在20℃時最高,隨著溫度的升高,其活性逐漸降低[44]。PL啟動子的冷反應(yīng)由E.coli整合宿主因子,一種與DNA結(jié)合的序列特異性多功能蛋白來正調(diào)控[45,46]。主要冷應(yīng)激基因cspA啟動子同樣也被證明在低溫具有活性[47]。對cspA和PL啟動子進行分子剖析,鑒定了在較低溫度下參與增強轉(zhuǎn)錄的特異性DNA區(qū)域。從而開發(fā)了一系列在20℃低溫具有高活性的PL衍生啟動子[48]。選用冷反應(yīng)啟動子的基本原理是在15-20℃的條件下,蛋白質(zhì)的折疊速度只受到輕微的影響,而作為生物化學(xué)反應(yīng),轉(zhuǎn)錄和翻譯的速度將被充分降低。這就為蛋白質(zhì)折疊、產(chǎn)生有活性的蛋白和避免非活性蛋白聚合體即包涵體的形成提供了充足的時間,而目的蛋白的最終產(chǎn)量并未減少。最近新報道的一些啟動子具有諸多誘人之處,為選擇新的高效表達系統(tǒng)提供了方便。如非常強的pH啟動子[49,50],重組蛋白的產(chǎn)量可達總蛋白的40-50%[51]。但表達的水平會因不同的基因而有差異。因為蛋白質(zhì)的合成不僅依賴于啟動子的強弱,而且有賴于轉(zhuǎn)錄的效率。

人們通常只考慮E.coli啟動子的核心區(qū)域,即-10和-35六核苷酸區(qū)和一15-19bp的間隔序列。但有人提出核心序列以外的元件也能刺激啟動子的活性[52]。許多研究也已證明,核心啟動子上游的序列能夠在體內(nèi)提高轉(zhuǎn)錄起始的效率[53,54,55]。Gourse等證明,位于E.coli rRNA啟動子rrnB P1 -35區(qū)上游的DNA序列即UP元件,能夠在體內(nèi)和體外提高轉(zhuǎn)錄效率30倍[56]。UP元件是作為一個獨立的啟動子組件發(fā)揮作用的,因為將其融合到其他啟動子如lacUV5中也能刺激轉(zhuǎn)錄[57,58]。UP元件與其他啟動子融合所表現(xiàn)的這種轉(zhuǎn)錄增強子效應(yīng),使其有望通用于高效表達系統(tǒng)。盡管已經(jīng)證明rRNA啟動子P1、P2的超強能力[59],但它們?nèi)晕幢挥糜贓.coli進行高水平表達,其主要原因是難以對其進行調(diào)控。rRNA的體內(nèi)合成從屬于細胞增殖速度的控制。在細胞快速增殖期,P1和P2是活化的,當(dāng)細胞處于生長的靜息期,則P1、P2被負調(diào)節(jié)。因此,rRNA啟動子在前誘導(dǎo)期將持續(xù)活化。在體內(nèi)快速增殖的細胞中,P2的活性很弱,而且可誘導(dǎo)性差,但若與P1分開,P2啟動子的活性明顯升高(達到P1的70%),且對應(yīng)激反應(yīng)敏感。這表明在天然的串聯(lián)體中,P2是部分關(guān)閉的[60]。Brosius和Holy[61]將lac操縱子序列插入到rrnB rRNA P2啟動子的下游,在帶有l(wèi)acIq基因的菌株中成功地抑制了P2的活性。轉(zhuǎn)錄活性是以氯霉素乙酰轉(zhuǎn)移酶的產(chǎn)生和4.5s RNA的表達為標準的。然而,P2構(gòu)建體的活性只相當(dāng)于tac啟動子活性的1/2,而且當(dāng)rrnB P1啟動子被置于P2啟動子下游時,不能完全抑制轉(zhuǎn)錄。有人試圖利用反轉(zhuǎn)啟動子的方向來嚴格調(diào)控rRNA啟動子。將rRNA啟動子克隆于目的基因的上游,但轉(zhuǎn)錄方向相反。利用λ整合位點和可調(diào)控的λ整合酶來實現(xiàn)啟動子的反轉(zhuǎn),從而達到進行誘導(dǎo)的目的,而且,在高度活化的啟動子上游有一強轉(zhuǎn)錄終止子將避免在前誘導(dǎo)期可能出現(xiàn)的載體的不穩(wěn)定性。

2.轉(zhuǎn)錄終止子

在原核生物中,轉(zhuǎn)錄終止有兩種不同的機制。一種是依賴六聚體蛋白rho的rho依賴性轉(zhuǎn)錄終止,rho蛋白能使新生RNA轉(zhuǎn)錄本從模板解離。另一種是rho非依賴性轉(zhuǎn)錄終止,它特異性依賴于模板上編碼的信號,即在新生RNA中形成發(fā)卡結(jié)構(gòu)的一回文序列區(qū),和位于該回文序列下游4-9bp處的dA、dT富含區(qū)[62,63]。雖然轉(zhuǎn)錄終止子在表達質(zhì)粒的構(gòu)建過程中常被忽略,但有效的轉(zhuǎn)錄終止子是表達載體必不可少的元件,因為它們具有極其重要的作用。貫穿啟動子的轉(zhuǎn)錄將抑制啟動子的功能,造成所謂的啟動子封堵[64]。這種效應(yīng)可以通過在編碼序列下游的適當(dāng)位置放置一轉(zhuǎn)錄終止子,阻止轉(zhuǎn)錄貫穿別的啟動子來避免。同樣地,在啟動目的基因的啟動子上游放置一轉(zhuǎn)錄終止子,將最大限度地減小背景轉(zhuǎn)錄[65]。另有資料證明,由強啟動子啟動的轉(zhuǎn)錄會使轉(zhuǎn)錄通讀到復(fù)制區(qū),造成控制質(zhì)??截悢?shù)的ROP蛋白的過量表達,從而導(dǎo)致質(zhì)粒的不穩(wěn)定[66]。另外,轉(zhuǎn)錄終止增強mRNA的穩(wěn)定性[67],從而提高蛋白質(zhì)的表達水平。如果來源于E.coli rrB rRNA操縱子的兩個轉(zhuǎn)錄終止子T1和T2串聯(lián),則效果更好[68]。但其他的許多轉(zhuǎn)錄終止子通常情況下都是十分有效的。

3.轉(zhuǎn)錄抗終止子

細菌中許多參與氨基酸生物合成的操縱子在其第一個結(jié)構(gòu)基因的5’端含有轉(zhuǎn)錄衰減子。衰減子由特定操縱子的氨基酸產(chǎn)物調(diào)節(jié)。這樣關(guān)聯(lián)的帶電荷tRNA的存在就會在核糖體剪切之后引導(dǎo)初始轉(zhuǎn)錄本中二級結(jié)構(gòu)的形成。如果沒有關(guān)聯(lián)的帶電荷tRNA,則會形成抗終止子結(jié)構(gòu),從而抑制終止子中發(fā)卡結(jié)構(gòu)的形成和轉(zhuǎn)錄的終止[69]??菇K止元件能使RNA 多聚酶越過核糖體RNA操縱子中的rho依賴性終止子即boxA[70,71]。轉(zhuǎn)錄抗終止是有一個極其復(fù)雜的過程,其中包含許多已知和未知因子。有關(guān)這方面的知識已有詳盡的綜述。在此我們主要討論抗終止元件在E.coli中表達外源基因的應(yīng)用。

在E.coli表達系統(tǒng)中作用比較強、應(yīng)用較廣的一個啟動子是噬菌體T7晚期啟動子[72,73]。該系統(tǒng)的活性依賴于提供T7 RNA多聚酶的轉(zhuǎn)錄單元。RNA多聚酶的嚴格阻遏對防止T7啟動子的滲漏是必需的。有許多用于調(diào)節(jié)T7多聚酶表達的途徑,但每一種方法都有其各自的缺陷。Merten等通過構(gòu)建一基于λPL調(diào)節(jié)的反轉(zhuǎn)衰減T7 RNA多聚酶表達盒闡明了這一問題??梢酝ㄟ^在啟動子和編碼T7多聚酶的基因之間插入三個串聯(lián)排列的轉(zhuǎn)錄終止子來削弱T7多聚酶的基礎(chǔ)表達水平。在誘導(dǎo)的情況下,噬菌體λ來源的nutL依賴的抗終止功能也可以協(xié)同來阻止轉(zhuǎn)錄終止[74]。來源于E.colirrnB rRNA操縱子的轉(zhuǎn)錄抗終止區(qū)已被用于某些表達載體如pSE420。該載體應(yīng)用trc啟動子[75]。其基本原理是使得轉(zhuǎn)錄通過重度二級結(jié)構(gòu)區(qū),從而減少宿主RNA 多聚酶引起的轉(zhuǎn)錄提前終止的可能性。但是rrnB抗終止子在這種情況下似乎并不十分有效。

4.嚴緊型調(diào)節(jié)表達系統(tǒng)

可嚴緊調(diào)節(jié)的啟動子的優(yōu)點使得我們能夠設(shè)計許多巧妙、可高度抑制的表達系統(tǒng)。這在表達那些產(chǎn)物對宿主的生長不利的基因時尤其有用。所用的策略包括“鋪平板”法[76];提高抑制基因和操縱基因的比例[77];用突變的噬菌體感染誘導(dǎo)[28 ];致弱高拷貝數(shù)載體上的啟動子活性[78];利用轉(zhuǎn)錄終止子和抗終止子[79];在拷貝數(shù)可控的質(zhì)粒中使用可誘導(dǎo)的啟動子[80];使用“交叉調(diào)節(jié)”系統(tǒng)[81];共轉(zhuǎn)導(dǎo)使用SP6 RNA多聚酶的質(zhì)粒[82];利用與克隆基因mRNA互補的反義RNA[31]。最后一個巧妙的方法是反轉(zhuǎn)啟動子:在啟動子兩側(cè)為兩個λ整合位點,啟動子的方向與基因的表達方向相反,而且只通過由λ整合酶介導(dǎo)的誘導(dǎo)位點特意性遺傳重組來完成反轉(zhuǎn)[83,84]。

上述這些系統(tǒng)也各有其優(yōu)缺點。即依賴固體培養(yǎng)基的方法不適用于大批量表達,高水平抑制系統(tǒng)常造成蛋白質(zhì)產(chǎn)量的下降[85],這就有必要優(yōu)化抑制基因和操縱基因的比例[86]。由λ噬菌體介導(dǎo)的誘導(dǎo)更增加了系統(tǒng)的復(fù)雜性,利用反轉(zhuǎn)啟動子迂回方法又引入了復(fù)雜的載體結(jié)構(gòu)。盡管這些表達系統(tǒng)大多數(shù)尚未用于蛋白質(zhì)的大規(guī)模、高產(chǎn)量生產(chǎn),但是它們?yōu)榛虮磉_提供了重要的工具。

翻譯水平的調(diào)控

1.mRNA翻譯起始

有關(guān)轉(zhuǎn)錄過程的大量知識使得能夠在不被附近核苷酸序列影響的情況下,在表達盒中使用原核啟動子[87]。對于決定蛋白質(zhì)合成的起始因素,雖然尚不能完全弄清楚,但目前已經(jīng)明白,mRNA轉(zhuǎn)錄本5’末端的獨特結(jié)構(gòu)是mRNA翻譯起始效率的最主要決定因素。至今還沒有發(fā)現(xiàn)通用的有效起始翻譯的共同序列。已知序列的絕大部分(91%)E.coli基因的翻譯起始區(qū)均含有起始密碼子AUG,GUG的利用率為8%,而UUG的利用率則為1%[88,89]。Shine-Dalgarno(SD)位點在翻譯起始階段與16S rRNA的3’端相互作用。SD與起始密碼子間的距離約為5-13bp,這一距離影響翻譯起始的效率[90]。人們對此進行了深入的研究,以確定最佳的SD區(qū)序列和SD與起始密碼子之間的最有效間隔[91,92]。Ringquist等[93]研究了RBS的翻譯功能,得出了以下結(jié)論:(1)在間隔相同的情況下,UAAGGAGG的SD序列比AAGGA的SD序列能使蛋白質(zhì)的產(chǎn)量提高3­­-6倍;(2)對于同一SD序列,存在一最佳的間隔。AAGGA的間隔為5-7個核苷酸,而UAAGGAGG的間隔為4-8個核苷酸;(3)對于同一SD序列,有一翻譯所必需的最小間隔。AAGGA的最小間隔為5個核苷酸,而UAAGGAGG的最小間隔為3-4個核苷酸。這些間隔提示,在16S rRNA的3’末端和結(jié)合于核糖體P位點的fMet-tRNAf的反義密碼子之間存在精確的物理關(guān)系。

在mRNA的翻譯起始區(qū)的二級結(jié)構(gòu)在決定基因表達效率方面具有重要作用[94,95,96]。如用一發(fā)卡結(jié)構(gòu)封閉SD區(qū)和/或AUG密碼子就會阻止其與30S核糖體亞單位的結(jié)合,從而抑制翻譯[97]。已經(jīng)設(shè)計了幾種不同的策略以使mRNA形成二級結(jié)構(gòu)的可能性最小。提高RBS中A、T殘基的豐度能增強某些基因的表達[98]。同樣地,突變SD區(qū)上游或下游的某些特定核苷酸就會抑制mRNA二級結(jié)構(gòu)的形成和提高翻譯效率[99]。另一途徑得益于在E.coli中自然發(fā)生的一種翻譯偶聯(lián)現(xiàn)象[100]。翻譯偶聯(lián)的機制已被用來解釋來自多順反子mRNA的不同基因的并列表達。已經(jīng)證明,當(dāng)galK與上游基因偶聯(lián)翻譯時,經(jīng)修飾的gal強啟動子能夠指導(dǎo)半乳糖激酶的高水平合成。這提示即使很弱的RBS,如果與核糖體結(jié)合也能非常有效。這種調(diào)節(jié)機制有可能在蛋白質(zhì)超量生產(chǎn)生物技術(shù)中發(fā)揮重要作用。事實上,翻譯偶聯(lián)已經(jīng)被廣泛用于不同基因的高效表達。

除了SD區(qū)與16S rRNA結(jié)合之外,mRNA和核糖體的其他相互作用也參與翻譯的起始。如核糖體S1蛋白直接參與30S亞基對mRNA的識別和結(jié)合[101]。

2.翻譯增強子

已經(jīng)在細菌和噬菌體中鑒定了一些在E.coli中顯著增強異源基因表達的序列。Olins等從T7噬菌體基因10前導(dǎo)序列(g10-L)中鑒定了一9bp的序列,該序列似乎能替代有效的RBS。同SD共有序列相比,g10-L能使多種基因的表達水平提高40-340倍[102]。若將其置于合成SD序列的上游,按照β-半乳糖苷酶的活性與LacZ mRNA的水平來估計,g10-L序列能使 LacZ的翻譯水平提高110倍[103]。另外的研究小組在mRNA的5’非翻譯區(qū)(UTR)鑒定了一U富含序列,該序列同樣具有翻譯增強子活性。McCarthy等[104]在 E.coli atpE基因中緊接于SD位點下游鑒定一類似區(qū)域。有文獻用一30bp的序列超量產(chǎn)生IL-2和IFN-β[105]。另有人證明在編碼RNase D的rnd mRNA SD位點的上游,有一U8序列對該mRNA的有效翻譯是必需的。缺失這一區(qū)域會顯著降低翻譯,但不影響rnd mRNA的水平和轉(zhuǎn)錄起始位點[106]。研究證明這些類似序列的靶位是30S核糖體亞單位的S1蛋白[107]。在另一項有趣的研究中,研究者證明在緊接起始密碼子下游的序列在翻譯起始過程中發(fā)揮重要作用。位于T7基因0.3編碼區(qū)+15至+26之間或位于T7基因10編碼區(qū)+9至+21之間被稱做下游框(DB)的特定區(qū)域具有翻譯增強子的功能。DB區(qū)與16S rRNA的1469-1483核苷酸互補,這一區(qū)域稱做反下游框(ADB)。缺失DB將廢除翻譯活性。相反,如果優(yōu)化DB和ADB之間的互補則會以最高水平表達dhfr融合基因。有趣的是,如果將DB從起始密碼子的上游移到SD序列的位置,DB則失去功能。DB序列存在于一些E.coli和噬菌體基因中[108,109]。

上述這些發(fā)現(xiàn)充分證明,除了SD位點和起始密碼子以外,mRNA中的其他序列對于有效的翻譯也是重要的。盡管其精確的機制還不太清楚,但有可能利用翻譯增強子來達到超量表達蛋白質(zhì)的目的。

3.mRNA的穩(wěn)定性

mRNA的快速降解勢必影響蛋白質(zhì)的產(chǎn)生。因此在這一部分重點闡述決定mRNA穩(wěn)定性的因素,這將在E.coli高效表達外源基因中有實際應(yīng)用。在E.coli中有多種不同的RNase參與mRNA的降解,其中包括內(nèi)切核酸酶(RNase E,RNase K和RNase III)和3’外切核酸酶(RNase II和多聚核苷酸磷酸化酶[PNPase]),目前尚未在原核細胞中發(fā)現(xiàn)5’外切核酸酶[110]。mRNA的降解并非由非特異性的外切核酸酶隨機剪切而引起,因為在mRNA的長度和半衰期之間并沒有反向相關(guān)性[111]。已經(jīng)證明,在E.coli中有兩類保護性元件能夠穩(wěn)定mRNA。一類由mRNA的5’UTRs中的序列組成[112];另一類由3’UTRs和多順反子間區(qū)的發(fā)卡結(jié)構(gòu)組成[113]。其中一些元件與異源mRNA融合后起穩(wěn)定劑作用,但只在嚴格的條件下如此。例如,噬菌體T4基因32的5’UTR在T4噬菌體感染的細胞中延長非穩(wěn)定mRNA在E.coli中的半衰期[114]。革蘭氏陽性菌如金黃色葡萄球菌和枯草桿菌的紅霉素抗性基因(erm)編碼的mRNA 5’UTR含有穩(wěn)定元件。但ermC和ermA 5’UTRs的穩(wěn)定作用需要由抑制翻譯和引起核糖體失控的抗生素來誘導(dǎo)[115]。同樣,噬菌體λPL對于λPL-trp轉(zhuǎn)錄本的穩(wěn)定作用需要λ噬菌體的感染[116]。與此相反,E.coli ompA轉(zhuǎn)錄本能夠在細胞快速增殖的正常情況下延長一系列異源mRNA在E.coli中的穩(wěn)定性[117]。Emory等證明,在接近或緊接ompA 5’UTR的5’末端存在發(fā)卡結(jié)構(gòu)對于其穩(wěn)定效果是必需的。而且可以通過在5’末端添加發(fā)卡結(jié)構(gòu)來延長在正常情況下不穩(wěn)定的mRNA的半衰期[118]。這樣看來,對異源基因添加ompA 5’穩(wěn)定元有可能提高E.coli中的基因表達。另一類由3’UTR組成的mRNA保護性元件能夠形成發(fā)卡結(jié)構(gòu),因而能夠阻斷外切核酸酶從3’末端對轉(zhuǎn)錄本的降解[113]。Wong和Chang[119]在蘇云金桿菌的晶體蛋白基因的轉(zhuǎn)錄終止子中鑒定了一個這樣的元件。將該“陽性反調(diào)節(jié)子”與地衣桿菌的青霉素酶基因(penP)的3’末端和人IL-2 cDNA融合,能夠延長mRNA的半衰期,且提高了相應(yīng)多肽在枯草桿菌和E.coli中的產(chǎn)量。然而,同某些5’穩(wěn)定元一樣,這類3’反向調(diào)節(jié)子不可能作為一個通用的mRNA穩(wěn)定元。而且有證據(jù)表明,可以通過選用缺乏某些特定RNase如RNaseII或PNPase的宿主菌來提高基因的表達。這同樣并非一有效途徑。因為缺乏RNaseII或PNPase與RNase過量表達一樣,對于E.coli整體mRNA的平均半衰期并無多大影響。而且缺乏RNaseII或PNPase的菌株常常是不穩(wěn)定的[120,121]。

4.翻譯終止

在mRNA中存在終止信號是翻譯終止過程必不可少的。除了三個終止密碼子UAA、UGA、

和UAG外,翻譯終止這一復(fù)雜事件還包括核糖體、mRNA和終止位點的幾種釋放因子的特異相互作用[122]。在E.coli中,RF-1在終止密碼子UGA處終止翻譯;RF-2在UAA密碼子處終止翻譯[123]。最近還克隆了另外一個因子RF-3[124]。

在設(shè)計表達載體時,通常插入三個終止密碼子以防止核糖體的跳躍。在E.coli中偏向于使用UAA密碼子[125]。一項對于2000多個E.coli基因的統(tǒng)計分析表明,在終止密碼子和緊接三聯(lián)體的核苷酸序列中存在局部非隨機性[126]。同時他們還利用體內(nèi)終止試驗測定12個可能的四核苷酸“終止信號”(UAAN、UGAN、UAGN)的終止力量。在體內(nèi)終止試驗中,通過其與框架移位的競爭測定其終止效率。轉(zhuǎn)錄效率依據(jù)終止密碼子和第四個核苷酸而有顯著的差異,這種差異從80%(UAAU)到7%(UGAC)不等。這些研究表明,緊接終止密碼子后的核苷酸特性強烈地影響E.coli中的翻譯終止效率[127]。UAAU是E.coli中最有效的轉(zhuǎn)錄終止序列。此外,終止密碼子5’末端的鄰近序列也影響終止的效率。因此,新生肽中倒數(shù)第二位(-2位)C-末端氨基酸殘基的電荷和疏水性能引起多達30倍不同的UGA終止效率,而在UAG位的終止對于-2位氨基酸殘基的特性不敏感[128]。對于-1位,α-螺旋、β-鏈和回轉(zhuǎn)傾向是UGA終止中的決定因素[129]。

蛋白質(zhì)靶向

確定將目的蛋白表達在特定的細胞室,即細胞質(zhì)、細胞間質(zhì)或是培養(yǎng)基中,需要權(quán)衡各自的利弊。

1.細胞質(zhì)表達

包涵體的形成仍然是在細胞質(zhì)中進行基因表達的一個主要障礙。包涵體雖然具有多方面的好處,但這些優(yōu)越之處與后期繁瑣的蛋白重新折疊工作、重疊蛋白的生物活性的未知性以及重疊和純化后蛋白的總產(chǎn)量降低相比,則顯得微不足道。至今尚不明了包涵體形成的精確機制。對于形成和不形成包涵體的81種蛋白質(zhì)的統(tǒng)計學(xué)分析表明,有6個主要的理化指標與此有關(guān)。這6個指標是電荷平均數(shù)、轉(zhuǎn)變形成的殘基組分、半胱氨酸組分、脯氨酸組分、親水性和殘基總數(shù)。其中前兩個指標與包涵體形成密切相關(guān)。一種基于這些指標的模型可以根據(jù)某種蛋白質(zhì)的氨基酸組成來預(yù)測包涵體形成的可能性。該模型曾成功地預(yù)測人T細胞受體Vβ5.3在E.coli中的可溶性[130] 。

已經(jīng)建立了多種策略以幫助蛋白質(zhì)天然空間結(jié)構(gòu)的形成[131]。這些策略包括在較低溫度下培養(yǎng)細菌[132],選擇不同的E.coli菌株[133],替換某些氨基酸殘基[134],與分子伴侶共表達[135,136,137],利用高溶解性的多肽作為共表達分子[138],在山梨糖醇和甘氨酸三甲內(nèi)鹽存在時,以低滲透壓培養(yǎng)和誘導(dǎo)細胞[139],改變培養(yǎng)基的pH值[140]。與分子伴侶共表達或許是一種有望提高蛋白質(zhì)可溶性和折疊效率的途徑[141]。但這種策略似乎具有蛋白質(zhì)特異性[142]。即便在分子伴侶存在的條件下,仍有多種因素使得過量表達的蛋白不能折疊成其天然構(gòu)象。這些因素包括缺乏二硫鍵和/或翻譯后修飾;細胞質(zhì)的氧化還原狀態(tài)妨礙了二硫鍵的形成。在E.coli中,有兩條途徑參與二硫鍵的還原。即硫氧還蛋白系統(tǒng),該系統(tǒng)由硫氧還蛋白還原酶和硫氧還蛋白組成;谷氧還蛋白系統(tǒng),該系統(tǒng)由谷胱甘肽還原酶、谷胱甘肽和三種谷氧還蛋白組成[143]。制造次還原細胞質(zhì)環(huán)境,以利于二硫鍵形成的策略包括選用硫氧還蛋白還原酶(trxB)缺陷的E.coli菌株,這有助于巰基還原勢能。

蛋白質(zhì)在細胞質(zhì)中被降解的可能性比其他細胞室要大得多。因為在細胞質(zhì)中含有大量的蛋白酶。另外,從細胞質(zhì)蛋白混合物中純化目的蛋白相對比較困難,因為在此細胞室包含總細胞蛋白的絕大部分蛋白[144]。

2.細胞外周質(zhì)表達

在細胞外周質(zhì)進行蛋白質(zhì)表達有許多優(yōu)越之處。在外周質(zhì)只有4%的總細胞蛋白,這顯然有利于目的蛋白的純化,外周質(zhì)的氧化環(huán)境有利于蛋白質(zhì)的正確折疊,在轉(zhuǎn)移到外周質(zhì)的過程中,信號肽在細胞內(nèi)剪切更有可能產(chǎn)生目的蛋白的天然N-末端。此外,外周質(zhì)中的蛋白質(zhì)降解也少得多[145]。蛋白質(zhì)通過內(nèi)膜轉(zhuǎn)運到外周質(zhì)需要信號肽[146,147,148]。許多原核和真核細胞來源的信號肽已成功地用于Ecoli中蛋白質(zhì)從內(nèi)膜到外周質(zhì)的轉(zhuǎn)運。如E.coli的PhoA信號[149]、OmpA[150]、OmpT[151]、LamB和OmpF[152]以及金黃色葡萄球菌的A蛋白[153],鼠RNase[154]和人生長激素信號肽[155]等。但是,蛋白質(zhì)轉(zhuǎn)運到細菌外周質(zhì)是一個特別復(fù)雜和尚未完全明了的過程,信號肽的存在并不總能保證有效的蛋白質(zhì)通過內(nèi)膜轉(zhuǎn)運[156]。改善蛋白質(zhì)轉(zhuǎn)運到外周質(zhì)的策略包括提供蛋白質(zhì)轉(zhuǎn)運和加工所需的成分:過量表達信號肽酶I[157],利用prlF突變株[158],共表達參與膜轉(zhuǎn)運的幾種蛋白質(zhì),降低蛋白質(zhì)的表達水平以防止轉(zhuǎn)運工具的過載[159]。

3. 細胞外分泌(外泌)

將蛋白質(zhì)分泌到細胞外是人們最期望的一種策略。因為這樣容易純化目的蛋白質(zhì),減少細菌的蛋白酶對目的蛋白質(zhì)的裂解。但是,E.coli在正常情況下只有很少量的蛋白質(zhì)分泌到細胞外。要解決蛋白質(zhì)外泌方面的難題,必須弄清E.coli的分泌途徑。Pugsley[160]對革蘭氏陰性菌的分泌途徑進行了詳細的研究。在E.coli中將蛋白質(zhì)分泌到培養(yǎng)基中的方法大致分為兩類:(1)利用已有的“真正”的分泌蛋白所采用的途徑[161];(2)利用信號肽序列、融合伴侶和具有穿透能力的因子。第一種方法具有將目的蛋白質(zhì)特異性分泌的優(yōu)點,并最小限度地減少了非目的蛋白的污染。最突出的例子是溶血素基因,該基因曾被用于構(gòu)建分泌的雜交蛋白[162,163];第二種方法依賴于有限滲透的誘導(dǎo)而導(dǎo)致蛋白質(zhì)的分泌。例如應(yīng)用pelB[164]、ompA[165]和A蛋白引導(dǎo)序列[153,166];與細菌素釋放蛋白的共表達[167];絲裂霉素誘導(dǎo)的細菌素釋放蛋白和在培養(yǎng)基中添加甘氨酸[168]以及與kil基因共表達而進行膜穿透[169]。但通常情況下,外泌蛋白質(zhì)的產(chǎn)量是中等的。有文獻報道[170],在大腸桿菌表達系統(tǒng)中,金黃色葡萄球菌A蛋白的信號肽能引導(dǎo)帶有E結(jié)構(gòu)域的A蛋白片段或融合產(chǎn)物從細胞質(zhì)外泌到培養(yǎng)基中,蛋白的外泌表達發(fā)生于細胞生長后期。但所用的啟動子為A蛋白自身的啟動子,該啟動子在大腸桿菌中為非可控性的組成性表達,且強度較弱。如果能利用可控的強啟動子進行A蛋白信號肽引導(dǎo)的基因表達,則有望在蛋白質(zhì)外泌方面有所突破。目前我們正在進行這方面的嘗試,且已經(jīng)取得初步成效。

密碼子的使用

原核和真核生物的基因?qū)νx密碼子的使用均表現(xiàn)非隨機性[171,172]。對E.coli中密碼子的使用頻率進行系統(tǒng)分析得到以下結(jié)論[173]:(1)對于絕大多數(shù)的簡并密碼子中的一個或兩個具有偏好;(2)某些密碼子對所有不同的基因都是最常用的,無論蛋白質(zhì)的含量多少,例如CCG是脯氨酸最常用的密碼子;(3)高度表達的基因比低表達的基因表現(xiàn)更大程度的密碼子偏好;(4)同義密碼子的使用頻率與相應(yīng)的tRNA含量有高度相關(guān)性。這些結(jié)果暗示,富含E.coli不常用密碼子(表1)的外源基因有可能在E.coli中得不到有效表達。已經(jīng)證明[174],微精氨酸t(yī)RNAArg(AGG/AGA)是多種哺乳動物基因在細菌中表達的限制因子。因為AGA和AGG在E.coli中不常用。如果共表達編碼tRNAArg(AGG/AGA)的argU(dnaY)基因,就會高水平表達目的蛋白[174]。但利用同方法所進行的另外幾項研究的結(jié)果卻不一致[175,176]。其他的研究表明,通過用常用密碼子替換稀有密碼子或與“稀有”tRNA基因共表達可以提高外源基因在E.coli中的表達水平[177,178]。許多研究者對有關(guān)密碼子使用模式的進化意義和密碼子使用效果的機制進行了研究,但至今尚未找到協(xié)調(diào)密碼子的使用和轉(zhuǎn)錄本翻譯的精確規(guī)則。似乎在轉(zhuǎn)錄本5’末端附近存在稀有密碼子將會影響翻譯效率。另外,基因5’編碼區(qū)中GC含量似乎也影響其表達。這在人胸苷酸激酶(TS)中已經(jīng)得到證明[179]。在不改變所編碼蛋白的前提下,將TS cDNA的第三、四、五密碼子的嘌呤堿基變成胸腺嘧啶,使得TS基因的表達占到E.coli中總蛋白量的25-30%。綜上所述,有許多可變因素可能影響實驗結(jié)果,如位置效應(yīng)、稀有密碼子的群集和mRNA的二級結(jié)構(gòu)等等。

在大腸桿菌中高效表達外源蛋白的全攻略

蛋白質(zhì)的蛋白酶解

蛋白酶解是一個選擇性的、高度調(diào)節(jié)的過程,該過程參與許多代謝活動。E.coli在細胞質(zhì)、細胞外周質(zhì)、內(nèi)膜和外膜有許多蛋白酶[180,181]。這些蛋白酶參與宿主的代謝活動,如選擇性地清除異常和錯誤折疊的蛋白。到目前為止,蛋白酶解的機制尚未完全明了,但已有一些策略和方法以減少E.coli中異源蛋白的降解。雖然使得蛋白質(zhì)不穩(wěn)定的精確結(jié)構(gòu)特點還不清楚,但是通過系統(tǒng)研究已經(jīng)明確了一些蛋白不穩(wěn)定的決定因素。蛋白酶解途徑的“N-末端規(guī)則”在E.coli中能夠發(fā)揮作用,即蛋白質(zhì)的穩(wěn)定性與其氨基端的殘基有關(guān)[182]。在E.coli中,N-末端Arg、Lys、Leu、Phe、Tyr和Trp的半衰期為2分鐘,而除脯氨酸外的其他氨基酸的半衰期均超過10小時。有研究表明,在多肽的第二位帶有較小側(cè)鏈的氨基酸有利于甲硫氨酸氨肽酶催化的N-末端甲硫氨酸的去除,從而暴露出位于第二位的亮氨酸,使得該蛋白不穩(wěn)定[183]。蛋白質(zhì)的第二個決定因素是位于近氨基端的特異性內(nèi)源賴氨酸殘基[142,143]。該殘基是多遍在蛋白鏈的受體,多遍在蛋白鏈在真核細胞中有利于遍在蛋白依賴的蛋白酶對蛋白質(zhì)的降解。有趣的是在一個多遍在蛋白中,它的兩個決定簇可以位于不同的亞基上,卻能靶向同一個蛋白進行加工[184]。氨基酸成分和蛋白質(zhì)不穩(wěn)定性的另一個關(guān)系體現(xiàn)在PEST假說中[185]。根據(jù)對短壽命真核蛋白的統(tǒng)計分析,蛋白質(zhì)如果富含Pro、Glu、Ser和Thr的區(qū)域,且在該區(qū)域附近有某些特定的氨基酸,則該蛋白就會不穩(wěn)定。這些PEST結(jié)構(gòu)域的磷酸化導(dǎo)致鈣的結(jié)合能力提高,從而利于鈣依賴性蛋白酶對蛋白質(zhì)的降解。這提示可以在缺乏PEST蛋白裂解系統(tǒng)的E.coli中表達PEST富含蛋白。

減少E.coli中重組蛋白裂解的策略有以下幾種:(1)將蛋白質(zhì)靶向細胞周質(zhì)或培養(yǎng)基[145,186];(2)在較低的溫度下培養(yǎng)細菌[187];(3)選用蛋白酶缺陷的菌株[188];(4)構(gòu)建N-末端或C-末端融合蛋白[186];(5)將目的基因多拷貝串聯(lián)[188];(6)與分子伴侶共表達[189];(7)與T4 pin基因共表達[190];(8)替換特定的氨基酸殘基以消除蛋白酶裂解位點[191];(9)改善蛋白質(zhì)的親水性[192];(10)優(yōu)化培養(yǎng)條件[193]

融合蛋白表達

在E.coli中表達外源蛋白,尤其是真核蛋白時,蛋白質(zhì)的穩(wěn)定性是經(jīng)常遇到的問題。最近幾年,眾多巧妙的蛋白質(zhì)——融合系統(tǒng)的發(fā)展,為E.coli中高效表達和純化重組蛋白提供了極大方便。融合表達具有多方面的優(yōu)點:如防止包涵體的形成,促進蛋白質(zhì)的正確折疊,限制蛋白酶解和利于純化[159,194]。

Uhlen和其同事[195]利用葡萄球菌A蛋白和合成的結(jié)構(gòu)域(Z)開發(fā)了一種多功能的融合伴侶,除了能夠作為純化標記外,A蛋白組分還作為一種可溶性伴侶促進蛋白質(zhì)的折疊,A蛋白信號肽的存在可使表達蛋白分泌到培養(yǎng)基中。另一個融合伴侶是鏈球菌G蛋白(SPG),它是一種細菌胞壁蛋白,在其氨基端具有分離的白蛋白結(jié)合區(qū),在OH端具有免疫球蛋白IgG結(jié)合區(qū)[196]。最小的白蛋白結(jié)合區(qū)由來源于SPG的46個氨基酸殘基組成,作為親和純化標記純化cDNA編碼的蛋白。如果將A蛋白和SPG結(jié)構(gòu)域聯(lián)合組成三聯(lián)融合蛋白,則為純化提供了更為廣泛的選擇,可以更進一步防止蛋白酶解。SPG-白蛋白的一個重要應(yīng)用是其能夠穩(wěn)定哺乳動物外周循環(huán)中的短壽命蛋白,這一效應(yīng)是通過SPG結(jié)構(gòu)域與一種長壽命蛋白——血清白蛋白的結(jié)合來介導(dǎo)的[197]。

最近又建立了一種更為復(fù)雜和巧妙的親和系統(tǒng)[198]。這種多元系統(tǒng)利用了七種不同的親和標記,從而允許使用多種結(jié)合和洗脫條件,為重組蛋白的生產(chǎn)、檢測和純化提供了一個有力的工具。

使用基因融合表達系統(tǒng)在E.coli中表達外源基因已經(jīng)越來越受歡迎。這在很大程度上歸因于融合系統(tǒng)能夠產(chǎn)生大量的可溶性的融合蛋白。谷胱甘肽S-轉(zhuǎn)移酶(GST)、麥芽糖結(jié)合蛋白(MBP)以及硫氧還蛋白(Trx)均已經(jīng)被證實能非常成功地生產(chǎn)正確折疊、有生物活性的蛋白質(zhì),能明顯提高在E.coli細胞質(zhì)中產(chǎn)生的融合蛋白的可溶性,并能抑制包涵體的形成[159,194]。其中每一種都備有方便的純化方法,可將融合蛋白與細胞污染物分開。已經(jīng)建立了多種對融合蛋白進行位點特異性裂解的方法,方法的選擇通常由特定蛋白的組成、序列及物理性質(zhì)決定[199]??刹捎弥T如溴化氰(Met↓)、羥胺(Asn↓Gly)、等試劑或低pH(Asp↓Pro)來進行融合蛋白的化學(xué)裂解?;瘜W(xué)裂解的方法較便宜而且有效,甚至常常可以在變性的條件下裂解非變性不能溶解的蛋白質(zhì)。但有時目的蛋白中存在裂解位點,或因發(fā)生副反應(yīng)而導(dǎo)致對蛋白質(zhì)進行不必要的修飾,從而阻礙了它們的應(yīng)用。作為一個備選方案,酶解的方法相對來說其反映條件較溫和,更重要的是,普遍用于此用途的蛋白酶都具有高度的特異性。其中常用的酶有:Xa因子、凝血酶、腸激酶、凝乳酶和膠原酶。所有這些酶都具有較長的底物識別序列,從而降低了蛋白質(zhì)中其他無關(guān)部位發(fā)生斷裂的可能性。在上述提及的各種酶中,Xa因子和腸激酶應(yīng)用最多,因為它們切割各自的識別序列的羧基端,使帶有天然氨基酸的被融合部分得以釋放。