方法介紹
定位克隆首先是獲取基因在染色體上的位置的信息,然后采用各種實(shí)驗(yàn)方法克隆基因和進(jìn)行定位?;虻亩ㄎ豢寺〔呗源篌w上可以分成四個(gè)步驟。
①通過家系連鎖分析資料或染色體微小缺失(雜合性丟失,LOH)等數(shù)據(jù),確定基因在染色體上的位置;
②通過染色體步移(chromosomewalking)、染色體區(qū)帶顯微切割等技術(shù),獲得基因所在區(qū)段的DNA片段疊連群(contig),繪制出更精細(xì)的染色體圖譜;
③確定含有候選基因的染色體片段;
④從這些片段中進(jìn)一步篩選目的基因,并作突變檢測驗(yàn)證和功能分析。
重要地位
當(dāng)前,人類基因組研究的重心正在由“結(jié)構(gòu)”向“功能”轉(zhuǎn)移,一個(gè)以基因組功能研究為主要內(nèi)容的所謂“后基因組時(shí)代”(post-genomics),也即功能基因組(functionalgenomics)時(shí)代,即將到來。如何獲取基因的功能信息,即與人類重大疾病和重要生理功能相關(guān)的基因信息,就擺在了我們面前。定位候選克隆策略(positionalcandidatecloning)是傳統(tǒng)定位克隆(positionalcloning)的改進(jìn)和發(fā)展,并以其在克隆疾病相關(guān)基因中的有效性而日益受到重視。
人類基因組計(jì)劃已確定了一系列分布于全基因組24條染色體上的分子標(biāo)記。根據(jù)這些分子標(biāo)記的序列和定位信息,結(jié)合雜交或PCR的方法可以快速檢測染色體上與腫瘤或遺傳性疾病相關(guān)的熱點(diǎn)位置,進(jìn)而從中克隆疾病相關(guān)基因。定位候選克隆克服了經(jīng)典的定位克隆純粹依靠連鎖分析進(jìn)行染色體定位的繁冗而緩慢的弊端,大大加快了克隆工作的進(jìn)程,而且它也不僅僅局限于遺傳病,現(xiàn)在已更多地運(yùn)用于腫瘤易感基因的克隆工作。
1994年國際上開始構(gòu)建并于1996年首次公布的基因圖譜是一個(gè)以cDNA為基礎(chǔ)的STS(sequence-taggedsite)標(biāo)記的物理圖和多態(tài)性微衛(wèi)星標(biāo)記的遺傳圖相結(jié)合的圖譜,它一方面使染色體定位更加準(zhǔn)確、可靠、精密,同時(shí)為從候選區(qū)域內(nèi)獲得疾病相關(guān)的候選基因提供了極大的便利,使得目的基因的克隆更加簡便而快捷,為這種方法的發(fā)展和應(yīng)用注入了更大的活力,表現(xiàn)為此后相繼克隆出16條新的疾病相關(guān)基因,如從胰腺癌中分離得到的抑癌基因DPC4等。1998年10月GeneBank公布了最新的“基因圖譜98”,它的信息量更大,且準(zhǔn)確度和精確度都有大幅度的提高,包含有41464個(gè)STS標(biāo)記,代表了30181條基因的定位信息,也即完成了人的全部基因組約6萬~7萬條基因中的一半左右的定位工作??傊S著人類基因組計(jì)劃的推進(jìn),定位候選克隆已成為一種有效的克隆疾病相關(guān)基因的方法。
基本步驟
綜述
定位候選克隆包括三個(gè)基本步驟:基因組定位、候選cDNA的獲得、全長及功能分析。本文即對此策略的發(fā)展和應(yīng)用作一概要介紹。
基因組定位
新發(fā)展起來的,尤其在分離腫瘤易感基因中常用的方法是用PCR方法檢測多樣本的雜合性丟失(LOH)或純合性丟失的高發(fā)頻率區(qū),從而獲得疾病候選基因定位。體細(xì)胞抑癌基因的失活是導(dǎo)致癌變的一個(gè)主要因素,最常見的表現(xiàn)即雜合性缺失。通常在染色體上雜合性缺失的高發(fā)頻率區(qū)含有一個(gè)或多個(gè)抑癌基因。利用散布于各條染色體上的分子標(biāo)記(包括STS、微衛(wèi)星標(biāo)記等),用PCR檢測多個(gè)腫瘤樣本的染色體各區(qū)帶的缺失情況,可確定LOH的高發(fā)頻率區(qū),也即確定了相關(guān)腫瘤生長負(fù)調(diào)控因子的染色體定位,并可精確到基因組分子標(biāo)記指示的區(qū)域,進(jìn)一步可作基因的克隆工作。利用這一方法已成功地克隆了幾個(gè)抑癌基因,如乳腺癌中的BRCA1、BRCA2及胰腺癌中的DPC4基因等。同時(shí),F(xiàn)ISH技術(shù)的不斷發(fā)展及推廣應(yīng)用,染色體顯微切割技術(shù)的成熟,可在顯微鏡下切割特定的染色體區(qū)帶,制備染色體區(qū)帶特異探針,對正常和病變組織作FISH分析,比較確定疾病相關(guān)基因的染色體區(qū)帶定位。近些年來,RH譜(radiationhybridmap)的建立,使染色體精細(xì)定位成為可能。這些方法比原先連鎖分析的檢測速度更快、精確度更高。例如L-CTsui用連鎖分析花費(fèi)了大約10年的時(shí)間才把囊性纖維變性基因定位在7號染色體,而現(xiàn)在可能只要一年或更短的時(shí)間就可完成這項(xiàng)工作。
候選cDNA的獲得
基因組定位提供的信息包含一定的分子標(biāo)記,可用PCR或雜交的方法直接從YAC(yeastartificialchromosome)庫,或從BAC(bacterialartificialchromosome)庫、PAC(P1artificialchromosome)庫中篩選相對應(yīng)的克隆。YAC庫的嵌合性嚴(yán)重且操作難度較大,已逐步為PAC庫和BAC庫取代。PAC系統(tǒng)是以噬菌體P1為基礎(chǔ)的克隆系統(tǒng),它可容納70~100kb的插入片段,并可選擇性地區(qū)分重組子和非重組子,且同時(shí)有兩套復(fù)制機(jī)制。單拷貝復(fù)制子可用于穩(wěn)定克隆增殖,而多拷貝復(fù)制子則可在Lac操縱子的控制下用于DNA的制備。BAC系統(tǒng)是基于大腸桿菌中可大容量容納基因且穩(wěn)定性良好的F因子衍生而來的載體系統(tǒng),可容納超過100kb的插入片段,BAC克隆的插入片段的平均長度為120kb,最大可達(dá)到240kb左右。良好的穩(wěn)定性和操作的簡便性是BAC系統(tǒng)的主要優(yōu)點(diǎn)。由這些克隆入手,采用依賴于適當(dāng)cDNA文庫的方法、依賴于特征序列的方法或依賴于表達(dá)性質(zhì)等方法獲得候選cDNA。
全長及功能分析
獲得了眾多的候選cDNA后,通過篩選cDNA文庫或RACE等方法克隆全長基因。為確定其中的致病基因,需要逐個(gè)檢測它們在患病家系中的變化情況,并分析其功能。功能分析往往是定位克隆中的一個(gè)難點(diǎn),因?yàn)椴煌募膊∮胁煌奶卣?,也就需要用不同的功能檢測系統(tǒng)進(jìn)行分析。常用的如細(xì)胞水平的正義或反義基因的表達(dá)后細(xì)胞形態(tài)和功能變化的研究,在腫瘤研究中檢測細(xì)胞形態(tài)和接觸抑制的變化,軟瓊脂生長能力的變化及裸鼠致瘤性分析等。更進(jìn)一步的功能分析則包括個(gè)體水平的基因敲除實(shí)驗(yàn)等。
現(xiàn)在還發(fā)展出了一些與其它方法相結(jié)合的新思路,如與差減雜交相結(jié)合,篩選位于候選區(qū)域的差異表達(dá)基因,大大提高了獲得有價(jià)值基因的可能性。同時(shí)人類基因組計(jì)劃中轉(zhuǎn)錄圖譜〔15〕工作的開展,有很多EST已被精確定位于染色體的不同區(qū)帶上,可以直接進(jìn)行功能研究。隨著研究的深入,越來越多的EST定位工作的完成,基因轉(zhuǎn)錄圖譜的不斷完善,我們完全可以直接跳過定位克隆的第二個(gè)步驟而直接進(jìn)入功能鑒定和基因全長的克隆工作,這可能將是定位克隆中最快的方法。在分析分離手段不斷提高,人類基因組計(jì)劃緊鑼密鼓地實(shí)施的今天,各種新思路新方法層出不窮,定位克隆方法的周期也將不斷縮小,為人類最終克隆各種疾病基因提供了可能性。
篩選方法
直接篩選法依賴適當(dāng)cDNA文庫的方法有直接篩選法和cDNA選擇法(cDNAselection)。直接篩選法即用基因組DNA直接從cDNA文庫中篩選位于該基因組片段內(nèi)的cDNA,如從覆蓋有候選區(qū)域的YAC、PAC、BAC克隆中分離外源片段作為探針從文庫中篩選候選基因;而cDNA選擇法恰恰與直接篩選法相反,它把基因組DNA固定在膜上,用總cDNA與之雜交,通過PCR從中回收可與基因組片段結(jié)合的cDNA片段。直接篩選法的優(yōu)點(diǎn)在于避免了對候選區(qū)域大片段地亞克隆操作,且在單一的篩選中可以獲得多個(gè)轉(zhuǎn)錄子的信息。但缺點(diǎn)是大片段地純化,標(biāo)記較困難,而PAC、BAC克隆片段純化相對方便的優(yōu)點(diǎn)就成為這種方法發(fā)展的趨勢;同時(shí)由于探針的復(fù)雜性,使雜交背景加深,假陽性增多,而且容易忽略短的外顯子或低豐度cDNA。cDNA選擇法的最大優(yōu)越性在于PCR反應(yīng)的介入,大大提高了選擇的靈敏度,可以檢測到一些稀有轉(zhuǎn)錄子。
表達(dá)依賴法也即Northern雜交分析法。用候選區(qū)域基因組DNA作為探針與總RNA雜交,切下陽性條帶,反轉(zhuǎn)錄為cDNA并克隆,即可獲得位于此基因組片段中的轉(zhuǎn)錄子。
上述方法都各有其優(yōu)缺點(diǎn),必須根據(jù)原材料及要達(dá)到的目的,選擇適當(dāng)?shù)囊环N或多種方法組合來達(dá)到研究目的。此外,其它方法還很多,如微切割和微克隆法、減法cDNA雜交法、重組篩選法等。
依賴特征序列依賴特征序列的方法是依據(jù)轉(zhuǎn)錄子內(nèi)部及其兩側(cè)的序列特征直接從基因組DNA中分離cDNA片段,主要有CpG島搜尋法、外顯子捕獲法(exontrapping)、交叉物種序列同源性比較法(cross-speciessequencehomology)、AluPCR法與直接序列分析法等。CpG島也稱為HTF島,是一些富含GC的小區(qū)域。大部分轉(zhuǎn)錄子的附近(通常是在5′上游區(qū)域)都含有非甲基化的CpG島。利用一些識別CpG島的稀有酶,如SacⅡ、BssHⅡ、EagⅠ等,切割基因組DNA,獲得位于CpG島附近的序列作為探針從總RNA或cDNA文庫中得到轉(zhuǎn)錄子。外顯子捕獲法是基于對外顯子兩側(cè)的功能性5′和3′剪接位點(diǎn)的識別,從基因組DNA中分離外顯子片段。交叉物種序列同源性比較的依據(jù)是編碼區(qū)序列在不同物種間的保守性要遠(yuǎn)高于非編碼區(qū),把候選區(qū)域的DNA分為多個(gè)亞克隆,分別與不同的物種總DNA雜交,與不同物種DNA都有陽性信號的DNA克隆可能就是編碼區(qū)基因。這種方法依賴的是物種間DNA水平上的序列同源性。Alu序列是散布于人基因組中的短的重復(fù)序列,通過設(shè)計(jì)人特異的Alu序列作為引物,可直接快速用PCR方法從YAC、BAC、PAC克隆或人鼠雜合細(xì)胞中得到人源的特異序列。直接序列分析法則在基因組序列信息中用GRAIL和GeneScan等軟件分析推測編碼基因的方法。