1. 程式人生 > >基因突變基本知識

基因突變基本知識

iad bgp 可能 dlp eps 們的 總結 toe ide

賽福基因公開課今天正式開講。第一課我們來對基因檢測進行基本的介紹。

技術分享

今天我主要從以下兩個方面介紹一下基因檢測的基礎知識,一是基因,包括細胞、染色體、DNA、基因的簡單介紹。另一是基因突變,包括基因突變的概念介紹,基因突變的來源以及基因突變的類型及對蛋白的影響等。

技術分享

技術分享

在精準醫療中基因檢測這個領域,有一個很著名的事件——安吉麗娜朱莉事件。

安吉麗娜朱莉一家有腫瘤的家族史,她的母親、祖母和曾祖母,阿姨,此前都因癌癥去世。

2013年,安吉麗娜·朱莉進行了基因測序,發現了自己是 BRCA1 突變基因攜帶者,患上乳腺癌和卵巢癌的幾率分別是80%和50%,所以毅然接受預防性乳腺切除。

技術分享

現在精準醫療中的基因檢測技術主要的應用領域有4大方面:

第一是產前篩查,通過抽取孕婦的外周血液就可以進行胎兒染色體類疾病的產前診斷,目前應用最好的比如:21三體綜合征,18三體綜合征的產前篩查。由於孕婦的外周血中含有胎兒的遊離DNA,就克服了傳統有創產前篩查取樣的問題。

第二是腫瘤:對腫瘤患者進行基因檢測,找到其針對該患者的致病基因突變信息,從而輔助其選擇正確的靶向治療藥物和化療藥物,實現腫瘤患者的精準個性化治療。

第三是遺傳病領域,更準確的說是單基因遺傳病領域。目前已有超過4000種單基因遺傳病有明確的致病基因,所以通過基因檢測的方式可以輔助醫生明確疾病診斷,輔助選擇合適的治療方式,並評估患者的預後情況。

第四是現在很流行的以預防為主的針對健康人的基因檢測。通過分析人體內攜帶的基因堿基信息,評估個體的健康狀況,最重要的是預測未來患某種疾病的幾率,從而達到提前預防,或體檢時重點針對的疾病類型的目的。達到早預防、早發現、早治療的目的。

技術分享

我們一直在說表型和疾病。事實上,疾病就是人體表現出表型的一種,即每一個人表現出的樣子,這些表型中有些不是疾病,只是體現出人體的多樣性,比如膚色、發色、智商、身高和運動能力等,這些差異不是疾病。但是有一些表型就是疾病,比如說智力障礙、運動障礙等,這些嚴重地影響到正常生活,就稱之為疾病。我們可以說每個個體表現出的樣子幾乎都和遺傳相關,疾病也不例外。

同時凡事都有兩面性,無論疾病還是其他表型都受環境和遺傳因素兩方面影響,環境因素包括營養因素、理化因素、感染外傷等,遺傳因素包括染色體異常、單基因缺陷等。但是疾病與環境和遺傳的相關程度不同,有些疾病受遺傳因素影響的比較多,有些受環境因素影響比較多。

技術分享

那麽所謂的遺傳因素是什麽呢?遺傳因素的本質是什麽呢?

技術分享

這就涉及到我們今天講的第一個概念,即基因。

技術分享

談基因,首先要從人的細胞說起,細胞是生命的基本單位,遺傳物質就蘊藏在細胞核和線粒體中。

人體內約有40萬億--60萬億個細胞,細胞的平均直徑在10--20微米之間。細胞由多個部分組成,每個部分行使不同的功能。其中被稱為細胞器的那些部分,具有特殊的結構以確保在細胞中行使一定的任務。細胞器老師們可能還有一些印象:比如內質網、高爾基體、溶酶體等。

那麽我們所說的遺傳物質位於何處呢?一是細胞核,人的細胞中都有一個細胞核,除了成熟的紅細胞和血小板(攜帶血紅蛋白;體積小方便流動等),這個也是人體基因組中絕大部分遺傳物質的儲存空間。二是線粒體,人體中的很小部分遺傳物質位於這裏。

技術分享

那麽我們再來看看細胞核中有什麽東東?這就涉及到另一個概念,即染色體。

人類的細胞核中有23對,46條染色體。包括(1-22號)22對常染色體,和1對性染色體,這對性染色體決定了人的性別,XX型為女性,XY型為男性。其中23條來自母親,23條來自父親。

技術分享

染色體展開即可看到DNA的雙鏈結構,染色體就是由DNA分子和組蛋白組成的。

我們來看一下DNA的平面結構,2 條鏈,它的基本組成單位是A T C G四種堿基,其中A和T互補配對,C和G互補配對,這種配對規則是不會改變的。

技術分享

那麽基因是什麽呢?基因是一段具有遺傳效應的DNA分子片段,它排布在DNA雙鏈上。那麽既然它是DNA的一部分,故其基本組成單位仍是A T C G四種堿基。那麽我們所說的基因序列,其實就是由這四種堿基經過多種排列組合組成的。

技術分享

人類基因組計劃被譽為生命科學的"登月計劃",它於1990年開始啟動,並於2003年完成,比原定的2005年完成早了2年。人類基因組計劃是一個大的國際合作項目,是為了測定人類基因組的全部序列並發現組成基因組的全部基因信息。該項目由美國國立衛生研究院和美國能源部進行主要協調,其他的參與者還包括美國的部分大學,以及英國、法國、德國、日本和中國。

那麽人類基因組計劃主要實現了什麽呢?在2003年4月的時候,研究人員宣布人類基因組計劃完成了一個基本上是完整人類基因組的高質量序列,這項研究也搞清了人體內許多基因位於整個基因組的位置信息,以及它們的結構和組成信息。

技術分享

那麽現在我們所說的人體基因組是由多少基因組成的呢?還是2大部分,一是編碼蛋白的位於細胞核中的22000多個基因,以及線粒體基因組中的37個基因。

我們以1號染色體為例,DNA的計量單位是bp,1號染色體的基因組大小的248.96Mb,編碼的蛋白質有11046種,位於1號染色體上的基因有5078個(包括編碼蛋白基因及非編碼蛋白基因)。其實總體看下來,基因在染色體上的分布是不均勻的,1號染色體上的基因數目最多。我們再來看看線粒體的基因組,一共有37個基因,其中2個編碼rRNA, 22個編碼tRNA, 13個編碼多肽。

技術分享

對這一小部分做一個總結:A T C G四種堿基經多種排列組合組成了基因,基因位於DNA分子上,DNA和組蛋白組成染色體,染色體位於細胞核中,細胞核位於細胞中,細胞是人體的基本組成單位。還有另一個小分支即是,細胞中的另一個細胞器,線粒體中的DNA分子,構成了整個人類基因組非常小的一部分。

技術分享

好,介紹完基因的基本概念,我們再來看看我們真正關心的基因變異是怎麽回事。

技術分享

基因是如何行使功能的呢?是通過指揮蛋白質的合成來控制我們的生命現象。基因表達是指細胞在生命過程中,把存儲在DNA序列中的遺傳信息經過轉錄和翻譯,轉變成具有生物活性的蛋白質分子。人體除水分外,蛋白質是最主要組成部分,也是一切生命的物質基礎。

那麽我們現在來看看基因和蛋白之間的對應關系:比如現在有一條基因序列,…GCA AGA GAT TTA ACT…,其中每3個相連的核苷酸稱為密碼子,分別編碼一個氨基酸,比如GCA編碼丙氨酸,AGA編碼精氨酸…,蛋白質其實就是由這一堆氨基酸組成的。這也就將基因序列和蛋白的關系對應了起來。

技術分享

技術分享

我們以這張幻燈片為例,正常人的序列如圖所示,為GCA AGA GAT TTA ACT,如果編碼精氨酸的密碼子AGA,G堿基發生突變,變成了A堿基,那麽密碼子就會變為AAA,編碼賴氨酸,這樣就導致了氨基酸的序列發生了變化,進而可能會影響該基因編碼的蛋白結構,導致其不能正常行使功能。

如果編碼蛋白程序不正常了,那會影響到正常生命活動,就構成了遺傳病或者腫瘤。我們可以說:遺傳病就是遺存物質發生了破壞,正常基因功能改變而引起的疾病。

技術分享

那麽突變是如何發生的,或是突變的來自哪裏呢?主要是3個層面,胚系(生殖細胞)突變,體細胞突變,新發突變。

技術分享

突變遺傳自父母並存在於整個人的生命中,幾乎存在於身體的每個細胞,這些突變也稱為胚系突變,因為它們來自父母的卵子或精子,也稱為生殖細胞。

當卵子和精子結合時,合二為一的受精卵細胞接受來自雙親的DNA。 如果這個DNA有一個突變,孩子從受精卵發育開始,他/她的每個細胞將帶有這個突變。

這個也是我們進行遺傳病基因檢測時遇到比較多的一個類型。比如現在這個表中所列的我們公司的一個檢測結果,患者臨床表型與脊肌萎縮高度吻合,我們進行全外顯子組測序時就找到了這個致病的基因突變信息,為位於8號染色體上的ASAH1基因發生了純合突變所致,由該基因導致的基因突變與患者的臨床表型高度相符,我們在進行家系樣本分析的時候,就發現了該患者的父母均是這個致病基因的雜合突變攜帶者。即該患者的純合基因突變來自於雙親。

技術分享

獲得性(或體細胞)突變發生在一個人的某個時間並且僅存在於某些細胞中,而不存在於體內的每個細胞中。

這些變化可能是由環境因素造成的比如來自太陽的紫外線輻射,或者DNA在細胞分裂期間自己復制時發生錯誤。

獲得體細胞突變(精子和卵細胞以外的細胞)不能遺傳給下一代。

那麽這種常見的突變類型在哪一類疾病中比較常見呢,就是腫瘤。

技術分享

這也是為什麽腫瘤患者做基因檢測,樣本必須要求是腫瘤組織的原因。因為腫瘤的發生多是體細胞突變的結果,腫瘤組織中的基因信息與其他組織中的不同。

表中列出了腫瘤組織取樣的一些樣本要求和每個分別對應的保存及運輸條件。

技術分享

那麽這就有一個問題了,如果腫瘤患者沒有做過手術,或者腫瘤組織樣本不易獲取,腫瘤患者如何進行基因檢測呢?這就涉及到了現在比較流行的一個概念,及液態活檢。取的樣本就是人體的外周血,這個是為什麽呢?因為人體的外周血中就帶有來自腫瘤基因組的DNA片段,我們稱為循環腫瘤DNA(ctDNA)。它包含腫瘤組織的全部基因信息,就解決了腫瘤組織樣本取樣難的問題。

表中列出了如果做液態活檢所要求的血液樣本信息。

技術分享

新發突變的遺傳變異可以來自父母也可以是體細胞突變。

在某些情況下,突變發生在人的卵細胞或精細胞中,但不存在於任何其他細胞中。

在其他情況下,在卵細胞和精細胞結合後不久,在受精卵中發生突變。(通常不可能準確地知道何時發生了新發突變。)當受精卵分裂,每個生長的胚胎中的細胞都會有突變。

新發突變可以解釋部分受影響的患遺傳病孩子在身體的每個細胞中都有突變,但是父母卻沒有突變,而且沒有家族史。

這是我們分析過的另一個實例,該患兒檢測到可以解釋所患表型的SCN1A的雜合突變信息,但是檢測其雙親樣本時,並沒有發現這個基因突變的攜帶情況,即雙親樣本在該位點均和正常人相同。這種情況下,我們即可定義該基因突變為新發突變。

技術分享

以上簡單介紹了基因突變的來源,現在我們簡單介紹一下突變的類型。

它們可以影響少到單個DNA堿基多到包含多個基因的大片段染色體。

我們測一個全外顯子組數據,檢測到的變異數目大概在50000個左右,那麽這些變異都會影響我們的健康嗎?不是的,只有很少的一部分的變異導致遺傳疾病,大多數對健康沒有影響。例如,一些變異改變了基因DNA序列,但不改變由該基因產生的蛋白質的功能。

評判一個基因變異是否會對人體造成損害的基礎一步,就是看基因變異是否會對其編碼的蛋白產生影響。

技術分享

我們先來看看堿基水平的變異類型,主要分為2大類,一是單核苷酸變異( Single nucleotide variation ),簡稱為SNV;一是插入缺失( Insertion deletion ),簡稱InDel。

技術分享

單核苷酸變異即是基因組中的某個位置的單個堿基發生了變異。根據其對蛋白功能的影響,主要分為以下幾種類型:

第一種:錯義突變。指編碼某種氨基酸的密碼子經堿基替換以後,變成編碼另一種氨基酸的密碼子,從而使多肽鏈的氨基酸種類和序列發生改變。

我們以這個圖為例,GCA AGA GAT TTA ACT,編碼精氨酸的密碼子AGA,G堿基發生突變,變成了A堿基,那麽密碼子就會變為AAA,變成了編碼賴氨酸,導致了蛋白質的序列發生了改變。這種類型的突變稱為錯義突變。錯義突變的結果通常能使多肽鏈喪失原有功能,許多蛋白質的異常就是由錯義突變引起的。

技術分享

第二種:同義突變。指堿基被替換之後,產生了新的密碼子,但由於生物的遺傳密碼子存在簡並現象,新舊密碼子仍是同義密碼子,所編碼的氨基酸種類保持不變,因此同義突變並不產生突變效應。這裏涉及到一個概念,簡並密碼子,指一個氨基酸由一個以上的三聯體密碼編碼的現象叫做密碼子的簡並性。其中的密碼就叫做簡並密碼子。比如編碼精氨酸的密碼子有:CGU; CGC; CGA; CGG; AGA; AGG共6種。

我們以這個圖為例,GCA AGA GAT TTA ACT,編碼精氨酸的密碼子AGA,A堿基發生突變,變成了G堿基,那麽密碼子編碼的氨基酸其實還是精氨酸,並沒有造成蛋白質序列的改變,這種情況下也就不會對蛋白的功能造成影響。這種突變類型稱為同義突變。

技術分享

第三種:無義突變。指由於某個堿基的改變使代表某種氨基酸的密碼子突變為終止密碼子,從而使肽鏈合成提前終止。這類突變導致蛋白質縮短,其可能影響蛋白功能或完全破壞蛋白功能。

這裏涉及到另一個概念,終止密碼子,蛋白質翻譯過程中終止肽鏈合成的信使核糖核酸(mRNA)的三聯體堿基序列: UAG,UAA,UGA是終止密碼子。

我們以這個圖為例,GCA AGA GAT TTA ACT,編碼天冬酰胺的密碼子TTA,T堿基發生突變,變成了A堿基,那麽對應的密碼子編碼的氨基酸就由天冬酰胺,變成了終止密碼子TAA,導致其之後的密碼子不能再繼續編碼氨基酸,使蛋白質的序列縮短。這種情況通常是比較嚴重的,大多數情況下都會影響蛋白功能或完全破壞蛋白功能。

技術分享

插入:通過插入一段DNA序列,改變了基因的解讀方式。結果,由該基因產生的蛋白質可能完全不能正常運行。

如圖所示,在AGA 密碼子的AG之間插入了一個A堿基,這種情況下,在GCA之後的所有正常氨基酸的序列都被破壞了,由原有的丙氨酸-精氨酸-天冬氨酸-天冬酰胺-半胱氨酸…變成了丙氨酸-賴氨酸-精氨酸-苯丙氨酸-天冬酰胺…

這種情況對於蛋白質功能的影響也是巨大的。

技術分享

缺失是指缺少一段DNA,減少了DNA堿基的數目。缺失範圍可以從一個或幾個堿基對,到整個基因或幾個相鄰的基因。

如圖所示,若發生AGAG四個堿基的缺失,由正常的GCA AGA GAT TTA ACT…序列變成GCA ATT AAC T…,那麽編碼的氨基酸序列就會由原有的丙氨酸-精氨酸-天冬氨酸-天冬酰胺-半胱氨酸…變成了丙氨酸-異亮氨酸,由於TAA是一個終止密碼子,就導致了肽鏈合成的提前終止。

被刪除的DNA可能改變編碼蛋白質的功能。

技術分享

動態突變:由DNA分子中某些短串聯重復序列,尤其是基因編碼序列或側翼序列的三核苷酸重復擴增所引起。且重復次數會隨著世代交替的傳遞而呈現逐代遞增的累加突變效應。

如脊髓小腦性共濟失調,這是由動態突變導致的最常見的一類疾病。SCA1患者中的ATXN1基因,其正常人對應的CAG三核苷酸重復是在6-39次,而患者的該三核苷酸重復次數則達到了41-81次。

這裏邊比較嚴重的是SCA7型,正常人對應的CAG三核苷酸重復是在7-35次,而部分患者的該三核苷酸重復次數則高達200次。

這三個核苷酸的具體重復次數還和疾病的外顯率相關:

SCA17: 41 to 48 CAG/CAA repeats(外顯率50%);若大於等於49次,則會造成完全外顯。

外顯率:指在一定環境條件下,群體中某一基因型(通常在雜合狀態下)個體表現出相應表型的百分率。外顯率等於100%時稱為完全外顯,低於100%時則為不完全外顯或外顯不全。

技術分享

移碼突變:在正常的DNA分子中,堿基缺失或增加非3的倍數,造成這位置之後的一系列編碼發生移位錯誤的改變,這種現象稱移碼突變。所得蛋白質通常是無功能的。插入,缺失和重復都可以是移碼突變。

這種類型的突變發生在DNA堿基的插入或缺失時改變基因的閱讀框。閱讀框由多個含3個堿基的密碼子組成,每個密碼子編碼一個氨基酸。移碼突變使密碼子編碼錯位,改變了編碼的氨基酸類別。

技術分享

第二種大的變異類型為染色體水平的變異,包括兩種,一種是染色體數目異常,一種是染色體結構異常。

技術分享

人類細胞通常含有23對,46條染色體。染色體數量的變化可能導致身體生長,發育上存在問題。在細胞分裂過程中,染色體分離障礙,可導致染色體數目異常,包括整倍體和非整倍體兩類。

我們先來看一下染色體數目異常中的整倍性改變,如果染色體的數目變化是單倍體(n23)的整倍數,成倍的增加或減少,稱為整倍性改變。比如三倍體:就是2*23+1*23=69條染色體。

技術分享

非整倍體是染色體數不是染色體組的整倍數。

染色體數目異常按照染色體的類別分成了常染色體數目異常和性染色體數目異常。先看第一大類,常染色體數目異常。

比如唐氏綜合征是由三體型引起病癥的一個典型案例。唐氏綜合征患者通常有三條21號染色體,每個細胞總共有47條染色體。

其他的常見三體綜合征還有18三體綜合征、13三體綜合征等。

技術分享

第二大類是性染色體數目異常,就是指決定性別的女性XX染色體和男性XY染色體的數目異常導致。

比如Turner綜合征(也稱為女性先天性性腺發育不良或先天性卵巢發育不良綜合征),患該病的女性患者其中的一條X染色體缺失,每個細胞總共45條染色體。

Klinefelter綜合征:也稱為先天性睪丸發育不全,核型為47,XXY,故本病也稱為XXY綜合征。

技術分享

除染色體數目發生異常之外,還有一種就是染色體結構發生了畸變。主要包括缺失、重復、倒位、易位、環裝染色體、等臂染色體、插入等。

1.缺失 染色體中某一片段的缺失 例如,貓叫綜合征是人的第5號染色體部分缺失引起的遺傳病,因為患病兒童哭聲輕,音調高,很像貓叫而得名。貓叫綜合征患者的兩眼距離較遠,耳位低下,生長發育遲緩,而且存在嚴重的智力障礙。

2.重復 染色體增加了某一段,如圖所示。

3.倒位 染色體某一片段的位置顛倒了180度,造成染色體內的重新排列, 如女性習慣性流產的一種致病原因就是第9號染色體長臂倒置所致。

4.易位 染色體的某一片段移接到另一條非同源染色體上或同一條染色體上的不同區域 。如慣性粒白血病(第14號與第22號染色體部分易位。

5、環狀染色體:一條染色體的長短臂同時發生了斷裂,含有著絲粒的兩斷端發生重接,即形成環狀染色體。

6、等臂染色體:染色體的兩臂在基因的種類、數量和排列方面為對稱的相同的染色體。

7、插入:一條染色體的片段插入到另一條染色體中的現象。

技術分享

以上是關於基因變異的一些簡介。那麽我們所說的基因檢測的實質就是先找出和正常人不同的基因變異,進而再評估這些基因變異產生的影響,定位到和表型相關的基因變異信息的一個過程。

技術分享

以上就是基因檢測中的的一些基礎知識,包括細胞、染色體、DNA、基因的簡單介紹。基因突變,包括基因突變的概念介紹,基因突變的來源以及基因突變的類型及對蛋白的影響等。

下次課程中會介紹神經系統遺傳病基因檢測的一些簡單知識,包括OMIM數據庫的簡單介紹,單基因遺傳病的遺傳方式以及神經系統遺傳病的基因檢測技術選擇。

技術分享

感謝各位老師在百忙之中抽出時間收聽基因檢測基礎知識的簡單介紹。下面我們進入提問環節,各位老師有任何基因相關問題,都歡迎您在群內提出,我們共同進行交流。

現場問答環節

1. 您剛才所說的人體內編碼蛋白的基因的22000多個,還有37個線粒體基因。那如果我們平時通常選用的基因測序手段,會檢測到這些線粒體基因組嗎?

答:如果沒有特別說明的情況下,老師們選擇的基因測序手段通常都會是全外顯子組測序或基因panel的形式,這兩種檢測手段是檢測不到線粒體基因突變的。所以當有些疾病比如Leber視神經萎縮,肌陣攣性癲癇和粗糙纖維病等,致病基因很明確就是由線粒體基因突變導致。這種情況下我們就選擇線粒體基因測序就好了。下一次課程中我們會講一下神經系統疾病基因檢測的技術選擇,老師們可以關註一下。

2. 第四張圖片中的家系圖如何看?

方形代表男性,圓形代表女性,以黑色填充的代表患者,圖形中帶有斜線的表示這個人已經去世。圖形中有圓點的代表是突變基因攜帶者。

3. 你們對應報告中的那個檢測結果中的所列選項都是什麽意思?

基因—代表的是我們所檢測到的與患者表型相關的致病基因,染色體位置Chr2:166051890,代表該基因的突變位點位於2號染色體上的第166051890位,基因突變信息NM_006920是對應的轉錄本編號,exon6:c.793G>A:p.Gly265Arg:表示該突變位於SCN1A基因的第6號外顯子處,該基因編碼蛋白的序列的第793位由堿基G突變成了A,導致氨基酸由甘氨酸變成了精氨酸。

基因突變基本知識