雙端測序、DNA甲基化及CPG島、轉錄組分析名詞
表觀遺傳學認為在不改變DNA序列的情況下,通過DNA和組蛋白的修飾來調控基因的表達,而其中DNA甲基化最為常見(DNA methylation).在人類的表觀遺傳學中,CpG島的甲基化修飾最為常見,
CpG島的甲基化修飾主要過程是在CpG甲基化結合蛋白(Methyl-CpG Binding Proteins.MBDs)和DNA甲基化轉移酶(DNA methyltransferases.DNMTs)的作用下,使得CpG二核苷酸5’端的胞嘧啶轉變為5’甲基胞嘧啶。
目前研究發現,在正常人類的DNA中,約有3-6%的胞嘧啶被甲基化。在哺乳動物中,約有50,000,000個CpG二核苷酸,其中70%的被甲基化。而那些可被甲基化的CpG 二核苷酸並非隨機的分布於基因組序列中,相反,在基因組的某些區域中,通常是基因的啟動子區域,5’端非翻譯區和第壹個外顯子區,CpG序列密度非常高,超過均值5倍以上,成為鳥嘌呤和胞嘧啶的富集區,稱之為CpG島(CpG Islands, CGIs)
最近,為了排除那些Alu重復序列,提出了更嚴格的標準:長度至少500堿基對,GC含量超過55%,CpG比值大於0.65。? 據研究估計,哺乳動物基因組中的CpG島約有4萬個。在健康人的基因組中,CpG島中的CpG位點壹般處於非甲基化狀態,而CpG島外的CpG位點通常是被甲基化的。
如圖1左所示,在正常細胞中,位於抑癌基因啟動子區域的CpG島處於低水平或未甲基化狀態,此時抑癌基因處於正常的開放狀態,抑癌基因不斷表達抑制腫瘤的發生。而在腫瘤細胞中,該區域的CpG島被高度甲基化,染色質構象發生改變,抑癌基因的表達被關閉,從而導致細胞進入細胞周期,雕亡喪失,DNA修復缺陷,血管生成以及細胞粘附功能缺失等,最終導致腫瘤發生。同樣,如圖1右所示,對於在正常細胞中處於高度甲基化的壹些基因和重復序列,如果其甲基化水平降低,這些基因將表達和重復序列將激活,從而導致基因印記丟失,細胞過度增長,不合適的細胞特異性表達,基因組脆性增加,以及內寄生序列(endoparasitic sequence)的激活,最終也導致腫瘤發生。
由於CpG島的局部高度甲基化要早於細胞惡性增生,故其甲基化的檢測可用於腫瘤的預測,而全基因組水平的低水平甲基化狀態,則隨著腫瘤惡性程度的增加而進壹步降低,使其可用於腫瘤的診斷以及分級。
最後關於甲基化測定方法詳見/?p=18458
其中遇到壹個很重要的概念基因組印跡:經典孟德爾遺傳學認為所有父系及母系等位基因有同等表達,但隨著對遺傳學研究的深入,人們發現了壹種稱為基因印記的非孟德爾遺傳現象,它指在配子或合子的發生期間,來自親本的等位基因或染色體在發育過程中產生專壹性的加工修飾,導致後代體細胞中兩個親本來源的等位基因有不同的表達方式,又稱遺傳印記或配子印記。它是壹種伴有基因組改變的非孟德爾遺傳形式,可遺傳給子代細胞,但並不包括DNA序列的改變。
Alu序列:Alu重復序列是哺乳動物基因組中SINE家族的壹員,約有50萬份拷貝。也就是說平均4~6 kb中就有壹個Alu序列。Alu序列壹般散在分布,少數呈簇狀分布。在細胞遺傳學水平上觀察,Alu重復序列集中在基因轉錄最活躍的染色體區段內。在所有已知的基因內含子中,幾乎都發現了Alu序列。這種DNA序列中有限制性內切核酸酶Alu的識別序列AGCT,所以稱為Alu重復序列
轉錄組分析之名詞解釋:/s/YTJC5cv4xshKyD6lqPsWog