摘要: 到目前為止,還無法解釋大約一半罕見遺傳性疾病的病因。
到目前為止,還無法解釋大約一半罕見遺傳性疾病的病因。慕尼黑的一個研究小組開發(fā)了一種算法,可以預(yù)測基因突變對RNA形成的影響,比以前的模型精確6倍。因此,可以更準(zhǔn)確地確定罕見遺傳疾病和癌癥的遺傳原因。
基因序列的變異發(fā)生得相對頻繁——平均而言,一個人的基因組中每一千個核苷酸中就有一個受到影響。在極少數(shù)情況下,這些變化會導(dǎo)致有缺陷的rna,從而導(dǎo)致無功能的蛋白質(zhì)。這可能導(dǎo)致個別器官功能障礙。如果懷疑一種罕見疾病,計算機輔助診斷程序可以幫助尋找可能的遺傳原因。具體來說,可以使用算法分析基因組,以找出罕見的遺傳變異與身體特定部位的功能障礙之間是否存在聯(lián)系。
跨學(xué)科研究項目
在慕尼黑工業(yè)大學(xué)(TUM)計算分子醫(yī)學(xué)教授、慕尼黑亥姆霍茲計算分子醫(yī)學(xué)研究小組負(fù)責(zé)人Julien Gagneur的領(lǐng)導(dǎo)下,來自信息學(xué)和醫(yī)學(xué)系的一個跨學(xué)科團隊開發(fā)了一種新的模型,該模型比以前的模型更能預(yù)測哪些DNA變異會導(dǎo)致錯誤形成的RNA。
圖1 一種新的模型能更好地預(yù)測哪些DNA變異會導(dǎo)致錯誤形成的RNA
Holger Prokisch博士說:“使用現(xiàn)有的DNA分析方法可以對大約一半的患者做出可靠的診斷。"Holger Prokisch博士是該研究的合著者,也是慕尼黑工業(yè)大學(xué)和亥姆霍茲慕尼黑大學(xué)人類遺傳學(xué)研究所的組長?!笆O碌模覀冃枰P蛠砀倪M我們的預(yù)測。我們新開發(fā)的算法可以為此做出重要貢獻(xiàn)。"
模型的重點是拼接
在他們的研究中,研究人員考慮了影響DNA轉(zhuǎn)化為RNA過程的遺傳變異,并最終以組織特異性的方式形成蛋白質(zhì)。研究的重點是剪接——細(xì)胞中的一個過程,在這個過程中,RNA被切割成一種可以稍后讀取蛋白質(zhì)構(gòu)建指令的方式。如果DNA發(fā)生變異,這一過程就會被打亂,導(dǎo)致從RNA上切割的DNA要么過多,要么過少。剪接過程中的錯誤被認(rèn)為是不正確的蛋白質(zhì)形成和遺傳性疾病的最常見原因之一。
比以前的研究要精確得多
該團隊利用現(xiàn)有的數(shù)據(jù)集,以便能夠?qū)μ囟ńM織中遺傳變異和剪接功能障礙之間的可能關(guān)聯(lián)做出陳述。這些數(shù)據(jù)集包含來自946個人的49個組織的DNA和RNA樣本。
與之前的研究相比,研究小組最初考慮了每個樣本,看看DNA變異導(dǎo)致的錯誤剪接是否以及在多大程度上通常通過剪接功能障礙在某些組織中表現(xiàn)出來。例如,一種蛋白質(zhì)可能與心臟的特殊區(qū)域有關(guān),而它可能在大腦中沒有功能。
“為此,我們創(chuàng)建了一個組織特異性剪接圖,其中我們量化了RNA上的哪些位置對給定組織中的剪接很重要。由于我們的方法,我們能夠?qū)⑽覀兊哪P拖拗圃谏飳W(xué)相關(guān)的背景下。我們使用的皮膚和血液樣本使我們能夠得出關(guān)于難以到達(dá)的組織的結(jié)論,例如大腦或心臟,"該研究的主要作者、TUM計算分子醫(yī)學(xué)主席的博士生尼爾斯瓦格納說。
圖2 研究設(shè)計和主要發(fā)現(xiàn)
在分析中,每個基因至少有一種罕見的遺傳變異,并且與蛋白質(zhì)的形成有關(guān)。除了RNA上的蛋白質(zhì)編碼部分,還有一些部分對我們細(xì)胞中的其他過程很重要。這項研究沒有考慮到這些因素。這導(dǎo)致了總共近900萬個罕見的遺傳變異被研究。
“由于我們新開發(fā)的模型,與以前的模型相比,我們能夠?qū)㈩A(yù)測錯誤拼接的精度提高六倍。在召回率為20%的情況下,以前的算法達(dá)到了10%的精度。我們的模型在相同的召回率下達(dá)到了60%的精度,"Julien Gagneur教授說。
精確率和召回率是預(yù)測模型有效性的重要指標(biāo)。這種精確度表明,該模型預(yù)測的基因變異中有多少實際上導(dǎo)致了錯誤的剪接。召回顯示了有多少導(dǎo)致錯誤剪接的遺傳變異突變被該模型恢復(fù)。
Julien Gagneur教授說:“我們通過以組織特異性的方式觀察剪接過程,并通過使用易于接近的組織(如血液或皮膚細(xì)胞)的直接剪接測量來預(yù)測心臟或大腦等不可接近組織的剪接錯誤,從而在精度上取得了如此大的進步。"
算法的實際應(yīng)用
該模型被用作歐洲研究項目“解決-研發(fā)-解決未解決的罕見疾病"的一部分。該倡議的目標(biāo)是通過廣泛的知識交流來改善罕見病的診斷結(jié)果。TUM的研究小組已經(jīng)分析了來自6000個受影響家庭的2萬個DNA序列。
此外,該模型應(yīng)該使將來更容易找到各種形式的白血病的遺傳診斷成為可能。為此,研究人員目前正在檢查來自白血病患者的4200個DNA和RNA樣本。
進一步的信息
Julien Gagneur教授于2016年來到TUM擔(dān)任助理教授。2020年,他接任計算分子醫(yī)學(xué)主席。他的研究是基于基因調(diào)控的遺傳基礎(chǔ)及其對疾病的影響,使用統(tǒng)計算法和機器學(xué)習(xí)。他也是亥姆霍茲慕尼黑大學(xué)的研究小組負(fù)責(zé)人。
Julien Gagneur教授與TUM和Helmholtz Munich人類遺傳學(xué)研究所的組長Holger Prokisch一起,正在制定確定遺傳疾病原因的策略。
參考資料:
[1] Aberrant splicing prediction across human tissues