1. 程式人生 > >“基因編輯嬰兒”惹爭議,你或許不知道機器學習在脫靶效應中的作用?

“基因編輯嬰兒”惹爭議,你或許不知道機器學習在脫靶效應中的作用?

640?wx_fmt=jpeg


作者|琥珀

出品| AI科技大本營


又一次,電腦科學家和生物學者站在一起,對抗人類向內探索的挑戰——用機器學習預測基因編輯 CRISPR 中的脫靶效應。


今年年初,發表在《自然》生物工程雜誌上的一篇論文描述了 Elevation 這項工具。該工具由微軟研究員 Nicolo Fusi、加州大學伯克利分校的 Jennifer Listgarten 和 Broad 研究所副主任 John Doench 合作研發,可在 CRISPR 編輯基因時預測脫靶效應。


640?wx_fmt=png

那麼何為“脫靶”?何為“CRISPR”?何為“基因編輯技術”?


首先,讓我們來認識這項關鍵技術“CRISPR”(Clustered regularly interspaced short palindormic repeats),也被稱為“CRISPR/Cas9 基因編輯技術”。


根據維基百科上的介紹來看,CRISPR 是存在於細菌中的一種基因組,該基因組中含有曾經攻擊過該細菌的病毒的基因片段。細菌透過這些基因片段來偵測並抵抗相同病毒的攻擊,並摧毀其 DNA 的特定部分。目前 Cas9 是首個被掌握且廣泛應用的核酸酶。


該系統主要由兩部分構成:一個負責剪下的 Cas9 蛋白,一個負責識別基因組中特定序列的“嚮導RNA”(sgRNA)。


通過該序列,科學家們可以準確且有效地編輯生命體內的部分基因(通俗來講,就是在特定基因的特定位點切割和改變 DNA)。該技術可能會帶來突破性應用,如改造細胞生產高產耐寒作物,甚至還可能幫助人類大規模消除癌症、艾滋等疾病。


機器學習預測脫靶效應


不知大家是夠還記得 2017 年 5 月發表在《Nature Methods》雜誌上的一篇題為“Unexpected mutations after CRISPR-Cas9 editing in vivo”的論文研究?儘管後續調查發現研究存在的實驗漏洞導致了錯誤判斷,但也側面反映出 CRISPR/Cas9 基因編輯系統存在的技術安全上諸多挑戰。


其中一個重要問題就是發生在基因組中的脫靶效應,不僅在其目標序列切割,還對相似序列進行切割,導致產生潛在突變及危害。這一現象被稱為“脫靶效應”。


為此,研究人員現在有多種方法來改善這一問題。本文開頭提到的 Elevation 工具正是試圖通過機器學習手段予以預測。


首先,他們在生成的資料上訓練出了第一層機器學習模型。這些資料報告了所有可能的靶向區域的活動,只有一個核苷酸與嚮導 RNA 不匹配。


然後,通過團隊哈佛醫學院和馬塞諸塞州總醫院附屬醫院給出的公開資料,機器學習專家訓練了第二層模型,該模型將第一層模型改進並推廣到模型存在多個錯配核苷酸的案例中。


"第二個模型非常重要,因為脫靶效應可以發生在不止一次嚮導 RNA 與靶向 DNA 之間的錯配",伯克利大學分校 Lisgarten 教授表示。在他看來,一些模型特徵是直觀的,例如嚮導 RNA 與核苷酸序列之間的錯配問題。


最後,該團隊在其他幾個公開資料集上驗證了他們的雙層模型,這其中還包括哈佛醫學院和馬塞諸塞州總醫院附屬醫院生成的資料集。


通過計算工具,研究人員可以輸入他們想要修改的基因名稱,搜尋結果將反饋出預測的脫靶效應,研究人員據此再進行排序。研究人員面臨的首要挑戰是為特定的實驗選擇何種 RNA。在每個嚮導 RNA 上大約有 20 個核苷酸,因此在每組實驗中,每個靶向 DNA 基因上都匹配有數百種潛在的嚮導 RNA。


目前 Elevation 和另一篇用於預測靶向效應的工具 Azimuth 合起來使用,現已開原始碼。(連結:https://www.crispr.ml/)


一場始料未及的風波


實際上,“脫靶效應”這個早就讓研究人員們“草木皆兵”的研究話題自始至終都沒有妥善的解決方案,而今卻因另一件尚未確認的“突破性”進展驟然掀起了世界範圍內包括學術研究者在內的熱議。


挑起人們興趣的來源於 11 月 26 日的一則公開訊息。


“一對基因經過修改的雙胞胎嬰兒已於 11 月健康誕生,基因編輯使她們將來可能具有天眼抵抗艾滋病的能力。這是世界首例免疫艾滋病的基因編輯嬰兒,也意味著中國在基因編輯技術用於疾病預防領域實現歷史性突破。”


來自中國深圳的科學家賀建奎在第二屆國際人類基因組編輯峰會召開前一天表示。


640?wx_fmt=png

圖:賀建奎


然而,這個“歷史性突破”卻未迎來掌聲,而是更多人對該起事件的譴責。就連該技術發明人 Jennifer Doudna 也緊急迴應稱:“假定今天( 26 日)的新聞得到證實,這使得對基因編輯技術的使用限制更為緊迫,我們應該限制對人類胚胎細胞的基因編輯僅僅用於確切的未被滿足的醫學需求。”


基因編輯技術,無論是用在人類醫學、動植物育種還是藥物篩選領域,都存在技術與倫理道德層面的雙重考驗。


那麼如果在可接受的倫理道德和醫學需求範圍之內,研究人員對基因編輯技術的探索仍舊不會終止。


這不禁讓筆者想起了“進擊的巨人”中描述的那樣:破牆而入捕食人類的巨人,實際上在數百年前是人類自己所創造。


目前賀建奎團隊表示將於11 月 28 日(本週三)在香港正式釋出關於此次基因編輯的全盤報告,讓我們拭目以待。


精彩推薦



CSDN 學院出品的《人工智慧工程師直通車》實訓營,目的是:通過 120 天的實戰,將學員培養達到具備一年專案經驗的人工智慧工程師水平。CSDN 百天計劃課程共分為 3 個階段,4 個月完成。掃描下方二維碼可領取千元優惠券。


640?wx_fmt=png