DeepMind研發基因檢測AI工具,將公開發布針對7100萬種變體的預測

2023-09-21     DeepTech深科技

原標題:DeepMind研發基因檢測AI工具,將公開發布針對7100萬種變體的預測

DeepMind 表示,它已經訓練出一種人工智慧,可以預測我們基因組中的哪些 DNA 變異可能導致疾病。預測結果可以加快罕見疾病的診斷,並可能為藥物開發提供線索。

(來源:AI 生成)

DeepMind 成立於倫敦,10 年前被谷歌(Google)收購。DeepMind 此前最出名的人工智慧程序以打遊戲出名,征服了《星際爭霸 2 》和圍棋等複雜的遊戲。

該公司此前曾宣布,其人工智慧程序 AlphaFold 能夠準確預測蛋白質的形狀,這是生物學上的一個「重大挑戰」。

最近,該公司表示,他們已經對 AlphaFold 模型進行了微調,以預測在人類 DNA 中發現的哪些「拼寫錯誤」可以安全地忽略,哪些可能導致疾病。

在 Science 上發表的最新論文中,DeepMind 的研究人員介紹了這款名為 AlphaMissense 的新軟體。

DeepMind 表示,作為其項目的一部分,它公開發布了數千萬個這樣的預測,但該公司不允許人們直接下載該模型。因為它認為,如果該技術應用於其他物種,可能會帶來潛在的生物安全風險。

雖然不是為了直接診斷,但醫生已經在使用計算機預測來幫助定位一些神秘的綜合症的遺傳原因。

在一篇博客文章中,DeepMind 表示,其研究結果是揭示「疾病根源」的努力的一部分,可能會幫助尋找「更快的診斷和開發挽救生命的治療方法」。

這個為期三年的項目由 DeepMind 工程師 Jun Cheng 和澤佳·阿烏賽克(Žiga Avsec)領導,該公司表示,它將公開發布對 7100 萬種可能變體的預測。

每一個都是所謂的「錯義突變」,即一個 DNA 字母,如果它被改變,就會改變基因所產生的蛋白質。

「(這項工作)想要達成的目標是,如果看到了一個蛋白質的變化,我不需要預測蛋白質的形狀,而是想知道,這個變化會對人有害嗎?」 美國密西根州立大學(Michigan State University)物理學家 Stephen Hsu 說道。他主要研究用人工智慧技術解決遺傳問題。

「大多數這樣的基因改變,我們根本不知道它們是否會導致疾病。」

一些專家表示,DeepMind 的聲明只是又一個新的光鮮亮麗的商業演示,其商業價值尚不明確。

「DeepMind 正在做 DeepMind 一直在做的事,」研發藥物的人工智慧公司 Insilico Medicine 的創始人亞歷克斯·扎沃龍科夫(Alex Zhavoronkov)說。

「宣傳工作很到位,人工智慧工作也很棒。」

扎沃龍科夫認為,對現代人工智慧的真正考驗是,它是否能帶來新的治療方法,而這一點目前還沒有展現出來。

但投資者表示,一些人工智慧設計的藥物正在測試中,研究和創造有用的新蛋白質是一個特別熱門的領域。

據報道,一家名為 Generate Biomedicines 的公司剛剛籌集了 2.73 億美元用於製造抗體,一群前 Meta 工程師創建了 EvolutionaryScale 公司,該公司認為人工智慧可以製造出「尋找並摧毀癌症的可編程細胞」。

更好的模型

然而,DeepMind 的新努力與藥物關係不大,更多的是與醫生如何診斷罕見疾病有關,尤其是對那些有神秘症狀的患者,比如不會消失的新生兒皮疹,或者成年人突然感到虛弱。

隨著基因測序技術的興起,醫生現在可以解碼人們的基因組,然後在 DNA 數據中尋找可能的罪魁禍首。

有時,病因是明確的,比如導致囊性纖維化的突變。

但美國麻薩諸塞州劍橋市伯德研究所(Broad Institute)臨床實驗室主任海蒂•雷姆(Heidi Rehm)說,在進行了廣泛基因測序的病例中,約有 25% 的病例會發現可疑的 DNA 變化,但其影響尚不完全清楚。

科學家們稱這些神秘的突變為「意義不明的變異」,它們甚至可能出現在像 BRCA1 這樣經過詳盡研究的基因中。BRCA1 出現特定的遺傳性變異,可導致一種遺傳性的癌症風險。

雷姆說:「沒有一個基因是不會出現這些變異的。」

DeepMind 表示,AlphaMissense 使用了人工智慧來預測哪些 DNA 變化是良性的,哪些是「可能致病的」,從而幫助人們尋找答案。

該模型並不是唯一一個嘗試此類預測的模型,另一個名為 PrimateAI 的程序,也旨在做出類似的預測。

雷姆說:「在這個領域已經有很多工作,總的來說,這些計算機預測器的質量已經提高了很多。」

然而,雷姆說,計算機預測只是「一個證據」,它本身並不能讓她相信 DNA 的變化真的會讓人生病。

通常情況下,專家們在獲得來自患者的真實數據、家庭遺傳規律的證據和實驗室測試結果(這些信息通過 ClinVar 等公共網站共享)之前,是不會確認突變是致病的。

雷姆說:「這些模型正在改進,但沒有一個是完美的,它們仍然不能讓你知道某種變異是否致病。」她說,DeepMind 直接將變異描述為良性或致病,這種做法似乎誇大了其預測結果的醫學確定性,讓她感到「失望」。

微調

DeepMind 表示,新模型是基於此前預測蛋白質形狀的 AlphaFold 模型的。

DeepMind 科研副總裁普什米特·科利(Pushmeet Kohli)表示,儘管 AlphaMissense 做了一些非常不同的事情,但該軟體在某種程度上「利用了它從之前的任務中獲得的」生物學直覺。

由於新模型是基於 AlphaFold 的,它只需要相對較少的運算時間來運行,比從頭開始構建消耗的能量更少。

用技術術語來說,模型經過了預訓練,隨後進行了微調來適應新的任務。

出於這個原因,KdT Ventures 的醫生和生物學家派屈克·馬龍(Patrick Malone)認為,AlphaMissense 是「一個很好的例子,展示了人工智慧領域最近最重要的方法論發展」。

馬龍說:「其背後的核心概念是,經過微調的人工智慧能夠利用先前學到的東西。」

「預訓練框架在計算生物學中特別有用。在該領域中,我們經常受到數據規模的限制。」

生物安全風險

DeepMind 表示,它已經免費提供了對人類基因的所有預測,以及完全複製這項工作所需的所有細節,包括計算機代碼。

然而,DeepMind 並沒有發布整個模型供其他人下載和使用。因為它聲稱,如果應用於分析人類以外物種的基因會有生物安全風險。

作者在論文的中寫道:「作為我們承諾的安全、負責任地發布研究突破的一部分,我們不會共享模型權重,以防止在潛在的不安全應用中使用。」

目前還不清楚這些不安全的應用具體指的是什麼,也不清楚研究人員想到了哪些非人類物種。

DeepMind 沒有詳細說明這些風險,但風險可能包括使用人工智慧設計更危險的細菌或生物武器。

然而,至少有一位外部專家(由於谷歌投資了他創辦的公司,他要求匿名)表示,這些限制是為了阻止其他人和機構迅速部署該模型,以滿足自己的用途。

DeepMind 否認它是出於安全以外的原因限制該模型。

DeepMind 的一位發言人表示,這項工作由研究負責任人工智慧的 Google DeepMind Institute 和一位「外部生物安全專家」進行了評估。

DeepMind 在一份聲明中表示,對該模型的限制「主要限制了對非人類蛋白質序列的預測」。

「不公開模型權重,可以防止其他人下載該模型,並在非人類物種中使用,從而減少了不良行為者濫用該模型的可能性。」

作者簡介:安東尼奧·尼加拉多(Antonio Regalado)是《麻省理工科技評論》生物醫學的高級編輯。他致力於尋找技術如何改變醫學和生物醫學研究的故事。在 2011 年 7 月加入《麻省理工科技評論》之前,他住在巴西聖保羅,在那裡他為《科學》和其他出版物撰寫了關於拉丁美洲科學、技術和政治的文章。2000 年至 2009 年,他曾是《華爾街日報》的科學記者。

支持:Ren

文章來源: https://twgreatdaily.com/zh/9261f2037a77c3ef01b921b731a39cfc.html