聯邦學習最新醫療場景發布:楊強團隊與劉琦團隊合作打破藥物數據共享壁壘

2020-12-20     AI科技評論

原標題:聯邦學習最新醫療場景發布:楊強團隊與劉琦團隊合作打破藥物數據共享壁壘

近日,國內AI場景應用再次取得重要成果。來自同濟大學生物信息系的劉琦教授課題組與微眾銀行楊強教授AI團隊合作,通過聯邦學習來進行本地藥物隱私數據的保障,以及模擬多個製藥機構(用戶)之間的藥物協同開發,助力製藥機構在保障自身藥物數據隱私安全的前提下進行協同藥物發現。

該成果已發表在生物信息學領域著名期刊《Bioinformatics》上,題為《FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery》,首次探索了應用聯邦學習進行協同藥物開發的可行性,並提出了一種基於聯邦學習的協同藥物定量構效原型系統FL-QSAR。

圖:聯邦學習流程圖

定量構效模型是藥物設計領域的經典模型,可用於對於藥物分子結構和分子活性之間關係的建模和預測。生命科學領域嘗試通過經典的加密計算手段來進行生物和藥物數據的共享和建模,然而隨著世界各國提出了一系列法律法規(如歐盟的GDPR,美國的CCPA)來保護數據的私密性和安全性,要求數據不能出本地或跨域,傳統數據共享方法將面臨新的法律法規的挑戰。

聯邦學習是近年提出的一種新的合法連結數據孤島進行數據共享計算的協作範式,由谷歌和楊強教授團隊分別在to C和to B場景率先提出。相比於傳統數據加密共享方法,聯邦學習基於數據可用不可見的理念,通過聚合所有用戶的加密模型參數,在數據不出本地的情況下進行模型協同訓練,能夠更好的面對數據共享領域出現的新的問題和法律法規約束。

聯邦學習在金融等領域已獲得廣泛關注,但是在藥物研發及生物計算領域尚未有所應用。製藥領域普遍對於數據不出本地進行共享有著強烈需求,迫切需要探索聯邦學習在該領域的應用。本次微眾銀行AI團隊和同濟大學的合作項目,是聯邦學習在藥物研發領域首次應用探索。

項目首次在藥物小分子領域探索使用聯邦學習範式進行藥物協同開發的可行性,結合微眾銀行的聯邦學習開源平台FATE,開發了基於聯邦學習的協作藥物發現平台FL-QSAR。研究團隊通過對於包含了15個藥靶的QSAR 基準數據來構建深度學習模型,進行QSAR建模以及多製藥機構(多用戶)環境下的協同藥物開發模擬,模擬結果證明:(1)多用戶通過FL-QSAR進行協同QSAR建模,將顯著優於單用戶僅使用其私有數據進行QSAR建模,(2)通過特定的模型優化,FL-QSAR可以在保護藥物小分子結構隱私的前提條件下,獲得與直接整合多用戶小分子數據進行QSAR建模相同或者類似的模型預測效果。

同濟大學與微眾銀行AI團隊在這項產學研協同中,嘗試去解決傳統藥物領域的上述「頑疾」——即不同的製藥機構之間可以通過數據共享來提高QSAR建模預測的準確率,然而該領域的智慧財產權和相關的經濟利益不利於製藥機構之間進行數據的直接共享和合作。通過在藥物小分子領域探索使用聯邦學習範式進行藥物協同開發的可行性,結合微眾銀行的聯邦學習開源平台FATE, FL-QSAR可以在保護藥物小分子結構隱私的前提條件下,獲得與直接整合多用戶小分子數據進行QSAR建模相同或者類似的模型預測效果。

這是一種有效的藥物協同發現的解決方案,打破了傳統QSAR建模時不同製藥機構之間的數據無法直接共享的壁壘,有助於在隱私保護的前提條件下進行協同藥物發現,並適合於推廣和應用到生物醫學隱私計算的其他相關領域。該研究成果得到國家重大研究與發展計劃、國家自然科學基金項目、上海市自然科學基金項目、上海市人工智慧標準專項項目等基金的資助。

從全球來看,AI產業化進入深水區,近日谷歌AI團隊DeepMind所研究的AlphaFold 算法在生物學領域也取得了重要突破,在此算法下,可通過蛋白質的胺基酸序列高精度地確定其3D結構。AI與生物醫學的密切結合將推進人類健康事業的發展與探索進入新的階段,多位業界專家紛紛表態,稱「AI將改變生物學」,而聯邦學習等新技術的加入將從隱私保護等倫理道德層面為探索之路保駕護航。

論文詳情:https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaa1006/6026958

文章來源: https://twgreatdaily.com/zh-tw/DVZFiHYBur8RWXSAwEjj.html