聯邦學習最新醫療場景發布：楊強團隊與劉琦團隊合作打破藥物數據共享壁壘

近日，國內AI場景應用再次取得重要成果。來自同濟大學生物信息系的劉琦教授課題組與微眾銀行楊強教授AI團隊合作，通過聯邦學習來進行本地藥物隱私數據的保障，以及模擬多個製藥機構（用戶）之間的藥物協同開發，助力製藥機構在保障自身藥物數據隱私安全的前提下進行協同藥物發現。

該成果已發表在生物信息學領域著名期刊《Bioinformatics》上，題為《FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery》，首次探索了應用聯邦學習進行協同藥物開發的可行性，並提出了一種基於聯邦學習的協同藥物定量構效原型系統FL-QSAR。

圖：聯邦學習流程圖

定量構效模型是藥物設計領域的經典模型，可用於對於藥物分子結構和分子活性之間關係的建模和預測。生命科學領域嘗試通過經典的加密計算手段來進行生物和藥物數據的共享和建模，然而隨著世界各國提出了一系列法律法規（如歐盟的GDPR，美國的CCPA）來保護數據的私密性和安全性，要求數據不能出本地或跨域，傳統數據共享方法將面臨新的法律法規的挑戰。

聯邦學習是近年提出的一種新的合法連結數據孤島進行數據共享計算的協作範式，由谷歌和楊強教授團隊分別在to C和to B場景率先提出。相比於傳統數據加密共享方法，聯邦學習基於數據可用不可見的理念，通過聚合所有用戶的加密模型參數，在數據不出本地的情況下進行模型協同訓練，能夠更好的面對數據共享領域出現的新的問題和法律法規約束。

聯邦學習在金融等領域已獲得廣泛關注，但是在藥物研發及生物計算領域尚未有所應用。製藥領域普遍對於數據不出本地進行共享有著強烈需求，迫切需要探索聯邦學習在該領域的應用。本次微眾銀行AI團隊和同濟大學的合作項目，是聯邦學習在藥物研發領域首次應用探索。

項目首次在藥物小分子領域探索使用聯邦學習範式進行藥物協同開發的可行性，結合微眾銀行的聯邦學習開源平台FATE，開發了基於聯邦學習的協作藥物發現平台FL-QSAR。研究團隊通過對於包含了15個藥靶的QSAR 基準數據來構建深度學習模型，進行QSAR建模以及多製藥機構（多用戶）環境下的協同藥物開發模擬，模擬結果證明：（1）多用戶通過FL-QSAR進行協同QSAR建模，將顯著優於單用戶僅使用其私有數據進行QSAR建模，（2）通過特定的模型優化，FL-QSAR可以在保護藥物小分子結構隱私的前提條件下，獲得與直接整合多用戶小分子數據進行QSAR建模相同或者類似的模型預測效果。

同濟大學與微眾銀行AI團隊在這項產學研協同中，嘗試去解決傳統藥物領域的上述「頑疾」——即不同的製藥機構之間可以通過數據共享來提高QSAR建模預測的準確率，然而該領域的智慧財產權和相關的經濟利益不利於製藥機構之間進行數據的直接共享和合作。通過在藥物小分子領域探索使用聯邦學習範式進行藥物協同開發的可行性，結合微眾銀行的聯邦學習開源平台FATE， FL-QSAR可以在保護藥物小分子結構隱私的前提條件下，獲得與直接整合多用戶小分子數據進行QSAR建模相同或者類似的模型預測效果。

這是一種有效的藥物協同發現的解決方案，打破了傳統QSAR建模時不同製藥機構之間的數據無法直接共享的壁壘，有助於在隱私保護的前提條件下進行協同藥物發現，並適合於推廣和應用到生物醫學隱私計算的其他相關領域。該研究成果得到國家重大研究與發展計劃、國家自然科學基金項目、上海市自然科學基金項目、上海市人工智慧標準專項項目等基金的資助。

從全球來看，AI產業化進入深水區，近日谷歌AI團隊DeepMind所研究的AlphaFold 算法在生物學領域也取得了重要突破，在此算法下，可通過蛋白質的胺基酸序列高精度地確定其3D結構。AI與生物醫學的密切結合將推進人類健康事業的發展與探索進入新的階段，多位業界專家紛紛表態，稱「AI將改變生物學」，而聯邦學習等新技術的加入將從隱私保護等倫理道德層面為探索之路保駕護航。

論文詳情：https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaa1006/6026958

聯邦學習最新醫療場景發布：楊強團隊與劉琦團隊合作打破藥物數據共享壁壘

直播預告 | 明晚七點，相約阿里巴巴ACL 2021分享會（一）

ICCV 2021 DeeperAction挑戰賽

真正實現類人智能！美國工程院院士Jeff Hawkins：創造機器智能之路

Call for Papers丨KDD 2021 預訓練研討會，唐傑教授領銜

618如何避免剁手"X.O"洋酒？這個打假AI說：不怕，我1秒能識別20個！

亞馬遜首席科學家李沐：五年總結

強迫投稿者引用自己論文，IEEE高級會員被終身「禁賽」，網友：這事在國內很常見......

這5個數學猜想最早在30年前提出，如今AI證明它們都錯了

華人首次！清華姚班助理教授張煥晨獲得SIGMOD Jim Gray博士論文獎！

PapersWithCode和arXiv再次合作！可一鍵顯示論文使用的數據集

香港、澳洲三所高校 AI 博士生招生！還有研究助理和實習生等你加入......

ICML剛剛放榜！接收率僅21%為近五年最低，感謝審稿人不「殺」之恩

李飛飛高徒Andrej Karpathy用AI撰寫內心獨白：我的「進化」之路

直播預告 | 視聽感知學習魯棒性初探

香港、美國、新加坡三所高校新一輪 AI 博士生招生！快來一起發頂會論文

2021年Facebook博士生獎研金名單公布！一半獲獎者是華人博士生

摩根大通公布2021年AI研究博士生獎學金名單！獲獎華人博士生占1/3

預告 | 商湯學術公開課-AI畫質專題課程來襲！

網吹錢偉長寫論文「不必參考任何文獻」，但這的確不符合學術規範

重磅！Science &上海交大發布最新「全世界最前沿的125個科學問題」！

圖靈獎得主Jeffrey Ullman ：我是如何入坑計算機科學的？

學NLP的人跑去CV頂會投稿，中了頂會一作，還是一位本科生？

德撲AI大神、AAAI學術新星 Noam Brown：不完美信息多智能體場景下的AI研究

「倒計時1天」香港AI頂會報名開啟！楊強、譚鐵牛等6位院士18位專家，聯袂報告