不知道大夥們還記得,那名用 50 張 1080 TI 顯卡對抗癌症的「 業餘 」程式設計師不。
他曾自掏腰包訓練了個 AI ,還整了個免費的網站,讓人工智幫你「 看片子」,能快速診斷出乳腺癌。
當時差評君就在暢想,未來,AI 技術在醫學領域,鐵定能濺起不小的水花兒。
但誰也沒想到,這未來來得實在有些快,而且比起水花,AI 掀起的更像是大浪。
這不在前不久,醫學頂刊 Nature Medicine 上就登了一篇論文,說是用 AI 大模型 + 簡單的平掃 CT ,就可能大規模地篩查出早期胰腺癌了。
這消息,直接就在醫學圈兒炸開了。
Nature Medicine 就罕見地附帶了一篇評論文章,標題是這樣的:在AI 加持下的醫療影像,即將迎來黃金時代。
各大媒體也都爭相報道, 「 突破難題 」「 人類首次 」 等讚美之詞毫不吝嗇。
而如果用一句話,來形容這技術的含金量的話。
差評君覺得比較貼切的是:放在過去,這事兒想都不敢想。
這麼說吧,這次的大反派 「 胰腺癌 」 ,在所有癌症里有個可怕的名字—— 「 癌症之王 」 。
只要確診胰腺癌,幾乎就是被判了死刑,近 90% 的人在確診胰腺癌後,活不過 5 年,這在癌症里算是一個相當可怕的數字了。
好多名人像吳尊友、帕瓦羅蒂等都是因為胰腺癌去世的。
死亡率這麼高的原因,在於胰腺癌早期太難被發現了,一旦發現,大機率就是晚期。
因為胰腺這玩意兒,位置非常隱蔽,藏在胃後面,被十二指腸、脾臟和肝臟等器官包圍住了。
而我們一般去醫院體檢的項目,像超聲、平掃 CT 等等這些,很難發現早期胰腺癌的特徵。
當然,增強 CT 或者是增強核磁共振,能把胰腺看得更清楚些。
但胰腺癌的發病率其實並不高,在所有癌種中只排在十名開外。
所以考慮到輻射、醫療資源擠兌等問題。。。為了胰腺,每個人每年都去做增強 CT 或增強核磁共振,其實划不來。
基本上只有病人發現了異樣,才會去做這些項目。
但在症狀上想發現早期胰腺癌,也很難行得通。
前期患者們的症狀一般是噁心、嘔吐、身體虛弱等,這和普通生病的症狀沒啥兩樣,醫生們很容易就會被 「 忽悠 」 。
並且癌變會影響胰腺功能,早期胰腺癌還很可能偽裝成糖尿病。。。
於是在影像 + 症狀雙重 Debuff 的情況下,想大規模篩查早期的胰腺癌就變成了一件難上加難的事。
所以這些年來,醫學界為了能早點發現胰腺癌,可脫了不少發、禿了不少聰明腦瓜,但最後的成果呢,寥寥無幾。
前些年,業內還有個很火的滴血驗癌( ctDNA ),一度被大家看好,它是從患者的血液里找有沒有癌症的碎片。
但這個方法,同樣也很難發現癌症一期、二期的血液碎片,到現在快十年過去了,依舊沒啥進展。
而這次,研究人員們想到了用 AI 大模型,來解這道題。
差評君也去到 Nature Medicine 官網上,翻了翻論文原文,有一說一,它還真有可能在早篩胰腺癌這塊豁出個口子。
這次,他們整出了個名叫PANDA ( pancreatic cancer detection , with artificial intelligence )的 AI 大模型,根據簡單的平掃 CT 圖像,它就能做出胰腺癌相關的診斷。
這麼說吧,在臨床驗證中,研究團隊試驗了兩萬多個病例, PANDA 幾乎就沒咋漏診,99.9% 有胰腺癌的都給診斷出來了。
偶爾有一些誤診,也都是很容易排除的病變,像什麼脂肪浸潤、胃腸內容物等,醫生簡單審核下就能排除掉。
而用 AI 這點子,最早是上海市胰腺疾病研究所的曹凱醫生(也是這篇論文的共同第一作者 )想到的。
在他身上還有這麼一小段故事,在大學期間,曹凱的實習導師也因胰腺癌去世,和很多患者一樣,他在確診的時候就已經是晚期了。
不過後來他在整理導師的病例資料時發現,在確診十個月前,導師就曾做過一次平掃 CT 。
雖然當時沒發現什麼苗頭,但帶著結論回過頭來分析,就能隱約看到到胰腺那裡有病變的跡象。
在這樣一個契機下,曹凱就想,既然人眼很難識別到平掃 CT 圖像里,早期胰腺癌病變的跡象,那不如藉助 AI 幫醫生先篩查一遍。
後來,他遇到了達摩院醫療 AI 團隊負責人呂樂,他們兩個在這塊不謀而合,這才有了現在的 PANDA 模型。
PANDA 幫忙篩查胰腺癌的過程說起來也很簡單,和醫生看片子也沒啥兩樣。
不過它憑藉強大的算法,注意到的細節比醫生肉眼看到的多得多,自然也能順利找到疑似病變的地方。
但要練好這麼一個 AI ,可不是動動嘴皮那麼容易的事。
它不像語言模型出錯了打個哈哈就能過去, PANDA 對準確性的要求非常高。
而判斷它看病好不好,還有兩個維度,一個是特異性,一個是敏感性。
要是特異性高了,就很容易漏診,敏感性高了,又會誤診。
而調這個漏診、誤診的 「 天平 」 ,歸根結底,還得看喂給模型的數據集和訓練模型的方法。
先是數據集,都說寵物毛髮順不順還得看主人喂什麼,在訓練模型上也是同樣的道理。
這塊研究團隊是下了血本,他們召集了來自各個醫院的48 個醫生,一共收集了3000 個病人的腹部 CT 圖像。
其中有大概 2200 多個胰腺癌患者,和將近 1000 個非胰腺癌的病人。
這 3000 個病人的數據,都是醫生們自己一個個手動標註的。
並且因為平掃 CT 圖的對比度太低,手動標註不太現實,所以他們都是在患者的增強 CT 圖上標註。
標註的過程也是相當專業,醫生們要勾畫每一層 CT 圖上腫瘤的二維圖像,每張有十多二十層,非專業人士是一點都幹不了。
畫出來的十多張二維圖像,疊加起來差不多就是整個腫瘤的三維圖。
要喂的數據準備好了,接下來就是選擇模型 + 訓練。
研究團隊先是搞了個配准算法,把之前標註的增強 CT 數據遷移到平掃 CT 圖上,讓AI 學會看平掃的 CT 影像。
後面,就是重頭戲了,雖說在醫學領域 3000 個數據已經算是相當多了,但對於深度學習來說這些量就是中規中矩。
所以他們只好在模型算法上更下功夫,好找補回來一些。
據達摩院團隊的張靈介紹,在選擇模型的時候,他們團隊先先後後試了好多種技術路線,最後搞出了一個 「 混合版 」 的模型,集分割、檢測和分類功能於一身。
而且這三個功能還不是各干各的,而是層層遞進、環環相扣。
就拿正常的一套完整的檢測流程舉例。
PANDA 在拿到平掃 CT 圖之後,先會用分割功能在整張圖像中找到胰腺的位置。
找到胰腺後,再啟動檢測功能,去看胰腺里有沒有啥不對勁的地方。
要是找到有異常的地方,就用第三步的分類功能,去識別這情況屬於哪種胰腺病變。
靠著這套模型和算法, PANDA 也開始在臨床試驗中,不斷疊代和更新。
這個過程就是個典型的 「 出錯—反饋—糾錯 」 的循環了,前前後後研究團隊大概花費了有一年的時間。
算法修正倒不是什麼大問題,比較麻煩的是前期的反饋:要怎麼修改這個 AI 。。。
就拿期間的一個例子來說, PANDA 有時會把脂肪浸潤的情況檢測出來。
光是這個情況,研究團隊就和醫生們討論了三個月,要不要讓它這麼 「 敏感 」 ,糾結了幾次最後才斃掉了。
當然,雖說 PANDA 的準確性已經相當高了,但在實際的檢測過程中,它只能起到一個初篩的作用。
它把醫生們看不到的病變找出來後,還是得讓醫生們再次把關,確保沒有誤診啥的。
去年 PANDA 模型已經成功上線,一些醫院以及體檢中心已經在用這個 AI 幫忙篩查了。
根據張靈的說法,到現在為止,他們已經用 PANDA 模型幫忙篩查了超過了50 萬個人。
並且這裡面,還成功發現並救治了兩個臨床漏診的胰腺癌患者。
其中有一個人,每年都會去醫院的體檢中心定期體檢,當時他在體檢時並沒發現什麼異常。
結果七個月後,在 PANDA 進行臨床試驗的時候,他的 CT 圖被檢測出了有 95% 的機率是胰腺神經內分泌腫瘤。
後來,醫院直接找來他,用增強磁共振檢查了一通,發現 PANDA 還真沒判斷失誤。
幸好腫瘤還在早期,早早手術割掉了,後續檢查時也沒再復發。
現在,研究團隊也還沒停下來,他們還想著進一步拓寬 PANDA 的篩查範圍。
張靈透露道,眼下在考慮的,是要不要把囊腫加到 PANDA 的檢測範圍內。
在未來,他們還打算把更多的癌症、甚至慢性病都納入進來,讓大家只要在體檢的時候做一次平掃 CT ,醫生通過 AI 輔助,就能看出這些疾病的苗頭。
或許有一天,在這個 AI 的協助下,所有的癌症,都能通過一次簡單的平掃 CT 在早期被發現。。。
最後,我覺得穆克吉寫的《 重病之王 · 癌症傳 》中的一段話,還挺應景的:
為了追上這種疾病的步伐( 癌症 ),人類一而再、再而三地創造、學習新知識,揚棄舊策略。我們執著地與癌症進行抗爭,時而精明,時而絕望,時而誇張,時而猛烈,時而瘋狂,時而凜然。這場戰爭,人類已經持續了數千年。
為了追上這種疾病的步伐( 癌症 ),人類一而再、再而三地創造、學習新知識,揚棄舊策略。我們執著地與癌症進行抗爭,時而精明,時而絕望,時而誇張,時而猛烈,時而瘋狂,時而凜然。這場戰爭,人類已經持續了數千年。
而差評君也希望,在這次 AI 開闢的 「 新戰場 」 上,人類可以徹底降伏癌症這頭猛獸。
撰文:松鼠 編輯:江江 & 面線 封面:煥妍
圖片、資料來源:
達摩院、Nature Medicine
機器之心,達摩院的AI研究,讓人類首次實現了大規模胰腺癌早篩
雷鋒網,達摩院迎戰「癌王」