這位上海醫生帶頭搞的AI,要讓癌症診斷進入好時代了。

2023-12-05     差評

原標題:這位上海醫生帶頭搞的AI,要讓癌症診斷進入好時代了。

不知道大夥們還記得,那名用 50 張 1080 TI 顯卡對抗癌症的「 業餘 」程式設計師不。

他曾自掏腰包訓練了個 AI ,還整了個免費的網站,讓人工智幫你「 看片子」,能快速診斷出乳腺癌。

當時差評君就在暢想,未來,AI 技術在醫學領域,鐵定能濺起不小的水花兒。

但誰也沒想到,這未來來得實在有些快,而且比起水花,AI 掀起的更像是大浪。

這不在前不久,醫學頂刊 Nature Medicine 上就登了一篇論文,說是用 AI 大模型 + 簡單的平掃 CT ,就可能大規模地篩查出早期胰腺癌了。

這消息,直接就在醫學圈兒炸開了。

Nature Medicine 就罕見地附帶了一篇評論文章,標題是這樣的:在AI 加持下的醫療影像,即將迎來黃金時代。

各大媒體也都爭相報道, 「 突破難題 」「 人類首次 」 等讚美之詞毫不吝嗇。

而如果用一句話,來形容這技術的含金量的話。

差評君覺得比較貼切的是:放在過去,這事兒想都不敢想。

這麼說吧,這次的大反派 「 胰腺癌 」 ,在所有癌症里有個可怕的名字—— 「 癌症之王 」 。

只要確診胰腺癌,幾乎就是被判了死刑,近 90% 的人在確診胰腺癌後,活不過 5 年,這在癌症里算是一個相當可怕的數字了。

好多名人像吳尊友、帕瓦羅蒂等都是因為胰腺癌去世的。

死亡率這麼高的原因,在於胰腺癌早期太難被發現了,一旦發現,大機率就是晚期。

因為胰腺這玩意兒,位置非常隱蔽,藏在胃後面,被十二指腸、脾臟和肝臟等器官包圍住了。

而我們一般去醫院體檢的項目,像超聲、平掃 CT 等等這些,很難發現早期胰腺癌的特徵。

當然,增強 CT 或者是增強核磁共振,能把胰腺看得更清楚些。

但胰腺癌的發病率其實並不高,在所有癌種中只排在十名開外。

所以考慮到輻射、醫療資源擠兌等問題。。。為了胰腺,每個人每年都去做增強 CT 或增強核磁共振,其實划不來。

基本上只有病人發現了異樣,才會去做這些項目。

但在症狀上想發現早期胰腺癌,也很難行得通。

前期患者們的症狀一般是噁心、嘔吐、身體虛弱等,這和普通生病的症狀沒啥兩樣,醫生們很容易就會被 「 忽悠 」 。

並且癌變會影響胰腺功能,早期胰腺癌還很可能偽裝成糖尿病。。。

於是在影像 + 症狀雙重 Debuff 的情況下,想大規模篩查早期的胰腺癌就變成了一件難上加難的事。

所以這些年來,醫學界為了能早點發現胰腺癌,可脫了不少發、禿了不少聰明腦瓜,但最後的成果呢,寥寥無幾。

前些年,業內還有個很火的滴血驗癌( ctDNA ),一度被大家看好,它是從患者的血液里找有沒有癌症的碎片。

但這個方法,同樣也很難發現癌症一期、二期的血液碎片,到現在快十年過去了,依舊沒啥進展。

而這次,研究人員們想到了用 AI 大模型,來解這道題。

差評君也去到 Nature Medicine 官網上,翻了翻論文原文,有一說一,它還真有可能在早篩胰腺癌這塊豁出個口子。

這次,他們整出了個名叫PANDA ( pancreatic cancer detection , with artificial intelligence 的 AI 大模型根據簡單的平掃 CT 圖像,它就能做出胰腺癌相關的診斷。

這麼說吧,在臨床驗證中,研究團隊試驗了兩萬多個病例, PANDA 幾乎就沒咋漏診,99.9% 有胰腺癌的都給診斷出來了。

偶爾有一些誤診,也都是很容易排除的病變,像什麼脂肪浸潤、胃腸內容物等,醫生簡單審核下就能排除掉。

而用 AI 這點子,最早是上海市胰腺疾病研究所的曹凱醫生也是這篇論文的共同第一作者 )想到的。

在他身上還有這麼一小段故事,在大學期間,曹凱的實習導師也因胰腺癌去世,和很多患者一樣,他在確診的時候就已經是晚期了。

不過後來他在整理導師的病例資料時發現,在確診十個月前,導師就曾做過一次平掃 CT 。

雖然當時沒發現什麼苗頭,但帶著結論回過頭來分析,就能隱約看到到胰腺那裡有病變的跡象。

在這樣一個契機下,曹凱就想,既然人眼很難識別到平掃 CT 圖像里,早期胰腺癌病變的跡象,那不如藉助 AI 幫醫生先篩查一遍。

後來,他遇到了達摩院醫療 AI 團隊負責人呂樂,他們兩個在這塊不謀而合,這才有了現在的 PANDA 模型。

PANDA 幫忙篩查胰腺癌的過程說起來也很簡單,和醫生看片子也沒啥兩樣。

不過它憑藉強大的算法,注意到的細節比醫生肉眼看到的多得多,自然也能順利找到疑似病變的地方。

但要練好這麼一個 AI ,可不是動動嘴皮那麼容易的事。

它不像語言模型出錯了打個哈哈就能過去, PANDA 對準確性的要求非常高

而判斷它看病好不好,還有兩個維度,一個是特異性,一個是敏感性。

要是特異性高了,就很容易漏診,敏感性高了,又會誤診

而調這個漏診、誤診的 「 天平 」 ,歸根結底,還得看喂給模型的數據集和訓練模型的方法

先是數據集,都說寵物毛髮順不順還得看主人喂什麼,在訓練模型上也是同樣的道理。

這塊研究團隊是下了血本,他們召集了來自各個醫院的48 個醫生,一共收集了3000 個病人的腹部 CT 圖像

其中有大概 2200 多個胰腺癌患者,和將近 1000 個非胰腺癌的病人。

這 3000 個病人的數據,都是醫生們自己一個個手動標註的。

並且因為平掃 CT 圖的對比度太低,手動標註不太現實,所以他們都是在患者的增強 CT 圖上標註。

標註的過程也是相當專業,醫生們要勾畫每一層 CT 圖上腫瘤的二維圖像,每張有十多二十層,非專業人士是一點都幹不了。

畫出來的十多張二維圖像,疊加起來差不多就是整個腫瘤的三維圖。

要喂的數據準備好了,接下來就是選擇模型 + 訓練。

研究團隊先是搞了個配准算法,把之前標註的增強 CT 數據遷移到平掃 CT 圖上,AI 學會看平掃的 CT 影像。

後面,就是重頭戲了,雖說在醫學領域 3000 個數據已經算是相當多了,但對於深度學習來說這些量就是中規中矩。

所以他們只好在模型算法上更下功夫,好找補回來一些。

據達摩院團隊的張靈介紹,在選擇模型的時候,他們團隊先先後後試了好多種技術路線,最後搞出了一個 「 混合版 」 的模型,集分割、檢測和分類功能於一身。

而且這三個功能還不是各干各的,而是層層遞進、環環相扣

就拿正常的一套完整的檢測流程舉例。

PANDA 在拿到平掃 CT 圖之後,先會用分割功能在整張圖像中找到胰腺的位置。

找到胰腺後,再啟動檢測功能,去看胰腺里有沒有啥不對勁的地方。

要是找到有異常的地方,就用第三步的分類功能,去識別這情況屬於哪種胰腺病變。

靠著這套模型和算法, PANDA 也開始在臨床試驗中,不斷疊代和更新。

這個過程就是個典型的 「 出錯—反饋—糾錯 」 的循環了,前前後後研究團隊大概花費了有一年的時間。

算法修正倒不是什麼大問題,比較麻煩的是前期的反饋:要怎麼修改這個 AI 。。。

就拿期間的一個例子來說, PANDA 有時會把脂肪浸潤的情況檢測出來。

光是這個情況,研究團隊就和醫生們討論了三個月,要不要讓它這麼 「 敏感 」 ,糾結了幾次最後才斃掉了。

當然,雖說 PANDA 的準確性已經相當高了,但在實際的檢測過程中,它只能起到一個初篩的作用。

它把醫生們看不到的病變找出來後,還是得讓醫生們再次把關,確保沒有誤診啥的。

去年 PANDA 模型已經成功上線,一些醫院以及體檢中心已經在用這個 AI 幫忙篩查了。

根據張靈的說法,到現在為止,他們已經用 PANDA 模型幫忙篩查了超過了50 萬個人。

並且這裡面,還成功發現並救治了兩個臨床漏診的胰腺癌患者。

其中有一個人,每年都會去醫院的體檢中心定期體檢,當時他在體檢時並沒發現什麼異常。

結果七個月後,在 PANDA 進行臨床試驗的時候,他的 CT 圖被檢測出了有 95% 的機率是胰腺神經內分泌腫瘤。

後來,醫院直接找來他,用增強磁共振檢查了一通,發現 PANDA 還真沒判斷失誤。

幸好腫瘤還在早期,早早手術割掉了,後續檢查時也沒再復發。

現在,研究團隊也還沒停下來,他們還想著進一步拓寬 PANDA 的篩查範圍。

張靈透露道,眼下在考慮的,是要不要把囊腫加到 PANDA 的檢測範圍內。

在未來,他們還打算把更多的癌症、甚至慢性病都納入進來,讓大家只要在體檢的時候做一次平掃 CT ,醫生通過 AI 輔助,就能看出這些疾病的苗頭。

或許有一天,在這個 AI 的協助下,所有的癌症,都能通過一次簡單的平掃 CT 在早期被發現。。。

最後,我覺得穆克吉寫的《 重病之王 · 癌症傳 》中的一段話,還挺應景的:

為了追上這種疾病的步伐( 癌症 ),人類一而再、再而三地創造、學習新知識,揚棄舊策略。我們執著地與癌症進行抗爭,時而精明,時而絕望,時而誇張,時而猛烈,時而瘋狂,時而凜然。這場戰爭,人類已經持續了數千年。

為了追上這種疾病的步伐( 癌症 ),人類一而再、再而三地創造、學習新知識,揚棄舊策略。我們執著地與癌症進行抗爭,時而精明,時而絕望,時而誇張,時而猛烈,時而瘋狂,時而凜然。這場戰爭,人類已經持續了數千年。

而差評君也希望,在這次 AI 開闢的 「 新戰場 」 上,人類可以徹底降伏癌症這頭猛獸。

撰文:松鼠 編輯:江江 & 面線 封面:煥妍

圖片、資料來源

達摩院、Nature Medicine

機器之心,摩院的AI研究,讓人類首次實現了大規模胰腺癌早篩

雷鋒網,達摩院迎戰「癌王」

文章來源: https://twgreatdaily.com/zh-hk/6ca569cdd83197e05c51c6d51569da78.html