前列腺癌檢測 AI 算法登上《柳葉刀》:分類性能超過人類專家,還能完成其他臨床任務

2020-07-29     AI科技評論

原標題:前列腺癌檢測 AI 算法登上《柳葉刀》:分類性能超過人類專家,還能完成其他臨床任務

作者 | 蔣寶尚

編輯 | 叢 末

近日,《柳葉刀-數字醫療》期刊刊登了一篇「用人工智慧算法診斷前列腺癌」的論文,論文中,作者除了報告了一項盲法臨床驗證研究,還部署了一種基於人工智慧的算法用來處理常規臨床應用任務,具體而言是輔助前列腺疾病診斷。

在算法性能測試中,該 AI 算法用內部數據得到的AUC是0.997,在UPMC外部驗證數據集上,其AUC是0.991。換句話說,性能指標超過了一般的AI算法。

論文地址:https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30159-X/fulltext

這篇論文的作者是來自UPMC和匹茲堡大學的研究員,他們提出的算法的核心技術是多層卷積神經網絡,專門為圖像分類任務而設計。整個算法工作的流程有三個連續的步驟:組織檢測、分類和病理圖片級別分析。

算法和臨床應用一覽

具體而言,先使用數千個圖塊對梯度提升(Gradient Boosting)分類器進行訓練,目的是為了區分圖片中的組織區域和背景區域;然後用分離出的組織區域訓練三個基於CNN的模型。

這些模型接受了1,357,480張貼有標籤圖塊的訓練,這些圖塊是從549張圖片的「手工標註」中提取出來的,而這549張圖片則是根據不同的標準,從65,000張圖片中挑出來的。

值得一提的是,「手工標註」由三位資深病理學家完成,每位都從業20~40年。

模型訓練好之後,作者又用了1,600張圖片進行了測試,這1,600張圖片取自100名在 UPMC 就診的疑似前列腺癌患者。

測試結果是:AI在前列腺癌症檢測方面表現出了98%的敏感性和97%的特異性,此外,不僅是癌症檢測,在完成例如腫瘤分級等其他臨床上重要的特徵任務方面,也有比較高的性能。更值得注意的是,AI還「看」出了6張人類專家沒檢測出的前列腺癌圖片。

同時,作者也提出,這並不一定意味著這台機器比人類更優秀。但對於經驗較少的病理學家來說,該算法可以作為一個故障保險機制,幫助他們「漏檢」錯過的病例。

畢竟在評估這些病例的過程中,病理學家可能只是在病人的樣本中看到了其他地方惡性腫瘤的足夠證據,從而推薦治療。不過,對於經驗較少的病理學家來說,該算法可以作為一個故障保險機制,發現否則可能會錯過的病例。

作者在論文中還表示,在訓練人工智慧算法和模型的時候,過擬合是一個非常常見的問題,儘管在訓練數據中進行測試時表現良好。但在訓練集之外的數據上進行測試時,性能會出現下降。雖然有多種策略可以避免過度擬合(例如,交叉驗證),但真正的性能只能通過外部數據集的盲法研究來確定。

在這裡,作者創新性地使用了外部的、不同地理、盲試驗數據集( blinded dataset)來測試算法的性能和實用性。在論文中,作者稱:「據我們所知,很少有醫學研究嘗試過這樣的驗證,尤其是對於應用範圍較窄,性能明顯較低的算法。」

1

網友評論:褒貶不一

此項研究的新聞也被網友貼在了Reddit的人工智慧版塊,引起了一波小討論,有的網友持贊成態度,肯定了AI在癌症和心臟病發病幾率預測方面的工作;也有的網友,對作者使用的算法產生了好奇,也提出了精度和召回率的疑問。

例如,上面這位網友:AI對於醫療行業來說不可或缺,特別是在預測癌症和心臟病發病幾率方面。

這應該是屬於專用的算法,沒有數據和代碼共享,這讓復現成為了一個問題......我們應該如何解決這個問題。

還有網友說:「雖然有非常好的結果,但在精確度方面並不比專家高出多少。」在這條帖子下面,也有網友「交流」到:「普通患者不太可能從專家小組那裡得到診斷,他們只是從普通的醫生那裡得到診斷。而人工智慧可以讓每個人都能得到「專家」診斷。」

2

AI會取代影像科醫生麼?

在今年一月份,關於前列腺癌AI輔助診斷研究就曾經發表在《柳葉刀腫瘤》雜誌,當時作者在論文中得出的結論是:用AI系統來檢測和分級前列腺穿刺活檢樣品中的癌症,在部分場景中其等級可與前列腺病理學專家相媲美。

另外,在1月2日,Google Health聯合多個機構在《Nature》雜誌上發表了一篇論文,介紹了一種新型的深度學習鉬靶影像系統。根據Google的說法,這個系統與之前的模型相比,該模型有效減少了乳腺癌被錯誤識別或遺漏的情況,將乳腺癌檢測的假陽性率降低了5.7%,假陰性率也降低了9.4%,並號稱擊敗了6名受過「」全日制教育」的放射科醫生。

當然,Google對該成果過於誇大的公關措辭,隨之也引來了圖靈獎得主Yann Lecun以及中美多位知名學者在社交媒體上的炮轟。

可以看到,當前的一些AI醫學研究動不動就是「超越專家」、「打敗人類」,尤其是在影像科這種計算機視覺「容易」攻克的領域,AI即將取代人類的聲音最盛。

那麼問題來了,AI在醫學影像方面取代人類麼?換句話說,當前影像學有哪些地方在短期離不開人類。

2018年,英國影像學AI大牛Hugh Harvey發布了一篇《Why AI will not replace radiologists》,稱:「無論你已經有多麼深信甚至痴迷AI和自動化的諸多可能性,要想在不久的將來完全替代人類影像科醫生是完全不可能的。」

當時,他給出了三個理由:第一、醫學影像科醫生不是只會看片子,診斷推導仍然是最難啃的那塊骨頭,也是人類有最多存在感的地方;第二、人類始終要承擔最終責任,幾乎不可想像人工智慧系統的所有者在人命關天時,會讓機器負全部法律責任;第三、生產力進步將驅動需求,最明顯的表現是:在影像科,只要你能安排多一個醫生來檢查患者,就總會有患者來補上這個空位。

這也正如《柳葉刀-數字醫療》那篇論文而言,AI算法或許很優秀,或許在很多方面準確度、精度比人類高,但是人類終究是不可或缺的。

via https://scitechdaily.com/artificial-intelligence-identifies-prostate-cancer-with-near-perfect-accuracy/

https://zhuanlan.zhihu.com/p/33424522

https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30159-X/fulltext

更多交流

掃碼關注AI研習社小助手2(AIyanxishe3),備註【 RL夏令營】,參與更多交流互動!

閱讀原文,直達官方報名地址。

文章來源: https://twgreatdaily.com/zh-cn/CN2knXMBd8y1i3sJ-kz2.html