AI在醫(yī)療保健中的關(guān)鍵障礙是“黑匣子”問題。對于大多數(shù)AI系統(tǒng)來說,模型很難解釋,也很難理解為什么它們會做出某種診斷或推薦。
作者|Susan Ruyu Qi
(資料圖片)
編譯|YIFEI DeepMind發(fā)表在的《自然醫(yī)學》(Nature Medicine)雜志上的研究展示了他們的AI產(chǎn)品,該產(chǎn)品能夠通過3D視網(wǎng)膜OCT掃描診斷許多眼部疾病。它的性能與最好的視網(wǎng)膜專家相當,甚至優(yōu)于一些人類專家。
該產(chǎn)品的準確性和診斷范圍令人印象深刻,這也是第一個AI模型達到專家級的性能與三維診斷掃描。然而,從臨床的角度來看,更具開創(chuàng)性的是這種AI系統(tǒng)運作的巧妙方式,它模仿了現(xiàn)實生活中的臨床決策過程,解決了“黑匣子”問題,而這個問題一直是AI技術(shù)在醫(yī)療領(lǐng)域的最大障礙之一。
視網(wǎng)膜的光學相干斷層掃描掃描
兩個神經(jīng)網(wǎng)絡(luò)
DeepMind的人工智能系統(tǒng)通過創(chuàng)建一個包含兩個獨立神經(jīng)網(wǎng)絡(luò)的框架,提高了“黑匣子”的可解釋性。他們的框架不是訓練一個單一的神經(jīng)網(wǎng)絡(luò)從醫(yī)學圖像中識別病理,這將需要大量的標記數(shù)據(jù),每個病理,他們的過程解耦為兩個:1.分割:識別圖像上的結(jié)構(gòu);2.分類:分析分割,并提出診斷和轉(zhuǎn)診建議。
DeepMind的框架通過在兩個神經(jīng)網(wǎng)絡(luò)之間使用一個容易看到的中間表示(組織圖)來解決“黑匣子”問題
1.細分網(wǎng)絡(luò)
使用三維U-Net結(jié)構(gòu),這是第一個神經(jīng)網(wǎng)絡(luò),將原始OCT掃描轉(zhuǎn)換成組織圖。它使用877個臨床OCT掃描進行訓練,對于每次掃描的128個切片,只有大約3個具有代表性的切片被手動分割。這種稀疏的注釋過程大大減少了工作量,并允許它們覆蓋大量的掃描和病理。組織圖識別顯示的解剖(十層視網(wǎng)膜)和標記疾病特征(視網(wǎng)膜內(nèi)液體,出血)和偽影。
這個過程模仿典型的臨床決策過程。它允許醫(yī)生檢查AI的分割和獲得洞察神經(jīng)網(wǎng)絡(luò)的“推理”。這種中間表征是未來AI融入臨床實踐的關(guān)鍵,它在困難和模棱兩可的情況下特別有用,醫(yī)生可以檢查及可視化地自動分割,而不是簡單地提出診斷和轉(zhuǎn)診建議。
這種分割技術(shù)在臨床培訓中也有巨大的潛力,因為它可以幫助專業(yè)人員學會閱讀醫(yī)學圖像。
此外,它可以用來量化和測量視網(wǎng)膜病變。目前,視網(wǎng)膜專家只能通過觀察當前和過去OCT掃描之間的差異來客觀判斷疾病進展(例如視網(wǎng)膜內(nèi)液體增多)。通過人工智能的自動分割,可以自動獲得所見異常的位置和體積等定量信息。這些數(shù)據(jù)可以用于疾病跟蹤和研究,例如,作為臨床試驗的終點。
左:原始OCT掃描;中:手動分割;右:自動分割
2.分類網(wǎng)絡(luò)
第二個神經(jīng)網(wǎng)絡(luò)分析組織分割圖并輸出診斷和轉(zhuǎn)診建議。它使用7621名患者的14884個OCT掃描卷進行訓練,所有掃描都自動生成分割圖,通過檢查患者的臨床記錄獲得臨床標簽,以便回顧性地確定最終診斷與最佳轉(zhuǎn)診途徑。
因此,分類網(wǎng)絡(luò)使用分割地圖,并學習將患者的治療需求優(yōu)先級劃分為緊急、半緊急、常規(guī)和僅觀察。然后,它以多種伴隨視網(wǎng)膜病變概率的形式輸出診斷。
輸出:預(yù)測的診斷概率和轉(zhuǎn)診建議
圖像模糊與合成
對于人類和機器來說,由于存在模糊的區(qū)域,無法從圖像中推斷出真正的組織類型,因此圖像的解釋和分割都很困難,存在多種同樣合理的解釋。為了克服這個挑戰(zhàn),DeepMind的框架使用了5個分段實例,而不是1個。每個網(wǎng)絡(luò)實例為給定的掃描創(chuàng)建一個完整的分段映射,產(chǎn)生5個不同的假設(shè)。這些不同的地圖,就像不同的臨床專家一樣,在具有清晰圖像結(jié)構(gòu)的區(qū)域達成一致,但在模棱兩可的低質(zhì)量區(qū)域可能有所不同。使用這個集合,原始OCT掃描產(chǎn)生的模糊性被提交給后續(xù)的決策(分類)網(wǎng)絡(luò)。該分類網(wǎng)絡(luò)還有一個由5個實例組成的集合,它們被應(yīng)用于5個分割圖中的每一個,每次掃描得到總共25個分類輸出。
結(jié)果:
該框架在ROC曲線下的面積達到了99%以上,與臨床專家相當。至于轉(zhuǎn)診建議,其業(yè)績與五名最佳專家相當,優(yōu)于其他三名專家。
未來:
OCT是現(xiàn)在最常見的成像程序之一,僅2014年一年就有535萬次OCT掃描在美國醫(yī)療保險人群中進行。
OCT的廣泛應(yīng)用還沒有與專業(yè)人員解釋掃描結(jié)果和將患者轉(zhuǎn)診到適當?shù)呐R床護理的可用性相匹配。
DeepMind的人工智能解決方案有可能降低成本,增加使用OCT進行視網(wǎng)膜病變篩查的可用性。它不僅可以自動檢測眼疾的特征,而且還可以優(yōu)先考慮最需要緊急護理的患者,建議他們是否應(yīng)該被轉(zhuǎn)診治療。這種即時分流過程大大減少了掃描和治療之間的延遲,使患有嚴重疾病的患者能夠及時獲得保護視力的治療。
“每當談到醫(yī)學中的機器學習時,下意識的反應(yīng)就是擔心醫(yī)生會被取代。但這并不能取代醫(yī)生,事實上,這將增加那些真正需要治療的真正疾病患者的數(shù)量。”Ehsan Rahimy博士,醫(yī)學博士,谷歌大腦顧問,帕洛阿爾托醫(yī)學基金會玻璃體視網(wǎng)膜實踐專家。
*附錄:
分割算法本身仍然是一個黑盒子,并不能真正解決問題。然而,從臨床的角度來看,三維OCT掃描的分段視圖是非常有價值的。這與醫(yī)生如何通過影像學診斷非常相似:1.在掃描中識別異常,2.將異常與病理聯(lián)系起來。因此,在診斷算法中增加一個中間表示可以顯著提高AI系統(tǒng)的可解釋性,使其在未來的臨床部署中更加可行。
熱門