前列腺癌病理學中的人工智能,是朋友還是敵人?
發布日期:2024-03-20醫學博士彼得·a·漢弗萊表示,自十多年前首次嘗試計算機輔助診斷前列腺癌以來,人們對人工智能在前列腺癌病理學中的應用越來越感興趣。然而,在這項技術被引入常規臨床實踐之前,研究人員必須首先證明人工智能可能帶來的進步超過了當前的挑戰。
在紐約州紐約市醫師教育資源(PER)主辦的第17屆年度跨學科前列腺癌大會和其他泌尿生殖系統惡性腫瘤會議上,漢弗萊討論了人工智能在前列腺癌中的潛在優勢和局限性。漢弗萊是耶魯大學醫學院的病理學教授,也是康涅狄格州紐黑文市耶魯大學醫學院泌尿生殖系病理學主任。
旨在定義人工智能在前列腺癌診斷和分級中的能力的幾項研究之一是熊貓挑戰。從歷史上看,格里森分級(通過對前列腺癌生長模式的光學顯微鏡解釋進行)一直是最有力的預后指標。然而,漢弗萊解釋說,這本質上是主觀的,容易出錯。為了確定人工智能是否優于標準識別方法,研究人員匯編了來自6個地點的12,625張前列腺活檢的完整幻燈片圖像:10,616張用于模型開發,393張用于競爭階段的性能評估,545張和1071張分別用于內部和外部驗證。
在競賽階段,來自65個國家的1290名開發人員提交了算法,其中15個是根據算法的性能選出的。結果顯示,在美國和歐盟,所選算法與泌尿病理學家的平均一致性分別為0.862(二次加權κ,95%置信區間為0.840-0.884)和0.868(95%置信區間為0.835-0.900)。此外,癌癥檢測的靈敏度在97.7%至98.6%之間,特異性在75.2%至84.3%之間。
然而,假陽性率確實很高,Humphrey解釋說,主要的算法錯誤是將良性病例誤診為前列腺癌,導致過度診斷。研究作者得出結論,人工智能前列腺癌分級算法與具有病理學家水平表現的洲際和跨國隊列相當,值得在前瞻性臨床試驗中進一步研究。