智能乳腺癌篩查能否準確到取代人工審查
發布日期:2023-12-12在BMJ在線發表的一篇評論表明,在篩查期間發現可能的乳腺癌病例的準確性方面,人類似乎仍然比技術更好。研究人員表示,目前還缺乏質量良好的證據來支持時人工智能(AI)技術、取代人力放射政策篩查為乳腺癌。乳房癌是全世界婦女和許多國家死亡的首要原因,紛紛推出乳腺X線檢查程序來檢測和早期治療。但檢查乳房 X 線照片是否有癌癥的早期跡象,是放射科醫生的大量重復性工作,并且會遺漏一些癌癥。
先前的研究表明,人工智能系統的表現優于人類,并且可能很快會取代經驗豐富的放射科醫生。然而,最近對 23 項研究的審查強調了證據差距和對所用方法的擔憂。為了解決這種不確定性,英國國家篩查委員會委托華威大學的一組研究人員,檢查人工智能在乳房 X 光檢查篩查實踐中檢測乳腺癌的準確性。
研究人員回顧了自 2010 年以來開展的 12 項研究,涉及瑞典、美國、德國、荷蘭和西班牙的 131,822 名接受篩查的女性的數據??傮w而言,這 12 項研究中使用的方法質量較差,它們對歐洲或英國乳腺癌篩查計劃的適用性較低。三項涉及 79,910 名女性的大型研究將 AI 系統、與原始放射科醫生的臨床決策進行了比較。其中,1,878 人在篩查后的 12 個月內篩查檢測到癌癥或間期癌癥(在常規篩查預約之間診斷出癌癥)。
在這三項研究中評估的人工智能系統中的大多數(36 個中的 34 個或 94%),不如單個放射科醫生準確,并且都比兩個或多個放射科醫生的共識準確,這是歐洲的標準做法。相比之下,涉及 1,086 名女性的五項較小的研究報告稱,所有評估的人工智能系統都比單個放射科醫生更準確。但研究人員指出,這些研究存在較高的偏倚風險,而且它們有希望的結果無法在更大的研究中得到復制。在三項研究中,人工智能用作預篩選,以對哪些乳房 X 光照片需要由放射科醫生檢查,哪些沒有篩選出 53%、45% 和 50% 的低風險女性,但也篩選出了 10%、4%、和 0% 的放射科醫生檢測到的癌癥。
作者指出了一些研究局限性,例如排除可能包含相關證據的非英語研究,并且他們承認人工智能算法是短暫的并且不斷改進,因此報告的人工智能系統評估在研究時可能已經過時出版物。然而,使用嚴格的研究納入標準、以及對研究質量的嚴格和系統評估表明他們的結論是可靠的。因此,他們說:“目前關于在乳腺癌篩查中使用人工智能系統的證據,距離其在臨床實踐中實施所需的質量和數量還有很長的路要走。”他們補充說:“需要在大型篩查人群中精心設計的比較測試準確性研究、隨機對照試驗和隊列研究,在臨床實踐中與放射科醫生結合評估商用人工智能系統?!?/p>