使用機(jī)器學(xué)習(xí),可以識(shí)別無法診斷的癌癥
發(fā)布日期:2022-09-20麻省理工學(xué)院科赫綜合癌癥研究所和馬薩諸塞州總醫(yī)院 (MGH) 的研究人員開發(fā)的一種新的深度學(xué)習(xí)方法,可以通過仔細(xì)研究與早期細(xì)胞發(fā)育和分化相關(guān)的基因表達(dá)程序,來幫助對未知原發(fā)性癌癥進(jìn)行分類。
在極少數(shù)情況下,即使經(jīng)過廣泛的檢測,也無法確定癌癥的起源。盡管這些原發(fā)性未知的癌癥往往具有侵襲性,但腫瘤學(xué)家必須用非靶向療法治療它們,這些療法通常具有嚴(yán)重的毒性并導(dǎo)致低存活率。
“有時(shí),你可以應(yīng)用病理學(xué)家必須提供的所有工具,但你仍然沒有答案,”Salil Garg 說。“像這樣的機(jī)器學(xué)習(xí)工具,可以使腫瘤學(xué)家選擇更有效的治療方法,并為他們的患者提供更多指導(dǎo)。”
Garg 是一項(xiàng)新研究的資深作者,解析不同類型原發(fā)性未知腫瘤的基因表達(dá)差異,是機(jī)器學(xué)習(xí)解決的理想問題。癌細(xì)胞的外觀和行為與正常細(xì)胞完全不同,部分原因是它們的基因表達(dá)方式發(fā)生了廣泛的改變。由于單細(xì)胞分析的進(jìn)步和在細(xì)胞圖譜中對不同細(xì)胞表達(dá)模式進(jìn)行分類的努力,有大量的數(shù)據(jù)——如果對人眼來說是壓倒性的——包含不同癌癥起源方式和起源的線索。然而,建立一個(gè)機(jī)器學(xué)習(xí)模型,利用健康和正常細(xì)胞之間以及不同種類癌癥之間的差異,將其用于診斷工具是一種平衡行為。
如果一個(gè)模型過于復(fù)雜,并且考慮了太多癌癥基因表達(dá)的特征,該模型可能看起來完美地學(xué)習(xí)了訓(xùn)練數(shù)據(jù),但在遇到新數(shù)據(jù)時(shí)會(huì)動(dòng)搖。然而,通過縮小特征數(shù)量來簡化模型,模型可能會(huì)遺漏導(dǎo)致癌癥類型準(zhǔn)確分類的信息種類。
為了在減少特征數(shù)量和提取最相關(guān)信息之間取得平衡,該團(tuán)隊(duì)將模型重點(diǎn)放在癌細(xì)胞發(fā)育途徑改變的跡象上。研究人員比較了兩個(gè)大細(xì)胞圖譜,確定了腫瘤和胚胎細(xì)胞之間的相關(guān)性:癌癥基因組圖譜 (TCGA),其中包含 33 種腫瘤類型的基因表達(dá)數(shù)據(jù),以及小鼠器官發(fā)生細(xì)胞圖譜 (MOCA),其中描述了 56 個(gè)獨(dú)立的腫瘤細(xì)胞軌跡,胚胎細(xì)胞發(fā)育和分化。
“單細(xì)胞解析工具極大地改變了我們研究癌癥生物學(xué)的方式,但我們?nèi)绾问惯@場革命對患者產(chǎn)生影響是另一個(gè)問題,”Moiso 解釋說。“隨著發(fā)育細(xì)胞圖譜的出現(xiàn),特別是那些關(guān)注器官發(fā)生早期階段的圖譜,如 MOCA,我們可以將我們的工具擴(kuò)展到組織學(xué)和基因組信息之外,并為分析和識(shí)別腫瘤以及開發(fā)新療法的新方法打開大門。”