高光譜成像結(jié)合機(jī)器學(xué)習(xí)模型用于不同原發(fā)灶頭頸部轉(zhuǎn)移瘤的鑒別診斷
應(yīng)用方向:高光譜成像技術(shù)(HSI)通過在像素級同時獲取空間信息與連續(xù)光譜信息,能夠反映組織在細(xì)胞和分子層面的生物學(xué)差異,為復(fù)雜疾病的精準(zhǔn)識別提供了新的技術(shù)路徑。基于該文獻(xiàn)的研究結(jié)果,HSI 在醫(yī)學(xué)領(lǐng)域,尤其是在腫瘤診斷與分型方面展現(xiàn)出廣闊的應(yīng)用前景。通過捕獲組織在光譜層面的差異特征,實現(xiàn)對形態(tài)學(xué)上高度相似病變的有效區(qū)分,從而彌補傳統(tǒng)影像學(xué)和病理診斷在信息維度上的不足。此外,結(jié)合機(jī)器學(xué)習(xí)與集成學(xué)習(xí)方法,HSI 能夠支持構(gòu)建高精度、低誤診率的智能診斷模型,提升復(fù)雜臨床場景下的診斷效率與一致性??傮w而言,高光譜成像技術(shù)與智能算法的深度融合,有望推動醫(yī)學(xué)影像診斷由經(jīng)驗依賴型向數(shù)據(jù)驅(qū)動型轉(zhuǎn)變,為精準(zhǔn)醫(yī)學(xué)和智能醫(yī)療提供重要技術(shù)支撐。
背景: 頭頸部轉(zhuǎn)移性腫瘤(MTHN)通常提示腫瘤已處于進(jìn)展期或晚期,其原發(fā)灶來源復(fù)雜,不同原發(fā)腫瘤在治療方案和預(yù)后評估上存在顯著差異。因此,快速、準(zhǔn)確地判定頭頸部轉(zhuǎn)移腫瘤的原發(fā)部位對于制定精準(zhǔn)治療策略具有重要臨床意義。然而,當(dāng)前 MTHN 的診斷主要依賴影像學(xué)檢查和病理學(xué)分析,前者對微小病灶敏感性有限、易發(fā)生誤診,后者雖為金標(biāo)準(zhǔn),但存在取樣誤差、主觀性強(qiáng)且診斷周期較長等問題,難以滿足臨床對高效、客觀診斷的需求。近年來,機(jī)器學(xué)習(xí)與深度學(xué)習(xí)方法在醫(yī)學(xué)影像分析中展現(xiàn)出良好潛力,但現(xiàn)有研究多集中于單一腫瘤類型,且受限于傳統(tǒng)成像手段信息維度不足,*型對不同原發(fā)來源腫瘤的判別能力和泛化性仍有待提升。高光譜成像(HSI)能夠在像素級上獲取空間信息與連續(xù)光譜信息,反映組織在細(xì)胞和分子層面的生物學(xué)差異,為腫瘤類型區(qū)分提供了更豐富的信息基礎(chǔ)。因此,將高光譜成像與機(jī)器學(xué)習(xí)方法相結(jié)合,構(gòu)建高性能、魯棒性的分類模型,用于頭頸部轉(zhuǎn)移性腫瘤不同原發(fā)部位的快速識別,成為當(dāng)前亟需解決的重要研究問題之一。
作者信息:李瑋,山東大學(xué)控制科學(xué)與工程學(xué)院,碩導(dǎo)
期刊來源:Journal of Biophotonics
研究內(nèi)容
通過采用 Stacking 方法對多個結(jié)構(gòu)相對簡單的機(jī)器學(xué)習(xí)模型進(jìn)行集成,有效增強(qiáng)了模型對光譜特征波段中蘊含的生物學(xué)信息的挖掘能力,從而提升了模型學(xué)習(xí)過程的穩(wěn)定性和分類判別的可靠性。本研究為 MTHN 類型的臨床快速診斷及相應(yīng)治療措施的制定提供了一種可行且有效的技術(shù)解決方案。
實驗設(shè)計
本研究收集了山東第一醫(yī)科大學(xué)附屬腫瘤醫(yī)院存檔的208張?zhí)K木精-伊紅(HE)染色病理切片,于20倍放大倍數(shù)下進(jìn)行圖像采集。所用頭頸部轉(zhuǎn)移性腫瘤(MTHN)樣本來源于六種常見原發(fā)惡性腫瘤:肺腺癌(LAC)、鼻咽癌(NPC)、乳腺癌(BC)、食管鱗狀細(xì)胞癌(ESCC)、胃腸道腺癌(GIAC)及甲狀腺乳頭狀癌(PTC)。樣本依據(jù)原發(fā)灶來源進(jìn)行分型標(biāo)記:0型代表NPC,1型代表LAC,2型代表PTC,3型代表BC,4型代表ESCC,5型代表GIAC。
采用線掃描推掃式高光譜成像系統(tǒng)(GaiaMicro-V10E-DY,江蘇雙利合譜科技有限公司)在熒光模式下采集MTHN樣本的高光譜圖像。該系統(tǒng)由覆蓋400–1000 nm光譜范圍(256個波段)的光譜儀、空間分辨率為1392×1550像素的高性能sCMOS相機(jī)、顯微鏡及一體化移動平臺組成。HSI系統(tǒng)的圖像采集與分析原理如圖1所示。

圖1 高光譜成像系統(tǒng)結(jié)構(gòu)示意圖
研究方法
不同原發(fā)灶來源的頭頸部轉(zhuǎn)移性腫瘤(MTHN)蘊含獨特的生物標(biāo)志物信息,可被HSI系統(tǒng)捕獲并以光譜數(shù)據(jù)形式呈現(xiàn),供進(jìn)一步分析?;诖?,本研究采用主成分分析(PCA)和盲源分離-主成分分析(BSS-PCA)方法進(jìn)行光譜波段篩選。在Stacking集成學(xué)習(xí)框架下,選用支持向量機(jī)(SVM)和輕量級梯度提升機(jī)(LightGBM)作為基學(xué)習(xí)器,隨機(jī)森林(RF)作為元學(xué)習(xí)器,構(gòu)建了高性能分類模型MTHN-SC(頭頸部轉(zhuǎn)移性腫瘤堆疊分類器)。隨后,應(yīng)用SVM、LightGBM、MTHN-SC、ResNet50和FastGRNN模型對篩選后的光譜波段數(shù)據(jù)進(jìn)行分類,建立了兼具高精度與強(qiáng)魯棒性的MTHN診斷流程(圖2)。

圖2 研究方法流程圖
對于SVM,通過引入核函數(shù), SVM能夠高效處理復(fù)雜的非線性分類任務(wù),本研究在 SVM 模型中采用徑向基函數(shù)(RBF)核。通過網(wǎng)格搜索方法對 RBF 核的相關(guān)參數(shù)進(jìn)行了優(yōu)化選擇。此外,本研究中的 LightGBM 模型采用基于梯度的貝葉斯優(yōu)化方法,自動確定*優(yōu)的決策樹節(jié)點數(shù)量,并使用基于梯度提升決策樹(GBDT)的提升策略進(jìn)行模型構(gòu)建。ResNet50和FastGRNN模型添加了dropout和L2正則化策略。
對于MTHN-SC,本研究在 Stacking 框架的第一層采用了基于RBF核的SVM和基于GBDT的 LightGBM 作為基模型,在第二層選用了隨機(jī)森林作為元模型。Stacking 集成模型的整體結(jié)構(gòu)如示意圖所示。圖 3 展示了 MTHN-SC 模型的詳細(xì)結(jié)構(gòu),體現(xiàn)了基模型(SVM 和 LightGBM)與元模型(隨機(jī)森林)之間的集成關(guān)系。

圖3 MTHN-SC模型結(jié)構(gòu)示意圖
結(jié)果
本研究對MTHN樣本病理切片的HSI光譜曲線進(jìn)行了反射率校準(zhǔn)。圖4直觀展示了病理切片HSI數(shù)據(jù)經(jīng)校準(zhǔn)處理前后的對比效果。反射率校準(zhǔn)通過將原始數(shù)字圖像數(shù)據(jù)轉(zhuǎn)換為反射率值,顯著提高了對病理組織細(xì)微光譜變化的檢測敏感性,使各類組織間的光譜差異在校準(zhǔn)后的數(shù)據(jù)中更為凸顯。

圖4 HSI反射率校準(zhǔn)流程。(a) HSI相機(jī)采集的LAC病理切片圖像;(b) 感興趣區(qū)域(圖a中綠色框選區(qū)域)的原始光譜曲線;(c) 經(jīng)反射率校準(zhǔn)后的光譜曲線。
圖5比較了不同原發(fā)灶來源MTHN的平均光譜反射率曲線,不同原發(fā)灶MTHN的光譜反射率強(qiáng)度存在顯著差異,這些差異源于不同原發(fā)癌特定生物組分的內(nèi)在光譜特性,為利用機(jī)器學(xué)習(xí)鑒別腫瘤原發(fā)灶提供了堅實的理論依據(jù)。

圖5 不同原發(fā)灶MTHN平均光譜曲線對比
本研究對反射率校準(zhǔn)后的高光譜圖像進(jìn)行圖像增強(qiáng)與分割策略,有效擴(kuò)充了樣本量。應(yīng)用PCA和BSS-PCA兩種不同的特征提取方法來處理樣品的全光譜(256個波段)數(shù)據(jù)。經(jīng)特征選擇后,選用徑向基核函數(shù)支持向量機(jī)(SVM-RBF)、LightGBM、基于Stacking技術(shù)的融合模型(MTHN-SC)及ResNet50四種機(jī)器學(xué)習(xí)模型,系統(tǒng)評估其對六種不同原發(fā)灶來源MTHN的鑒別性能。評價指標(biāo)涵蓋準(zhǔn)確率(Accuracy)、召回率(Recall)和特異度(Specificity)三項核心指標(biāo)。下表匯總了各模型在PCA與BSS-PCA兩種特征選擇方法下的性能表現(xiàn),實驗結(jié)果表明,傳統(tǒng) PCA 特征選擇下各模型性能差異明顯,且在高維判別信息保留方面存在一定局限。相比之下,BSS-PCA 能夠更有效地提取判別特征,顯著提升整體分類性能,其中 BSS-PCA 與 MTHN-SC 的組合取得了最高準(zhǔn)確率(82.47%),并在召回率和特異性上均表現(xiàn)*優(yōu)。得益于 Stacking 結(jié)構(gòu)對多模型信息的有效融合,MTHN-SC 在降低誤分類和過擬合風(fēng)險的同時顯著增強(qiáng)了泛化能力。盡管 ResNet50 展示了深度學(xué)習(xí)在高光譜數(shù)據(jù)分析中的潛力,但其性能和實用性仍受限于數(shù)據(jù)規(guī)模和計算成本。

結(jié)論
本研究利用 HSI 技術(shù)對來源于六種不同原發(fā)部位的 MTHN 病理切片進(jìn)行采集與分析,采用 PCA 和 BSS-PCA 兩種特征波段選擇方法,并結(jié)合四種機(jī)器學(xué)習(xí)模型(SVM-RBF、LightGBM、MTHN-SC 和 ResNet50)對腫瘤類型進(jìn)行分類,旨在通過多模型協(xié)同提升 MTHN 的分類精度。MTHN-SC 模型通過 Stacking 結(jié)構(gòu)集成 SVM、LightGBM 和隨機(jī)森林,充分發(fā)揮不同算法的互補優(yōu)勢,將線性模型與樹模型的預(yù)測能力有效融合,從而提升診斷準(zhǔn)確率。該模型采用 BSS-PCA 進(jìn)行特征波段選擇,相較于傳統(tǒng) PCA,能夠增強(qiáng)特征判別能力并有效抑制噪聲,為機(jī)器學(xué)習(xí)模型提供更高質(zhì)量的輸入數(shù)據(jù),這在處理高維高光譜數(shù)據(jù)時具有顯著優(yōu)勢。通過引入隨機(jī)森林作為元模型對 SVM 和 LightGBM 的輸出進(jìn)行融合,MTHN-SC 有效降低了醫(yī)學(xué)機(jī)器學(xué)習(xí)中常見的偏置和過擬合風(fēng)險,顯著提升了診斷過程的魯棒性和泛化能力。實驗結(jié)果表明,MTHN-SC 模型取得了 82.47% 的診斷準(zhǔn)確率,在對比模型中表現(xiàn)*優(yōu),驗證了其在多原發(fā)部位 MTHN 快速、準(zhǔn)確診斷中的應(yīng)用潛力,對精準(zhǔn)治療方案制定及高光譜技術(shù)在醫(yī)學(xué)診斷中的推廣具有重要意義。
相關(guān)產(chǎn)品
免責(zé)聲明
- 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
手機(jī)版
化工儀器網(wǎng)手機(jī)版
化工儀器網(wǎng)小程序
官方微信
公眾號:chem17
掃碼關(guān)注視頻號
















采購中心