摘要:
膽囊炎(Cholecystitis)是一種常見的臨床疾病,通常由膽囊結石或其他膽囊功能異常引起,其臨床表現包括右上腹疼痛、發熱及消化不良等症狀。傳統的膽囊炎診斷手段主要依賴於醫學影像學檢查,如超聲波(USG)、計算機斷層掃描(CT)、磁共振成像(MRI),以及結合顯影劑的檢查以提高診斷準確性。然而,這些方法通常需要經驗豐富的醫師進行解讀,對於醫療資源有限的地區,診斷效率和準確性可能受到限制。 本研究旨在探索深度學習技術於膽囊炎影像分析中的應用,以實現自動化診斷,提升診斷效率與精確性。研究中,我們採用了麗臺科技的 AIDMS 無程式碼影像辨識平臺,該平臺整合了多種先進的深度學習模型(如 ResNet、Inception 和 MobileNet),並提供可視化介面與模型參數調整功能,使我們能夠靈活地設計並優化影像分類模型。通過該平臺,我們對帶有顯影劑的影像數據進行了標準化處理,包括影像去噪、尺寸調整與數據增強(如水平翻轉與垂直旋轉),以提升模型的泛化能力。 在實驗過程中,我們採用 2456 張經臨床標註的膽囊影像作為數據集,其中包含陰性與陽性病例。影像數據按 7:2:1 的比例分為訓練集、驗證集和測試集,以保證模型的穩定性與可靠性。通過多輪模型訓練與調參,我們觀察了不同模型的性能表現,並以混淆矩陣(Confusion Matrix)、準確率(Accuracy)、靈敏度(Sensitivity)與特異度(Specificity)作為評估指標。 在本研究的技術架構中,我們將有顯影劑與無顯影劑的數據資料分別使用6種影像辨識模型並各自嘗試4組批次大小 (Batch size) 和訓練週期 (Epoch)進行獨立訓練與比較,後續再觀察模型的訓練集和驗證集之損失函數(loss function)[1]重新調整批次大小(Batch size)與訓練週期(Epoch)。在無顯影劑之獨力測試當中,基於準確率 (Accuracy) 進行比較,ResNet-18取得最高的準確率,達 100.00%,但其他模型,如ResNet-101、MobileNet-v3-small均也取得不錯的準確度(Accuracy)與靈敏度(Sensitivity),ResNet-18和MobileNet-v3-smal能夠以少量的參數量有效地處理和識別影像中的複雜特徵並且能在不降低太多Performance的情況下提高運算速度,同時這對於未來用於訓練某些過於罕見病例的疾病至關重要。而有顯影劑之獨立測試中,最高準確率同樣由ResNet-18模型取得,達 99.53%。與其他模型相比,效能提升幅度介於 4.38% 至 26.9%,顯示出顯著的準確率優勢。並且在研究過程當中,未使用顯影劑之模型,相較於使用顯影劑之模型在預測上有著更高的準確率。相信透過這項技術能夠減少醫學影像診斷技術的時間與成本,也能減少患者對於顯影劑產生過敏的可能性,同時我們還整合了數據可視化工具方便醫生在使用的過程中能持續的對模型進行校準。

結論:
本研究利用深度學習技術訓練了多個有顯影劑膽以及無顯影劑的囊炎影像辨識模型,並透過 AIDMS 平臺進行參數調整與優化,最終選擇了有顯影劑模型 ResNet-18、MobileNet-v3-small、MobileNet-v3-large 和 Inception-V3 以及無顯影劑模型作為候選模型 ResNet-18、ResNet-50、ResNet-101 和 MobileNet-v3-small。經 95% 信賴區間 (CI) 驗證,模型效能穩定且可靠,並透過 Grad-CAM 等可視化技術,驗證了模型的解釋性與合理性。 實驗結果顯示,在有顯影劑的模型當中MobileNet-v3-large模型以99.9%的準確率和99.7%的靈敏度達到最佳性能,特別適用於臨床場景中需將誤診降至最低的陽性病例檢測。此外,輕量化的MobileNet-v3-small模型表現出卓越的運算效率,適合部署於資源受限的環境,例如移動端或邊緣設備。而在無顯影劑的模型當中,以ResNet-18、MobileNet-v3-small模型均達到99.9%的準確度和靈敏度達到最佳性能,而ResNet-101在準確度也來到了99.9%,雖然在靈敏度的部分僅有99.0%,但也同樣是一個較為精準的預測模型。
本研究的主要貢獻包括:
(1) 高性能模型:對六種深度學習模型的全面評估顯示,其在準確率、靈敏度和特異度上相較傳統診斷方法具有顯著提升。
(2) 可解釋性人工智慧的應用:基於Grad-CAM的特徵可視化技術驗證了模型能準確聚焦於膽囊壁和炎症區域等臨床相關特徵,增強了臨床解釋性。
(3) 數據增強技術:整合水平翻轉、垂直翻轉和隨機旋轉等數據增強方法,有效提升了模型的泛化能力並降低過擬合風險。
儘管取得了以上進展,本研究仍存在一些限制:
(1) 數據集規模有限:數據集僅包含來自單一醫療機構的2,456張標註影像,可能限制模型在多樣化臨床情境中的泛化能力。
(2) 對顯影劑的依賴:依賴顯影劑增強影像可能限制模型在無法使用或禁忌顯影劑場景中的應用。
(3) 過擬合風險:部分模型的驗證損失出現波動,表明需要進一步優化參數與正則化技術。
為解決這些挑戰,未來研究方向包括:
• 擴展數據集,涵蓋多機構和多設備的數據,以增強模型的穩健性與通用性。
• 開發針對非顯影劑增強CT影像的模型,以拓展臨床應用範圍。
• 結合多模態數據,例如實驗室結果和患者病史,構建更全面的診斷框架。
• 開展實際臨床驗證,評估系統在現場的實用性與可靠性。
• 進一步優化輕量化架構,以提高推理速度並降低運算資源需求,適合資源受限環境的部署。
本研究顯示深度學習技術在提升膽囊炎診斷準確率和效率方面的潛力,為人工智慧驅動的診斷工具奠定了基礎。通過解決所述局限並結合AI與醫學影像技術的進步,未來版本的系統有望革新診斷實踐,並在資源豐富與有限的環境中改善患者診療效果。