top of page

工作環境

從 113 學年開始,我們先是利用各自的電腦在 google colab 的環境下建立模型訓練,熟悉深度學習的流程與方法。接著1141學期開始研究我們的專題後,固定每周二 17:00~19:00 至學校的 1505B 研討室與教授進行 meeting,每周跟循著教授指派給我們的進度,逐步完成,並使用實驗室的電腦進行遠端連線,使我們可以在各自舒適的空間進行研究。

實習期間完成之進度

基礎模型練習

  • ​​在Google Colab 自行建立模型及訓練

  • ​使用 MNIST 影像資料及建立 CNN 模型,完成數字辨識

  • ​​利用MS COCO Object Detection Dataset在YOLO v9模型建模與訓練

  • ​建立 3D U-Net 模型並訓練

論文研究

  • 透過閱讀論文選擇有興趣的主題

  • ​研究各主題的可行性並篩選,例如是否可以取得資料集、研究是否已達飽和狀態

  • ​確認主題,並詳細研究論文中可用的方法和模型

資料集分析

  • 研究資料集的特徵和輸出結果欄位,並分析資料集內有用的屬性資訊

  • ​觀察病患的每張CT影像排序方式

  • ​確認每個出血類型的影像數量、病患的數量、序列數量

影像前處理作業

  • 找出自動化調整影像參數的方法,使影像變得更清晰可見

  • ​調整影像大小及位置使其趨於統一

訓練 ResNet 50 模型進行影像分類

  • 加入 K-fold 訓練

  • ​了解模型輸出的評估指標,並學習觀察訓練和驗證的 loss function 是否收斂

  • 了解尋找最佳閾值(threshold)的規則和標準

  • 學習調整學習率 (batch size) 與訓練週期 (epoch) 來提升準確度

調整訓練集

  • 先以少量的資料訓練。假設建立之模型正確執行,再逐步增加資料量

  • ​調整有出血影像和沒有出血影像的比例,以及五種出血類型比例,以提升模型訓練

調整變因提升訓練

  • 影像分別以單通道和三通道輸入模型比較,讓模型學習更多資訊

  • ​加入Z值正規化,讓模型學習特定位置所對應的出血類型​

  • ​訓練 EfficientNet B4,比較不同 CNN backbone 的結果

加入CBAM

  • 一個注意力模組,加在模型特定的地方能讓評估指標提升

  • 通過空間與通道兩個維度依序推斷出注意力權重

  • ​建立在ResNet 50模型上,觀察是否有提升準確度和Recall

訓練 EfficientNet B4 模型進行影像分類

  • 提升模型在特徵擷取效率與分類準確率間的平衡

  • 採用 MBConv模組與 Swish(SiLU)啟動函數,有效提升非線性特徵學習能力並減少計算資源消耗。

元智大學資訊管理學系  |   元智大學資管系第三十屆專題製作競賽展

bottom of page