工作環境
從 113 學年開始,我們先是利用各自的電腦在 google colab 的環境下建立模型訓練,熟悉深度學習的流程與方法。接著1141學期開始研究我們的專題後,固定每周二 17:00~19:00 至學校的 1505B 研討室與教授進行 meeting,每周跟循著教授指派給我們的進度,逐步完成,並使用實驗室的電腦進行遠端連線,使我們可以在各自舒適的空間進行研究。
實習期間完成之進度
基礎模型練習
-
在Google Colab 自行建立模型及訓練
-
使用 MNIST 影像資料及建立 CNN 模型,完成數字辨識
-
利用MS COCO Object Detection Dataset在YOLO v9模型建模與訓練
-
建立 3D U-Net 模型並訓練
論文研究
-
透過閱讀論文選擇有興趣的主題
-
研究各主題的可行性並篩選,例如是否可以取得資料集、研究是否已達飽和狀態
-
確認主題,並詳細研究論文中可用的方法和模型
資料集分析
-
研究資料集的特徵和輸出結果欄位,並分析資料集內有用的屬性資訊
-
觀察病患的每張CT影像排序方式
-
確認每個出血類型的影像數量、病患的數量、序列數量
影像前處理作業
-
找出自動化調整影像參數的方法,使影像變得更清晰可見
-
調整影像大小及位置使其趨於統一
訓練 ResNet 50 模型進行影像分類
-
加入 K-fold 訓練
-
了解模型輸出的評估指標,並學習觀察訓練和驗證的 loss function 是否收斂
-
了解尋找最佳閾值(threshold)的規則和標準
-
學習調整學習率 (batch size) 與訓練週期 (epoch) 來提升準確度
調整訓練集
-
先以少量的資料訓練。假設建立之模型正確執行,再逐步增加資料量
-
調整有出血影像和沒有出血影像的比例,以及五種出血類型比例,以提升模型訓練
調整變因提升訓練
-
影像分別以單通道和三通道輸入模型比較,讓模型學習更多資訊
-
加入Z值正規化,讓模型學習特定位置所對應的出血類型
-
訓練 EfficientNet B4,比較不同 CNN backbone 的結果
加入CBAM
-
一個注意力模組,加在模型特定的地方能讓評估指標提升
-
通過空間與通道兩個維度依序推斷出注意力權重
-
建立在ResNet 50模型上,觀察是否有提升準確度和Recall
訓練 EfficientNet B4 模型進行影像分類
-
提升模型在特徵擷取效率與分類準確率間的平衡
-
採用 MBConv模組與 Swish(SiLU)啟動函數,有效提升非線性特徵學習能力並減少計算資源消耗。