top of page

此網站是使用

網站幫手設計的。立即用來製作您的網站吧！立即開始

工作環境

從 113 學年開始，我們先是利用各自的電腦在 google colab 的環境下建立模型訓練，熟悉深度學習的流程與方法。接著1141學期開始研究我們的專題後，固定每周二 17:00~19:00 至學校的 1505B 研討室與教授進行 meeting，每周跟循著教授指派給我們的進度，逐步完成，並使用實驗室的電腦進行遠端連線，使我們可以在各自舒適的空間進行研究。

實習期間完成之進度

基礎模型練習

在Google Colab 自行建立模型及訓練
使用 MNIST 影像資料及建立 CNN 模型，完成數字辨識
利用MS COCO Object Detection Dataset在YOLO v9模型建模與訓練
建立 3D U-Net 模型並訓練

論文研究

透過閱讀論文選擇有興趣的主題
研究各主題的可行性並篩選，例如是否可以取得資料集、研究是否已達飽和狀態
確認主題，並詳細研究論文中可用的方法和模型

資料集分析

研究資料集的特徵和輸出結果欄位，並分析資料集內有用的屬性資訊
觀察病患的每張CT影像排序方式
確認每個出血類型的影像數量、病患的數量、序列數量

影像前處理作業

找出自動化調整影像參數的方法，使影像變得更清晰可見
調整影像大小及位置使其趨於統一

訓練 ResNet 50 模型進行影像分類

加入 K-fold 訓練
了解模型輸出的評估指標，並學習觀察訓練和驗證的 loss function 是否收斂
了解尋找最佳閾值(threshold)的規則和標準
學習調整學習率 (batch size) 與訓練週期 (epoch) 來提升準確度

調整訓練集

先以少量的資料訓練。假設建立之模型正確執行，再逐步增加資料量
調整有出血影像和沒有出血影像的比例，以及五種出血類型比例，以提升模型訓練

調整變因提升訓練

影像分別以單通道和三通道輸入模型比較，讓模型學習更多資訊
加入Z值正規化，讓模型學習特定位置所對應的出血類型
訓練 EfficientNet B4，比較不同 CNN backbone 的結果

加入CBAM

一個注意力模組，加在模型特定的地方能讓評估指標提升
通過空間與通道兩個維度依序推斷出注意力權重
建立在ResNet 50模型上，觀察是否有提升準確度和Recall

訓練 EfficientNet B4 模型進行影像分類

提升模型在特徵擷取效率與分類準確率間的平衡
採用 MBConv模組與 Swish(SiLU)啟動函數，有效提升非線性特徵學習能力並減少計算資源消耗。

bottom of page