專題心得與建議
時光飛逝,從上學期在 Google Colab 初次接觸 DICOM 影像,到這學期建立完整的五折交叉驗證系統,這段專題旅程充滿挑戰與收穫。這學期最大的任務是提升模型效能。透過文獻回顧與競賽解決方案研究,我們發現 CT 影像的三維空間特性是關鍵。我們實作了位置感知模型,將 Z 軸位置正規化後透過 MLP 編碼,再與影像特徵融合。當第一次看到位置資訊確實提升表現時,讓我深刻體會到研究需要站在前人肩膀上創新。在模型選擇上,最初的 ResNet50 雖然達到 weighted F1=0.710,但召回率僅 0.665,意味著約三分之一的出血病例可能被漏診。這讓我們意識到在醫學影像任務中,「不漏診」比「不誤診」更重要。組員採用 EfficientNet-B4 架構,透過複合縮放策略提取更豐富的特徵,成功將召回率提升至 0.833、weighted F1 達到 0.874,有效降低漏診風險。我們也實作多窗口影像處理策略,整合腦窗、硬膜下窗與骨窗成三通道輸入。
訓練過程中遇到過擬合問題,我們引入 MixUp、標籤平滑、Dropout 等正則化技術。有次發現驗證集 log loss 居高不下,原因是模型輸出機率過於極端,促使我們實作溫度校正,最終將 log loss 從 0.5 以上降至 0.360。這次經歷讓我體會到研究需要細心觀察、耐心調試。這學期透過共用電腦開發,用資料夾命名與文件記錄管理版本,每周會前一起檢視訓練曲線、分析結果,組員間互相支持與知識分享是我們順利完成的關鍵。回顧整個專題旅程,我經歷了技術能力、時間管理、團隊協作等多方面的成長,學會了如何閱讀文獻、如何在失敗中尋找改進方向。這份專題不只是為了學分,而是真正有機會為醫療領域貢獻力量。這段旅程培養的能力與心態,將伴隨我走向更遠的未來。
梁凱晰
在本專題中我們深入分析競賽提供的顱內出血 CT 影像資料,並透過自主學習補足醫學影像與機器學習的相關知識,包含出血類型判讀與手動標註練習,這不僅是技術挑戰,更是跨領域學習的寶貴經驗。在教授與醫師協助下,我們更理解影像的醫學意義和病灶的複雜性。過程中我們學會了有效整合網路與學術論文資訊,並透過實作與除錯,加深對醫學影像處理的模型分類的理解,也領悟到資料集的重要性,而面對多標籤分類加上資料不平衡的情況,我們做了非常多嘗試與修改,過程中逐步培養了解決問題與獨立思考的能力。這些扎實的基礎,對我們理解專案核心至關重要。
整個專題研究過程充滿了無數耗時數小時的嘗試與實驗,這是一場對意志力的長期考驗。尤其是在模型跑了十幾個小時後的結果卻不如預期,面對新嘗試的方法無效的高度不確定性和頻繁挫敗,我多次感到疲累與被打擊。然而,正是這種充滿壓力與挫折的探索,培養了我的獨立思考和解決問題能力。我努力將這些經歷視為預先體驗研究所生活的磨練,在不斷面對失敗並快速重振旗鼓的過程中,我深刻體會到理論與實踐結合的真諦,以及在錯誤中學習、從實作中成長的價值。每一次觀察到模型性能的提升,都會帶來顯著成就感,激勵我們持續投入。我在專題研究中體悟到,從零開始學習跨領域知識的挑戰,在不斷嘗試、錯誤和反思中,我們不僅初步認識了醫學影像分析和深度學習技術,更體會到理論與實踐結合的重要性。如今,我的心態和抗壓性已逐漸成長,雖然挫折感仍會出現,但我能更快地從中學習,繼續嘗試新的優化方向。這段寶貴的經歷不僅讓我對機器學習原理理解更深入,更為未來獨立研究奠定了堅實的基礎,培養了我的信心與期待。