商研所PHD BBL: Data Analytics for Semiconductor Manufacturing Sciences 獲益良多、深受啟發的學術饗宴
工商管理學系暨商學研究所
撰文者/商學研究所博士生 張詠勛
非常開心能於10月4日邀請到任教台灣大學工業工程學研究所的藍俊宏老師來到商學研究所演講,藍老師相當幽默風趣,也非常耐心、細心。本次主題是半導體製程與數據分析,對於商研所的學生來說會比較生硬,但老師在演講的過程中除了列舉台積電的例子外,還不停提到很多生活化的例子(如天氣預測、披薩製作等),使演講內容更容易理解,也使我們得以深刻體會並學習理論的精隨,課後更是相當耐心地回答我們的問題,給予我們許多鼓勵。相當榮幸能參與這場專題演講,本次演講相當精采,讓我們獲益良多。
老師一開場講解所謂的製造系統三個關鍵元素「產品、製程、設備」,這三項元素彼此互動、互相影響,並會影響決策系統,而我們可以藉此找出最佳品質產品的製造過程、予以控制,達到品質優化的效果。但由於公司的產線不只一條、製程不止一項、產品項目也不只一種,導致人工蒐集信號與訊息並及時反饋與調整,需耗費相當大的人力、時間與成本。為了縮減上述成本,我們可以使用機械學習,讓AI來做蒐集與資料的反饋,並將資訊快速反應給工程師,讓其不必再以直覺進行判斷,可以更快速地進行故障排除或設備的設定調整。
然而,要導入AI必須蒐集數據讓電腦進行學習。在蒐集可讓電腦學習的數據時,如果隨機抽一台機器蒐集數據,讓電腦進行分析學習,會產生兩種問題:其一,該機器不一定是最好的設備,單一設備機台裡可能也會有複數的製程,就算產品最終結果為優良的,也不能證明該設備裡的製程皆為標竿製程;為了解決此問題,將所有機台的數據皆蒐集並讓電腦學習,未來可以更全面地反應狀況,但用上述做法便會遇到第二種問題──數據量相當龐大。老師舉了當時他在蒐集TSMC資料的例子,光產品種類就有800多種,其製程複雜度相當高,就算每個設備只裝上蒐集三種資訊的感應裝置,其回傳的數據量也相當龐大,電腦難以應付如此龐大的數據,所以必須做數據減量,才能讓電腦處理並學習。
而以前數據減量的作法,是由工程師判斷每項製程重要的時刻,並擷取該重要時刻的資訊給電腦進行學習,這沒辦法反映所有情況,所以老師用了維度縮減的方法。首先集結高度相關的感應器資訊,並將他們匯集成一處,經過計算可以產出一條高解釋能力的方程式去做資料彙整,即將多筆資料整合成一筆,並多次利用,將資訊成功簡化,但又不失去其資訊的代表性,並利用拉長或縮短頻率去增加方程式的解釋程度,使匯集的資訊更具代表性,藉此讓電腦蒐集並學習全面的資訊,以因應未來更複雜的情境。
最後,老師勉勵我們,資料分析的技巧大可不必在學校學,可以上網找尋資源,甚至在以後的世代,小學生都可以利用模組的方式做出機器學習與AI等,但若想要更進一步,我們必須理解科技背後的邏輯與道理,這才是我們該前進的方向,也是今天我們坐在這裡的原因。
整場演講精彩無比,演講脈絡層次分明,邏輯清晰明確,老師利用例子循循善誘,加速我們理解艱深內容,讓我們獲益良多,對我們攻讀博士與主題發想有許多啟發。