資管系專題演講心得 – 因果推斷介紹及因果強化學習之初探

資訊管理學系暨研究所

撰文者/資訊管理學研究所碩士生 楊雅汝

『因果推斷介紹及因果強化學習之初探(An introduction of causal inference and causal reinforcement learning with sequential data)』演講者是Huck Yang先生。其研究領域和聲音、speech、機器學習相關,他是在沙烏地阿拉伯的時候接觸到Causality,進而想使用機器學習做推理。演講一開始,講者介紹Causality(因果)和Causal Inference(因果推斷)的關係,我們必須要用能量化的假設原因來嘗試推斷,且要避免掉倒果為因、因果不相合等邏輯不順的現象。我覺得講者的舉例都很可愛也很易懂,例如用柯南、黑衣人和目暮警官去解釋事件發生的變因,還有倒果為因的黃色皮卡丘舉例。

在相關性的破綻部分,講者更用吉娃娃和餅乾的舉例來提到機器學習的謬誤, 我們需要進一步的考量除了 feature extraction、參數選擇等等以外的問題,以此帶到因果的重要性。

在做Causal時需考慮到干擾因素,例如用A/B test等,然後根據自身的假設去干擾這些因素,再加以量化分析因素的效果。這些因素與事件的結構可稱為 Structural Causal Model,且思考層級與條件是有劃分階層(Causal Hierarchy)的。

在Average Treatment Effect (平均處理效應)部分,講者做了冰淇淋銷量好之 後犯罪率下降的探討,考量干擾因子(氣溫),同時也將時間納入參考,之後就能將資料套入Neyman–Rubin causal model。綜合以上,我覺得自己可以試著把某個事情畫成structural causal model,再嘗試量化為什麼學校線上舉辦杜鵑花節,卻實體舉辦就業博覽會,這個事件的干擾因素之類的。講者也提到了 Causal Inference 的應用,例如推薦系統(推薦類似興趣的人之喜好產品)或者消費者行為、Healthcare、資訊科學、生物醫學‥‥‥等等。

最後在Deep learning部分的講解中,講者提到可以用inference去判斷data的Label有無noise之後再額外做處理,讓我們能得到更為穩健的AI model,避免或減少掉資料noise對正確率所造成的影響,進而針對AI model,協助其克服看到沒看過資料就很容易判斷錯誤的問題。

在聽演講之前,我對因果推斷介紹及因果強化學習毫無涉略,但今天聽完講者的介紹之後,雖然沒有全部都聽懂,但是整體而言,我感覺對因果推斷介紹及因果強化學習已經有一個基本的認識了!