本學期「數據分析與數位轉型學群演講」終場-Causal Inference in Marketing and Operation Application 分享熱絡

院行政辦公室

撰文者/陳彥彣

國立政治大學資訊管理學系周彥君副教授12月7日受邀於臺大「數據分析與數位轉型學群演講」分享她關於Causal Inference in Marketing and Operation Application的研究。周博士專精於數據分析等領域且現為期刊Decision Support Systems的編輯委員。此分享由臺大資管系教授李家岩主持,並邀請多位相關領域的教授參與。在分享中,周教授探討在企業策略上數據分析方法如何提出有因果推斷的方針建議,以及可能面臨到的風險與挑戰。

對於企業而言,決策者在做出任何資源配置之前,都需要洞悉不同策略的效果,也就是不同活動對業務績效的影響,這就需要獲得這些策略因子與業務績效的因果關係。因此在現代企業環境中,如何克服混雜效應(Confounding Effect)的干擾,從營運數據萃取真實的因果效應,是新近的重要研究議題。

為了瞭解因果關係,周教授介紹了從實際數據中獲取因果效應同時消除混淆效應的方法。差異中的差異(Difference in Difference,簡稱DID)是其中重要的概念,這是一種廣泛應用於觀察性研究中的統計技術,基於時間維度的設計,通常包括「處置前」和「處置後」的時間點。模型的估計是DID的核心步驟,這涉及將治療效應區分為「時間效應」和「組效應」。時間效應捕捉了在處置實施後整體上升或下降的趨勢,而組效應則衡量了實驗組相對於對照組的額外效應。這有助於控制時間變化的混雜效應,特別有助於降低選擇偏差,提高因果推論的內部效度。

周教授還介紹了DID的進階應用,如分段差異中的差異(Staggered Difference in Differences,簡稱Staggered DID)。Staggered DID的核心區別在於實際商業營運下,不同個體的策略的實施通常不是同時進行,而是在不同的時間點上發生,此模型有助於更精準地估計不同實施時間段的因果效應。此外,雙重機器學習(Double Machine Learning,簡稱DML)也是因果效應估計的新近發展,利用機器學習能夠彈性地捕捉資料間複雜的關係,我們能夠更好的去除和策略操作無關的環境變數之混雜效應,同時透過估計模型的正交化(orthogonalization)以及交互估計(cross-fitting),針對機器學習的預測誤差進行校正,進而能更準確的估計不同營運策略之的因果效應。

這些因果效應的資訊最終都可以協助營運決策,如同周教授研究主題中管理者針對資訊系統演算法提供的建議進行修改,然而此人為修改的最終效益為何?我們能否透過上述的估計模型,從變數間的相關性進一步推斷出人和演算法互動的因果效應?周教授透過歐洲大型零售商存貨訂購系統和供應鏈經理人真實的互動資料,結合因果效應及機器學習的DML模型,探討不同情境下經理人增加以及減少系統建議的修改,對於實際營運績效的影響,此研究結果對於決策系統演算法以及經理人在系統輔助下的決策,都能提供修正及改善的指引。