Towards Open-Domain Conversational AI - 國立臺灣大學管理學院院訊

資訊管理學系暨研究所

撰文者／資訊管理研究所碩一蕭溥辰

臺大資管系專題演講邀請本校資工系助理教授陳縕儂老師，演講主題是對話式AI。在 2020，當我們提到未來科技趨勢，不外乎就是人工智慧、區塊鏈、5G等，其中人工智慧更是被人們時常提起，許多論文更是與人工智慧結合，彷彿在這個時代，任何東西都必須與AI有所連結。而AI確實也深深地影響了我們的生活，曾幾何時，我們的生活已經無法脫離AI了。因此，當我得知今天這場演講與AI相關，即令我十分期待。

在演講一開始，講者首先定義何謂對話式AI，對話式AI 不只是單純的聊天機器人(chatbot)，而是能幫你完成特定的工作，例如在我們的生活中，可以透過 AI來開燈、開冷氣等。能幫助我們完成一些生活中的瑣碎小事，最有名的就是Apple Siri，Siri是蘋果在 2011 年提出語音助理，之後許多企業也推出類似的產品，包括Google在 2012 推出Google Now、Microsoft在 2014 推出 Cortana等，除了讓對話式 AI 產品相繼出現，也讓這部份的技術越來越進步。對話式 AI 主要分為工作導向及聊天導向，他們彼此發展完全獨立，工作導向是希望能在最短時間內，準確快速完成特定指令或任務，因此，聊天內容越短越好，但聊天導向則是希望聊天內容越長越好，是為了讓對話不中斷，但現今仍以工作導向為主要，包含Siri、Google Assistant。而這些語音助理之所以能夠出現，都是多虧於NLP技術的進步，NLP技術的背後，大多都是利用深度學習實踐，講者也對深度學習、類神經網路做詳盡的介紹，從最簡單的NN到RNN、LSTM等等，因為在上學期有執行過機器學習相關的專案，因此，在講者介紹及評估各種模型優缺點時，有非常深的感觸。

最後，講者提到，在訓練對話式AI時，需要面臨的挑戰之一是需要大量的資料，這在我上學期接觸的專案就有遇到類似的問題，因為機器學習不像以往需要由開發人員寫條件，而是由機器根據訓練資料來自主學習，因此，訓練資料的數量跟訓練資料的乾淨程度就相當重要，如果訓練資料數量不夠，那可能會造成訓練不夠完整，如果訓練資料不夠乾淨，可能會學到不正確的特徵，這兩項在機器學習至關重要，缺一不可，因為在訓練過程中，只要資料有問題，通常訓練出來的模型都不會有很好的結果。

綜論這場演講，陳縕儂老師從生活中的許多例子，慢慢帶入實際的訓練模型，由淺至深的講述，讓這場演講更加豐富，也令我獲益良多。