Towards Open-Domain Conversational AI
資訊管理學系暨研究所
撰文者/資訊管理研究所碩一 蕭溥辰
臺大資管系專題演講邀請本校資工系助理教授陳縕儂老師,演講主題是對話式AI。在 2020,當我們提到未來科技趨勢,不外乎就是人工智慧、區塊鏈、5G等,其中人工智慧更是被人們時常提起,許多論文更是與人工智慧結合,彷彿在這個時代,任何東西都必須與AI有所連結。而AI確實也深深地影響了我們的生活,曾幾何時,我們的生活已經無法脫離AI了。因此,當我得知今天這場演講與AI相關,即令我十分期待。
在演講一開始,講者首先定義何謂對話式AI,對話式AI 不只是單純的聊天機器人(chatbot),而是能幫你完成特定的工作,例如在我們的生活中,可以透過 AI來開燈、開冷氣等。能幫助我們完成一些生活中的瑣碎小事,最有名的就是Apple Siri,Siri是蘋果在 2011 年提出語音助理,之後許多企業也推出類似的產品,包括Google在 2012 推出Google Now、Microsoft在 2014 推出 Cortana等,除了讓對話式 AI 產品相繼出現,也讓這部份的技術越來越進步。對話式 AI 主要分為工作導向及聊天導向,他們彼此發展完全獨立,工作導向是希望能在最短時間內,準確快速完成特定指令或任務,因此,聊天內容越短越好,但聊天導向則是希望聊天內容越長越好,是為了讓對話不中斷,但現今仍以工作導向為主要,包含Siri、Google Assistant。而這些語音助理之所以能夠出現,都是多虧於NLP技術的進步,NLP技術的背後,大多都是利用深度學習實踐,講者也對深度學習、類神經網路做詳盡的介紹,從最簡單的NN到RNN、LSTM等等,因為在上學期有執行過機器學習相關的專案,因此,在講者介紹及評估各種模型優缺點時,有非常深的感觸。
最後,講者提到,在訓練對話式AI時,需要面臨的挑戰之一是需要大量的資料,這在我上學期接觸的專案就有遇到類似的問題,因為機器學習不像以往需要由開發人員寫條件,而是由機器根據訓練資料來自主學習,因此,訓練資料的數量跟訓練資料的乾淨程度就相當重要,如果訓練資料數量不夠,那可能會造成訓練不夠完整,如果訓練資料不夠乾淨,可能會學到不正確的特徵,這兩項在機器學習至關重要,缺一不可,因為在訓練過程中,只要資料有問題,通常訓練出來的模型都不會有很好的結果。
綜論這場演講,陳縕儂老師從生活中的許多例子,慢慢帶入實際的訓練模型,由淺至深的講述,讓這場演講更加豐富,也令我獲益良多。