國企系「人工智慧與商業應用」專題演講:《自然語言及其應用》

國際企業學系暨研究所

撰文者/國際企業學研究所 李哲柔

本系簡睿哲老師「人工智慧與商業應用」課程中邀請新創公司人工智慧技術顧問阮榮裕講師蒞臨演講,本次主題為《自然語言及其應用》,藉由分享自然語言的相關概念,來讓學員們有對AI應用的更深一層認識。

首先,講師先帶學員們複習過去演講課的深度學習概念,包含機器學習深度學習三個步驟、深度學習的神經元:線性運算與非線性運算、深度學習模型為什麼包含了我們要的函式,以及CNN、RNN等概念。透過DNN的初始複習,學員們重新被提醒了機器學習三框架:建立一個模型、設定評估好壞的方式、找出模型中最好的一個函式。接著,講師向大家介紹DNN之模型:包含神經元、神經元層、全連接層等等,而在決定資料與模型後,進而設定連接的權重,以得到好的推論。

藉由圖形的展示,講師讓大家實際看見深度學習之操作,接著,帶到CNN之概念,提及一個影像物體是由許多物件組成、每一個物件的細節都跟區域畫素群有關,進而帶到本演講之重點:自然語言處理NLP。透過NLP,可進行字詞推估,且不只是字詞推敲,也可能應用在股市推算當中。而RNN/LSTM/GRU 的應用當中,除了 NLP 基本的文字生成、作曲,也可當作分類器、意向偵測器等應用;在非文字範疇的題目中,只要有時序特性的資料也適用。

接著,講師提及One Hot Encoding的要點,提及One Hot Encoding 的兩個缺點: 維度過高 (3000 個字就要3000 維度) 以及字元間沒有關聯資訊,因而需要採取降維或是word embedding的方式。透過一些編碼的分享過後,講師也跟學員們特別強調「單字、詞的編碼有一定特徵工程的功能,因此當這些“資料”的特徵工程處理得很好時,後續的模型可能會比較輕鬆」。

透過概念的漸進式介紹以及實際的操作,講師向學員們展現出NLP的AI實際應用範圍,且鼓勵學員們能夠將此與期末報告相結合,且思考如何能結合自身所學,與所能應用之範疇相扶持。