種子教師研究計畫成果分享:工管系柯冠州、余俊瑜老師「更全面地聆聽顧客線上聲音:研究泛自閉特徵者的使用者自產內容分析的可行性」

院行政辦公室

撰文者/劉先格

臺大管理學院於2022年10月6日舉辦跨領域系列種子教師研究計畫成果分享會,由工管系柯冠州教授擔任主講人,分享與余俊瑜教授合作進行探討泛自閉特徵者的使用者自產內容分析的可行性的研究。

 

首先,柯老師闡述針對少數樣本特別設計專門的研究方法的重要性。最近有越來越多的研究注意到有必要將代表性不足的消費者群體(如:泛自閉族群)作為研究樣本的一部分。不僅是為了增加社會包容性,也是為了與轉型消費者研究(Transformative Consumer Research)運動的理念保持一致。研究人員應重新思考如何將現有以大眾或普遍消費者為主來驗證和建構的理論模型和框架適用於這些代表性不足、較難研究的族群。此外,老師也進一步解釋為何選擇泛自閉族群作為主要探討樣本。據統計數據顯示泛自閉族群的人數近年來在全球都有大幅增加,這可能是源於父母和老師對於泛自閉的意識和了解都有增加的緣故,因此當有類似症狀時更願意接受診斷。此外,在實務界,不僅在人力資源方面有對於泛自閉族群的特殊招募或工作設計外,在面對泛自閉消費者,也有越來越多的企業採取特殊的服務或產品設計,以滿足他們的需求。這些現象都顯示了解泛自閉族群在業界和學術的重要性。

最後,老師也介紹為何使用使用者自產內容作為主要了解途徑。過去文獻在研究少數族群時大多採用訪談、觀察等研究方法,然而對於泛自閉族群來說,面對面與人交流時,容易感到不便或不自在。此外,雖然問卷法可能可以規避掉實體交流的問題,但對泛自閉族群的稱呼也可能是一大問題。過去研究發現,相較於專業人士偏好使用的稱謂和泛自閉族群本身或其家人好友偏好的稱呼是不同的,也就是我們很容易使用到讓泛自閉族群不自在或不舒服的稱呼,這些都會增加研究的困難。因此老師提出,若利用在社群上已公開的使用者自產內容,不僅可以規避掉以上問題,過去研究也有指出泛自閉族群在網路上較能自在輕鬆的表達自己的意見。

然而,泛自閉族群的使用者自產內容是否真的有其分析價值是待驗證的。因此本研究旨在利用使用者自產內容作為主要資料來源,經過以下四大步驟,希望驗證泛自閉族群的使用者自產內容有其分析價值。以下簡述四大步驟以及研究結論:

 

步驟一:利用爬蟲蒐集泛自閉族群的使用者自產內容

我們選擇利用reddit(美國類似於台灣PTT的資訊交換平台),並鎖定蒐集其中最多使用者和發文數的泛自閉的交流版(autism,約14萬使用者)中的貼文。

 

步驟二:辨識發文者身分是否為泛自閉族群

我們以人工閱讀方式標記該貼文中是否有揭示泛自閉者身分並將資料透過機器學習方式進行分析,建立機器學習模型。

 

步驟三:蒐集泛自閉族群和非泛自閉族群在非自閉社群內的使用者自產內容

我們根據步驟 2 生成的泛自閉作者列表,蒐集了這些用戶在消費性論壇(如:醫療服務或遊戲)撰寫的發文。此外,為了比較泛自閉族群與非泛自閉族群表達情感的差異,也在同樣論壇中蒐集非泛自閉族群的貼文。

 

步驟四:情感分析(sentiment analysis)

情感分析是行銷中最常使用的文本分析之一,並且因為過去研究對於泛自閉族群是否能表達自身情緒的發現有不一致,因此本研究希望利用三種方法(人工標記、機器學習與字典標記(LIWC)進行情感分析驗證泛自閉族群是否能在網路社群上表達自己的情緒。結果顯示泛自閉族群與非泛自閉族群在表達情緒和表達正面情緒上並無顯著差異,並且有更高的機率比非泛自閉族群表達負面情緒。

此外,針對自動化標記的正確性,我們以人工標記作為標準答案,比較字典與機器學習的結果發現,機器學習在判斷有情緒的表現較判斷無情緒的表現差;而字典標記法則表現均不佳。因此最後本研究提出了人機混合的文本分析,讓機器學習先判斷資料是否為無情緒,接著再將並無被判斷無情緒的資料交以人工閱讀標記,如此能以更有效率的方式,來了解泛自閉族群的想法。