研究生: |
吳佩珊 WU, Pei-Shan |
---|---|
論文名稱: |
使用BERT-CNN進行Twitter 使用者之立場偵測 A BERT-CNN Model for Detecting User's Stance in Tweets |
指導教授: |
侯文娟
Hou, Wen-Juan |
口試委員: |
郭俊桔
方瓊瑤
侯文娟
Hou, Wen-Juan |
口試日期: | 2022/01/26 |
學位類別: |
碩士 Master |
系所名稱: |
資訊工程學系 Department of Computer Science and Information Engineering |
論文出版年: | 2022 |
畢業學年度: | 110 |
語文別: | 中文 |
論文頁數: | 51 |
中文關鍵詞: | Twitter 分析 、立場偵測 、類神經網路 、深度學習 |
DOI URL: | http://doi.org/10.6345/NTNU202200199 |
論文種類: | 學術論文 |
相關次數: | 點閱:229 下載:31 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
在人們的文字表達敘述裡,「立場」可能包含正向或是負向的情緒用詞,贊成或反
對的語氣,但這些特徵都無法直接與立場相關聯。人們可以利用支持一個對象或是說法
來反對特定目標,也可以藉由反諷法,使得字面上不能直接了解真正所表達的意思,但
真實意義正好與字面上相反。在本研究中,將已標記立場標籤、來自 Twitter 使用者所
發表的推文(Tweet) 當作訓練資料,使用監督式學習的方式來訓練深度神經網路(Deep
Neural Network)。
本研究所使用的資料集來自於 2016 年舉辦的國際自然語言語意評測競賽(Semantic
Evalution 2016, SemEval 2016)的Task 6 ,主辦單位所提供已標記立場的推文之訓練集與測試集,將其進行資料前處理並與類神經網路進行連接,其中使用到由Google 公司於
2018年所提出之 BERT (Bidirectional Encoder Representations from Transformers)及卷積類神經網路(Convolutional Neural Network,CNN)。
本研究針對SemEval 2016 Task 6中之子任務A進行實驗,使用監督式框架來偵測
Twitter使用者的立場,評估方法採用F1分數,並與當年參加競賽之隊伍進行比較,本研
究所使用之方法在數個項目中排名居前。主辦單位所提供之資料集僅有兩千多筆,因此
在訓練模型的成效有一定限制,若是有更多的已標記之訓練集,應會獲得更好的成績。
因此本研究再加入MPCHI資料集進行訓練,此資料集包含五個健康相關的主題,並已標
計立場,並分別實驗測試集為SemEval、MPCHI以及SemEval加上MPCHI,觀察其實驗
結果顯示有其幫助性,優於僅使用原始資料集之實驗結果。
Bethard, S., Carpuat, M., Cer, D., Jurgens, D., Nakov, P., & Zesch, T. (2016, June).
Proceedings of the 10th International Workshop on Semantic Evaluation (SemEval-2016). In Proceedings of the 10th International Workshop on Semantic Evaluation (SemEval-2016).
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of Deep
Bidirectional Transformers for Language Understanding.
Igarashi, I., Komatsu, H., Kobayashi, S., Okazaki, N., &Inui, K. (2016). Tohoku at
SemEval-2016 Task 6: Feature-based Model versusConvolutional Neural Network for Stance Detection.
Sen, A., Sinha, M., Mannarswamy, S., & Roy, S. (2018, January). Stance classification of
multi-perspective consumer health information. In Proceedings of the ACM India Joint International Conference on Data Science and Management of Data (pp. 273-281).
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N.& Polosukhin,
I. (2017) Attention is all you need. In Advances in neural information processing system (pp. 5998-6008).
Vijayaraghavan, P., Sysoev, I., Vosoughi, S.,& Roy, D. (2016). DeepStance at SemEval2016 Task 6: Detecting Stance in Tweets Using Character and Word-Level CNNs.
Wei, W., Zhang, X. (2018)., Liu, X., Chen, W., & Wang, T. (2016). pkudblab at SemEval2016 Task 6 : A Specific Convolutional Neural Network System for Effective Stance Detection.