簡易檢索 / 詳目顯示

研究生: 李兆珩
Li, Zhao-Heng
論文名稱: 協助動態節目導覽推薦系統訓練資料增量之研究
Data Augmentation for the Training of Smart Electronic Program Guide Systems
指導教授: 黃文吉
Hwang, Wen-Jyi
學位類別: 碩士
Master
系所名稱: 資訊工程學系
Department of Computer Science and Information Engineering
論文出版年: 2020
畢業學年度: 108
語文別: 中文
論文頁數: 38
中文關鍵詞: 推薦系統強化式學習主動學習
DOI URL: http://doi.org/10.6345/NTNU202001211
論文種類: 學術論文
相關次數: 點閱:96下載:5
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 本研究為了解決使用主動式學習的推薦系統可能面臨到因為使用者使用系統的頻率不高,而造成資料收集困難的問題,我們希望透過使用者點選的歷史資料,進行資料增量,藉由多次的觀看紀錄,也就是使用者行為資料,產生相應且大量的模擬資料,來加速使用Active Learning的推薦系統收集資料的速度,減少時間資源的浪費。
    本論文以強化式學習的Policy Gradient與主動式學習結合的動態節目導覽推薦系統為例來做資料增量。我們的推薦系統同時考慮使用者的觀看節目類別的喜好,工作日與例假日,觀看時間等,因此為了有效率的產生符合一般人習慣的模擬訓練資料,我們試圖產生情境式的模擬資料來訓練類神經網路。藉由對多種情境作情境增量,我們得以解決主動式學習所面臨到需要花費大量時間收集資料的問題。

    第壹章 簡介 1 第壹節 研究背景 1 第貳節 研究動機 3 第參節 研究目的 4 第貳章 強化式學習與推薦系統紹 5 第壹節 類神經網路基礎介紹 5 第貳節 強化式學習介紹 7 第一項 Policy Gradient演算法介紹 8 第參節 主動式學習與推薦系統介紹 10 第肆節 推薦系統與資料增量之研究 11 第參章 情境式模擬資料增量之方法 12 第壹節 情境式模擬資料概述 12 第貳節 電視台節目種類與時間關聯 14 第參節 情境設定介面介紹 15 第肆節 使用者模擬資料訓練流程 16 第伍節 情境定義 18 第一項 條件定義 18 第二項 每筆資料定義 19 第三項 training data 定義 20 第陸節 情境範例定義 20 第肆章 實驗結果與分析 24 第壹節 實驗環境簡述 24 第一項 觀看節目來源說明 25 第貳節 情境比較 25 第參節 實驗結果 26 第一項 情境範例1實驗結果 27 第二項 情境範例2實驗結果 29 第三項 情境範例3實驗結果 31 第四項 情境範例4實驗結果 32 第肆節 實驗結果分析 34 第伍章 結論 36 參考文獻 37

    [1] Chang, N., Irvan, M., & Terano, T. (2013). A TV program recommender framework. Procedia Computer Science, 22, 561-570.

    [2] N. Rubens, M. Elahi, M. Sugiyama, and D. Kaplan (2015). Active Learning in Recommender Systems, Chap. 24 of Recommender Systems Handbook, 2nd Ed., Editors: F. Ricci, L. Rokach, B. Shapira, Springer-Verlag, New York, USA.

    [3] Elahi, M., Ricci, F., & Rubens, N. (2014, September). Active learning in collaborative filtering recommender systems. In International Conference on Electronic Commerce and Web Technologies (pp. 113-124). Springer, Cham.

    [4] Felder, R. M., & Brent, R. (2009). Active learning: An introduction. ASQ higher education brief, 2(4), 1-5.

    [5] 黃文吉,楊日鳳,徐雅盈”OTT/OTA模組開發合作研究”,資策會結案報告,2019.

    [6] Kaelbling, L. P., Littman, M. L., & Moore, A. W. (1996). Reinforcement learning: A survey. Journal of artificial intelligence research, 4, 237-285.

    [7] 楊日鳳, ”使用強化式學習於時間序列預測之應用”, 國立台灣師範大學,2019.

    [8] Elahi, M., Ricci, F., & Rubens, N. (2014, September). Active learning in collaborative filtering recommender systems. In International Conference on Electronic Commerce and Web Technologies (pp. 113-124). Springer, Cham.

    [9]PyQt:https://riverbankcomputing.com/software/pyqt/intro.

    [10] xlwings: https://www.xlwings.org/.

    [11] TitanTV: https://titantv.com/default.aspx.

    [12] 爬蟲: https://www.selenium.dev/.

    下載圖示
    QR CODE