簡易檢索 / 詳目顯示

研究生: 翟柏森
Chai, Po-sen
論文名稱: 應用開放資料預測農產品菜價之研究:以甘藍為例
Applying Open Data to Predict Vegetable Prices in Farm Products: Taking Cabbage as an Example
指導教授: 葉耀明
Yeh, Yao-Ming
吳榮根
Wu, Jung-Gen
學位類別: 碩士
Master
系所名稱: 資訊工程學系
Department of Computer Science and Information Engineering
論文出版年: 2018
畢業學年度: 106
語文別: 中文
論文頁數: 90
中文關鍵詞: 政府開放資料農產品蔬菜價格預測類神經網路
英文關鍵詞: government open data, vegetable price prediction
DOI URL: http://doi.org/10.6345/THE.NTNU.DCSIE.022.2018.B02
論文種類: 學術論文
相關次數: 點閱:262下載:46
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 農產品價格的波動影響著我們日常生活。近年來劇烈的氣候變化更加劇菜價漲跌。本研究目的為農產品交易資訊透明化做出貢獻,研究流程分成三大部分:自動化資料擷取與特徵工程、資料視覺化、農產品價格預測模型。本研究首先搜集農產品交易開放資料、氣象開放資料和颱風警報資料,並透過資料清洗及各項特徵工程方法來整理資料和特徵建構,經過多次試算與調整後,再將資料擷取、特徵工程等步驟整合並撰寫成自動化擷取程式,使得未來更新資料能夠不依靠人工便可自動化更新;此外本論文提出農產品交易訊息視覺化方法,藉由視覺化圖形彼此交互比對,使得大眾能夠直觀地觀察、分析龐大且繁雜的數據,最後使用類神經網路之LSTM(長短期記憶模型)設計價格預測模型,預測全國最大宗蔬菜-甘藍價格。

    The purpose of this study is to predict vegetable prices in the wholesale markets using governmental open data. We collected various governmental open data in Taiwan, including agricultural product prices in wholesale markets and climate statistics of each county in Taiwan. In order to develop our prediction model, we organize and construct vegetable price data features using data cleansing and feature engineering. We also develop automated data extraction programs to constantly download the new data without human intervention. In addition, a visualization scheme is developed for these complicated agricultural transaction data. Our prediction model, LSTM (Long short-term memory) architecture, is developed using Deep Learning RNN (Recurrent Neural Network) architecture. A preliminary vegetable price prediction experiment is conducted.

    摘要 i Abstract ii 誌謝 iii 目錄 iv 附表目錄 viii 附圖目錄 ix 第一章、緒論 1 1.1 研究背景 1 1.2 研究目的 2 1.3 研究架構 4 第二章、文獻探討 6 2.1 開放資料 6 2.2 特徵工程 6 2.3 隨機森林演算法 7 2.4 類神經網路之LSTM 7 2.5 植物生長理論 8 第三章、資料擷取與特徵工程 10 3.1 開放資料擷取 10 3.2 農產品交易開放資料之特徵工程 11 3.2.1 建立新欄位 12 3.2.2 刪除市場休息資料 14 3.2.3 轉換欄位名稱為英文 15 3.2.4 刪除相依欄位 16 3.2.5 建構日期特徵與市場休息特徵 17 3.3 氣象開放資料之特徵工程 19 3.3.1 特徵工程 22 3.3.2 獨立各縣市天氣特徵 23 3.4 建立自動化資料擷取程式 26 第四章、資料視覺化 27 4.1 農產品供貨量分析 28 4.1.1 農產品供貨量前30名分析 29 4.1.2 蔬菜供貨量前30名分析 31 4.2 市場供貨量分析 33 4.2.1 全部市場供貨量分析 34 4.2.2 蔬菜市場分析 35 4.3 單一品項交易訊息分析 36 4.3.1 各年總供貨量比例 36 4.3.2 歷年供貨量及平均價 36 4.3.3 每日交易訊息分析 38 4.4 五大市場分析 39 4.5 多品項交易訊息分析 40 4.6關聯度分析 41 4.6.1 國產蔬菜供貨量關聯度分析 41 4.6.2 國產蔬菜平均價關聯度分析 43 4.6.3 進階多品項分析 44 4.7 供貨量與天氣特徵分析 48 第五章、特徵分析 52 5.1 平均價漲跌分類方法 53 5.2 供貨量特徵 55 5.3 天氣特徵 56 5.3.1 溫度特徵 56 5.3.2 降水量特徵 61 5.4 颱風警報發布特徵 66 5.5 市場休息與日期特徵 67 第六章、價格預測模型 69 6.1 預測未來5日價格模型 69 6.2 價格預測混合模型 71 6.3 價格預測模型結果討論 76 6.4 研究結果與未來展望 78 附錄 80 參考文獻 89

    [1] 黃明德 發行人,1994-09-11,「果菜批發價格是怎麼訂的?」,台東區農業專訊,第9期
    [2] 行政院綜合業務處,「行政院第3322次院會決議」,101-11-08
    [3] Jason Brownlee, 2014-09-26, “Discover Feature Engineering, How to Engineer Features and How to Get Good at It”
    [4] 机器学习特征工程实用技巧大全:https://zhuanlan.zhihu.com/p/26444240
    [5] 高麗菜有這麼多種?口感特色一次看懂!http://food.ltn.com.tw/article/1243
    [6] Breiman, L., 1996, “Bagging Predictors”
    [7] Tin Kam Ho, “The Random Subspace Method for Constructing Decision Forests”, 1998-08-18
    [8] Brandon brohrer, “How Recurrent Neural Networks and Long Short-Term Memory Work”
    [9] 古明萱教授,「第五章 作物與溫度」,屏東科技大學農藝學
    [10] 古明萱教授,「第六章 作物與水」,屏東科技大學農藝學
    [11] 農產品交易行情API 介接說明書:https://data.coa.gov.tw/Query/ServiceDetail.aspx?id=037
    [12] 台北果菜市場20天休市11天 菜價崩跌:https://www.businessweekly.com.tw/article.aspx?id=22017&type=Blog
    [13] 觀測資料說明書:https://e-service.cwb.gov.tw/HistoryDataQuery/index.jsp

    (開放資料來源)
    農產品批發市場交易行情站:http://data.coa.gov.tw/Service/OpenData/FromM/FarmTransData.aspx
    中央氣象局測站代號及站況資料查詢:
    https://e-service.cwb.gov.tw/wdps/obs/state.htm
    中央氣象局:觀測資料查詢系統:
    http://e-service.cwb.gov.tw/HistoryDataQuery/index.jsp
    颱風資料庫:有發警報颱風列表:http://rdc28.cwb.gov.tw/TDB/ntdb/pageControl/ty_warning

    下載圖示
    QR CODE