國立臺灣師範大學博碩士論文全文系統

簡易檢索 / 詳目顯示

回結果列表

研究生：	紀凱文 Ji, Kai-Wun
論文名稱：	摺積神經網路全連結層FPGA實現之研究 The FPGA Implementation of Fully-connected Layers of Convolutional Neural Networks
指導教授：	吳榮根 Wu, Jung-Gen 黃文吉 Hwang, Wen-Jyi
學位類別：	碩士 Master
系所名稱：	資訊工程學系 Department of Computer Science and Information Engineering
論文出版年：	2016
畢業學年度：	104
語文別：	中文
論文頁數：	62
中文關鍵詞：	類神經網路、全連結、摺積神經網路
DOI URL：	https://doi.org/10.6345/NTNU202204029
論文種類：	學術論文
相關次數：	點閱：333 下載：28
分享至:	分享至facebook 分享至twitter

查詢本校圖書館目錄查詢臺灣博碩士論文知識加值系統勘誤回報

本論文旨在於FPGA ( Field Programmable Gate Array ) [1] [2]平台設計實現全連結架構，並與摺積神經網路結合，成為高速的人工視覺辨識系統。
本論文之基礎建立於類神經網路之全連結的使用，除了將全連結硬體化之外，並與具有即時運算的能力摺積神經網路(Convolutional Neural Network)整合。現存的摺積神經網路系統大多以GPU實現，雖具有高速的運算，但同時也擁有高功率消耗等缺點。雖然以FPGA為主之設計可有效降低功率消耗，但也有許多可改善之處。首先是在運算過程中會產生許多的中繼結果，這會使記憶體增加儲存資料之負擔；其次是現有硬體實現之架構僅具焦於摺積神經網路內的摺積層架構，往往忽略了其他重要架構像是全連接層(Fully-Connected Layer)之設計，根據上述原因導致無法實現高速及高準確度之人工視覺系統。
本系統採用全連結架構做為硬體實現，此架構大致上可分為2個全連結層，利用將這2個層級硬體化，進而實現高速的全連結運算。除了實現高速運算之外，為了提高此系統的辨識率，將以此架構與摺積神經網路整合，使辨識率大幅增加。此系統通常應用於字元及人臉辨識，透過我們的實驗結果顯示此架構適合使用於需要高速運算、高準確度、高可攜度、低功率消耗等的人工視覺辨識系統之應用程式。

中文摘要                                     I
誌謝                                        II
目錄                                       III
附表目錄                                     V
附圖目錄                                    VI
第一章    緒論                               1
第一節     研究背景                          1
第二節     動機與目的                        3
第三節     研究方法                     5
第四節     全文架構                     7
第二章    基礎理論及技術背景                     8
第一節     類神經網路                     8
第二節     類神經網路-單層全連結            11
第三節     多層全連結架構                    14
第四節     摺積神經網路-LeNet-5            16
第五節     FPGA系統整合設計                    21
第三章    系統架構                            23
第一節     整體系統架構                    23
第二節     全連結電路                    24
第三節     應用全連結網路於LeNet-5架構之設計    43
第四章    實驗數據與效能分析                    49
第一節     開發平台與實驗環境設定            49
第二節     實驗數據呈現與討論            52
第五章    結論                            60
參考文獻                                    61
                                

[1] S. Hauck and A. Dehon, Reconfigurable Computing: The Theory and Practice of FPGABased, 2008.
[2] U. Meyer-Baese, Digital Signal Processing with Field Programmable Gate Arrays, 4th Ed.,, 2014.
[3] Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner, Gradient-Based Learning Applied to Document Recognition. Proceedings of the IEEE, 86, pp. 2278-2324, 1998.
[4] Y. LeCun, Y. Bengio and G. Hinton, Deep Learning, Nature, 521, pp. 436-444, 2015.
[5] C. Farabet, B. Martini, B. Corda, P. Akselrod, E. Culurciello, and Y. LeCun, Neuflow: A Runtime Reconfigurable Dataflow Processor for Vision. In Proc. IEEE Workshop Embedded Comput. Vision., 2011.
[6] J. Jin, V. Gokhale, A. Dundart, B. Krishnamurthy, B. Martinit and E. Culurciello, An Efficient Implementation of Deep Convolutional Neural Networks on a Mobile Coprocessor. In Proc. IEEE Int. Midwest Symp. on Circuits and Systems, pp.133-136., 2014.
[7] S. Chakradhar, M. Sankaradas, V. Jakkula, and S. Cadambi, A Dynamically Configurable Coprocessor for Convolutional Neural Networks. In Proc. ACM Int. Symp. on Comput Architecture, pp. 247-257., 2010.
[8] C. Farabet, C. Poulet, J. Y. Han, and Y. LeCun, CNP: An FPGA-Based Processor for Convolutional Networks. In Proc. IEEE Int. Conf. Field Programmable Logic and App., pp. 32-37., 2009.
[9] M. Sankaradas, V. Jakkula, S. Cadambi, S. Chakradhar, I. Durdanovic, E. Cosatto, and H. P.Graf, A Massively Parallel Coprocessor for Convolutional Neural Networks. In Proc. IEEE Int. Conf.on Application-Specific Syst., Arch. and Proc., pp. 53-60., 2009.
[10] C. Zhang, P. Li, G. Sun, Y. Guan, B. Xiao, and J. Cong, Optimizing FPGA-Based Accelerator Design for Deep Convolutional Neural Networks. In Proc. ACM/SIGDA Int. Symp. on Field-Programmable Gate Arrays, pp.161-170., 2015.
[11] Y. Cheng, F. X. Yu, R. Feris, S. Kumar, A. Choudhary, and S.-F. Chang, An Exploration of Parameter Redundancy in Deep Networks with Circulant Projections. In Proc. IEEE Int. Conf. Comput. Vision., 2015.
[12] 王雅慶, 以FPGA實現摺積神經網路及應用於人臉特徵辨識之研究,國立台灣師範大學碩士論文, 2016.
[13] Carl Latino, Marco A. Moreno-Armendariz, and Martin Hagan, Realizing General MLP Networks with Minimal FPGA Resources. In Proc. IEEE Int. Joint Conf. on Neural Net., pp. 1722-1729., 2009.
[14] Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick, S. Guadarrama, and T. Darrell, Caffe: Convolutional Architecture for Fast Feature Embedding. In Proc. ACM Int. Conf. on Multimedia, pp. 675-678., 2014.

簡易檢索 / 詳目顯示

相關論文