國立臺灣師範大學博碩士論文全文系統

簡易檢索 / 詳目顯示

回結果列表

研究生：	王雅慶 Wang, Ya-Ching
論文名稱：	以FPGA實現摺積神經網路及應用於人臉辨識之研究 The implementation of CNN-based face recognition systems based on FPGA
指導教授：	吳榮根 Wu, Jung-Gen 黃文吉 Hwang, Wen-Jyi
學位類別：	碩士 Master
系所名稱：	資訊工程學系 Department of Computer Science and Information Engineering
論文出版年：	2016
畢業學年度：	104
語文別：	中文
論文頁數：	78
中文關鍵詞：	摺積神經網路
DOI URL：	https://doi.org/10.6345/NTNU202204484
論文種類：	學術論文
相關次數：	點閱：371 下載：48
分享至:	分享至facebook 分享至twitter

查詢本校圖書館目錄查詢臺灣博碩士論文知識加值系統勘誤回報

本研究主要提出一個以可程式化邏輯閘陣列(Field Programmable Gate Array; FPGA) [1]為主的硬體架構來實現快速辨識影像架構，此架構是採用摺積神經網路(Convolutional Neural Network ; CNN)的向前傳遞法則(Forward propagation)來實現影像的辨識階段，現有的CNN系統架構多以GPU實現，GPU有高功率的缺點，而現有使用FPGA實現CNN運算的電路設計大部分只有設計CNN中的少數幾層，只實作出摺積層或是全連結層，本研究以FPGA為平台，設計CNN中的Lenet5模型，設計出Lenet5完整架構，具有低功率消耗跟極高的辨識率的優點。
本研究的架構為可程式化系統晶片(System on Programmable Chip; SOPC)中的硬體加速器以實現圖像辨識，本研究使用人臉圖像來當作辨識影像，總共辨識28個人的人臉。實驗結果顯示本研究所提出的CNN架構十分合適於使用在需要高可攜性，高辨識率，高計算速度等的視覺應用。本論文實作CNN的Lenet5架構比較適合運用在社區的人臉監視系統，Lenet5 模型對於很多人的辨識運用比其它摺積神經網路較差些，像是VGG Net [2]、GOOGLE Net [3]，但對於30人左右的辨識率Lenet5模型還是辨識率還是足夠的。本研究可以使用在社區人臉辨識，社區的人臉監視系統只需要辨識社區內所有人物，而且辨識的速度快速，一有辨識錯的影像可以馬上被察覺，不會讓社區以外的人進入，這是本論文的一個有趣的應用。

中文摘要    i
誌謝    ii
目錄    iii
附表目錄    v
附圖目錄    vi
第一章    緒論    1
第一節 研究背景與動機    1
第二節 研究目的與方法    3
第三節 全文架構    5
第二章    基礎理論與文獻探討    6
第一節 類神經網路介紹    6
第二節 Convolutional Neural Networks basics    9
第三節 Convolutional Neural Networks演算法則    10
第四節 FPGA系統設計    15
第三章    系統架構    16
第一節 研究流程    16
第二節 電路架構    17
第一項 C3電路架構    19
第二項 S2電路架構    32
第三項 C3電路架構    40
第四項 NIOS Ⅱ系統單元    59
第四章    實驗數據與效能分析    60
第一節 開發平台與實驗環境    60
第二節 實驗結果與效能分析    65
第五章    結論    74
參考文獻    75
                                

[1] C. Zhang, P. Li, G. Sun, Y. Guan, B. Xiao, and J. Cong, (2015). Optimizing FPGA-Based Accelerator Design for Deep Convolutional Neural Networks. In Proc. ACM/SIGDA Int. Symp. on Field- Programmable Gate Arrays, pp.161-170.
[2] L. Wang, S. Guo, W. Huang, and Y. Qiao (2015). Places205-VGGNet Models for Scene Recognition; Available online: https://github.com/wanglimin/Places205-VGGNet (accessed on 20 Nov. 2015).
[3] C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, A.Rabinovich (2015). Going Deeper with Convolutions. In Proc. IEEE Int. Conf. on Comp. Vis. and Pattern Recogn.
[4] Y. LeCun, Y. Bengio and G. Hinton, (2015). Deep Learning, Nature, 521, pp. 436-444.
[5] J. Fan, W. Xu, Y. Wu, and Y. Gong, (2010) Human Tracking Using Convolutional Neural Networks. IEEE Trans. Neural Networks, 21, pp. 1610 -1623.
[6] S. Ji, W. Xu, M. Yang and K. Yu (2013). 3D Convolutional Neural Networks for Human Action Recognition. IEEE Trans. Pattern Analysis and Machine Intelligence, 35, pp.221-231.
[7] K. Simonyan and A. Zisserman, (2015). Very Deep Convolutional Neural Networks for Large Scale Image Recognition, In Proc. Int. Conf. on Learning Representation.
[8] Y. Jia, http://caffe.berkeleyvision.org/.
[9] S. Sun and J. Zambreno (2009). A Floating-point Accumulator for FPGA-based High Performance Computing Applications. In Proc. IEEE Int. Conf. on Field-Programmable Tech., pp. 493-499.
[10] A. Krizhevsky, I. Sutskever, and G. E. Hinton, (2012) Imagenet Classification with Deep Convolutional Neural Networks. Advances in Neural Inform. Processing Syst., 25, pp. 1106-1114.
[11] S. Himavathi, D. Anitha, and A. Muthuramalingam, (2007).Feedforward Neural Network Implementation in FPGA Using Layer Multiplexing for Effective Resource Utilization, IEEE Trans. Neural Networks, 18, pp.880-888..
[12] Y. Jia, E. Shelhamer, J. Donahue, S. Karayev, J. Long, R. Girshick,
S. Guadarrama, and T. Darrell(2014) Caffe: Convolutional Architecture for Fast Feature Embedding. In Proc. ACM Int. Conf. on Multimedia, pp. 675-678
[13] Y. LeCun and Y. Bengio, (1995) Convolutional networks for images, speech, and time series. In The Handbook of Brain Theory and Neural Networks, M. A. Arbib, Ed., MIT Press, pp. 255-258.
[14] 紀凱文(2016),摺積神經網路全連結層FPGA實現之研究, 國立台灣師範大學碩士論文

簡易檢索 / 詳目顯示

相關論文