簡易檢索 / 詳目顯示

研究生: 吳振傑
WU, Zhen-Jie
論文名稱: 以Density map為基礎之輕量化網路架構應用於室內人群計數之研究
Lightweight Neural Network Based on Density Map For Indoor Crowd Counting
指導教授: 黃文吉
Hwang, Wen-Jyi
口試委員: 黃文吉
Hwang, Wen-Jyi
葉佐任
Yeh, Tso-Zen
歐謙敏
口試日期: 2022/01/25
學位類別: 碩士
Master
系所名稱: 資訊工程學系
Department of Computer Science and Information Engineering
論文出版年: 2022
畢業學年度: 110
語文別: 中文
論文頁數: 41
中文關鍵詞: 人群計數類神經網路邊緣運算裝置
英文關鍵詞: Density Map
研究方法: 實驗設計法
DOI URL: http://doi.org/10.6345/NTNU202200243
論文種類: 學術論文
相關次數: 點閱:115下載:12
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 近年來由於受到疫情的影響,室內的人群數量管控就變得越來越重要,因此越來越多的人開始研究如何使用電腦視覺的方式,來解決傳統用人力的方式來計數人群數量的問題。
    本論文為了能夠在室內環境下進行人群計數,且方便應用於日常生活之中,於是提出了輕量化Density Map網路架構,Simple Indoor Crowd Counting Neural Network(SICCNet),使用MobileNetV2、Depthwise Convolution、Dilated Convolution等等的技術來達到較少的模型參數量及計算量,並且能夠提升模型的運算速度。
    SICCNet具有高效率、高準確度且耗費資源較少的特性,並且整合至低成本、體積小且運算受限的邊緣運算裝置,能夠保持辨識的準確率之餘,也能達到即時運算的效果,準確的預測出室內環境下的人數,因此可以應用在日常生活中。

    摘要 i 目錄 ii 表目錄 iv 圖目錄 v 第1章 論文背景及目的 1 1-1 緒論 1 1-2 文獻探討 2 1-2-1 Density Map為基礎的人群計數方法 2 1-2-2 Neural Network和Density map為基礎的方法 3 1-2-3 Transfer Learning和Density map為基礎的方法 3 1-2-4 MobileNetV2 4 1-3 研究目的及貢獻 5 1-3-1 研究困難 5 1-3-2 研究目的 5 1-3-3 研究貢獻 6 第2章 理論基礎與背景 7 2-1 一般Convolution的運作原理 7 2-2 Depthwise Convolution的運作原理 9 2-3 Pointwise Convolution的運作原理 10 2-4 Bottleneck 12 2-5 Dilated Convolution 13 2-6 Transfer Learning 14 第3章 研究方法 15 3-1 類神經網路的架構概述 15 3-2 Frontend 16 3-3 Backend 20 3-4 輕量化Density Map網路架構 22 3-5 Ground Truth Generation 24 3-6 損失函數 25 3-7 Optimizer從SGD改用Adam 26 第4章 實驗數據與效能分析 27 4-1 實驗環境介紹 27 4-2 MC2 Dataset 28 4-3 模型評估方法 31 4-4 模型預測結果評估 32 4-5 在邊緣運算裝置上之測試 36 第5章 結論 40 參考文獻 41

    [1] Guangshuai Gao, Junyu Gao, Qingjie Liu, Qi Wang, Yunhong Wang. CNN-based Density Estimation and Crowd Counting: A Survey. CVPR, 2020.

    [2] V. Lempitsky, A. Zisserman. Learning to count objects in images. In NIPS, 2010.

    [3] Elad Walach, Lior Wolf. Learning to Count with CNN Boosting. ECCV, 2016.

    [4] L. Boominathan, S. S. Kruthiventi, and R. V. Babu. Crowdnet: A deep convolutional network for dense crowd counting. arXiv:1608.06197, 2016.

    [5] Karen Simonyan, Andrew Zisserman. Very Deep Convolutional Networks for Large-Scale Image Recognition. arXiv:1409.1556, 2014.

    [6] Yuhong Li, Xiaofan Zhang, Deming Chen. CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes. CVPR, 2018.

    [7] Pongpisit Thanasutives, Ken-ichi Fukui, Masayuki Numao, Boonserm Kijsirikul. Encoder-Decoder Based Convolutional Neural Networks with Multi-Scale-Aware Modules for Crowd Counting. ICPR, 2020.

    [8] Mark Sandler, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, Liang-Chieh Chen. MobileNetV2: Inverted Residuals and Linear Bottlenecks. CVPR, 2018.

    [9] Fisher Yu, Vladlen Koltun. Multi-Scale Context Aggregation by Dilated Convolutions. ICLR, 2016.

    [10] Diederik P. Kingma, Jimmy Ba. Adam: A Method for Stochastic Optimization. ICLR, 2014.

    [11] Weizhe Liu, Mathieu Salzmann, Pascal Fua. Context-Aware Crowd Counting. CVPR, 2019.

    [12] Yingying Zhang, Desen Zhou, Siqin Chen, Shenghua Gao, Yi Ma. Single-Image Crowd Counting via Multi-Column Convolutional Neural Network. CVPR, 2016.

    下載圖示
    QR CODE