簡易檢索 / 詳目顯示

研究生: 黃俊程
Huang, Chun-cheng
論文名稱: 實現於圖形處理器的高性能平行位置檢知近似字串比對演算法
High-Performance Parallel Location-Aware Algorithms for Approximate String Matching on GPUs
指導教授: 林政宏
Lin, Cheng-Hung
學位類別: 碩士
Master
系所名稱: 電機工程學系
Department of Electrical Engineering
論文出版年: 2017
畢業學年度: 105
語文別: 中文
論文頁數: 44
中文關鍵詞: 近似字串比對位元平行演算法圖形運算處理器編輯距離非確定有限狀態自動機平行演算法
英文關鍵詞: approximate string matching, bit-parallel algorithm, graphic processing units, Levenshtein distance, nondeterministic finite automaton, parallel algorithm
DOI URL: https://doi.org/10.6345/NTNU202202622
論文種類: 學術論文
相關次數: 點閱:218下載:1
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 近似字串比對被廣泛的應用於各種不同的領域。例如:去氧核糖核酸序列搜尋比對、電腦文字輸入校正、文字資料探勘以及垃圾電子郵件過濾等。近似字串比對的設計是用來搜索文件中所有近似字串文字樣式字串及使用者定義的插入、刪除、取代的容許誤差值搜索後的匹配的位置。在眾多被提出的近似字串比對演算法中,位元平行演算法被認定是最適、最有效率的演算法。然而,傳統的位元平行演算法無法同時偵測樣式字串匹配字串的起始及結束位置。除此之外,因應現代多核心處理器的硬體發展,以及叢集運算、雲端運算以及大數據處理的需求。如何加速位元平行演算法成為當今重要的課題。本研究分別提出利用多串流平行和高維度平行這兩種位置偵測近似字串比對方法並利用圖形運算處理器(GPU)來加速演算法。實驗結果顯示,比較高維度平行演算法在圖形運算處理器(GPU)以及CPU的執行效能,圖形運算處理器(GPU)版本無論是在作業系統執行環境或者是在圖形顯示處理(GPU)核心執行的情況,效能皆得到顯著的提升。相較於其他相關研究,本研究所提出的高維度平行的方法達到了 11 至 105 倍的效能改善。最終,我們開發了一個讓使用者可以在線上執行位置偵測近似字串比對並找出所有樣式字串匹配結果起點及終點位置網路服務。

    Approximate string matching has been widely used in many applications, including deoxyribonucleic acid sequence searching, spell checking, text mining, and spam filters. The method is designed to find all locations of strings that approximately match a pattern in accordance with the number of insertion, deletion, and substitution operations. Among the proposed algorithms, the bit-parallel algorithms are considered to be the best and highly efficient algorithms. However, the traditional bit-parallel algorithms lacks the ability of identifying the start and end positions of a matched pattern. Furthermore, acceleration of the bit-parallel algorithms has become a crucial issue for processing big data nowadays. In this paper, we propose two kinds of parallel location-aware algorithms called data-segmented parallelism and high-degree parallelism as means to accelerate approximate string matching using graphic processing units. Experimental results show that the high-degree parallelism on GPUs achieves significant improvement in system and kernel throughputs compared to CPU counterparts. Compared to state-of-the-art approaches, the proposed high-degree parallelism achieves 11 to 105 times improvement.
    Finally, we develop a web service which allows users to perform approximate string matching on line and deliver all matched substrings with the start and end positions.

    中文摘要 ii 英文摘要 iii 誌謝 v 目錄 vi 圖目錄 vii 表目錄 ix 第一章  緒論 1 1.1 研究背景 1 1.2 研究動機與目的 2 1.3 研究貢獻 2 第二章  位元平行演算法 3 2.1 非確定有限狀態自動機 3 2.2 Bit-Parallel Algorithm by Row 5 2.3 Bit-Parallel Algorithm by Diagonal 6 2.4 BPR 與 BPD 之比較分析 7 2.5 各種 GPU 近似字串比對演算法 7 第三章  位置偵測近似字串比對平行演算法 8 3.1 平行運算架構 8 3.2 數據分割平行 9 3.3 高密度平行 11 第四章  實驗方法與結果 14 4.1 實驗環境與簡介 14 4.2 實驗結果 14 第五章  結論 43 參考文獻 44 圖 目 錄 圖2-1   匹配“ATCG”樣式字串(含一個編輯距離2)時NFA 3 圖2-2   通過2個刪除操作匹配“AT” 4 圖2-3   通過1個刪除操作匹配“ATG” 4 圖2-4   通過1個刪除操作匹配“ATGG” 5 圖2-5   BPR在一暫存器中存儲每一行 6 圖2-6   BPD 在記憶體中存儲對角線狀態 6 圖3-1   DSP 分別使用正向-NFA 和反向-NFA 來識別開始和結束 10 圖3-2   HDP 為每個輸入位置都賦予了一個Thread 11 圖3-3   HDP的新NFA 12 圖4-1   GBPDHDP 在樣式字串長度固定為4時的效能比較 16 圖4-2   GBPDHDP 在樣式字串長度固定為8時的效能比較 17 圖4-3   GBPDHDP 在樣式字串長度固定為12時的效能比較 17 圖4-4   GBPDHDP 在編輯距離固定為0時的效能比較 18 圖4-5   GBPDHDP 在編輯距離固定為1時的效能比較 18 圖4-6   GBPDHDP 在編輯距離固定為2時的效能比較 19 圖4-7   GBPDDSP 在樣式字串長度固定為4時的效能比較 20 圖4-8   GBPDDSP 在樣式字串長度固定為8時的效能比較 21 圖4-9   GBPDDSP 在樣式字串長度固定為12時的效能比較 21 圖4-10  GBPDDSP 在編輯距離固定為0時的效能比較 22 圖4-11  GBPDDSP 在編輯距離固定為1時的效能比較 22 圖4-12  GBPDDSP 在編輯距離固定為2時的效能比較 23 圖4-12  GBPDDSP 在編輯距離固定為2時的效能比較 23 圖4-13  GBPRHDP 在樣式字串長度固定為4時的效能比較 24 圖4-14  GBPRHDP 在樣式字串長度固定為8時的效能比較 25 圖4-15  GBPRHDP 在樣式字串長度固定為12時的效能比較 25 圖4-16  GBPRHDP 在編輯距離固定為0時的效能比較 26 圖4-17  GBPRHDP 在編輯距離固定為1時的效能比較 26 圖4-18  GBPRHDP 在編輯距離固定為2時的效能比較 27 圖4-19  GBPRDSP 在樣式字串長度固定為4時的效能比較 28 圖4-20  GBPRDSP 在樣式字串長度固定為8時的效能比較 29 圖4-21  GBPRDSP 在樣式字串長度固定為12時的效能比較 29 圖4-22  GBPRDSP 在編輯距離固定為0時的效能比較 30 圖4-23  GBPRDSP 在編輯距離固定為1時的效能比較 30 圖4-24  GBPRDSP 在編輯距離固定為2時的效能比較 31 圖4-25  CBPDOMP 在樣式字串長度固定為4時的效能比較 32 圖4-26  CBPDOMP 在樣式字串長度固定為8時的效能比較 33 圖4-27  CBPDOMP 在樣式字串長度固定為12時的效能比較 33 圖4-28  CBPDOMP 在編輯距離固定為0時的效能比較 34 圖4-29  CBPDOMP 在編輯距離固定為1時的效能比較 34 圖4-30  CBPDOMP 在編輯距離固定為2時的效能比較 35 圖4-31  CBPROMP 在樣式字串長度固定為4時的效能比較 36 圖4-32  CBPROMP 在樣式字串長度固定為8時的效能比較 37 圖4-33  CBPROMP 在樣式字串長度固定為12時的效能比較 37 圖4-34  CBPROMP 在編輯距離固定為0時的效能比較 38 圖4-35  CBPROMP 在編輯距離固定為1時的效能比較 38 圖4-36  CBPROMP 在編輯距離固定為2時的效能比較 39 圖4-37  系統吞吐量與輸入密度的比較 41

    P. H. Sellers, “The Theory and Computation of Evolutionary Distances: Pattern Recognition,” J. Algorithms 1, 1980, pp.359-373.
    E. Ukkonen, “Finding approximate patterns in strings,” J. Algorithms 6, 1985, pp.132–137.
    R. Baeza-Yates. Text retrieval: theory and practice. In J. van Leeuwen, editor, Proc. 12th IFIP World Computer Congress, volume I: Algorithms, Software, Architecture, pages 465–476. Elsevier Science, Amsterdam, September 1992.
    R. Baeza-Yates and G. Gonnet, “A new approach to text searching,” Communications of the ACM, 35(10): 74–82, October 1992.
    R. Baeza-Yates and G. Navarro, “Faster Approximate String Matching,” Algorithmica, vol. 23, 1999, pp. 127-158.
    S. Wu and U. Manber, “Fast text searching: allowing errors,” Commun. ACM, vol. 35, 1992, pp. 83-91.
    S. Wu, U. Manber, and E. Myers, “A subquadratic algorithm for approximate limited expression matching,” Algorithmica, 15(1):50–67, 1996.
    H. Hyyrö, “Improving the bit-parallel NFA of Baeza-Yates and Navarro for approximate string matching,” Information Processing Letters, vol. 108, 2008, pp. 313-319.
    CUDA, http://www.nvidia.com/object/cuda_home_new.html
    OpenMP, http://openmp.org/wp/
    D. Man, K. Nakano, and Y. Ito, “The Approximate String Matching on the Hierarchical Memory Machine,” with Performance Evaluation. Embedded Multicore Socs (MCSoC), Tokyo, Japan, September, 2013.
    K. Xu, W. Cui, and Y. Hu, and L. Guo, “Bit-Parallel Multiple Approximate String Matching based on GPU,” Procedia Computer Science, 17(0), 2013, pp. 523-529.
    O. Mikael, and A. Yoshinori, “Online approximate string matching with CUDA”, Technical Report of Tokyo Institute of Technology. 1-4. Retrieved March 27, 2014, from http://pds13.egloos.com/pds/200907/26/57/pattmatch-report.pdf

    下載圖示
    QR CODE