簡易檢索 / 詳目顯示

研究生: 林明璋
論文名稱: 電腦輔助記憶系統之研究與製作~諧音研究與文章斷詞分析
A Research and Implementation for Computer-Assisted Mnemonic System~The Research of Chinese Homonym and Word Segmentation
指導教授: 林順喜
學位類別: 碩士
Master
系所名稱: 資訊教育研究所
Graduate Institute of Information and Computer Education
論文出版年: 2002
畢業學年度: 91
語文別: 中文
論文頁數: 82
中文關鍵詞: 助憶中文助憶碼電腦輔助記憶系統諧音近似音國語音節中文斷詞漢語構詞
英文關鍵詞: mnemonic, Chinese mnemonic words, computer-assisted mnemonic system, homonyms, similar syllable, characteristic of Mandarin syllable, Chinese word segmentation, Chinese word-composition
論文種類: 學術論文
相關次數: 點閱:223下載:10
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 人的一生中,總是離不開數字,舉凡生日、身份證字號、信用卡卡號、電話號碼、提款卡卡號、密碼等,都與數字息息相關。面對林林總總的數字,除非常用,否則極少部分的人能將其全部數字完全記憶起來。市面上有許多廣告與流行術語,利用諧音來針對無意義、抽象的事物做記憶聯想,將數字轉換成中文諧音字來使得數字醒目又好記。如:000919(鈴鈴鈴,救一救)等。
    在本論文中,我們研究如何輔助人類方便且容易記憶其相關數字,將一連串無意義的數字,透過電腦輔助,轉換成有意義且容易記憶的詞語。使得人們在面對一連串的數字時,能夠很快地將數字做一中文詞句的聯結以達到易記的目的。
    研究中針對國語音節聲韻分析、諧音規則、中文斷詞、自然語言詞彙、及構詞組句基本剖析。作一深入的研究與分析,並設計出一套電腦輔助記憶系統。系統對於「無意義的數字轉換成中文助憶詞句」提供一條記憶的捷徑。實驗評估結果顯示:在數字與中文助憶碼的選擇上,有七成多的使用者願意選擇以中文助憶碼來幫助記憶數字;在輔助記憶成效上,經短期記憶與長期記憶的實驗分析,均可達到不錯的助憶效果。

    Human beings are closely related to numbers throughout their lifetime. For example, the birth date, identification number, credit card number, telephone number, ATM number, password, etc. all have something to do with numbers. Among plenty of numbers, except for those frequently used, very few people can remember the numbers by heart. In the commercial market, there are many advertisements and popular jargons using homonyms to associate the meaningless and abstract events and further turning numbers into homonyms to make numbers distinct and easy to be remembered.
    In this thesis, we study how to assist people to remember quickly and easily a series of meaningless numbers by changing them into meaningful and mnemonic Chinese terms through the assistance of computers. In a word, the purpose of this thesis is to associate a series of numbers with mnemonic Chinese phrase or sentence immediately when people encounter those numbers unexpectedly.
    In the research, we analyze the characteristic of Mandarin syllable, rule of homonyms, Chinese word segmentation, Chinese vocabulary, Chinese word-composition, etc. After a deep research and analysis, we have designed a Computer-Assisted Mnemonic System. This system can offer a shortcut to our memory concerning “meaningless numbers transformed into Chinese Mnemonic words”. According to the experimental results, 70 percent of the testers were willing to use the Chinese mnemonic words and found that it has reached the goal of helping people remember.

    目錄 附表目錄…………………………………………………………….…iii 附圖目錄…………………………………………………………………v 第一章 緒論…………………………………………………………….1 第一節 研究背景…………………………….………………………………....1 第二節 研究動機……….……………………...……………………………….2 第三節 研究目的…….………………………………..……………………….2 第四節 研究現況與文獻探討……………………………..…………………..3 第五節 問題分析……………………………………………………………....6 第六節 研究方法與系統架構………………………………………..………..6 第七節 本篇論文組織架構…………………………………………………10 第二章 相關研究與應用技術…………….…………………..………11 第一節 國語音節聲韻分析…………………………………………………...11 第二節 諧音規則分析………………….……………………..………………14 第三節 中文斷詞分析……………………………………………….………..21 第四節 自然語言詞彙分析……………………………………….…..………23 第五節 中文構詞語法剖析………………………………………….………..25 第三章 電腦輔助數字助憶系統…………….…………..……………33 第一節 數字諧音規則的建立………………….…………………..…………33 第二節 中文詞句資料庫的建立….…………………………………..………34 第三節 數字助憶系統的設計平台與基本架構……………….……………..36 第四節 數字轉換中文字串機制…………………………………………..…40 第五節 中文轉換數字諧音機制…………………………………………….48 第六節 資料庫處理技術與維護……………………………………..………50 第四章 評估分析與實驗結果……………….………………………..56 第一節 相關詞庫的統計與分析…….………………………………….…….56 第二節 系統助憶碼範例……………………………………………………...57 第三節 系統助憶碼的成效評估實驗…………….…………………………..58 第四節 資料庫擴增的可行性……….………………………………………..63 第五章 結論與未來研究方向…………….…………………………..65 第一節 結論…….……………………………………………………….…….65 第二節 未來研究方向…………….…………………………………………..66 參考文獻……………………………………….……………………..…68 附錄……………………………………………………………………71 附錄一 411個音節準確音編碼表……………………………………………71 附錄二 411個音節近似音集合(一)編碼表………………………………72 附錄三 411個音節近似音集合(二)編碼表………………………………73 附錄四 擴充詞庫之文章來源……………………………………………..…74 附錄五 系統評估問卷(一)…………………………………………………75 附錄六 系統評估問卷(二)…………………………………………………77 附錄七 系統評估問卷(三)…………………………………………………78 附錄八 中央社新聞~文章大小與擷取詞之統計…………………………..80 附錄九 中央社新聞擷取詞新增數量統計…………………………………..82 附表目錄 表1.1 國內常見數字用語………………………..…….…….…………………….4 表1.2 以英文為主的圓周率π記憶法……….……..……….…………………….5 表2.1 中文音節結構………………………………………..…………..……...…11 表2.2 聲母的分類……...……………………………………………..………..…12 表2.3 韻母的分類………………………………………………………………...13 表2.4 常見的混淆音組……………………………….……………..……………13 表2.5 所有聲母的分類編號……………………………..……………………….14 表2.6 所有韻母的分類編號………………………….………..…………………14 表2.7 數字音準確音編碼…………………………….…………..………………15 表2.8 聲母近似音集合編號(一)………………….…………………………..15 表2.9 韻母近似音集合編號(一)……………………………………………….16 表2.10 數字音近似音編碼(一)…………………………………………………17 表2.11 聲母近似音集合編號(二)………………………………………………17 表2.12 韻母近似音集合編號(二)…………………..……….………………….18 表2.13 數字音近似音編碼(二)…………………………….…………………...18 表2.14 「ㄙㄢ」音節的聲母與韻母近似音集合…………………………………19 表2.15 「ㄙㄢ」的可能近似音……………………………………………………20 表2.16 「ㄕㄥ」音節的聲母與韻母近似音集合…………………………………20 表2.17 「ㄕㄥ」的可能近似音………………………………..………………….20 表2.18 中研院詞庫小組CKIP詞類標記表…………………….………………...25 表2.19 詞的分類(張志公,1999)………………………………………………26 表2.20 詞的分類(中研院中文詞庫)……………………………………………26 表2.21 實詞的組合與例句說明……………………………..…………………….27 表2.22 詞組組合與例句說明……………………………………………………...28 表2.23 詞的組合與句型公式……………………………………………………..29 表2.24 基本構詞公式………………………………………………….…………31 表3.1 數字諧音規則……………..……………………………………………….33 表3.2 系統平台與需求……………………………………………….…………36 表3.3 字串切割集合表示法…………………………………….………………41 表3.4 挑詞S公式所產生的挑詞分數例子………………………………………43 表3.5 彈性加權的例子說明……………………………………………………...43 表3.6 〔2、3、5、25、51、75、513、133、375、1337、3375〕詞彙相關資料…44 表3.7 〔2513375〕分割組合的構詞評估公式結果……………………………..45 表3.8 簡易構詞語法公式……………………………………………………….46 表3.9 〔2513375〕分割組合的構詞句型範例………….……………………….47 表4.1 原始詞庫相關統計表…………………………………..………………...56 表4.2 基本詞庫相關統計表……………………………………….……………57 表4.3 文章擴充專業詞庫相關統計表………………………….………………57 表4.4 數字與中文助憶碼範例………………..…………….……………………58 表4.5 問卷調查統計結果(一)…………………………………………………...59 表4.6 問卷調查統計結果(二)…………………………………………………...60 表4.7 問卷調查統計結果(三)…………………………………………………...61 附圖目錄 圖1.1 國外電話號碼對應字母助憶法………….………….…………………….5 圖1.2 系統架構圖…………………………….…………….…………………….8 圖3.1 中文詞句資料庫架構圖……………………………..…………..……...…35 圖3.2 數字轉換中文助憶碼程式畫面……...…..……………………………..…37 圖3.3 中文轉換數字碼程式畫面………………………………………………...38 圖3.4 文章詞彙擴充詞庫程式畫面………………..……………………………39 圖3.5 資料庫管理維護架構圖………………………………..………………….40 圖3.6 數字轉換中文助憶碼系統流程圖………………………………..………47 圖3.7 中文轉換數字諧音碼系統流程圖……………………………..…………50 圖4.1 新聞擷詞的詞彙總數Ai…………………………………………………..63 圖4.2 新聞擷詞的新增詞彙數Ai-Ai-1………………………………………….64

    【1】 K.J. Chen and S.H. Kiu,1992, “Word identification for Mandarin Chinese sentences”, Fifth International Conference on Computational Linguistics,pp.101-107。
    【2】 R. Sproat and C. Shih,1990, “A statistical method for finding word boundaries in Chinese text”, Computer Processing of Chinese and Oriental Languages, pp.336-351。
    【3】 范長康(1989):以鬆弛法作中文斷詞及其應用。國立交通大學博士論文。
    【4】 袁筱青(1998):現代漢語諧音研究—以華語廣告文案為例。國立臺灣師範大學碩士論文。
    【5】 許世瑛(1994):中國文法講話。臺灣開明書店。
    【6】 趙元任(1982):中國話的文法。中文大學出版社。
    【7】 何大安(1989):聲韻學中的觀念與方法。大安出版社。
    【8】 吳金娥等(1993):國音及語言運用。三民書局。
    【9】 陳俊廷(1999):以類神經網路為基礎之中文連續語音辨認系統。國立交通大學碩士論文。
    【10】王建邦(2000):以語料為主具容錯能力之中文注音輸入研究。國立交通大學碩士論文。
    【11】甘居正(1980):中文文法與標點符號。黎明文化事業公司。
    【12】陳克健(1988):中文剖析的問題與對策。全國計算機會議論文集,
    頁21-28。
    【13】詞庫小組(1993):中文詞類分析。技術報告TR-93-05,中央研究院詞庫小組。
    【14】詞庫小組(1998):中央研究院平衡語料庫的內容與說明(修訂版)。技術報告TR-95-02/98-04。中央研究院詞庫小組。
    【15】邵敬敏(1999):漢語語法淺說。商務印書館(香港)有限公司。
    【16】張志公(1999):漢語語法常識。三聯書店(香港)有限公司。
    【17】羅肇錦(1990):國語學。五南圖書出版公司。
    【18】張俊盛、陳志達、陳舜德(1991):限制式滿足及機率最佳化的中文斷詞方法。全國計算機會議論文集,頁147-165。
    【19】陳克健、陳正佳、林隆基(1986):中文語句分析的研究-斷詞與構詞。技術報告TR-95-03,中央研究院詞庫小組。
    【20】王良志、貝子勝、黎偉權、黃麗卿(1991):以剖析為導向的中文斷詞法。電子發展月刊,80年7月,頁40-45。
    【21】陳鳳儀、蔡碧芳、陳克健、黃居仁(1999):中文句結構樹資料庫的構建。中文計算語言學期刊,88年8月,頁87-104。
    【22】 陳克健、黃居仁(1995):訊息為本的格位語法與其剖析方法。技術報告TR-95-03,中央研究院詞庫小組。
    【23】張靜(1994):漢語語法疑難探解。文史哲出版社。
    【24】http://apwsb.myrice.com/jia/jiaz17.html(教育網)
    【25】http://www.phonespell.org/
    【26】http://ourworld.compuserve.com/homepages/avantol/foneword.html
    【27】http://fun-with-words.com

    QR CODE