簡易檢索 / 詳目顯示

研究生: 丁偉民
Wei-Ming Ding
論文名稱: 文章摘要寫作評量系統
Summarization Scoring System
指導教授: 張國恩
Chang, Kuo-En
宋曜廷
Sung, Yao-Ting
學位類別: 碩士
Master
系所名稱: 資訊教育研究所
Graduate Institute of Information and Computer Education
論文出版年: 2005
畢業學年度: 93
語文別: 中文
論文頁數: 94
中文關鍵詞: LSASVD關鍵詞摘要摘要寫作評量
英文關鍵詞: LSA, SVD, keyword, summarization, Summarization Scoring
論文種類: 學術論文
相關次數: 點閱:282下載:63
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 本研究之主要目的為發展一國小摘要寫作評量系統。評量系統主要參考「潛在語意分析」(LSA)的方法,利用SVD (singular value decomposition)的技術來建立潛在語意空間,並建立不同文體及不同大小的語意空間,在不同的語意空間中,比對教師及學生的摘要的關鍵詞,作為摘要評量的依據。除此之外,我們也探討其他摘要評量的指標,希望能夠從中找出適合中文摘要評量的指標。
    本研究以台北市西門國小五年級的三個班級為實驗對象。經過學生摘要寫作的實驗過程之後,評估經由系統所獲得的各評量指標與教師人工評量的成績,在不同文體及不同大小的語意空間中的相關性。研究結果有一下發現:(1)使用SVD轉換的技術來建立語意空間,並在語意空間中做比對,可達到不錯的評量效果。(2)本研究嘗試使用教師及學生摘要句子的比對方式來評量學生摘要寫作,發現是值得繼續研究的方向。(3)不同文體及不同大小的語意空間,對於評量指標會有不同的影響。

    The main purpose of this research is to develop a summarization scoring system for the teacher of the elementary school. This system refers to a method called Latent Semantic Analysis(LSA), to use Singular Value Decomposition(SVD) to build the semantic space. We build several kinds of semantic spaces which the size and style of writing are different. To compare the keywords of the summarizations between the teacher and the students in the different semantic spaces for the scoring. In addition to scoring, we analyze the other indexes of the summarization scoring to find the more appropriate approaches to summarizing for Chinese.
    The participants are the students of Xi-men elementary school. After the processes of the experiments of the summarizing, we analyze the correlation between all kinds of indexes of scoring calculated by the system and the teacher of scoring in different kinds of semantic spaces. The Results of the research are :(1)We can get a good result when we compare the summarization between the teacher and the students in the semantic spaces built by the translation of the SVD.(2)We try to scoring the summarization written by the students by comparing to the sentences of the summarization between the teacher and the students, and think that this approach is a worthy aspect to research.(3)The difference of size and the style of writing will effect upon the analysis of the result for the indexes of the scoring.

    附表目錄…………………………………………………………….………………x 附圖目錄…………………………………………………………………………...xii 第一章 緒論……………………………………………………………………1 1-1 研究動機...............................................1 1-2 研究目的...............................................3 第二章 文獻探討................................................4 2-1 潛在語意分析(Latent Semantic Analysis)的相關理論........4 2-1-1 建立occurrence matrix.............................5 2-1-2 將occurrence matrix中的值做轉換運算...............7 2-1-3 利用SVD方法將矩陣分解............................ 8 2-1-4 利用singular value將矩陣重建(reconstruct).......9 2-1-5 SVD的探討....................................... 10 2-2 中文斷詞的探討........................................14 2-1-1 中文斷詞方法的說明...............................14 2-2-2 常見詞的處理.....................................15 第三章 摘要評量...............................................17 3-1 建立SVD Space.........................................17 3-2 建立摘要向量..........................................20 3-3 計算各摘要指標........................................22 第四章 系統架構與設計.........................................27 4-1 系統功能架構說明......................................27 4-2 Web Service的介紹.....................................28 4-3 系統透過Web Service處理中文斷詞的步驟.................30 4-4 系統功能說明..........................................32 4-4-1 系統登入........................................32 4-4-2 學生帳號的新增、修改、刪除及顯示個人成績........32 4-4-3 教材新增、修改、查詢及成績列表..................34 4-4-4 學生摘要寫作....................................36 第五章 實驗設計...............................................38 5-1 實驗對象..............................................38 5-2 研究設計..............................................38 5-3 實驗教材..............................................39 5-4 實驗工具..............................................39 5-5 實施程序..............................................39 第六章 實驗結果與討論.........................................41 6-1 各評量指標與教師人工評量之間的相關情形................41 6-2 高低能力的學生在各評量指標上的差異分析................54 6-2-1 敘述文體的檢定分析..............................54 6-2-2 故事文體的檢定分析..............................61 6-3 討論..................................................67 第七章 結論及未來的發展方向...................................69 7-1 結論..................................................69 7-2 未來的發展方向........................................69 參考文獻.......................................................71 附錄一 1994年網路新聞論壇中文字出現比率統計表................. 73 附錄二 1993 年全部 Big5 相關討論區字頻統計.....................76 附錄三 實驗文章「族群與群落」..................................79 附錄四 實驗文章「端午節」......................................80 附錄五 五年二班老師「族群與群落」摘要寫作......................81 附錄六 五年二班老師「端午節」摘要寫作..........................82 附錄七 五年三班老師「族群與群落」摘要寫作......................83 附錄八 五年三班老師「端午節」摘要寫作..........................84 附錄九 五年六班老師「族群與群落」摘要寫作......................85 附錄十 五年六班老師「端午節」摘要寫作..........................86 附錄十一 五年二班學生摘要寫作摘錄..............................87 附錄十二 五年三班學生摘要寫作摘錄..............................89 附錄十三 五年六班學生摘要寫作摘錄..............................91 附表目錄 表2-1 有關人機介面與電腦繪圖的文件標題............................6 表2-2 利用表2-1建立的occurrence matrix...........................6 表2-3 利用SVD分解後的三個矩陣.................................... 8 表2-4 利用singular value重建的矩陣................................9 表2-5 有關族群與食物鏈的相關句子.................................10 表2-6 利用表2-5建立的occurrence matrix..........................11 表2-7 利用SVD分解後的三個矩陣...................................12 表2-8 利用singular values重建的矩陣.............................13 表3-1 老師摘要句子及所對應的關鍵詞列表...........................25 表3-2 學生摘要句子及所對應的關鍵詞列表...........................25 表6-1 五年二班主題為「族群與群落」在SVD1S上的各項指標相關係數.....41 表6-2 五年三班主題為「族群與群落」在SVD1S上的各項指標相關係數.....42 表6-3 五年六班主題為「族群與群落」在SVD1S上的各項指標相關係數.....42 表6-4 五年二班主題為「族群與群落」在SVD1M上的各項指標相關係數.....43 表6-5 五年三班主題為「族群與群落」在SVD1M上的各項指標相關係數.....44 表6-6 五年六班主題為「族群與群落」在SVD1M上的各項指標相關係數.....44 表6-7 五年二班主題為「族群與群落」在SVD1L上的各項指標相關係數.....45 表6-8 五年三班主題為「族群與群落」在SVD1L上的各項指標相關係數.....46 表6-9 五年六班主題為「族群與群落」在SVD1L上的各項指標相關係數.....46 表6-10 五年二班主題為「端午節」在SVD2S上的各項指標的相關係數.......48 表6-11 五年三班主題為「端午節」在SVD2S上的各項指標的相關係數.......48 表6-12 五年六班主題為「端午節」在SVD2S上的各項指標的相關係數.......49 表6-13 五年二班主題為「端午節」在SVD2M上的各項指標的相關係數.......50 表6-14 五年三班主題為「端午節」在SVD2M上的各項指標的相關係數.......50 表6-15 五年六班主題為「端午節」在SVD2M上的各項指標的相關係數.......51 表6-16 五年二班主題為「端午節」在SVD2L上的各項指標的相關係數.......52 表6-17 五年三班主題為「端午節」在SVD2L上的各項指標的相關係數.......52 表6-18 五年六班主題為「端午節」在SVD2L上的各項指標的相關係數.......53 表6-19 各評量指標在SVD1S上之組別統計量............................ 55 表6-20 高低能力兩組之間在SVD1S上各評量指標的獨立樣本t檢定.........56 表6-21 各評量指標在SVD1M上之組別統計量............................ 57 表6-22 高低能力兩組之間在SVD1M上各評量指標的獨立樣本t檢定.........58 表6-23 各評量指標在SVD1L上之組別統計量............................ 59 表6-24 高低能力兩組之間在SVD1L上各評量指標的獨立樣本t檢定.........60 表6-25 各評量指標在SVD2S上之組別統計量............................ 61 表6-26 高低能力兩組之間在SVD2S上各評量指標的獨立樣本t檢定.........62 表6-27 各評量指標在SVD2M上之組別統計量............................ 63 表6-28 高低能力兩組之間在SVD2M上各評量指標的獨立樣本t檢定.........64 表6-29 各評量指標在SVD2L上之組別統計量............................ 65 表6-30 高低能力兩組之間在SVD2L上各評量指標的獨立樣本t檢定.........66 附圖目錄 圖4-1 系統功能架構圖.............................................. 27 圖4-2 Web Service運作架構圖........................................30 圖4-3 加入Web參考.................................................30 圖4-4要求服務描述過程............................................. 31 圖4-5提出要求並回傳服務........................................... 31 圖4-6系統登入畫面................................................. 32 圖4-7學生帳號管理畫面............................................. 33 圖4-8新增學生帳號畫面............................................. 33 圖4-9顯示學生個人成績畫面......................................... 34 圖4-10文章摘要管理畫面............................................ 35 圖4-11顯示各教材學生整體成績...................................... 35 圖4-12教材新增畫面................................................ 36 圖4-13學生摘要寫作畫面............................................ 37

    中文部分

    張寶珠(民83)。後設認知訓練對閱讀理解能力增進效果。諮商與輔導,第100期,35-39頁。

    塗芝嘉(民90)。國小三年級國語科讀寫結合教學之行動研究-以YY班為例。國立臺北師範學院課程與教學研究所碩士論文。

    官美媛(民87)。國小學生摘取文章大意策略之教學研究-以五年級說明文為例。國立東華大學教育研究所碩士論文。

    陳麗明(民87)。小論文寫作指導與圖書館利用教育。高中圖書館,22期,78-83頁。

    馮樹仁(民91)。以潛在語意分析法發展摘要寫作評量系統。國立臺灣師範大學資訊教育研究所碩士論文

    陳櫻代(民87)。概念構圖策略促進閱讀理解能力之研究。國立臺灣師範大學資訊教育研究所碩士論文

    英文部分

    Deerwester, S., Dumais, S. T., Furnas, G. W., Landauer, T. K., & Harshman, R.
    (1990). Indexing By Latent Semantic Analysis. Journal of the American Society For
    Information Science , 41 , 391-407.

    Jonathan I. M.,&Andrian M. (2000). Using latent semantic analysis to identify similarities in source code to support program understanding. Tools with Artificial Intelligence, 2000. ICTAI 2000. Proceedings. 12th IEEE International Conference 2000 , 46 -53.

    Kintsch, E., Steinhart, D., Stahl, G.,& LSA Research Group.(2000). Developing
    summarization skills through the use of LSA-based feedback. Journal of Interactive Learning Environments.8(2), 87-109.

    Landauer, T. K.,& Dumais, S. T. (1997). A solution to Plato's problem: The latent semanctic analysis theory of the acquisition, induction, and representation of knowledge. Psychological Review,104,211-140.

    Landauer, T. k., Foltz, P. W., & Laham, D., (1998). Introduction to latent semantic analysis. Discourse Processes, 25, 259-284.

    Malone, L. D., & Mastropieri, M. A.(1992). Reading comprehension instruction:
    Summarization and self-monitoring training for students with learning disabilities. Expextional Children,58(3),270-279.

    Pask, G.,& Scott, B. C. (1972). Learning strategies and individual competence. International Journal of Man-Machine Studies, 4 ,217-253.

    Rehder, B., Schreiner, M. E., Wolfe, B. W., Laham, D., Landauer, T. K., & Kintsch, W. (1998). Using latent semantic analysis to assess knowledge: Some technical considerations. Discourse Processes , 25 , 337-354.

    Weisberg, R., & Balajthy, E. (1990). Development of disabled readers' meatcomprehension ability through summarization training using expository text: Results of three studies. Reading, Writing, and Learning Disibilities,6, 117-136.

    QR CODE