簡易檢索 / 詳目顯示

研究生: 馮樹仁
Shu-Jen Feng
論文名稱: 以潛在語意分析法發展摘要寫作評量系統
A LSA-based Evaluation System for Text Summarization
指導教授: 陳世旺
Chen, Sei-Wang
張國恩
Chang, Kuo-En
學位類別: 碩士
Master
系所名稱: 資訊教育研究所
Graduate Institute of Information and Computer Education
論文出版年: 2002
畢業學年度: 90
語文別: 中文
論文頁數: 80
中文關鍵詞: 關鍵詞摘要寫作摘要寫作評量
英文關鍵詞: keyword, summaries, writing, summaries evaluation
論文種類: 學術論文
相關次數: 點閱:271下載:31
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 摘要
    本研究主要的目的為發展國小摘要寫作評量系統。評量的系統主要參考「潛在語意分析」的摘要寫作評量的方法,從教材及學生的摘要作品中,找出關鍵詞做為評量的依據。雖然在本研究的方法中,並未利用SVD(singular value decomposition)的技術來建立教材的潛在語意空間。但是經由關鍵詞的比對,仍然可以達到評量的效果。除了以常用的相關(correlation)函數來計算文件的相似程度外,在本研究中加上文件摘要效率的觀念及Entropy的觀念融入摘要評量的方法中。
    本研究以台中縣富春國小六年級的79名學生為實驗的對象。在經過摘要寫作及心得寫作的實驗過程及單元成就測驗後,評估透過本評量系統所獲得的評量指標與兩位教師評量結果和學生成就測驗之間的相關性。研究結果有以下發現: (1)本評量系統以關鍵詞為摘要寫作評量的依據,能夠達到令人滿意的效果;(2)本研究將文件摘要效率的觀念及Entropy的觀念融入摘要評量的方法中,並經由實驗中證實其評量效果不僅可提高與外在效標之間的關聯效度,更可有效降低與字數間的相關程度;(3)以教師的摘要為標準來評量學生的摘要寫作能獲得最佳的評量效果,然而直接以教材內容為標準來評量學生的摘要寫作,也能獲得滿意的結果。
    關鍵字:關鍵詞、摘要、寫作、摘要寫作評量

    Abstract
    The main purpose of this research is to develop a summaries evaluation system. The summaries evaluation system is based on Latent Semantic Analysis method. But it does not utilize the Singular Value Decomposition technical method just because its time-consuming process to build the latent semantic space.
    In this research, we present several approaches to grade the student’s summaries writing. It utilizes the corresponding weights of the keywords for textbook and student’s summaries. And we tried to match the sixth-graders’ summaries against a set of six summaries evaluation approaches.
    The average correlation based on the grades of the two teachers with our approaches’ scores for the 79 of the students’ summaries was quite high. Therefore, these scores are quite comparable to how an experienced teacher rates these summaries. Thus, based on evidence from these trial, the summarization software could work well. A comparison of the average grades given by two teachers likewise showed no difference in quality of the students’ summaries related to condition. The agreement between the two teacher graders was very high also.
    This paper proposes several approaches to generate summaries score. The experimental results show that two or more of our approach can easily perform better than the traditional cosine approach. Among of them the cos2 and compromise methods perform better than others.
    Keywords: keyword、summaries、summaries evaluation

    目錄 目錄………………….…………………………………………………………… I 附表目錄………………………………………………………………….……… III 附圖目錄…………………………………………………………………..……... V 第一章 緒論………..………………………………………………………...... 1 第二章 文獻探討…..………………………………………………………….. 5 2-1潛在性語意分析(Latent Semantic Analysis)的相關理……………....... 5 2-1-1建立occurrence matrix…………………………………………. 6 2-1-2 occurrence matrix中的值做轉換運算…………….….………... 8 2-1-3 利用SVD方法將矩陣分解…………………….……………… 9 2-1-4 利用singular value將矩陣重建………………………….......... 10 2-1-5 SVD的功能與探討…………………………………............... 11 2-1-6 LSA的評分法……………………………………..………….. 15 2-2 LSA在摘要寫作評量上的應用…….……………………………......... 17 2-2-1 State the Essence: Fall 1997- Fall 1998……………………….... 17 2-2-2 Summary Street: Spring 1999………………………….……….. 19 2-3有關中文寫作評量的相關探討………………………………….......... 22 2-3-1 關鍵詞的截取………………………………………………….. 22 2-3-2 中文斷詞……………………………………………………….. 23 2-3-3 文件的向量空間及相似性比對……………………………….. 26 第三章 系統的架構與設計……………………………………………………. 29 3-1 系統功能架構說明…………………………………………………..... 29 3-1-1 高頻字元的調整……………………………………………… 30 3-1-2 教材斷詞……………………………………………………… 31 3-1-3 成績評量……………………………………………………… 31 3-2 系統功能說明…………………………………………………………. 37 3-2-1 系統登錄…………………………………………………….... 37 3-2-2 教材單元查詢及新增…………………………………………. 37 3-2-3 評量單元設定…………………………………………………. 38 3-2-4 高頻字元資料庫的維護………………………………………. 39 3-2-5 教材斷詞的調整………………………………………………. 41 3-2-6 學生作品評量…………………………………………………. 43 第四章 實驗設計……………………………………………………………..... 45 4-1 實驗對象………………………………………………………………. 46 4-2 實驗設計…………………………………………………………......... 46 4-3 實驗教材…………………………………………………………......... 46 4-4 實驗工具…………………………………………………………......... 46 4-5 實施程式……………………………………………………………..... 47 第五章 實驗結果及討論……………………………………………………..... 49 5-1 各評量指標與效標之間的相關情形…………………………............. 49 5-1-1 以教材內容評量學生摘要作品,各評量指標與效標之間的相關情形………………………………………………………….. 49 5-1-2 以教師摘要評量學生摘要作品,各評量指標與效標之間的相關情形………………………………………………………….. 52 5-1-3 以教材內容評量學生心得作品,各評量指標與效標之間的相關情形………………………………………………………….. 55 5-1-4 以教師摘要評量學生心得作品,各評量指標與效標之間的相關情形………………………………………………………….. 56 5-2 各種評量方法的探討……………………………………………......... 59 5-3 高、低能力組的學生,在各評量指標的上的差異分析…………….. 60 5-4 討論…………………………………………………………………..... 63 第六章 結論及未來的發展方………………………………………………..... 65 6-1 結論……………………………………………………………………. 65 6-2 未來的發展方向……………………………………………………..... 65 參考文獻……………………………………………………………………...….. 66 附件一 中研院上古漢語語料斷詞………………………………………..….. 71 附件二 辭源語料斷詞…………………………………………………...……. 72 附件三 1994年網路新聞論壇中文字出現比率統計表……………………… 73 附件四 1993 年全部 Big5 相關討論區字頻統計…………………………... 75 附件五 單元成就測驗評量試題……………………………………………..... 79

    參考文獻
    曾元顯 (民86):關鍵詞自動擷取技術之探討,中國圖書館學會會訊,5卷3期,26-29頁。
    曾元顯 (民86):關鍵詞自動擷取技術與相關詞回饋,中國圖書館學會會報,59期,59-64頁。
    羅鳳珠(民89):試論引用資訊科技作為詩學研究輔助工具的發展方向與建構方法,2000年 6月29日- 7月 1日,2000年第三屆國際漢學會議,中央研究院。
    蔡美智 黃居仁 陳克健(民85):語料庫為本的語意訊息抽取與辨析, 以近義詞研究為例,第九屆計算語言學研討會論文集, 281-293頁。
    郭生玉(民76):當前學校教學評量工作的檢討與改進,現代教育,第2卷第4期,75-81頁。
    林蕙蓉(民83):從國小兒童語文閱讀教學談後設認知策略。國語文教育通訊,第八期,44-55頁。
    楊宗仁 。(民80):後設認知的源起及其理。資優教育季刊,38期,16-25頁。
    翁林茂花 (民83):談國小國語科閱讀與作文教學的銜接。國民教育,35卷,3.4期。
    張寶珠 (民83):後設認知訓練對閱讀理解能力增進效果。諮商與輔導,第100期,35-39頁。
    王萬清 (民88):寫作教學師資培育及思考模式研究。臺南師院學報,第32期,91-134頁。
    陳麗明 (民87):小論文寫作指導與圖書館利用教育。高中圖書館,22期,78-83頁。
    蘇月華(民84):中文閱讀理解能力的個別差異因素:成績稍遜學童與一般學童的比較。Educational Journal. Winter 1995, Vol, 23, No.2.
    塗芝嘉 (民90):國小三年級國語科讀寫結合教學之行動研究-以 YY班為例。國立臺北師範學院課程與教學研究所碩士論文。
    官美媛 (民87):國小學生摘取文章大意策略之教學研究-以五年級說明文為例。國立東華大學教育研究所碩士論文。
    羅明華 (民 83 ):從先備知識和文章架構談閱讀理解。教師之友,第35卷第4期,19-23頁。
    蔡銘津 (民85):閱讀能力的測驗與評量。測驗與輔導,139期,2879-2883頁。
    蔡銘津 (民87):文章結構分析策略教學對學童寫作成效之影響。課程與教學,1卷,2期,139-160頁。
    鄒慧英 (民89):國小寫作檔案評量應用之探討。初等教育學報, 13期,141-181頁。
    江榮才 (民84):國小學生之後設認知與科學文章閱讀。國民教育研究集刊,第1期,81-39頁。
    陳鳳如 (民88):閱讀與寫作整合的教與學。學生輔導,62期,20-29頁。
    賴銳霞 (民90):寫作過程及「過程導向」寫作教學之探討。教師之友,第42卷,第1期,37-47頁。
    張新仁(民83):著重過程的寫作教學策略。特教園丁,9卷3期,1-9頁。
    林玉柱(民82):中文熵值上限的估算。國立清華大學資訊科學學系碩士論文。
    林寶貴(民89):中文閱讀理解測驗之編製。特殊教育研究學刊,19期,79-104頁。
    林銘裕(民81):中文斷詞的研究。國立清華大學電機工程研究所碩士論文。
    王聖中(民82): 語法式中文斷詞之研究。淡江大學資訊工程研究所碩士論文。
    黃秀文(民86):不同寫作程度學生在過程寫作教學中的發展情形之探討。國民教育研究學報,5期,1-27頁。
    Antti Arppe, (1995) "Term extraction from unrestricted text," http://www.lingsoft.fi/doc/nptool/term-extraction.html.
    Bean, T W., & Steenwyk, F. L. (1984). The effect of three forms of summarization instruction on sixth graders' summary writing and comprehension. Journal of Reading Behavior, 16, 297-307.
    Beton,S. L. (1997).Psychological foundations of elementary writing instruction. In. Phye, G. D.(1997). (Ed.). Handbook of Academic Learning : construction of knowledge. 236-267. California: Academic.
    Byrd, M. (1990, May). Summary writing strategies of junior college students. Convention of the International Reading Association, Atlanta, GA.
    Daneman, M. (1991). Individual difference in reading skills In R. Barr, M. Kamil, P. Mossenthal, & P. Pearson (Eds.), Handbook of reading research (Vol. 2). New York: Longman.
    Foltz, P. W.(1996) Latent semantic analysis for text-based research. Behavior Research Methods. Instruments and Computers. 28(2), 197-202.
    Foltz, P. W.,Sara G., Scott K. (2000). Supporting content-based feedback in on-line writing evaluation with LSA, Interactive Learning Environments. Vol. 8, No. 2, 111-127.
    Friend, Rosalie(2000). Teaching summarization as a content area reading strategy. Journal of Adolescent & Adult Literacy, Vol. 44, Issue 4, 320-329.
    Gagn’e, E. D. (1985). Reading. In the cognitive psychology of school learning. 165-168. Boston: Little, Brown and Company.
    Jonathan I. M., Andrian M. (2000). Using latent semantic analysis to identify similarities in source code to support program understanding. Tools with Artificial Intelligence, 2000. ICTAI 2000. Proceedings. 12th IEEE International Conference 2000 , 46 -53.
    Kintsch, W.(in press). Metaphor comprehension: A computational theory. Psyhonomic Bulletin and Review.
    Kintsch, E., Steinhart, D., Stahl, G. & LSA Research Group.(2000). Developing summarization skills through the use of LSA-based feedback. Interactive Learning Environments.Vol. 8, No.2, 87-109.
    Landauer, T. k., Foltz, P. W., & Laham, D., (1998). Introduction to latent semantic analysis. Discourse Processes, 25, 259-284.
    Landauer, T. K., Laham, D., Rehder, B., & Schreiner, M. E., (1997). How well can passage meaning be derived without using word order? A comparison of Latent Semantic Analysis and humans. In M. G. Shafto & P. Langley (Eds.), Proceedings of the 19th annual meeting of the Cognitive Science Society , 412-417. Mawhwah, NJ: Erlbaum.
    Landauer, T. K. & Dumais, S. T. (1997). A solution to Plato's problem: Thelatent
    semanctic analysis theory of the acquisition, induction, and representation of knowledge. Psychological Review , 104 , 211-140.
    Luhn, H.P. (1958). The automatic creation of literature abstracts, IBM Journal of Research and Development, 2, 159-165.
    Pask, G. & Scott, B. C. (1972). Learning strategies and individual competence. International Journal of Man-Machine Studies, 4 ,217-253.
    Perfetti, C. A. (1986). Cognitive and linguistic components of reading ability. In B. R. Foorman & A. W. Siegel (Eds), Cultural constraints and cognitive universals. Hillsdale, NJ: Lawrence Erlbaum Associates.
    Rehder, B., Schreiner, M. E., Wolfe, B. W., Laham, D., Landauer, T. K., &
    Kintsch, W. (1998). Using latent semantic analysis to assess knowledge:
    Some technical considerations. Discourse Processes , 25 , 337-354.
    Rinehart, S. K., Stahl, S. A., & Erickson, L. G. (1986). Some effects of summarization training on reading and studying. Reading Research Quarterly, 22, 422-436.
    Ronald B., Karl M. , Lisa F. R.(1995). Automatic condensation of electronic publications by sentence selection, Information Processing & Management, Vol. 31, No. 5, 675-685.
    Xiaoyan Z., Michael W. B., Padma R. (2000). Level search schemes for information filtering and retrieval. Information Processing and Management 37, 313-334.
    Yuhe L. & Haihong D.(1997). Software Engineering Conference, 1997. Asia Pacific and International Computer Science Conference 1997. APSEC '97 and ICSC '97. Proceedings , 1997, 97 -105.

    QR CODE