語料庫於教學應用之研究 【文/語文教育及編譯研究中心助理研究員 吳鑑城】 電子報 第 167 期 > 語料庫於教學應用之研究 Cited from: https://120.127.233.26/index.php?edm_no=167&content_no=2952 一、語料庫簡介 語料庫是一種依據特定原則進行蒐集並以數位化方式儲存的大量文本,蒐集的來源可包括書籍、新聞、線上論壇文章、各類字幕等。由於語料庫蘊含了語言使用的真實情境,且因數位化的便利,使用者可透過電腦輔助進行檢索、統計以觀察語言使用情形,探究語言的變化。 常見的語料庫類型依照蒐集之種類可分為書面語(如書籍、雜誌等)、口語(如對話、演講等之轉寫檔),亦可根據撰寫語言區分為單語、雙語及多語類型。近年來,為瞭解語言學習的語言特徵與發展,研究者也開始收集語言學習者使用目標語之書面語或口語語料以建置學習者語料庫( learner corpus ),又稱中介語語料庫( interlanguage corpus )。 國外許多機構都早已著手建置各類型語料庫,包括英國國家語料庫( British National Corpus, BNC )、美國當代英語語料庫( Corpus of Contemporary American English, COCA )、國際英語學習者語料庫( International Corpus of Learner English, ICLE )等。國內語料庫起步較晚,著名的中央研究院漢語平衡語料庫主要收錄新聞類型文本,約有 1,000 萬詞。國家教育研究院自 102 年承接教育部之華語文八年計畫之「建置應用語料庫及標準體系」,目前已建置了華語文語料庫( Corpus of Contemporary Taiwanese Mandarin, COCT ),內容包含了書面語 4 億 1,000 萬字(書籍為主)、口語 2,030 萬字、華英雙語 1,000 萬字、華語中介語 112 萬字,且以近十年的文本為主要蒐集對象,期能繼中研院平衡語料庫之後,作為新一代語言及教學研究之基礎知識來源。 二、語料庫於教學之應用 由於語料庫客觀地呈現語言真實的使用情...
留言
張貼留言