發表文章

目前顯示的是 8月, 2019的文章

Word Frequency Data (COCA)

Word Frequency Data Cited from https://www.wordfrequency.info/free.asp

How to comment on dissertation (Key words)

Google:  How to comment on dissertation  evaluation of thesis dissertation phd review comments

菜鳥教授Blog

You’re Fired! 學術菜鳥不可不知的生存眉角! https://rookieprofessor.wordpress.com/category/%e5%ad%b8%e8%a1%93%e4%ba%ba%e7%94%9f/

荷蘭外語教學重視語料庫研究

荷蘭外語教學重視語料庫研究 2014-10-09 由 中國社會科學網 發表于文化 Cited from:  https://kknews.cc/culture/jz5z3rl.html 內容摘要:根據佛克馬(Douwe Fokkema)的語料, 17世紀中葉,荷蘭文字為標準書面語,當時的語言規划起到了統一的作用。出於直覺驅動,人們會想當然地認為語系相近的語言交互影響會使彼此更容易學會對方的語言,因此荷蘭人對英語能夠駕輕就熟,也的確有人憑直覺估計75%的荷蘭人英語講得很「流利」。語料庫應成為外語教學與習得的資源按照科門紐斯(Comenius)時代憑藉直覺驅動制定的外語教學大綱,荷蘭的語言學習者仍局限在課堂語言學習階段,學生往往無法適應現實生活中人們使用的真實語言。荷蘭外語教育從真實的語言使用實際出發,立足自己的語言分布歷史傳統實際,值得中國的語言教學界借鑑。 作者簡介: 荷蘭語不是荷蘭的唯一語種。弗里斯蘭省就有兩種官方語言,當地所有文件必須準備弗里斯蘭語和荷蘭語兩個版本。語言規劃的制定在相當程度上促成了標準語的走向。根據佛克馬(Douwe Fokkema)的語料,17世紀中葉,荷蘭文字為標準書面語,當時的語言規划起到了統一的作用。 然而,依賴直覺制定的語言規劃不斷顯露出弊端,而根據語料庫驅動語言學客觀地描繪出語言的分布和趨勢特徵,則可以在一定程度上避免這些問題,準確地為外語教育規劃提供依據。語料庫是由電子文本構成的語篇,由來源不同的語篇樣本收集而成,所選擇的語篇通常能夠系統地反映語言在社會上的使用情況。它是提取和驗證自然語言形式的經驗方法。 直覺不能準確反映語言狀況 按照荷蘭的外語教學大綱,從五年級開始,荷蘭的兒童就要學習英語。相比德語和法語,荷蘭人對英語更有好感。英語與荷蘭語同屬日耳曼語系,兩者之間有諸多類似之處。出於直覺驅動,人們會想當然地認為語系相近的語言交互影響會使彼此更容易學會對方的語言,因此荷蘭人對英語能夠駕輕就熟,也的確有人憑直覺估計75%的荷蘭人英語講得很「流利」。 然而,這種語言狀況也不盡然。撇開語法、語詞的廣度和深度不談,語料庫驅動語言學分析證實,在17世紀早期的倫勃朗(Rembrandt)時代,荷蘭人的英語交際能力遠不如今天。在語音方面,荷蘭人的英語上顎音較重;在寫作方面,荷蘭學生的英語水平與本...

Parallel corpora and concordances

圖片
Parallel corpora and concordances Cited from:https://corpling4efl.wordpress.com/2016/11/30/parallel-corpora-and-concordances/amp/ MichaelHB 3 years ago Advertisements This might be tl;dr … If you are just looking for a list or some links to parallel corpora, please go to the end of this post. In response to my  presentation  at this years ETJ Tokyo conference, where I talked about the parallel corpus and DDL tool called SCoRE, I was asked whether there were parallel corpora available in other languages. Short answer: Yes! Caveat: They are not always straightforward to use. First of all, a quick explanation of what is a parallel corpus. It is a kind of bi- or multilingual corpus. A parallel corpus is a corpus that contains text from one language that is aligned with translations from one or more other languages; so, for example, if I query  talk *  in the Japanese interface of SCoRE I will get concordance lines in En...

Terms used in Corpus Linguistics

Corpus research methods Language corpora and the language classroom.  from   Pascual Pérez-Paredes Cited from:http://www.perezparedes.es/selected-corpus-resources-for-second-language-educators/ There are different well-established  CL methods  to research language usage through the examination of naturally occurring data. These methods stress the importance of frequency and repetition across texts and corpora to create saliency. These methods can be grouped in four categories: – Analysis of keywords.  These are words that are unusually frequent in corpus A when compared with corpus B. This is a Quantitative method that examines the probability to find/not to find a set of words in a given corpus against a reference corpus. This method is said to reduce both researchers´ bias in content analysis and  cherry-picking  in grounded theory. – Analysis of collocations.  Collocations are words found within a given span (-/+ n words to t...

Parallel corpus: AntPConc

Parallel corpus: AntPConc AntPConc A freeware **parallel** corpus analysis toolkit for concordancing and text analysis using UTF-8 encoded text files. [ AntPConc Homepage ] [ Screenshots ] [ Help ] Downloads: Windows (1.2.1) Windows 64-bit (1.2.1) Macintosh OS X (1.2.1) Linux (1.2.1) Linux 64-bit (1.2.1) Older versions PayPal Donations and Patreon Supporters: Click one of the following if you want to make a small donation to support the future development of this tool. Laurence Anthony's AntConc https://www.laurenceanthony.net/software/antconc/ TOOLS:  https://www.laurenceanthony.net/software.html

语料库术语汇编

[转载]语料库术语汇编[ZZ] Cited from:http://blog.sciencenet.cn/home.php?mod=space&uid=36782&do=blog&id=306932 【Updated on March 28, 2010】左边为英文,右边的汉语凡以分号(;)隔开的表示该术语有不同含义,以顿号(、)隔开的表示该术语有两种以上可接受的汉语译法。 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码 Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统 Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocat...

語料庫於教學應用之研究

語料庫於教學應用之研究  【文/語文教育及編譯研究中心助理研究員 吳鑑城】 電子報 第 167 期  > 語料庫於教學應用之研究 Cited from:  https://120.127.233.26/index.php?edm_no=167&content_no=2952 一、語料庫簡介    語料庫是一種依據特定原則進行蒐集並以數位化方式儲存的大量文本,蒐集的來源可包括書籍、新聞、線上論壇文章、各類字幕等。由於語料庫蘊含了語言使用的真實情境,且因數位化的便利,使用者可透過電腦輔助進行檢索、統計以觀察語言使用情形,探究語言的變化。    常見的語料庫類型依照蒐集之種類可分為書面語(如書籍、雜誌等)、口語(如對話、演講等之轉寫檔),亦可根據撰寫語言區分為單語、雙語及多語類型。近年來,為瞭解語言學習的語言特徵與發展,研究者也開始收集語言學習者使用目標語之書面語或口語語料以建置學習者語料庫( learner corpus ),又稱中介語語料庫( interlanguage corpus )。    國外許多機構都早已著手建置各類型語料庫,包括英國國家語料庫( British National Corpus, BNC )、美國當代英語語料庫( Corpus of Contemporary American English, COCA )、國際英語學習者語料庫( International Corpus of Learner English, ICLE )等。國內語料庫起步較晚,著名的中央研究院漢語平衡語料庫主要收錄新聞類型文本,約有 1,000 萬詞。國家教育研究院自 102 年承接教育部之華語文八年計畫之「建置應用語料庫及標準體系」,目前已建置了華語文語料庫( Corpus of Contemporary Taiwanese Mandarin, COCT ),內容包含了書面語 4 億 1,000 萬字(書籍為主)、口語 2,030 萬字、華英雙語 1,000  萬字、華語中介語 112  萬字,且以近十年的文本為主要蒐集對象,期能繼中研院平衡語料庫之後,作為新一代語言及教學研究之基礎知識來源。 二、語料庫於教學之應用    由於語料庫客觀地呈現語言真實的使用情...

GG=TED Corpus Search Engine

圖片
TED Corpus Search Engine Cited from:https://yohasebe.com/tcse/ Created by Yoichiro Hasebe with data provided by  TED |  E-mail  |  Web  |
高校人才網 当前位置: 首页  >  外国语言文学 http://m.gaoxiaojob.com/list.php?tid=243

UQ: School of Languages and Cultures

UQ: School of Languages and Cultures Professor Mike Levy https://languages-cultures.uq.edu.au/profile/1085/mike-levy Professor Michael Haugh https://languages-cultures.uq.edu.au/profile/1498/michael-haugh Dr Peter Crosthwaite https://languages-cultures.uq.edu.au/profile/2845/peter-crosthwaite Researcher biography I am a Lecturer in the School of Languages and Cultures at UQ (since 2017), having formerly been an assistant professor at the Centre for Applied English Studies (CAES), University of Hong Kong (since 2014). I hold an MA TESOL from the University of London and an M.Phil/Ph.D in applied linguistics from the University of Cambridge. My areas of research and supervisory expertise include corpus linguistics and the use of corpora for language learning (known as 'data-driven learning'), as well as English for General and Specific Academic Purposes. I have published in leading journals including Language Learning, Corpus Linguistics and...