2014年3月11-12日晚,英国兰卡斯特大学Vaclav Brezina博士和Dana Gablasova博士应我中心之邀,围绕我中心、留学生院与兰卡斯特大学联合申报的英国科学院IPM国际项目“The Corpus-based Approach to the Acquisition of Mandarin Chinese as a Foreign Language”(《基于语料库的对外汉语习得研究》),举办了三场语料库工作坊。除项目组成员外,还吸引了语言学专业的众多教师和博士生参加。工作坊分三个主题进行。
工作坊1的主题为语料的收集,由Vaclav Brezina和Dana Gablasova博士共同主讲。Brezina博士首先以兰卡斯特大学建立的第一代大型电子语料库学习者语料库LOB抛砖引玉,系统介绍了语料库的建立需经历准备、语料收集和转写、语料处理与语料库的建设三个阶段,同时演示了口语语料转写软件Express Scribe的使用,并重点说明了口语语料转写的标注信息。Gablasova博士则具体分析了目前学习者口语语料转写所面临的三大挑战,即学习者具有不同的母语背景,学习者英语熟练程度和录音质量。

工作坊2的主题为语料标记与标注,主讲人Brezina博士通过演示Microsoft word、Notepad++向学员们介绍语料预处理的操作技巧,并与Gablasova博士帮助学员们上机演练。随后Brezina博士以丰富的标注为例,生动地介绍了XML标记语言的原理和优点,并演示了XML标记语言如何在Notepad++中逐步实现语料的标注。
工作坊3的主题为口语语料质量的控制。主讲人Gablasova博士以在线论坛或日志文件为例,强调语料转写标准一致的重要性,重点介绍了口语语料转写错误评估的方法。

经过两天的培训,学员们纷纷表示获益良多,对英国科学院国际项目下一阶段的开展打下了很好的基础,并为今后的科研和教学有很大的帮助。Brezina和Gablasova两位博士渊博的学识、独特的视角、耐心与细心,深受好评。