中心工作

中心工作
当前位置: 首页 > 新闻动态 > 正文

我中心徐海教授应邀参加兰卡斯特大学汉语应用语料库语言学研讨会

2016年05月04日 11:24 张松山 点击:[]

     

       2016429日,我中心徐海教授、博士生张松山应邀通过视频会议形式参加了兰卡斯特大学举办的汉语应用语料库语言学研讨会。此次研讨会由英国科学院资助、兰卡斯特大学社会科学语料库方法ESRC研究中心(ESRC Center for Corpus Approaches to Social Science, Lancaster University)承办,吸引了众多对汉语语言学和语料库语言学研究感兴趣的专家学者与会。

     

      徐海教授做了题为“Guangwai-Lancaster Chinese Learner Corpus: A Profile”的主旨报告,介绍了广外—兰卡斯特汉语学习者语料库的创建及其特色。该语料库由我中心徐海教授团队和兰卡斯特大学已故的肖忠华教授(Richard Xiao)团队合作共建,克服了目前可供公开检索的汉语学习者语料库容量小、数据类型单一、语料样本来源多为韩日及东南亚学生、汉语文本未分词、标注及检索功能不完备等缺点,充分考虑了学习者(年龄,性别,母语背景,水平)、任务(媒介,话题,时限)、数据类型(自然产出,半自然产出)等因素(Granger 2013),同时进行了汉语分词和标注(包括元信息标注和错误标注),以XML格式存储。该语料库规模达到120多万词次,包含书面语和口语两个子库,书面语口语比例为5.2 : 4.8,语料样本来自80个国家初、中、高3个不同汉语水平等级的近900名在华留学生。该报告引起了与会专家学者的极大兴趣和热烈讨论。      

     

      据悉,广外—兰卡斯特汉语学习者语料库建设已接近尾声,错误标注即将完成,下一步将开发在线公开检索系统。      

     

     

     

上一条:我中心举办全国外国语言学及应用语言学博士生论坛 下一条:系统功能语言学家Christian Matthiessen教授谈投射问题

关闭