2021年11月23日晚上7点,西安交通大学外语学院陈芯莹副教授做客广东外语外贸大学外国语言学及应用语言学研究中心论坛,为广外师生带了一场题为“Texts, Treebanks, Networks: Descriptions and Analysis of Languages”的主题报告。此次论坛为外国语言学及应用语言学研究中心语言资源与语料库研究团队系列讲座之七。会议采用线上腾讯会议模式,讲座由陈衡副教授主持,校内外300余名专家学者和师生们在线参加了本次讲座。
陈老师的讲座以索绪尔的语言系统观开始,介绍了语言研究的特点。语言数据可以有不同的描述方式,从而表现出不同的数据形式,例如文本、树库、网络等。继而从这三种不同的语言数据角度回顾总结了语言量化研究。在文本维度,陈老师指出,该方面的研究多为一维描述,如词频特征等。然后引出自然语言处理领域应用广泛的树库,即对语言数据的二维描述,如描述了词间关系的依存树库运用等,最后介绍了对语言数据的三维描述——语言网络手段,调查了语言的整体特征,不再局限于句内结构。在每个维度介绍时,陈老师都以自己的研究为例,细致地介绍了每种语言数据的特点、方法和应用。最后她指出,在进行语言研究前,应当对数据本身有充分的了解,并根据研究问题和数据的特点来选择研究范式与方法,从而让数据更好地为研究服务。
陈芯莹副教授教授的讲座逻辑清楚,叙述细致,内容丰富,详细而清晰地介绍了语言量化研究的三个维度。听众纷纷表示获益良多,反应热烈,并踊跃提问,陈老师对听众提出的问题一一予以详细解答,陈衡副教授最后进行总结,论坛圆满结束。