2018年5月9日至11日,由教育部人文社会科学重点研究基地广东外语外贸大学“外国语言学及应用语言学研究中心”主办的“第十五届外国语言学及应用语言学博士生论坛——语言学编程基础与机器学习入门工作坊”在广东外语外贸大学北校区二教417室举行。来自英国、西班牙、德国等国家以及中国内地、香港和澳门等地区知名院校的60多名在读语言学博士研究生参加了此次工作坊。
本次工作坊旨在讲解语言学研究中所需的编程基本思路和基本语句、机器学习的概念与算法及其在实践中的应用。工作坊采用集中授课和学术沙龙相结合的模式。授课任务由华南师范大学博士研究生夏骁凯及其PsychoR 团队担任。
图1 夏骁凯介绍工作坊日程安排
5月9日上午,围绕“编程基础串讲”这个话题,夏骁凯老师首先从为什么、学什么和怎么学的角度入手,教授在场师生下载、安装并且运行R语言程序。通过展示http://cran.r-project.org,与会者学会了通过镜像网站获取R语言包的具体操作方法。在此基础之上,他展示了R语言编写流程通过固定数据,函数操作控制和数据输出等三个模块相互协作的结果。他还进一步介绍了数据类型的整合,数据选择、数据建立,数据索引以及数据的增加、删除和改动等基础内容。随后,夏老师展示了根据线性空间或矩阵以及名称等对数据的索引方法。同时,通过介绍R-bloggers和tidyverse等网站来展示数据结构方面操作内容。在场学员还学习了安装数据软件包的具体方式以及dplyr的相关内容。
5月9日下午PsychoR 团队成员杨逸东给与会博士研究生带来了“关于数据结构与常用统计”方面的讲座。通过介绍基本数据类型,与会成员了解了通过R语言进行不同变量的创建与运算。在此基础之上,学员们学习了向量的建立与索引,数据的修改及其数据结构性质等内容。接着,通过讲授矩阵的建立、删除、修改以及合并等内容,学员们了解了二维数据组成的数组特性。随后,杨老师展示了数据框的建立、读取以及索引等等相关的命令。同时,还讲解了方差分析,因子分析等内容的R语言实现形式。最后,杨老师进行了相关软件包的讲解和实践操作。他着重介绍了数据的筛选以及T检验(单样本T检验、独立样本T检验以及配对样本T检验)的R语言操作。
工作坊的第二天上午,PsychoR 团队成员郑鑫为大家带来了关于“可重复报告与可视化”的报告。整个报告围绕Rmarkdown 撰写可重复研究报告、科研中的可视化思路、ggplot2 绘图等三个方面展开。通过实践操作与讲解结合的方式,与会成员了解到R语言Rmarkdown软件包可以通过只编写一个研究报告,就可以实现不同呈现方式(包括网页,pdf, word以及ppt格式)的便捷性与经济性的优势。通过展示R语言的可视化优势,激发了学员强烈的科学研究兴趣。值得一提的是,通过R语言的ggplot2软件包,学员们学会了通过不同图层,以简单快捷的命令对一个复杂的研究现象进行图形直观化呈现与修改。
5月10日下午的学习围绕“机器学习算法入门”这个话题而展开。夏骁凯老师通过生动浅显的例子展示了机器学习与我们日常生活学习的联系密不可分。整个讲座主要聚焦于机器学习概念、常用机器学习算法以及简单机器学习流程实训等三方面的内容。夏老师通过讲解机器学习,认为非常有必要将语言学、心理学以及计算机编程等知识在未来的科研中进行融合。为此,有关Python计算机程序的基础内容也在该讲座中得到了展示。与会学习者们对Python程序处理自然语言的功能产生了强烈的兴趣。
图2 夏骁凯介绍R语言基本知识
5月11日上午,夏骁凯老师继续进行了有关“贝叶斯统计与概率编程入门”方面的讲座。通过讲解贝叶斯统计基本原理、贝叶斯统计计算方法和概率编程技术入门,学员们深刻了解到当前国际上比较流行的贝叶斯统计方法的科学性与合理性。为此,夏老师还专门展示了实现贝叶斯统计的相关软件与操作。同时,学员们就当前基于不同数学思想的统计方法进行了探讨。最后,夏老师鼓励学员们要通过利用好网络资源,更好的服务与自己的科研。
5月11日下午,举行了工作坊学术沙龙。沙龙由夏骁凯老师主持,他邀请的嘉宾包括 Seedlink技术执行总监Simon Blanchard、 原大疆创新总经理助理、人才管理创新实验室负责人秦弋以及Seedlink 研发工程师季雨清等。整个沙龙围绕“自然语言识别技术在人才测评中的应用”而展开。与会博士研究生们与各位专家进行了热烈的讨论。围绕人工智能和机器学习等话题,与会者进行了一场别开生面的跨学科讨论。大家一致认为,未来的人工智能和机器学习将是语言学、心理学和计算机科学等等所有相关学科的共同协同的结果。
图3 座谈会交流
通过为期三天的工作坊,来自海内外的中外与会博士研究生收获丰硕,他们纷纷表示期待下一次博士论坛工作坊的内容更精彩。本次工作坊是“外国语言学及应用语言学博士生论坛”自2004年以来首次举办的会前工作坊。山东大学参会博士研究生杜明媚表示,“这次工作坊太棒了”。来自湖南大学的博士研究生杨雨萧认为“最近几天的课程超赞”!很多参会博士研究生表示,“期盼有机会继续开”这样的工作坊。因为“工作坊干货满满”。