2024年10月8日晚7点到9点40分,广东外语外贸大学外国语言学及应用语言学研究中心召开了第一次“大语言模型的逻辑、语言与认知结构”跨学科讨论会。会议由广东外语外贸大学云山首席专家鞠实儿教授主持,采取线上与线下相结合的方式进行。参加本次讨论会的有来自广东外语外贸大学、中山大学、武汉大学、华南师范大学、暨南大学、广东工业大学的专家学者二十余人。
本次会议的主题是“大语言模型的逻辑、语言与认知结构”。主要探讨当前AI新进展形成的问题。会上,华南师大马文俊副教授与中山大学陈伟伟副教授做了主旨报告,探讨大语言模型最新版本o1的特征与创新之处。他首先介绍了主流大语言模型, 认为主流模型本质是一个对话模型,通过巨型人工神经元网络直接在字词、语句等水平上总结语言使用者的习惯,同时结合“奖励/惩罚”机制调整模型的参数使得其对话符合人类要求,但其在解决数学问题、编程任务、科学推理上存在严重不足。而o1模型通过强化学习和思维链(Chain of Thought)机制技术,显著提升了在这些方面的性能。随后陈伟伟老师介绍了大模型思维链技术原理,阐述了思维链的原理以及介绍了大模型 “涌现” 的概念,并强调了思维链对大模型推理能力的关键作用,最后就如何从逻辑与论辩的角度提升大模型的逻辑与数学能力提出了自己的建议。
主旨报告后,与会老师纷纷提出自己的见解与问题。其中,鞠实儿教授指出了深度学习理论采用统计方法描述自然语言结构的局限性;广外张艺琼教授强调要加强从语境相关性角度开展大语言模型的研究,进而预测人工智能在语言处理及产出方面的问题;韩艳梅教授明确提出跨文化交流是大语言模型应该关注的领域;广工计算机学院副院长刘东宁教授指出因果机制在开发人工智能中的必要性与其实现策略。最后,鞠实儿教授主持交叉讨论阶段,广外熊涛教授、俞梦霞博士、朱晓真老师、Hristo Valchev老师也参加了讨论。期间与会者探讨了如何从语言学和逻辑学的角度进一步开展思维链研究,以及提高o1性能的各种途径。
讨论非常热烈,以至于会议推迟近40分钟才结束。大家一致认为:由于学科交叉的复杂性,因此应该先从大的方向上求同,然后聚焦具体问题,进而开展合作研究。本次会议是一个成功的开始,大家对本中心跨学科研究的未来充满信心。广外博士生宁建庚和中大博士生鉏佳威参与了会务工作。