2025年1月10日,外国语学院特别邀请到香港中文大学语言学与现代语言系、脑与心智研究所的蔡振光教授,为我校师生举办了一场极具深度与前瞻性的讲座,讲座题为“大语言模型的研究及应用”,共吸引了各文科学院约100名师生前来聆听。
蔡教授在讲座中指出,现代语言模型在理解人类提示和生成符合语法、连贯的文本方面表现出非凡的能力,这使得它们在工作和日常生活中的应用日益广泛。尽管研究者们对这些模型的物理架构、训练数据和基础数学原理已有深入了解,但其内部工作原理和行为规律仍然是人工智能领域一个活跃的探索方向。深入研究语言模型的行为及其驱动因素,不仅有助于推进可解释人工智能的发展,还对提升模型性能和扩展其应用领域具有重要意义。
讲座中,蔡教授详细介绍了其所在实验室开展的三个重点研究方向,这些方向均旨在深度探究语言模型的行为和神经元表征。首先,蔡教授介绍了团队关于语言模型在人类语言理解和生成方面与人类相似程度的研究。其次,深入挖掘语言模型内化句法知识的情况,揭示其获取与表示语法结构的具体方式。最后,重点分享了关于语言模型所展现出的语用理解以及处理、整合多模态信息(比如语言和视觉)能力的研究成果。
此外,蔡教授还慷慨分享了其在研究中使用大型语言模型(LLMs)作为助手的经验,包括在头脑风暴和修改文稿方面的应用,并指出这种辅助方式为学术研究注入了新的活力。
讲座最后的提问环节,师生们踊跃提问,与蔡教授就语言模型的应用前景、研究挑战以及未来发展方向展开了深入讨论。此次讲座为我院师生带来了前沿的学术知识,也进一步拓宽了大家在语言模型相关研究领域的视野,对我院后续的科研探索与学术交流有着积极的作用。
