《大语言模型概述》讲座顺利举办

发布时间： 2025-10-09 阅读量： 10

9月30日下午，通识教育系列讲座第61期之《大语言模型概述》在科大东区第二教学楼2104教室顺利开展。本次讲座由中国科学技术大学信息科学技术学院特任教授刘武主讲，聚焦生成式人工智能核心技术与大语言模型的发展应用，带领同学们探索人工智能技术的前沿图景。

讲座伊始，刘武教授介绍了目前流行的几种生成式大语言模型及其核心定义——生成式人工智能是一种基于输入数据生成新内容的人工智能技术，广泛覆盖文本、语音、图像、视频及三维生成等领域。结合科技发展趋势，他指出：生成式人工智能已成为推动新一轮科技革命和产业变革的重要力量，在全球范围内掀起人工智能研究与应用的热潮，ChatGPT、Deepseek、Sora等生成式大语言模型便是这一浪潮的典型代表。

随后，讲座围绕“大语言模型”深入展开。刘武教授从发展历程切入，从模型训练方式和模型架构的逐步更新上梳理出大语言模型从早期探索到成为人工智能核心方向的演进脉络。在应用案例环节，他通过生动实例展示大语言模型的实践场景：从没有编程基础的用户也能顺利使用的编程助手、到嵌入小红书评论区的即时翻译、再到帮助用户总结调研一个并不熟悉的领域……全方位展现出大语言模型广阔的应用场景。他围绕大语言模型的基础知识层层递进，从模型架构到技术原理介绍Transformer的基本原理，以及训练大模型的基本步骤，为同学们搭建起系统的知识框架。

作为《生成式人工智能概述》课程的重要组成部分，本次讲座聚焦生成式人工智能的核心技术演进、模型架构与行业新技术前沿。刘武教授的讲解既涵盖宏观技术趋势，又深入具体知识要点与应用场景，让同学们对大语言模型形成全面清晰的认知，激发了大家对生成式人工智能领域的探索热情，为后续深入学习人工智能相关知识奠定了良好基础。

返回列表