《大模型部署工程师知识与技能》
课程目标:本课程旨在让学员系统掌握大模型部署的全栈知识与核心技能。通过理论学习与实战实验相结合,使学员能够熟练使用主流工具链,完成从模型获取、优化、服务化部署到性能监控的全流程操作,并具备解决常见部署问题的能力。
目标学员: 计算机/软件相关专业高年级本科生、研究生、初级至中级软件开发工程师、运维工程师。
预备知识: 熟练掌握Python编程,了解Linux基础命令,对机器学习有基本概念。
培训时长: 16课时(每课时45分钟,总计12小时,可安排为2天密集培训或8周每周2课时)。
学习目标: 建立对大模型部署的整体认知,并搭建好标准的开发与实验环境。
- 第1课:大模型部署导论与技术全景图。
- 第2课:开发环境搭建与最佳实践
模块二:模型核心与推理基础 (4课时)
学习目标: 深入理解Transformer核心模块,掌握模型加载与原始推理方法。
- 第3课:Transformer架构深度解析(代码级)
- 第4课:模型加载与原始推理
- 第5课:推理性能优化基石:KV Cache与动态批处理
模块三:模型优化与加速技术 (4课时)
学习目标: 掌握模型量化和加速推理的核心技能,能显著降低部署成本、提升性能。
- 第6课:模型量化(Quantization)理论与实践
- 第7课:高性能推理引擎入门
- 第8课:模型编译与转换
模块四:服务化部署与工程化 (4课时)
学习目标: 掌握将优化后的模型打包成高并发、高可用的API服务,并实现容器化部署。
- 第9课:构建高性能模型API服务
- 第10课:容器化与编排部署
- 第11课:监控、日志与可持续部署
学习目标: 整合所有技能完成一个综合项目,并了解行业前沿趋势。
- 第12课:综合项目实战
- 第13课:高阶技巧与未来趋势
课程特色
- 循序渐进: 从基础到核心,再到高阶优化,层层递进,易于跟随。
- 实战驱动: 几乎每个核心知识点都配有 hands-on 实验,强调“学完即能用”。
- 工具链主流: 聚焦于行业公认的主流工具(vLLM, Docker, FastAPI, Hugging Face),确保技能不脱节。
- 问题导向: 课程设计围绕解决实际部署中的性能、成本、可用性等核心问题展开。
- 综合项目: 通过最终项目,将所有分散的知识点串联成完整的部署能力,增强学员信心。
这份大纲旨在为学员构建一个坚实且实用的知识体系,帮助他们成功踏入大模型部署这一高增长、高价值的职业领域。
惠德培训AI人工智能培训中心
北京惠德云课堂—企业数字化转型核心人才培训基地
北京惠德:010-85895152 15010940381(微信同号)
上海惠德:021-32562896 18721806712(微信同号)
深圳惠德: shenzhenhuide(微信同号)
e-mail: training@huide.net