课程简介
现代IT系统复杂度飙升,运维团队不仅深陷于海量数据带来的“认知债”,更面临着通用大模型缺乏企业内部知识、无法有效执行具体运维任务的现实鸿沟。
面对此困境,我们的答案并非在“外挂知识(RAG)”与“模型训练(微调)”间摇摆,而是打造混合架构,兼取两者之长。企业更核心的贡献是提出了一套体系化的 Agent后训练方法论,通过监督微调(SFT)为其注入专业技能,再以专家偏好对齐(如DPO)塑造其思维,最终确保大模型在AI Ops场景中行之有效。
本次分享将系统阐述后训练为核心技术,通过后训练大幅度提高运维Agent的效率和执行成功率,将一个通用大模型,锻造成一个真正能理解并解决企业具体运维难题的“内部Ops专家”。
课程收益
1、帮助学员洞悉大模型后训练打造私有领域的Agent数字员工
2、帮助学员了解大模型后训练的在AI Ops中的常应用见场景实践
受众人群
算法工程师、运维专家、系统架构师及技术管理者等从事大模型训练、运维管理的技术人员,以及其他对智能运维感兴趣的人员
课程周期
0.5天(3H)
课程大纲
1、 为什么Agent需要后训练微调
2、 RAG和后训练微调的区别和抉择
3、 后训练微调的基础理论
4、 后训练微调在Agent领域的应用路线
5、 本公司AI Ops Agent后训练的落地
6、 AI Ops Agent的最终目标
7、 QA