课程简介
随着强化学习技术在大模型训练和对齐过程中的持续应用与优化,当前的大语言模型正经历从“直接生成型模型”向“推理型模型”的转变。这一演进不仅提升了模型在复杂任务中的表现力与通用性,也显著增强了其输出内容的可解释性与可信度,标志着大模型在朝着更高层次智能行为发展的重要阶段。
在招标采购、合规审查、风控评估、战略规划、客户服务等诸多企业关键场景中,普遍存在规则复杂、信息不对称、决策链条长、依赖大量人工经验等共性难题。这些流程通常繁琐且重复,既耗费时间,又容易受到人为偏差的影响,导致决策成本高、响应效率低。面对日益增长的数据规模与业务复杂性,企业亟需引入更智能、更具推理与自适应能力的AI技术,以实现流程自动化、知识结构化和决策智能化,从而全面提升业务效率与决策质量。
针对当前企业或个人在决策类场景中普遍存在的规则复杂、知识碎片化、依赖专家经验等痛点,单纯依赖传统规则系统或浅层模型已难以满足业务对智能化、准确性、可解释性与透明度的更高要求。为此,关注并探索具备深度推理能力的大模型技术,特别是那些能够在复杂任务中展现“类人思考路径”的模型架构,如具备Chain of Thought(CoT)、Tree of Thought(ToT)等能力的推理模型。相较于传统的直接生成式模型,这类模型不仅能完成事实性回答,还能分步骤地解析复杂问题,有助于提升任务的可解释性、稳定性与准确性,非常契合诸如招标、审批、合规、投研等决策类场景中对“推理过程透明”与“结果可验证”的核心诉求。
当前业界在这一方向已出现积极探索,如基于多Agent协同推理、引入企业知识图谱增强上下文理解、结合RLHF机制优化多轮推理路径等方法,正逐步推动大模型更智慧。本次分享将聚焦深度推理模型在智慧招采辅助决策中的实践与探索。结合深度学习、强化学习技术,帮助AI从业者构建具有可解释性与自适应能力的推理系统,以应对合规判断、供应商筛选、异常识别、辅助评标等核心问题,给出相关研究已在多个大型国央企中应用并取得成效的方案。
课程收益
1、帮助学员掌握智能决策转型思路,获取实战技术启发;
2、帮助学员明晰模型价值边界,掌握落地路径要点;
3、帮助学员提升模型应用能力,助力企业智慧决策
受众人群
AI算法工程师、大语言模型研发专员及自然语言处理技术骨干、AI技术项目经理、智能系统架构师及企业AI应用负责人,以及对人工智能感兴趣的人员
课程周期
0.5天(3H)
课程大纲
1、强化学习技术解析
2、深度推理模型的发展
3、深入探讨剖析深度推理模型的场景特征与能力边界
4、深度推理模型在辅助决策的应用和实践
5、总结和展望
6、QA
京ICP备2022035414号-1