AI助手技术演进实践和多模态趋势

Hedda Zhai 查看讲师

在AI助手，NLP，搜索等领域相关领域有多年研发经验

浏览：283次

详情 DETAILS

课程简介

让大众可感知的AI助手是以智能硬件为载体的AI语音助手为代表，随着大模型的涌现能力出现后AI助手类应用在技术上产生了一个很大的技术演进，AI助手迎来了爆发式的发展，例如文心一言，豆包，Kimi等，用户规模也是曲线增长，AI助手类也被认为是最有可能成为下一个大模型超级应用的潜力，从技术趋势上，随着多模态大模型的发展AI助手也正从单模态交互向多模态交互演进。

在技术实践上AI助手可以分为任务式AI助手，开放域通用AI助手，垂类AI助手，任务式AI助手以语音助手为代表，典型应用场景是智能音箱，智能座舱，其主要研究点是在近场远场有噪环境下如何提升指令控制的准确率和泛化能力，以及自然流畅的全双工语音交互，开放域通用AI助手以当前热门的大模型AI助手为代表。其主要的难点有4点：

第一，幻觉问题，本质是大模型生成存在幻觉问题，当前的研究主要通过各种RAG技术解决。

第二，数学和逻辑推理不足，主要通过模型和数据维度去优化，以及上下文理解，包括多轮对话的连贯性和一致性，超长上下文复杂理解。

第三，多模态交互，多种模态的理解和生成是当前大模型发展的趋势，但实现端到端的多模态支持仍是技术上的难点，

第四，安全治理问题，也是各种AI助手的通用问题。垂类助手主要和各种领域垂类想结合，与通用AI助手技术体系相同，主要难点在于和领域知识的融合。

本次分享将探讨任务式AI助手的核心技术以及大模型下的优化方法实践，并针对当前热门的大模型AI助手在技术上给大家分享主流的技术架构，以及解决当前的难点问题的核心思路，并结合京东在AI助手的实践，看到从单模态到多模态的交互趋势。

课程收益

1、帮助学员了解AI助手的历史发展和技术趋势

2、帮助学员掌握AI语音助手解决核心难点的主流技术和关键设计思路

3、帮助企业在构建垂类大模型AI助手的思考和方法论

受众人群

企业管理者，IT行业从业者及其他对AI助手感兴趣的人员

课程周期