AI助手技术演进实践和多模态趋势
Hedda Zhai 查看讲师
在AI助手,NLP,搜索等领域相关领域有多年研发经验
浏览:283次
详情 DETAILS

课程简介

让大众可感知的AI助手是以智能硬件为载体的AI语音助手为代表,随着大模型的涌现能力出现后AI助手类应用在技术上产生了一个很大的技术演进,AI助手迎来了爆发式的发展,例如文心一言,豆包,Kimi等,用户规模也是曲线增长,AI助手类也被认为是最有可能成为下一个大模型超级应用的潜力,从技术趋势上,随着多模态大模型的发展AI助手也正从单模态交互向多模态交互演进。

在技术实践上AI助手可以分为任务式AI助手,开放域通用AI助手,垂类AI助手,任务式AI助手以语音助手为代表,典型应用场景是智能音箱,智能座舱,其主要研究点是在近场远场有噪环境下如何提升指令控制的准确率和泛化能力,以及自然流畅的全双工语音交互,开放域通用AI助手以当前热门的大模型AI助手为代表。其主要的难点有4点:

第一,幻觉问题,本质是大模型生成存在幻觉问题,当前的研究主要通过各种RAG技术解决。

第二,数学和逻辑推理不足,主要通过模型和数据维度去优化,以及上下文理解,包括多轮对话的连贯性和一致性,超长上下文复杂理解。

第三,多模态交互,多种模态的理解和生成是当前大模型发展的趋势,但实现端到端的多模态支持仍是技术上的难点,

第四,安全治理问题,也是各种AI助手的通用问题。垂类助手主要和各种领域垂类想结合,与通用AI助手技术体系相同,主要难点在于和领域知识的融合。

本次分享将探讨任务式AI助手的核心技术以及大模型下的优化方法实践,并针对当前热门的大模型AI助手在技术上给大家分享主流的技术架构,以及解决当前的难点问题的核心思路,并结合京东在AI助手的实践,看到从单模态到多模态的交互趋势

课程收益

1、帮助学员了解AI助手的历史发展和技术趋势

2、帮助学员掌握AI语音助手解决核心难点的主流技术和关键设计思路

3、帮助企业在构建垂类大模型AI助手的思考和方法论

受众人群

企业管理者,IT行业从业者及其他对AI助手感兴趣的人员

课程周期

3H

课程大纲

1、AI助手的历史和发展现状

2、语音助手核心技术和实践

3、大模型AI助手关键技术

4、京东在RAG、Agent等技术下的AI助手探索实践

5、AI助手多模态交互趋势和展望

6、QA

企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1