大模型时代下的视觉大模型:落地实践与未来探索
Burgess Leng 查看讲师
百林哲咨询(北京)有限公司专家团队成员
某知名企业人工智能研究院视觉方向负责人
浏览:814次
详情 DETAILS

课程简介

AIGC是Stable DiffusionchatGPT/GPT4的推出,大模型始走出实验室,真正入生产环境下的普及段。与语言大模型相比,视觉大模型更侧重感知能力,在研发和应用中需要面对更为广泛和复杂的场景挑战:从传统的视觉单模态走向图文多模态,实现开放世界的通用目标检测,实现视觉大模型与文本大模型的联动互补,以上都是当前视觉大模型亟待解决的问题。

本次分享将从从工界的角,梳理360人工智能研究院在视觉大模型方向的探索和心得视觉大模型在搜索、短视频、安防场景落地的成功案例同时也将对近期火热的多模大模型研究进行总结和梳理,一并引出360人工智能研究院在MLLM方向上的研思考

课程收益

1.目标

1了解视觉大模型方向的研究进展

2了解视觉大模型在工业界落地的考量因素及成功案例

3了解多模态MLLM未来的工作方向

2.成功要点

大模型的核心不仅是模型参数量大,更为关键的能够充分利用以往无法利用的“大”数据。

3.启示

视觉大模型的未来必然走向多模态融合和跨模态对齐,这一方向也更为符合现实业务对于AI能力的实际需求。

受众人群

算法工程师、开发工程师以及其他对AI算法感兴趣的人员。

课程周期

0.5/3小时

课程大纲

1.视觉“大”模型的大指的是什么?

2.视觉大模型案例1:跨模态

3.视觉大模型案例2:开放世界目标检测

4.视觉大模型与文本大模型的融合:MLLM

5.某知名研究院在MLLM方向的研究成果和未来方向











预约内训 APPLY
前往提交您的需求,我们会及时与您联系
课程推荐 COURSE

企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1