大语言模型垂直化训练技术与应用
Ogden Ji 查看讲师
百林哲咨询(北京)有限公司专家团队成员
达观数据首席数据官(CTO),研发团队总负责人。拥有10年技术团队管理经验,擅长数据挖掘以及实时服务系统架构设计工作。
浏览:684次
详情 DETAILS

课程简介

与实体经济相结合是大模型未来的发展路径,特别多的企业将大模型落地到垂直领域,打造出金融、医疗、电力等领域的专业大模型。大模型都绝不是昙花一现的风口,而是影响人类发展的重大技术变革,也是拉动全球经济增长的引擎,是绝对不能错过的重大战略机遇。

大模型作为当下科技创新的焦点、全球人工智能竞赛的主战场,也带来了诸多研究挑战。以chatgpt为代表的的通用大语言模型技术,在搜索引擎等场景也展现了非常高的价值。却在垂直场景使用上缺存在挑战:不能很好理解领域知识,领域效果不够好;

存在数据泄密的问题,为此很多公司都禁止使用chatgpt;除了搜索、问答,还需要探索更多应用场景,为了解决这些问题,最常用就是结合领域数据训练垂直领域的大语言模型,但训练大语言模型还是比较复杂,而且成本很高。

本次分享结合达观在大模型的实战经验,探讨垂直大模型训练的一些关键技术以及在办公场景上的应用。帮助更多企业打造专属模型,推动各行各业更快更好地分享智能化红利提供借鉴。

课程收益

目标:

了解垂直大语言模型训练的关键技术,以及办公应用场景

成功要点

1垂直模型需要选择合适的参数规模,太大成本太高,太小效果不好

2数据源的挑选和使用对效果起到至关重要的作用

3、每次训练的成本非常高,训练过程中可以通过加速、微调等方法减低成本

4、除了问答之外,很多的场景可以充分发挥大模型语义理解的能力来提高效率

启示

未来垂直大模型是重要的研究方向,通用模型和各领域专有的知识数据结合,让大模型从“万事通”变成政府通、行业通和企业通,这才是真正的价值受众人群

算法工程师、语音技术相关技术人员、架构师等,以及对语音传输架构和算法感兴趣的人员

课程周期

0.5/3小时

课程大纲

1行业需要垂直大语言模型的特征

2垂直大语言模型训练的关键技术,包括了参数选择,数据挑选,微调方法,训练加速等

3达观使用大语言模型的技术应用

4 QA







企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1