人工智能进阶训练营
Josiah Lu 查看讲师
百林哲咨询(北京)有限公司专家团队成员
信息技术中心AI开发专家,北京大学计算机技术研究所博士后。
浏览:829次
详情 DETAILS

课程简介

随着互联网技术的发展,近些年人工智能取得了显著的进展一举最受关注的领域之一人工智能应用场景广泛,包括自然语言处理、计算机视觉、系统推荐、自动驾驶、智能制造、智慧城市、医疗健康等领域,有着极为广阔的发展前景。它能够帮助人类更好地解决很多实际问题,提高工作效率、生活质量和安全性目前人工智能技术已经在很多领域得到了广泛应用但从宏观上看,全球人工智能还处于发展初期,并且人工智能已经上升至国家战略层面,关于我国人工智能发展现状来看,我国多项技术处于世界领先地位,创新创业也是日益活跃,但是整体水平与发达国家仍有较大差距。人工智能是一个充满机遇和挑战的领域,不管是现在或是未来都会有越来越多的机会和需求涌现,同时也需要不断的技术创新和应用探索。

本节课程分别从机器学习、自然语言处理、推荐系统等多个方面详细展开介绍,带领学员多方位全面领略人工智能的魅力。

课程收益

1、深入了解机器学习的逻辑与方法;

2、掌握NLP大规模预训练模型;

3、通过分析案例,详解实际工作中的自然语言处理项目;

4、深入了解推荐系统的整体框架与体系构建。

受众人群

人工智能,大数据,架构相关人员,技术工程师、算法工程师,对人工智能感兴趣人员。

课程周期

3天(18H)

课程大纲

课程主题

课程内容

一、机器学习

1. 分类模型的底层逻辑

2. 机器学习特征提取方法和技巧

3. 随机森林、GBDTXGBoost模型详解

4. 神经网络的可解释性分析

5. 对抗学习:gan和wgan

6. 生成式模型VAE

7. AIGC及扩散学习

二、NLP大规模预训模型

1. GoogleBert模型

1) NLP的龙骨模型-Bert

2) Bert模型的训练方法

3) Bert模型的应用

4) Bert模型实战

2. Bert模型改进

1) Elmo模型

2) XLNet模型

3) ROBERT模型

4) ALBert模型

5) T5模型

6) BART模型

3. GPT模型系列详解

1) 自回归模型和自编码模型

2) GPT1.0~GPT3.0模型精讲

3) in-context learning 学习思想详解

4) promot学习范式

5) chatgpt原理

三、中文自然语言处理

1. 百度ernie模型

1) paddle框架学习

2) 知识图谱构建

3) ernie大模型训练

4) ernie大模型使用场景

2. 中文分词

1) 序列标注与深度学习

2) HMM模型

3) CRF模型

4) CRF和LSTM结合

5) 中文分词代码实战

3. 新词发现

1) 信息熵和大数据

2) 中文信息熵计算

3) 基于信息熵的中文新词发现

四、自然语言处理项目

1. 京东客殿:智能聊天机器人

1) 智能聊天机器人整体框架

2) 文本匹配模型

3) 深度语义理解模型

4) Attention和语义匹配

5) 度量学习和语义快速检索

2. 腾讯新闻:内容平台的文本分类

1) 文本分类任务:多标签和多分类

2) 情感分析实战

3) 垃圾过滤实战

4) 样本不均衡和解决方案

3. 腾讯百万级实体知识图谱精讲

1) 结构化数据的抽取

2) neo4j数据库介绍和常见查询语句

3) transE模型及其改进

4) 大规模图随机游走算法

5) 知识图谱的落地场景和实际应用

4. 腾讯新闻内容理解-长文本标签抽取实战

1) 标签抽取和关键词抽取

2) 基于textrank的标签抽取

3) 异质标签的归一化

4) 基于双塔模型的标签抽取

5) 基于分类模型的标签抽取

5. 新浪舆情系统-文本摘要抽取

1) 抽取式摘要抽取

2) 基于Bert的摘要抽取

3) 基于大模型的生成式摘要

6.Huggingface实战

1) Huggingface为NLP领域带来的变革与价值

2) Huggingface各核心模块使用方法及其应用流程

3) 机器翻译模型详解

五、推荐系统

1. 推荐系统整体架构

1) 内容生产和内容理解

① 推荐系统的内容生产

② 内容审核和内容打标

③ 内容有效期预测

2) 内容分发

① 召回阶段的目的、意义和设计思想

② 排序阶段的目的、意义和设计思想

3) 推荐系统的评价指标

① 推荐系统的商业价值

② 日活、CTR、人均时长等指标分析

2. 召回模型

1) 基于行为类的召回

① 协同过滤: itemCF

② 协同过滤: userCF

③ 随机游走模型: node2vec

④ 行为类召回的优势、缺点总结

2) 基于内容类的召回

① 基于文本embedding的召回系统

② 基于标签体系的召回系统

③ 基于up主的召回系统

④ 微软DSSM双塔召回模型

⑤ 最近邻快速检索工具annoy和faiss

3) YoutubeDNN召回系统

① 用户行为特征、自然属性特征的提取预处理和归一化

② ltem特征提取,预处理和归一化

③ 负采样: NCE和sampledSoftmax

④ youtubeDNN召回系统

4) 交叉特征召回

① FM模型在召回系统中的应用

② FFM模型在召回系统中的应用

③ 矩阵分解SVD在召回系统中的应用

3. 排序系统

1) 31 CTR预估

① 排序指标精讲

② AUC和userAUC

2) Deep & Cross

① 模型结构精讲

② 特征交叉详解

③ 使用keras实现Deep & Cross模型

3) xDeepFM

① 模型结构精讲

② CIN模块

③ 使用keras实现xDeepFM模型

4) 逻辑回归在排序模型中的应用

① 逻辑回归精讲

② 详解大规模特征工程

③ 逻辑回归在百度凤巢系统

5) 阿里巴巴DIN模型详解

① Base模型详解

② DIN模型详解

③ DIEN模型详解

④ DSIN模型详解

6) 阿里CVR预估模型ESMM

① CVR预估的场景和挑战

② ESMM模型详解

③ 隐式学习pCVR

④ 样本选择(BBS) 问题的解决方案

⑤ 样本稀疏(DS) 问题的解决方案

4. 推荐系统指标体系构建

1) AB测试

① 流量分桶的原理

② AB测试置信度计算

③ 基于分层的AB测试

2) 指标评价体系

① 推荐系统的商业价值

② ctr提升的方法

③ 人均时长提升方法

5. 微信视频号推荐实战

1) 特征提取

① 文本内容特征提取

② 短视频内容embedding抽取

③ 短视频画面embedding抽取

④ 短视频多模态embedding抽取

2) 推荐系统核心代码实战

① 召回系统代码实战

② 排序系统代码实战


预约内训 APPLY
前往提交您的需求,我们会及时与您联系
课程推荐 COURSE

企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1