课程简介
随着互联网技术的发展,近些年人工智能取得了显著的进展,一举最受关注的领域之一。人工智能应用场景广泛,包括自然语言处理、计算机视觉、系统推荐、自动驾驶、智能制造、智慧城市、医疗健康等领域,有着极为广阔的发展前景。它能够帮助人类更好地解决很多实际问题,提高工作效率、生活质量和安全性,目前人工智能技术已经在很多领域得到了广泛应用。但从宏观上看,全球人工智能还处于发展初期,并且人工智能已经上升至国家战略层面,关于我国人工智能发展现状来看,我国多项技术处于世界领先地位,创新创业也是日益活跃,但是整体水平与发达国家仍有较大差距。人工智能是一个充满机遇和挑战的领域,不管是现在或是未来,都会有越来越多的机会和需求涌现,同时也需要不断的技术创新和应用探索。
本节课程分别从机器学习、自然语言处理、推荐系统等多个方面详细展开介绍,带领学员多方位全面领略人工智能的魅力。
课程收益
1、深入了解机器学习的逻辑与方法;
2、掌握NLP大规模预训练模型;
3、通过分析案例,详解实际工作中的自然语言处理项目;
4、深入了解推荐系统的整体框架与体系构建。
受众人群
人工智能,大数据,架构相关人员,技术工程师、算法工程师,对人工智能感兴趣人员。
课程周期
3天(18H)
课程大纲
课程主题 | 课程内容 |
一、机器学习 | 1. 分类模型的底层逻辑 2. 机器学习特征提取方法和技巧 3. 随机森林、GBDTXGBoost模型详解 4. 神经网络的可解释性分析 5. 对抗学习:gan和wgan 6. 生成式模型VAE 7. AIGC及扩散学习 |
二、NLP大规模预训模型 | 1. GoogleBert模型 1) NLP的龙骨模型-Bert 2) Bert模型的训练方法 3) Bert模型的应用 4) Bert模型实战 2. Bert模型改进 1) Elmo模型 2) XLNet模型 3) ROBERT模型 4) ALBert模型 5) T5模型 6) BART模型 3. GPT模型系列详解 1) 自回归模型和自编码模型 2) GPT1.0~GPT3.0模型精讲 3) in-context learning 学习思想详解 4) promot学习范式 5) chatgpt原理 |
三、中文自然语言处理 | 1. 百度ernie模型 1) paddle框架学习 2) 知识图谱构建 3) ernie大模型训练 4) ernie大模型使用场景 2. 中文分词 1) 序列标注与深度学习 2) HMM模型 3) CRF模型 4) CRF和LSTM结合 5) 中文分词代码实战 3. 新词发现 1) 信息熵和大数据 2) 中文信息熵计算 3) 基于信息熵的中文新词发现 |
四、自然语言处理项目 | 1. 京东客殿:智能聊天机器人 1) 智能聊天机器人整体框架 2) 文本匹配模型 3) 深度语义理解模型 4) Attention和语义匹配 5) 度量学习和语义快速检索 2. 腾讯新闻:内容平台的文本分类 1) 文本分类任务:多标签和多分类 2) 情感分析实战 3) 垃圾过滤实战 4) 样本不均衡和解决方案 3. 腾讯百万级实体知识图谱精讲 1) 结构化数据的抽取 2) neo4j数据库介绍和常见查询语句 3) transE模型及其改进 4) 大规模图随机游走算法 5) 知识图谱的落地场景和实际应用 4. 腾讯新闻内容理解-长文本标签抽取实战 1) 标签抽取和关键词抽取 2) 基于textrank的标签抽取 3) 异质标签的归一化 4) 基于双塔模型的标签抽取 5) 基于分类模型的标签抽取 5. 新浪舆情系统-文本摘要抽取 1) 抽取式摘要抽取 2) 基于Bert的摘要抽取 3) 基于大模型的生成式摘要 6.Huggingface实战 1) Huggingface为NLP领域带来的变革与价值 2) Huggingface各核心模块使用方法及其应用流程 3) 机器翻译模型详解 |
五、推荐系统 | 1. 推荐系统整体架构 1) 内容生产和内容理解 ① 推荐系统的内容生产 ② 内容审核和内容打标 ③ 内容有效期预测 2) 内容分发 ① 召回阶段的目的、意义和设计思想 ② 排序阶段的目的、意义和设计思想 3) 推荐系统的评价指标 ① 推荐系统的商业价值 ② 日活、CTR、人均时长等指标分析 2. 召回模型 1) 基于行为类的召回 ① 协同过滤: itemCF ② 协同过滤: userCF ③ 随机游走模型: node2vec ④ 行为类召回的优势、缺点总结 2) 基于内容类的召回 ① 基于文本embedding的召回系统 ② 基于标签体系的召回系统 ③ 基于up主的召回系统 ④ 微软DSSM双塔召回模型 ⑤ 最近邻快速检索工具annoy和faiss 3) YoutubeDNN召回系统 ① 用户行为特征、自然属性特征的提取预处理和归一化 ② ltem特征提取,预处理和归一化 ③ 负采样: NCE和sampledSoftmax ④ youtubeDNN召回系统 4) 交叉特征召回 ① FM模型在召回系统中的应用 ② FFM模型在召回系统中的应用 ③ 矩阵分解SVD在召回系统中的应用 3. 排序系统 1) 31 CTR预估 ① 排序指标精讲 ② AUC和userAUC 2) Deep & Cross ① 模型结构精讲 ② 特征交叉详解 ③ 使用keras实现Deep & Cross模型 3) xDeepFM ① 模型结构精讲 ② CIN模块 ③ 使用keras实现xDeepFM模型 4) 逻辑回归在排序模型中的应用 ① 逻辑回归精讲 ② 详解大规模特征工程 ③ 逻辑回归在百度凤巢系统 5) 阿里巴巴DIN模型详解 ① Base模型详解 ② DIN模型详解 ③ DIEN模型详解 ④ DSIN模型详解 6) 阿里CVR预估模型ESMM ① CVR预估的场景和挑战 ② ESMM模型详解 ③ 隐式学习pCVR ④ 样本选择(BBS) 问题的解决方案 ⑤ 样本稀疏(DS) 问题的解决方案 4. 推荐系统指标体系构建 1) AB测试 ① 流量分桶的原理 ② AB测试置信度计算 ③ 基于分层的AB测试 2) 指标评价体系 ① 推荐系统的商业价值 ② ctr提升的方法 ③ 人均时长提升方法 5. 微信视频号推荐实战 1) 特征提取 ① 文本内容特征提取 ② 短视频内容embedding抽取 ③ 短视频画面embedding抽取 ④ 短视频多模态embedding抽取 2) 推荐系统核心代码实战 ① 召回系统代码实战 ② 排序系统代码实战 |