简介
文档资料的内容自动化处理有广阔的应用前景,在大型集团企业、政府、教育、金融等行业客户中代替人工来自动化进行文档处理,是人工智能技术落地的关键应用之一。在对篇幅较长的文本进行内容理解和信息挖掘过程中,如何应用深度学习等技术来进行更好的进行分析挖掘。另外还将探讨深度学习模型和统计语言模型的相互结合,以及工程实践中值得注意的技术应用点等实践知识。
目标
分析神经网络;探索实践文本智能的多应用场景
受众人群
算法工程师、系统架构师、开发工程师以及其他对数据智能算法感兴趣的人员。
课程时长
1天(6H)
分享提纲
第1课 理解文本为什么这么难 | 1.NLP发展历史回顾 2.文本处理的宏观框架 3.语义理解、语料库、认知智能 |
第2课 语言模型是什么 | 1.什么是语言模型 2.从分词讲起 3.文本的表示(从one-hot到wordvec) |
第3课 为什么要对文本标注 | 1.什么是标注 2.标注的作用是什么 3.HMM和CRF的理解 |
第4课 怎么对文本分类和提取信息 | 1.朴素贝叶斯 2.传统的机器学习方式 3.摘要的生成 |
第5课 深度学习带来什么变化 | 1.神经网络回顾 2.重新理解文本分类 |
第6课 文本智能还有哪些应用场景 | 1.推荐系统 2.搜索系统 3.知识图谱 4.文本审阅 |