简介
作为很吸引人的人机交互方式,统计自然语言处理运用了推测学、机率、统计的方法来解决上述,针对容易高度模糊的长串句子,当套用实际文法进行分析产生出成千上万笔可能性时所引发之难题。统计自然语言处理的技术主要由同样自人工智能下与学习行为相关的子领域:机器学习及挖掘所演进而成。本内容从应用案例层面剖析NLP。
目标
常见的NLP技术和统计模型;内容的关键性计算;文本依赖中的层次依赖模型等
受众人群
算法工程师、系统架构师、开发工程师以及其他对大数据感兴趣的人员。
课程时长
1天(6H)
分享提纲
1.NLP基础知识(1.5 hours) | NLP的理解 NLP包含的内容 句法语义分析 信息抽取 文本挖掘 机器翻译 信息检索 问答系统 对话系统 常见NLP技术 统计语言模型 关键词提取 同义词挖掘 互信息 NLP领域会议及国内发展情况 |
2.电商图书评论排序(1.5 hours) | 背景 排序因素 内容相关性计算 排序模型 效果衡量与评估 作弊vs.反作弊 ROI分析 |
3.文本分类(1.5 hours) | SVM模型 扁平文本分类模型 层次文本分类模型 基于层次依赖关系的分类模型 |
4.新闻的个性化推荐 (1.5 hours) | 分词 关键词提取 语义主题聚类 用户画像 新闻个性化推荐 |