课程简介
随着深度学习技术的不断突破和发展,机器翻译已从统计机器翻译时代全面走向神经机器翻译时代。深度学习的一大特点是需要大量训练数据,神经机器翻译更是如此。而由于翻译需要的平行语料标注成本高,如何从已有的大量非结构化的平行语料中挖掘出知识,并应用知识来提升翻译质量,对神经机器翻译的重要性不言而喻。本次分享将从华为知识的挖掘和知识的应用角度来分享业界和我们的相关进展和研究。
课程收益
分享收益
目标:
从非结构化的平行翻译数据中挖掘并使用结构化知识
启示:
结构化的知识不仅可以带来翻译质量的提升,对模型的可解释性也有帮助
成功要点:
知识的质量、知识在机器翻译中的落地点和落地方式
受众人群
算法工程师、机器翻译相关工程师等等以及对机器翻译感兴趣的人员。
课程周期
1天
课程大纲
1. 机器翻译分享
a.发展历史
b.基于Transformer架构的神经机器翻译
c.神经机器翻译的挑战
2. 知识指导的神经机器翻译
a.为什么需要知识
b.知识的定义
c.知识的挖掘
d.知识的应用
e.目前的问题和挑战
3. QA