课程简介
大语言模型的出现为机器翻译技术带来了新的机遇。我们可以利用大模型的预训练参数或作为NMT模型的一个模块,以此提升翻译性能。同时,机器翻译数据也可反过来增强大模型的语言理解和生成能力。工业场景中,大模型和NMT可实现多语言、多模态、多层次的深层互操作和迭代优化。
大模型的多任务联合训练,也将促进多域知识的积累,并且在翻译、同传甚至垂直领域产生新的契机和优化范式。充分利用大模型的优势为机器翻译注入强大能量,构筑面向AIGC的多层次架构,技术人才的终身学习是通往未来工业AGI系统的必由之路。
本次分享主旨是提供一个L0大模型层和L1层NMT联合优化的范式,帮助企业软件开发工程师和科研学者,从0到1快速入门NMT,掌握TOP3的工业级NMT模型和架构;同时,利用大模型的海量数据和知识,以知识蒸馏和迁移学习,实现大模型增强机器翻译的质量和落地;最后,利用机器翻译来优化大模型的三大技术,上下文学习,指令学习和prompt持续优化大模型,让企业自主打造企业级可用的自有大模型。
课程收益
大语言模型的出现为机器翻译技术带来了新的机遇。我们可以利用大模型的预训练参数或作为NMT模型的一个模块,以此提升翻译性能。同时,机器翻译数据也可反过来增强大模型的语言理解和生成能力。工业场景中,大模型和NMT可实现多语言、多模态、多层次的深层互操作和迭代优化。
大模型的多任务联合训练,也将促进多域知识的积累,并且在翻译、同传甚至垂直领域产生新的契机和优化范式。充分利用大模型的优势为机器翻译注入强大能量,构筑面向AIGC的多层次架构,技术人才的终身学习是通往未来工业AGI系统的必由之路。
本次分享主旨是提供一个L0大模型层和L1层NMT联合优化的范式,帮助企业软件开发工程师和科研学者,从0到1快速入门NMT,掌握TOP3的工业级NMT模型和架构;同时,利用大模型的海量数据和知识,以知识蒸馏和迁移学习,实现大模型增强机器翻译的质量和落地;最后,利用机器翻译来优化大模型的三大技术,上下文学习,指令学习和prompt持续优化大模型,让企业自主打造企业级可用的自有大模型。
受众人群
人工智能,大数据,架构相关人员,技术工程师、算法工程师,对人工智能感兴趣人员。
课程周期
0.5天/3小时
课程大纲
1.大模型和NMT浅析
(1)大模型(Large Language Model):通过大规模语料 pretrain 的巨大神经网络模型,如 GPT4、Llamma2等。
(2)NMT:基于神经机器翻译(Neural Machine Translation), Seq2Seq, Transformer等SOTA模型。
2.大模型提升NMT能力
(1)翻译: KPE, Knowledge Prompt for Translation Evaluation.
(2)同传:WhiSLU,Speech Language Understanding based on Whisper.
(3)ICT应用: Biglog, Unsupervised Large-scale Pre-training for a Unified Log Representation.
3.NMT反馈大模型质量提升
(1)人机融合:Prompt Engineering.
(2)NMT 作为下游任务微调大模型。
(3)构建翻译对齐语料,提升大模型的多语言理解能力。
4.大模型和机器翻译融合的未来思考
(1)多模态翻译:视频/图文翻译。
(2)知识蒸馏:大小模型的交互式提升。
(3)大模型的AI平台Optimus:分享型的研究能力+自主产品的工业部署。
(4)终身学习的AI从业者之路。