从翻译工具到多语言助手:大模型下工业级机器翻译的未来之路
Glenn Yang 查看讲师
百林哲咨询(北京)有限公司专家团队成员
某大型互联网公司实验室架构及关键DFX科学家,北京邮电大学国家重点实验室博士,微软亚洲研究院明日之星,擅长自然语言处理等AI技术在搜索推荐、智能客服等应用场景落地。
浏览:662次
详情 DETAILS

课程简介

大语言模型的出现为机器翻译技术带来了新的机遇。我们可以利用大模型的预训练参数或作为NMT模型的一个模块,以此提升翻译性能。同时,机器翻译数据也可反过来增强大模型的语言理解和生成能力。工业场景中,大模型和NMT可实现多语言、多模态、多层次的深层互操作和迭代优化。

大模型的多任务联合训练,也将促进多域知识的积累,并且在翻译、同传甚至垂直领域产生新的契机和优化范式。充分利用大模型的优势为机器翻译注入强大能量,构筑面向AIGC的多层次架构,技术人才的终身学习是通往未来工业AGI系统必由之路。

本次分享主旨是提供一个L0大模型层和L1层NMT联合优化的范式,帮助企业软件开发工程师和科研学者,从0到1快速入门NMT,掌握TOP3的工业级NMT模型和架构;同时,利用大模型的海量数据和知识,知识蒸馏和迁移学习,实现大模型增强机器翻译的质量和落地;最后,利用机器翻译来优化大模型的三大技术,上下文学习,指令学习和prompt持续优化大模型,让企业自主打造企业级可用的自有大模型

课程收益

大语言模型的出现为机器翻译技术带来了新的机遇。我们可以利用大模型的预训练参数或作为NMT模型的一个模块,以此提升翻译性能。同时,机器翻译数据也可反过来增强大模型的语言理解和生成能力。工业场景中,大模型和NMT可实现多语言、多模态、多层次的深层互操作和迭代优化。

大模型的多任务联合训练,也将促进多域知识的积累,并且在翻译、同传甚至垂直领域产生新的契机和优化范式。充分利用大模型的优势为机器翻译注入强大能量,构筑面向AIGC的多层次架构,技术人才的终身学习是通往未来工业AGI系统必由之路。

本次分享主旨是提供一个L0大模型层和L1NMT联合优化的范式,帮助企业软件开发工程师和科研学者,从01快速入门NMT,掌握TOP3的工业级NMT模型和架构;同时,利用大模型的海量数据和知识,知识蒸馏和迁移学习,实现大模型增强机器翻译的质量和落地;最后,利用机器翻译来优化大模型的三大技术,上下文学习,指令学习和prompt持续优化大模型,让企业自主打造企业级可用的自有大模型

受众人群

人工智能,大数据,架构相关人员,技术工程师、算法工程师,对人工智能感兴趣人员。

课程周期

0.5/3小时

课程大纲

1.大模型和NMT浅析

1大模型(Large Language Model):通过大规模语料 pretrain 的巨大神经网络模型,如 GPT4、Llamma2等。

2NMT:基于神经机器翻译(Neural Machine Translation), Seq2Seq, Transformer等SOTA模型。

2.大模型提升NMT能力

1翻译: KPE, Knowledge Prompt for Translation Evaluation.

2同传:WhiSLU,Speech Language Understanding based on Whisper.

3ICT应用: Biglog, Unsupervised Large-scale Pre-training for a Unified Log Representation.

3.NMT反馈大模型质量提升

1人机融合:Prompt Engineering.

2NMT 作为下游任务微调大模型。

3构建翻译对齐语料,提升大模型的多语言理解能力。

4.大模型和机器翻译融合的未来思考

1多模态翻译:视频/图文翻译。

2知识蒸馏:大小模型的交互式提升。

3大模型的AI平台Optimus:分享型的研究能力+自主产品的工业部署。

4终身学习的AI从业者之路。










企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1