低资源下实时语音图像翻译技术
Billig Huang 查看讲师
百林哲咨询(北京)有限公司专家团队成员
某互联网社交媒体平台低资源多媒体翻译技术负责人,CCF 委员
浏览:255次
详情 DETAILS

课程简介

高资源如中英等实时翻译系统已经相当成熟。本演讲将重点介绍如何在低资源,数据稀少情况下,搭建出可以在工业级应用的语音实时翻译系统和 OCR 实时翻译系统

中国是一个 200 多种语言的国家,不同语言之间的交流经常会存在障碍,以维吾尔族为例,目前能够运用汉语顺利交流的人群只占有约 36%,能够消除语言交流的障碍,打造在低资源下可以进行音视图文交流的巴别塔,一直是团队的目标。利用低资源语音识别技术,听懂民族语言;利用低资源语言 OCR 技术,看懂民族语言;而如何把听懂和看懂转化为理解,就需要作为核心“大脑”的低资源语言机器翻译技术,把这些内容转化为大部分人可以看懂的汉语。本分享将重点介绍腾讯低资源语种 AI 团队在国内外一系列大赛中获奖的语言语音识别多媒体技术,以及在打造多媒体实时翻译的落地方案。

课程收益

1、目标:

帮助听众知道如何将前沿的语音识别,OCR 和翻译技术结合,打造在不同语种下的实时多

媒体翻译系统。

2、要点:

低资源语音图像翻译技术的建模,解码和应用。

3、启示:

如何通过低资源技术,节省 ai 团队的运营成本,同时打造实时多媒体翻译平台。

受众人群

语音技术相关技术人员、系统架构师,以及对语音传输架构和算法感兴趣的人员

课程周期

3H

课程大纲

1、腾讯的任务和技术布局

2、低资源语音识别技术的声学模型和语言模型

3、低资源 OCR 技术

4、端到端语音翻译

5、端到端 OCR 翻译

6、实时多媒体翻译技术的算法和工程

7、DEMO 个知识点(可以突出具体的实际行业实例)

8、互动答疑


预约内训 APPLY
前往提交您的需求,我们会及时与您联系
课程推荐 COURSE

企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1