2021全球人工智能技术大会开幕 百度王海峰:跨语

 新闻资讯     |      2021-06-09 12:15

原标题:2021全球人工智能技术大会百度王海峰开幕:跨语言交流正在成为现实

6月4-6日,在中国科协、中国科学院、中国工程院、浙江省人民政府的指导下,由中国人工智能学会、杭州市人民政府主办的2021全球人工智能技术大会在杭州召开。会议汇集了来自世界各地的人工智能领域的学者和专家,为人工智能的发展提出建议。

6日下午,在多语言智能信息处理专题论坛上,中国人工智能学会(CAAI)多语言智能信息处理专业委员会正式成立。国务院参事、CAAI主席、中国工程院院士戴琼海;CAAI名誉主席、中国工程院院士李德意;中国工程院院士、新疆多语种信息技术重点实验室主任胡舒尔·伊斯拉姆发表了演讲,许多来自学术界和工业界的贵宾带来了精彩的报告。百度首席技术官、CAAI/美国公民自由联盟研究员王海峰以“机器翻译:从梦想到现实”为题,介绍了机器翻译相关研究的重要成果和产业应用。

机器翻译进入深度学习时代

机器翻译的发展可以追溯到1947年机器翻译的提出。在过去的70年里,机器翻译经历了基于规则的方法、统计机器学习和神经网络机器翻译三个阶段,进入了深度学习时代。

神经网络机器翻译的大规模工业应用面临着高质量、多语言、跨模态的产业化需求。翻译质量方面,百度开发了集成丰富特征的神经网络机器翻译模型,缺失翻译率降低80%;多智能体联合学习模型突破了单一模型学习能力不足的局限;在国际权威机器翻译评测中获得第一名,翻译质量大幅提升。2015年5月,百度率先在全球推出大规模神经网络机器翻译产品。

在多语翻译方面,百度开发了基于共享编码器的翻译模式,突破了低资源语言翻译的瓶颈,开发了统一的多语翻译框架,大大提高了部署效率,实现了203种语言的互译,支持4.1万个翻译方向。

机器同传方面,百度创建了基于语义单元的同传模型,翻译准确率在80%以上,时间延迟约3秒,翻译水平堪比人类翻译者。同时,在端到端同声传译模型中,突破了语音识别和机器翻译的交互式同步解码,实现了跨模态知识共享。百度在机器翻译技术上不断创新突破,同时还积极与谷歌、清华大学合作举办机器同声传译研讨会,发布真实语音场景的汉英同声传译数据集,推进同声传译研究。

每天翻译超过1000亿个字符,跨语言交流正在成为现实

机器翻译是百度很早就开始积累和构建的AI技术之一。2010年以来,百度对机器翻译技术的大规模产业化、海量翻译知识的获取、多语言翻译、机器同声传译等进行了系统深入的研究。,技术不断突破创新,工业应用丰富。百度翻译已经形成了完整的产品矩阵,包括翻译PC版、翻译APP、AI同声传译和翻译开放平台等。,实时、准确地响应世界上海量、复杂的翻译请求,每天翻译1000多亿字,比十年前增加了10万倍。