2021数爱博体育博会发布面向南亚东南亚语言资源

 新闻资讯     |      2021-05-29 12:19

中国新闻社贵阳5月27日电 (记者 张伟)2021中国国际大数据产业博览会26日至28日在贵阳举行。“面向南亚东南亚语言资源库”在2021中国国际大数据产业博览会“激活数据要素潜能,加速数字化发展”论坛上正式对外发布。

南亚和东南亚语言资源库由昆明理工大学、小玉智能信息技术(云南)有限公司和大数据应用技术提升政府治理能力国家工程实验室联合发布。

随着“一带一路”的深入,中国与南亚和东南亚的互动与合作日益增强,经济走廊建设、国际能力合作和人文交流取得新进展。机器翻译对于南亚和东南亚语言具有重要的应用前景。

结果发布单位表示,为南亚、东南亚等资源稀缺的语言建设大型资源库,充分挖掘语言数据资源,提高南亚、东南亚语言机器翻译的效果,对促进国家间的政治、经济、文化交流具有重要作用。

据了解,R&D机构已建成2亿多双语平行语料库、200多万本南亚和东南亚语言双语词典和实体语料库,并开发了南亚和东南亚语言机器翻译引擎——云岭翻译,支持中文翻译、越南语、泰语等108种语言,翻译准确率高。

成果研发机构还研发了云岭翻译web系统、翻译APP、翻译机、翻译耳机等软硬件产品可以满足不同场景下的应用需求。该项成果已经在网信、旅游等领域得到很好的应用,日均调用量超7.8亿字符。(完) 【编辑:田博群】