国际性汉语翻译比赛字节跳动夺冠军,“并行处理汉语翻译”或将推动技术性转型

国际性汉语翻译比赛字节跳动夺冠军,“并行处理汉语翻译”或将推动技术性转型

从从左往右逐句汉语翻译的模式遭遇挑戰,“并行处理汉语翻译”已经变成翻译机器技术性新的发展前景。

7月15日信息,在WMT2021国际性翻译机器比赛上,字节跳动活火山汉语翻译精英团队以“并行处理汉语翻译”系统软件比赛,得到法语到英语方位翻译机器赛事全自动评定第一名。“并行处理汉语翻译”在国际性比赛初次现身,就取得成功战胜了从从左往右逐句汉语翻译的“自回归模型”技术性,摆脱后面一种在翻译机器行业的绝对统治影响力。

据了解,WMT2021是由国际性计算语言学研究会ACL举行的世界顶级翻译机器赛事,德英文向是该比赛市场竞争最猛烈的大语系新项目之一。自2006年至今,WMT已持续举行了16届,参赛选手来源于世界各国的顶尖公司、高等院校和科研院所,赛果被普遍认同为翻译机器技术性的方向标。

活火山汉语翻译精英团队责任人详细介绍说,“自回归模型”更贴近人们阅读习惯,逐句按序转化成汉语翻译,每一个輸出的词用取决于以前的词,当輸出文字较长或是实体模型非常复杂时,翻译机器的速率比较慢;“并行处理汉语翻译”则是由设备同歩輸出全部的词,能够灵活运用并行处理,将汉语翻译速率提升 数十倍。语句越长,速率提高越显著。

国际性汉语翻译比赛字节跳动夺冠军,“并行处理汉语翻译”或将推动技术性转型

图:左为“自回归模型”从从左往右逐句輸出,右为“并行处理汉语翻译”同歩輸出    

“并行处理汉语翻译”的技术性难题是怎样构成连贯性句子。对于此事,活火山汉语翻译精英团队选用了一项自主创新的渐近教学方式,由简易到繁杂、由精彩片段到全句训炼“并行处理汉语翻译”实体模型。在维持极高汉语翻译速率的与此同时,“并行处理汉语翻译”的品质明显提高。

活火山汉语翻译精英团队责任人直言,在训炼信息量小的情景下,“并行处理汉语翻译”的品质对比传统式技术性处在缺点。可是当训炼数据信息经营规模增大后,“并行处理汉语翻译”会慢慢克服障碍,乃至追上传统式技术性。现阶段“并行处理汉语翻译”技术性已运用在活火山汉语翻译商品中,用于适用字节跳动的一部分业务流程。

在上年的WMT2020赛事中,活火山汉语翻译得到英中、德英、德法等5个语向汉语翻译总冠军,2021年以全新升级技术性夺冠军也是一次关键的提升。据了解,活火山汉语翻译已适用50好几个语系、近3000个语向的汉语翻译,不但运用在飞书、头条等字节跳动集团旗下商品,也根据活火山模块向客户需求给予技术咨询。

国际性汉语翻译比赛字节跳动夺冠军,“并行处理汉语翻译”或将推动技术性转型:等您坐沙发呢!

发表评论

表情
还能输入210个字