欢迎来到池州三陆五信息科技有限公司- 未来科技

微信
手机版
网站地图

百度翻译10年:世界上第一个语言水平超过200,质量提高30个百分点,每天翻译1000亿字以上-量子比特,

2023-04-12 09:09:16 栏目 : 手机数码 围观 : 0次

10年后机器翻译系统会有什么变化呢

2011年的时候,TA只能翻译成“中-英”。可是,TA先生10年,在翻译的道持续磨练自己。

现在,TA的“打开方法”是这样的。

发布全球首个互联网神经翻译系统,10年内将翻译质量提升30个百分点(国际评价指标BLEU)

世界上首次突破200种语言的互译,10年内翻译语言数量增加了100倍。

不仅是文本翻译,还可以进行照片、动画、文档、甚至同时发送等变换翻译。

除了在输入框中输入文本进行翻译外,还出现了各种各样的产品,包括翻译应用程序、AI同声传译会议版、同声传译助理、小程序、翻译开放平台等。

而现在的它又变得非常忙碌,在全球每天寻找TA的翻译字数超过千亿,相当于2000部不列颠百科全书,是10年前的10万倍。

此外,Gartner如下所示进行了评论。

百度翻译。

但是如果现在你认为它只是做翻译,那可能有点片面。

因为现在的翻译,有点“怪味”了。

说起翻译的出发点,是10年前只会说英语的网站。

现在的那个,可以说把翻译提高到了一种新的水平。

首先是关于翻译语言,刚才也提到过,百度是世界上第一个突破200语言互译的系统。

不仅表现在语言数量之多,还表现在翻译的难度上。

例如,甚至涉外了“不受欢迎”的语言。以国粹文言文为例,输入“学弈”一节。

翻译能用现代语的形式表现瞬间难的古文。

但是机器要做到这一点并不容易。除了大的语言,大多数语言互译资源都很稀少,AI无法学习足够的知识。

但是百度翻译满足的不仅仅是文本翻译的“多”和“精”。在便利性方面也花了十年。

最近,百度翻译软件更新到10.0版,这里也经常出现“花形翻译”。

它并不是一种输入和翻动文字的简单模式,它还内置了语音、照片、视频和文档等形式。

也就是说,现在想翻译的并不是输入这一简单的东西。

说一句话,拍张照片,再直接发送文档,翻译就完成了。

不仅如此,即使是同传那样的高级翻译,百度翻译也不难保持。

在世界顶级机器翻译大赛WMT(Workshop on Machine Translation)中,他在中英翻译中取得了第一名的成绩。

你会发现,在翻译上花了10年的时间,不仅是横向扩展,也是对每个产品的纵向“自我修炼法”。大家庭现在正在展开树枝。

那么翻译是如何在10年内进步到现在的呢

简单回顾一下机器翻译的进化。

“机器翻译”是在1946年第一台计算机ENIAC诞生的那一年,由信息理论的先驱者美国沃伦韦伯提出的。

从这里开始,机器翻译是“基于规则的方法”的时代。

这种方法,本质上是将专家的翻译知识以规则的形式写出来,然后用软件的方法用翻译规则来实现机器翻译过程。

但是,也有构筑成本和维护成本高,动辄必须重写整个过程的缺点。

从1980年代末到90年代初,IBM提出了机器翻译的另一种方法——统计机器翻译,这开启了机器翻译时代的第二扇门。

与基于规则的机器翻译不同,统计机器翻译将转向数据驱动的机器学习方法,而不是人类编写翻译规则。

最大的好处是,传统的基于规则的手法需要人类专家的手和手,机器可以“自学”人工定义的特征。

翻译服务开始之初,主要使用统计性的机器翻译的手法,不过,同时,为了对应互联网上复杂多样的翻译委托,开发了融合了现有的手法的多战略模型。

2010年成立了开发团队,仅仅一年后就建立了网络版。

然而,统计机器翻译诞生20多年来,发展的瓶颈越来越明显。在经过基于词组的方法、基于语法的方法等一系列技术的迭代后,统计机器翻译逐渐达到了天花板,翻译质量的进一步提高变得困难。

2013年,一项名为“Recurrent Continuous Translation Models”的研究发表了。

随着研究者们提出了新的方法,机器翻译进入了神经机器翻译(NMT)的时代。

这个神经网络的手法确实是理想的“替代品”,但一个非常现实的问题摆在翻译团队面前。

那就是“不值得参考”,就是模特的做法完全是新的,没有经验。

另外,在当时的技术水平上,使用神经网络模型进行机器翻译还是“资源”。

作为提高翻译效果的代价,大量的计算资源被消耗,翻译一个句子需要十几秒的时间。

时间到了2015年,在这样大的背景下,翻译团队,“敢比人先”决定:

从技术上讲,翻译团队针对NMT的缺点,引入了上一代统计机器翻译的特性。

具体来说,将n-gram语言模型、短语列表的特征、长度特征等融合到NMT模型中。

实验结果表明,这种“新旧结合”的方法显著提高了NMT在中英互译中的翻译性能。

“百度”的翻译,从启动到世界上第一个互联网上神经网络机器翻译系统的发布,仅仅用了不到半年的时间。

这比google翻译快了16个月。

但是百度翻译仅此并不满足。

▲Bruno Pouliquen,全球知识产权组织机器翻译负责人,mtsummit-2017,还要做更多方向上的“领导”。为了翻译更多的语言,还提出了“多功能语言翻译”。

该研究提出了一种用于共享编码器的多任务学习神经网络翻译模型,构建了一个基于神经网络的多语言翻译统一框架。

▲共享编码器的翻译模型图这是翻译能够维持203语言互译的关键。

2017年,百度翻译中出现了AI的同时发送功能。

具体提出了语义单元驱动的机器同声传译模式,解决了翻译质量和同时延迟难以兼顾的问题。

同时,百度翻译团队开发了高质量、低延迟的机器同步传输系统,翻译精度超过80%,平均延迟3秒。

百度因为机器翻译的技术领先,翻译的精度也很高。

所以很多国际性的会议、活动都会选择百度翻译作为技术支持。更进了像服贸会、博览会这样的重要活动。

然后会出现以下问题:

首先,我们必须明确达成共识,机器翻译是人工智能的终极目标之一,也是AI技术最具挑战性的应用之一。

这就是为什么百度在机器翻译领域不断创新的原因。

但从另一个角度看,百度翻译所做的事,从来没有翻译本身这么简单。

从那十年的发展历程来看,现在的百度翻译已经“变味”了:

这个应该怎么考虑呢。

试着从百度翻译带来的东西理解那个「变味」怎样。

[TA]用户身边的翻译帮手比如交警执法过程中遇到过外国(俄罗斯)朋友的这种情况。

因为他们不会中文,所以沟通成了一个很大的问题。

最终,交警通过翻译能力成功救助外国船员。

此外,在工作中,语言障碍成为获取信息和沟通的障碍。

另一方面,用户可以通过使用百度翻译软件,使交叉语言交流更加顺畅。

但是,这样的服务和体验,即使是残疾人也必须是所有人都应该拥有的体验。

为此,百度翻译还帮助盲人开发者开发盲人操作软件,免费帮助大量盲人用户获得翻译服务。

正是这样的真实故事,百度翻译不仅赋予了翻译工具,还赋予了桥、窗、接受器等意义。

TA虽然支持全球疫情防治,但说实话,比起体验上的这种“怪味”,百度翻译正发挥着更深刻的使命和价值。

例如,在疫情对策方面,百度翻译也发挥了其热度。

法语3M口罩说明书、英语防护服说明书、俄语三层口罩商品检验证书……这些抗瘟疫物资等,没有不需要翻译的工作。

但大家都知道对抗瘟疫不仅任务繁重,而且与时间竞争。

百度翻译肩负着抗疫期间翻译的重担,仅仅用了两天时间就构建了高效易用的定制翻译工具,免费向志愿者团队开放。

◆多语言防疫视频TA服务于国家需要,为语言间交流铺路,以及百度为翻译而做,仍然符合国家需要。

国家在第二届“一带一路”国际合作高峰论坛上提出以下建议:。

而且,跨语言交流是实现这一目标的关键。

百度翻译10年来,在翻译语言增长100倍的情况下,沿着“一带一路”沿线国家,逐步拓展跨语言翻译。

很容易看出,这也是与国家乃至世界发展相对应的互联互通大趋势。

放眼当今,百度翻译仍然“怪味”,翻译这件事需要转变为生产性。

但是,翻译这件事任重而道远。拿到许多“世界第一”的百度翻译还有很长的路要走。

在接下来的时间里,百度翻译将在技术和价值方面带来怎样的提升,我们拭目以待。

展开剩余内容

分享到:

猜你喜欢

  • b2b网站策划书_b2b策划案

    b2b网站策划书_b2b策划案大家好,今天我来给大家讲解一下关于b2b网站策划书的问题。为了让大家更好地理解这个问题,我将相关资料进行了整理,现在就让我们一起来看看吧。文章目录...

    2024-10-22 企业 网站
  • 浙江高端网站_浙江高端网站有哪些

    浙江高端网站_浙江高端网站有哪些好久不见了,今天我想和大家探讨一下关于“浙江高端网站”的话题。如果你对这个领域还不太了解,那么这篇文章就是为你准备的,让我们一看看吧。文章目录列...

    2024-10-22 网站 浙江
  • 做酒的网站_做酒的网站有哪些

    做酒的网站_做酒的网站有哪些希望我能够回答您有关做酒的网站的问题。我将根据我的知识库和研究成果回答您的问题。文章目录列表:1.酒仙网CEO郝鸿峰的电商百亿梦想2.有没有关于介绍...

    2024-10-22 中国 酒类 酒仙 网站
  • 索尼手机软件_索尼手机软件商店

    索尼手机软件_索尼手机软件商店下面,我将为大家展开关于索尼手机软件的讨论,希望我的回答能够解决大家的疑问。现在,让我们开始聊一聊索尼手机软件的问题。文章目录列表:1.索尼的手机...

    2024-10-22 手机 索尼
热门标签