一款优秀的翻译软件DeepL

最近,一款在线机器翻译软件在日本大火。
在这里插入图片描述
这款翻译软件名叫DeepL,大火的原因正是因为它工作太负责了,翻译得太过准确,在日本引起了热议。

从日本网友的民间测评来看,不仅日语方言翻译效果杠杠的,连文言文也被拿下,要知道,这可是连谷歌翻译都无法做到的事。
在这里插入图片描述
但是有多精确呢?作为一个严谨的科技软件,当然还是要用数据来说话,DeepL官方也公开了日英互译和中英互译的盲测结果,如下图所示,可以看出,DeepL简直就是碾压级的存在嘛:
在这里插入图片描述
盲测就是在专业译员评审们不知道哪个翻译版本是由哪个网站翻译的情况下,对翻译文本进行评估,这也一直是DeepL的测试方式之一。

DeepL由于极好的准确性,也同样引爆了Reddit,有网友指出,DeepL不是像谷歌翻译那样从字词上进行翻译,从Textractor的设置上可以看到,DeepL还支持用以前的翻译作为上下文对翻译结果进行改善。
在这里插入图片描述
也有不少网友直呼“DeepL牛逼”!
在这里插入图片描述
3年前,DeepL刚出现在大众视野的时候就已经吸引到了不少目光,DeepL首席执行官Gereon Frahling曾表示,DeepL的目标不止于翻译任务,神经网络将从理解文本开始,开启更多可能。

至于更多可能是如何被开发出来的,文摘菌做了一次小小的测评,然后再一起来围观DeepL的发家史,小板凳已经放好,欢迎就坐~方言、文言文、学术论文,机器翻译神仙打架!

不管是民间测评还是DeepL官方的盲测结果,都暗示着DeepL可能是目前准确率最高的机器翻译,到底成色怎样,还是要亲自动手试试才知道。

既然本次更新也包含了简体中文,抱着一点点的怀疑和一点点的好奇,文摘菌也对DeepL进行了一次简单的测评,和目前主流的谷歌翻译、微软翻译、百度翻译、有道翻译进行了比较。

本次测评分为三轮,第一轮方言,第二轮文言文,第三轮学术论文。好,现在我们有请五位选手入场。第一轮,我们来看看方言。

大家都知道,中国方言文化博大精深,要是不能正确译出方言,那这个准确率还是要打上问号的。

我们选择了东北话十级题目:“我嘞个去,你长得也太磕碜了”。本题有两个得分点,一个是“我嘞个去”,一个是“磕碜”。让我们来看看五位选手的表现。

在第一个得分点上,谷歌翻译成了“I’ll go there”,微软和百度认为这是“I’ll go”的意思,有道则给出“I don’t know”的答案,DeepL表现很好,正确翻译成了带有惊讶语气的“oh my god”。

在第二个得分点上,五位选手都给出了不同的答案,谷歌“shy”、微软“snobful”、百度“shabby”、有道“bad”,DeepL“ugly”。

从得分点上看,百度在第二题表现尚可,有道…勉强过关吧,谷歌和微软则全军覆没。我们来欣赏一下DeepL的满分试卷:
在这里插入图片描述

这才第一题,不要担心,还有翻身的机会。接下来我们来看看文言文,既然DeepL都能翻译古日文,要是不能翻译古汉语可就不对了。第二轮,文言文。

文言文部分我们以著名唐代诗人张九龄《望月远怀》中的名句“海上生明月,天涯共此时”为考题,这句诗的意思是,在辽阔无边的大海上升起一轮明月,使人想起了远在天涯海角的亲友,他此时此刻也该是望着同一轮明月吧。

本题的得分点是看看各位选手能否用英文把整句诗的意境表达出来。好了,中文版的标准答案已经公布,那么五位选手的表现如何呢?

首先从句意上看,谷歌、微软和百度都直接放弃了后半句的翻译,有道把后半句译成“Tianya at this time”;在前半句的翻译上,微软和百度都用到了born这个词,但是微软的译文是“The sea is born”????

我们来看看DeepL,前半句和谷歌的答案一模一样,但是后半句的翻译是不是达到了信达雅的水平文摘菌不知道,但是读上去感觉非常舒服,大家也来品品:
在这里插入图片描述

第三题,也是最后一道压轴题,我们要考察的是各位选手对学术论文的中英互译。

学术论文的关键除了语句通顺外,还需要在专业词汇上做到准确,这也是本次考察的重点。

中译英部分,我们选择的是去年刊登在《国际新闻界》上的一篇文章,研究者调查的是社交媒体信任对隐私风险感知和自我表露的影响。

原文:实证结果显示:1.隐私风险感知与自我表露并无显著相关性;2.社交媒体信任负向影响用户的隐私风险感知,网络人际信任在其中发挥中介作用;3.社交媒体信任正向影响用户的自我表露,网络人际信任在其中发挥中介作用。

从翻译结果上看,五位选手给出的答案都比较让人满意,句型和语法也都没有问题,只是在一些具体的用词上各有千秋。比如,“自我表露”,DeepL和微软用的是“self-expression”,其余三位选手用的是“self-disclosure”;而“网络人际信任”,有道、百度和微软译成“network interpersonal trust”,谷歌给出“online interpersonal trust”的答案,DeepL则译为“cyber-interpersonal trust”。

照例,我们还是来看看DeepL的答案。

在这里插入图片描述
在英译中部分,我们选择了上周文摘菌报道的帝国理工大学论文的导论部分。在用户体验上文摘菌要插播一下,从中译英切换到英译中的时候,只有百度、有道和DeepL做到了自动识别,谷歌和微软仍需要手动选择语言。

原文:The global impact of COVID-19 has been profound, and the public health threat it represents is the most serious seen in a respiratory virus since the 1918 H1N1 influenza pandemic. Here we present the results of epidemiological modelling which has informed policymaking in the UK and other countries in recent weeks. In the absence of a COVID-19 vaccine, we assess the potential role of a number of public health measures – so-called non-pharmaceutical interventions (NPIs) – aimed at reducing contact rates in the population and thereby reducing transmission of the virus. In the results presented here, we apply a previously published microsimulation model to two countries: the UK (Great Britain specifically) and the US. We conclude that the effectiveness of any one intervention in isolation is likely to be limited, requiring multiple interventions to be combined to have a substantial impact on transmission.

从结果上看,五位选手的学术造诣都比较高,学术语言使用的规范性也都相差不大。但是,细节见真知,只有有道保留了双破折号的使用,但这在中文中其实并不常见;除有道外,其他三位选手在“非药物干预措施(NPI)”的表达上都没有做到尽善尽美。

仍然,笑到最后的还是DeepL,虽然还存在各种小问题,无法得到满分,但也是一张妥妥的高分试卷了:

在这里插入图片描述
以上就是本次测评全部的考题了,可以看出DeepL不愧是头号种子选手,不管是方言、文言文还是学术话语,都有不错的表现,看来DeepL官方还是很诚实的嘛。从Linguee蜕变,机器学习赋能DeepL

见识到了DeepL的“独秀”表现,接下来,我们就重点介绍一下本次测评表现最佳的头号种子DeepL。

不知道DeepL?那Linguee应该听说过吧,就是那个运营十多年的在线外语词典,DeepL的前身正是Linguee。Linguee是一款出现多年的翻译工具,尽管使用广泛,也有一批忠实用户,但其翻译质量尚无法与谷歌翻译相提并论,尤其是考虑到后者品牌和地位的巨大优势。

但真正重要的是Linguee的技术积累,Linguee的联合创始人Gereon Frahling之前就在谷歌研究院工作,2007年,他选择开启新的征程,团队数年来一直致力于机器翻译,直到2016年,他们才开始全力开发全新的系统,建设新公司,也就是DeepL。

Linguee的核心竞争优势就是爬虫和机器学习系统,前者能够抓取互联网上超过10亿句翻译结果和查询的大型数据库,后者在网页上搜索相似片段的真实翻译方法并对其评估,两者结合使Linguee成为了当时“世界上首个翻译搜索引擎”。

十年积累下来,Linguee无论在数据和对算法的研究上都不可小觑,而这也直接成为DeepL的绝对优势,为团队训练新模型打好了坚实的基础。
在这里插入图片描述

DeepL变革性的神经架构在冰岛的一台超级计算机上运行,该计算机能力为5.1 petaFLOPS(每秒5100万亿次操作),不到一秒内能翻译100万单词。“冰岛可再生能源丰富,因此我们可以在这里用非常低廉的成本训练我们的神经网络。我们将继续专注于高性能硬件”,DeepL的CTO Jaroslaw Kutylowski说。

“我们的神经网络架构已经实现了多个显著改善”,Gereon Frahling表示,“通过用不同的方式安排神经元及其连接,我们的网络比目前其他神经网络更全面地映射自然语言。”

大学、研究机构和Linguee的竞争对手发布的研究进展表明,卷积神经网络才是机器翻译的正确道路,而非DeepL之前使用的循环神经网络,但现在不是探讨二者区别的时候,对于相关词语的长、复杂字符串,只要你能够控制其弱点,卷积神经网络效果会更好。

例如,CNN一次处理一个单词,当句末单词决定句首单词的形成时,这就成了问题。查找整个句子寻找句首单词,如果网络获取到的第一个单词是错误的,就太浪费了,还得使用该知识重新开始,因此DeepL和机器学习领域的其他机构在CNN转向下一个单词或词组时,使用能够监控此类潜在问题的“注意力机制”来解决。

DeepL在最新版本增加了对日语和中文(简体)的支持,包括日语汉字,平假名和片假名以及数千个汉字。目前,DeepL支持的语言数量增加到11种,虽然语言支持不如其他翻译服务广泛,如Google Translate和Bing Microsoft Translator均支持一百多种不同的语言,但翻译精度也是不可忽视的关键点。

掌握多国语言的Techcrunch编辑Frederic曾这么评价DeepL:“谷歌翻译的风格非常直接,但却错过了一些细节和习语(或者把这些习语翻译错了),而 DeepL 经常可以提供更加自然的翻译效果,就像训练有素的人类翻译一样。”
官网链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/46144.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

程序员的需要掌握的数学知识

程序员的需要掌握的数学知识 人工智能跟开发 APP 、后台服务器、前端相比,人工智能需要大量的数学知识。一般都需要用到哪些呢? 微积分线性代数概率论最优化 关于书籍,特别说明一下,除非你是数学知识遗忘的特别厉害了,…

全网最详细中英文ChatGPT-GPT-4示例文档-读书书单推荐从0到1快速入门——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

从0到1快速入门读书书单推荐应用场景 Introduce 简介setting 设置Prompt 提示Sample response 回复样本API request 接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例 其它资料下载 ChatGPT是目前最先进的AI聊天机器人,它能够理解图片和文字…

使用 Python 进行网页抓取

如果您知道如何做到这一点,那么对于企业和个人使用来说,网络抓取似乎是一种非常有用的节省时间的工具。我们将重点介绍为什么您应该使用 Python 进行网页抓取,并为您提供有关如何完成它的快速教程,包括使用哪些Python 开发工具。 …

GPT-4太强,OpenAI也不懂!智能到底是怎么突然「涌现」的?

来源丨新智元 编辑丨LRS 点击进入—>3D视觉工坊学习交流群 2023年至今,ChatGPT和GPT-4始终霸占在热搜榜上,一方面外行人都在惊叹于AI怎么突然如此强大,会不会革了「打工人」的命;另一方面,其实内行人也不明白&#…

【视频课程】持续更新中!算法工程师如何从零掌握ChatGPT大模型

前言 自从2022年11月ChatGPT发布之后,迅速火遍全球。其对话的交互方式,能够回答问题,承认错误,拒绝不适当的请求,高质量的回答,极度贴近人的思维的交流方式,让大家直呼上瘾,更是带火…

GDOI2022游记

文章目录 Day -1Day 0Day 1Day 2Day 3()Day ?~?Day ? Day -1 考前好像写题状态不太好(可能是纯粹的懒)。 开始写板子,很多算法都很久没碰了,有的调了很久才过。树剖都调了一个多小时,身败名裂。不过想想省选应该不…

Web3.0与ChatGPT4如何开创未来创业机会?

随着Web3.0时代的到来,人们对于新一代互联网的期望越来越高,越来越多的企业开始关注区块链技术、人工智能技术和金融科技等方面的创新应用。在这个新时代的背景下,ChatGPT4作为最先进的自然语言处理技术之一,也将在未来创业机会中…

Virus Total 曝数据泄露大事件:涉及多国情报部门

The Hacker News 网站披露,可疑文件和病毒在线检测平台 VirusTotal 曝出数据泄露事故,一名员工无意中将部分 VirusTotal 注册客户的姓名、电子邮件地址等敏感数据信息上传到了恶意软件扫描平台,此举导致约 5600 名用户数据泄露。 据悉&#x…

深度学习博士自救指南

点击上方“AI遇见机器学习”,选择“星标”公众号 第一时间获取价值内容 来自|AI科技评论 编译 | 青暮、陈大鑫 关于如何攻读机器学习博士学位,这个嘛,主要是不要重蹈我的覆辙,哈哈。 你已经开始了博士的学习课程&…

NLP发展关键模型:BERT,GPT

文章目录 chat bot重大进展基于编码器的预训练模型word embeddingELMOBERT GPT:基于解码器的预训练模型GPT1:Improving Language Understanding by Generative Pre-Trainingfinetune如何实现实验 GPT2:Language Models are Unsupervised Multitask Learn…

GitHub更改username,注销账号的方法

小编很久之前就开始使用GitHub,那时候只要求能创建个账号,随便起了个username。 如今,随着GitHub深度使用,项目和粉丝都多了起来,对username也有了新的想法,毕竟username是显示在url里的。 方法&#xff…

[简易的网站登录注册,注销退出操作]

ml 数据库字段前端页面java处理信息 先看看最终效果吧 ;在登录提交时,前端页面会用JS点击事件判断; 1.首先判断的是账户框和密码框输入的是否符合规则(基本是判断不能为空,全部输空格是不允许的(用了字符串的trim()函数,将输入字符两边的空格去除,然后再判断),)然后就是密码不…

计算机账户注销重新登录,win10系统注销账户切换账号登录的方法

相信有很多用户在使用win10系统的电脑时经常需要切换账号进行登录,使用多个账号操作电脑的话可以对账号的一些权限进行限制,根据最高管理员对这些账户权限的分配可以限制某个账户对电脑进行某些操作,于是用户在使用的过程中就会遇到需要注销账…

如何注销Facebook账户

登录你的Facebook账户; 在浏览器键入地址:https://ssl.facebook.com/help/contact.php?show_formdelete_account,会转入以下界面 点提交后,再输入密码和验证码; 系统出现如下提示,并同时发一封邮件到你邮箱 然后确认删…

阿里云盘挂载本地

目录 一、先安装JDK,配置环境变量 二、获取refresh_token 三、Windows R -------> 输入cmd ------> 进入命令行模式 四、打开浏览器, 刺客边风!把64000GB网盘当成电脑本地硬盘用?最强网盘挂载本地盘神器&#xf…

阿里云linux挂载云盘

阿里云购买的第2块云盘默认是不自动挂载的,需要手动配置挂载上。 1.查看SSD云盘 sudo fdisk -l 可以看到SSD系统已经识别为/dev/vdb 2.格式化云盘 sudo mkfs.ext4 /dev/vdb 3.创建挂载点: mkdir /data 4.挂载 sudo mount /dev/vdb /opt (或mount /dev/vdb …

阿里云CentOS服务器挂载数据盘

1. 查看系统环境 lsb_release -a2. 查看磁盘分区情况 fdisk -l查看磁盘情况,该阿里云服务器对应的系统盘为vda:40G,数据盘为vdb2:1.7T。 3. 磁盘分区 输入fdisk /dev/vdb2 对数据盘进行分区。根据提示,输入 n, p, …

RaiDrive通过WebDAV挂载阿里云盘

有了阿里云盘后总是想怎么去折腾它,因为它的传输速度实在太快了,完全秒杀 “Bai度” ,因为电脑里面存的资料什么的比较多,笔记本只有一个 500G 的固态硬盘,感觉有点空间吃紧,所以想到了借助工具 RaiDrive把…

使用阿里云服务器安装AList

一、申请免费的服务器(需要学生认证) 打开链接阿里云学生云服务器免费申请,完成下面任务,即可免费申请一个2核2G的服务器 申请完成后,打开控制台, 重置实例密码 查看公网ip 二、安装步骤 1. 连接到服务器 使…

阿里云系统盘扩容及数据盘分区、格式化分区、挂载、取消挂载

系统盘扩容 重点注意: 1.如果出现ping不同或者ssh链接不上,解决办法,直接把/etc/fstab文件还原成默认就可以了(随便操作,退路以为你们留好) 2.分区后挂在会出现问题我这边分享个链接,不分区挂载…