跨越AI大门,一本翻译蓝皮书、一场人机共译比赛投射出怎样的未来?

a6b99db4e6911f5b137bece1948e0a6c.jpeg

大语言模型LLM是这几个月热度最高的全球明星。目前看来,AI逐渐走向复杂专业的白领型岗位,已经是必然的趋势。

OpenAI刚刚发布的35页论文中,提到了最容易受到LLM影响的职业中译员和笔译员排名第二。

以前机器翻译就是出国旅游时拍拍路标、看看菜谱,现在GPT-4连学术论文里的复杂长难句、专业术语都能理解,“人肉翻译”越来越没优势。

生成式AI能直接模拟已故的翻译家,输出大师风格的译文,一般人做翻译还有什么前途?

调用ChatGPT翻译一本中等部头的英文书,只需要花大概十个小时、四美元,人工翻译卷到天际也达不到这样的性价比……

这段时间,外语专业学生和翻译从业者们有类似心情的人不在少数。

根据中国翻译协会的调查,中国的翻译人才的规模是538万人,其中本科以上的中青年为主,这些年轻、专业、高素质的人才如果离开了翻译行业,岂不可惜?

所以,我们应该尽快回答这些问题:AI时代,我们为什么还需要人工翻译?翻译人才要怎么跨入AI的大门?译者+机器的人机协作,有哪些必要条件?

幸好,翻译行业的反应速度远比我们想象得快。4月3日至4日,2023中国翻译协会年会举办,百度翻译联合中国外文局翻译院、中国翻译协会翻译技术委员会,共同发布了《2023机器翻译技术及产业应用蓝皮书》。

《蓝皮书》系统阐述了机器翻译的发展历程和方向,介绍了产业级机器翻译系统和产品形式,并通过实际案例展示了机器翻译产业应用现状,对机器翻译未来发展提出建议。为推动机器翻译技术与各行业的深度融合提供有益借鉴,为机器翻译技术的产业应用提供有力支持,其客观、全面、权威的信息,也成为翻译人才把握当下趋势的权威参考。

(《2023机器翻译技术及产业应用蓝皮书》视频简介)

同时,在译协年会上,由百度翻译提供技术和平台支持的“首届全国翻译技术大赛”正式启动,预计赛制持续到8月,也为中国翻译人才拥抱技术提供了竞技舞台和窗口期。

没有人会怀疑,我们正处在一个非常重要的历史转折点。面对大语言模型等最新AI技术带来的无数可能性,中国翻译人才可以不焦虑、不盲目、有底气的进入人机共译新阶段。

26954db89a1f9522986da40349af29eb.png

不焦虑:

“见识过‘珍妮纺纱机’,

我还是选择当翻译”

49f6743bcebbc940611e24167664745b.png

在翻译行业工作多年的小A表示:太阳底下无新事,翻译人见过的“AI威胁论”并不少。

2016年,翻译领域就曾出现过类似的“珍妮纺纱机时刻”。当时,一篇名为《翻译界的重大突破!作为一个翻译,此刻我理解了18世纪纺织工人看到蒸汽机时的忧虑和恐惧!》的文章,传遍了翻译人的朋友圈。

不少译员和外语系学生就像在手工棉纺织时代,看到了由蒸汽机带动的珍妮纺纱机,能同时纺8卷线一样,感到非常担忧。

原来,百度于2015年发布了全球首个互联网神经网络机器翻译系统。随后,谷歌、微软相继部署了以神经网络作为基础的机器翻译系统。这种机器翻译技术,通过建立深度神经网络模拟人类的翻译过程,在语言表示、语义理解、译文生成等方面有显著进步,让机器翻译的质量大幅提升。结果呢?今天人类翻译依然存在,而大众使用翻译服务的门槛则大大降低了。

更早一点,上世纪末的翻译人,也曾遇到过“珍妮纺纱机”。九十年代,统计机器翻译方法的出现,可以基于大规模语料自动训练模型参数,这种方式不需要人工专家来构建翻译规则,比基于规则的机器翻译效率更高、效果更好,弥补了当时国内高水平的专业翻译人才匮乏、不能满足实际需求的问题,让更多高质量的译著走出了国门,走进大众视野。

作为一种更古早的机器翻译技术,基于规则的机器翻译,其实也曾是人类眼中的“珍妮纺纱机”。上世纪五十年代,哪怕穷尽全球翻译家们一生的力量,也只能掌握几十种语言,译著只占人类作品总量的冰山一角,通过计算机自动完成翻译,解决全球沟通和交流的问题,也带来了翻译业态的快速发展。

把时间拉回到当下,以 ChatGPT、文心一言为代表的新一代预训练模型技术,通过超大规模的数据和充分训练实现了智能涌现效应,大幅提升了机器翻译的鲁棒性和容错能力。

57ee71d1ee0e1a0c9db100625fe6d63c.png

所以说,机器翻译从来没有真正消灭人工翻译,这是历史上被多次证明的,反而机器翻译让高质量翻译人才的需求更加旺盛。

面对新的机器翻译技术,翻译人才对于“珍妮纺纱机”的恐惧,更多是源于对于自身发展的不确定。幸好,这种“不确定”正在被“国家队”所改变。

在刚刚发布的《2023机器翻译技术及产业应用蓝皮书》中,中国翻译协会的调研数据显示,有超过 85% 的受访者认为“机器翻译 + 译后编辑”的工作模式会在更大范围内应用。

674f068fd77e2faff6009bf6311a1859.png

《蓝皮书》认为,机器翻译成为人类译员的得力助手和有效补充,促使翻译行业催生出更多如译后编辑、机翻质量控制等新职业,正在多种场景中被应用。

简单举几例:

1.加速短视频、网络文学等中国优质内容出海。人人译视界助力 B 站的海外达人项目,完成三百多个频道的译制工作;晋江文学城、米读小说 APP使用针对网络文学垂直领域定制优化的机器翻译系统,将大量本土网络文学作品翻译成英语、西班牙语、葡萄牙语等语种,获得海外用户的青睐。

2.助力企业海外市场经营。中石化的企业智能翻译平台,支撑境外财务票据核销、重大项目审计、合规备案等翻译工作;新华社的“新华丝路”, 引入智能翻译平台,辅助人工译员提高翻译效率。

3.支撑各行各业数字化建设。译马网引入“AI+人工” 的译后编辑模式,日均翻译字数可提升近 4倍,翻译成本降低 34%;迈迪培尔开发的医药等垂直领域机器翻译,为科研人员的研究工作提供了极大便利。

总之,翻译领域的新机会还有很多,更详细的信息,大家可以在《蓝皮书》中阅览。

机器翻译大有用武之地,高端翻译人才也是时代所需。二者相辅相成,可以满足不同层次的翻译需求,在获取全球信息、对外交流等方面将发挥越来越重要的作用。

作为普通人,要做的是学习驾驭最新的“珍妮纺纱机”,把机器翻译用好,不是留恋做一个“手工纺纱人”。

80a1747fbe58b05f12737c5e78f3785a.png

不盲目:

从朦胧到清晰的人机协作之路

那么,“AI+人工” 的译后编辑工作模式下,究竟怎样才算用好AI技术?人机共译,需要具备哪些技能?

《蓝皮书》提供了方法论,呼吁培养 “翻译 + 技术 +N”的精翻译、懂技术、能力强的新时代高端翻译人才。首届全国翻译技术大赛,则提供了具体的实现路径。

要将AI技术和机器翻译作为得力助手,人类译员想要提高技能,也不能盲目。

“首届全国翻译技术大赛”,由中国外文局、全国翻译专业学位研究生教育指导委员会指导,中国翻译协会、中国外文局翻译院、大连外国语大学主办。百度翻译作为承办单位之一,提供翻译技术与比赛平台支持。

150b68aa44dd66cc5f40d9b40937bd83.png

从阵容中不难看到,赛事为推动行业各方对机器翻译技术的了解和应用,提供了清晰的方向和路径:

1.清晰的培养方向。

举办方是百度翻译,和翻译行业的“国家队”,保证了比赛涉及内容的前沿性和权威性,同时,赛事向各类翻译爱好者开放,高校学生、翻译机构、企业单位等都可以参与,人才覆盖面广。

由此证明,复合型翻译人才的培养,AI+翻译融合学科的建设,离不开政产学研用多方形成合力,提供更充沛的实践机会和更明确的方向引导。

2.清晰的技能标准。

中国的翻译人才要开启“人机共译”工作新范式,需要具备哪些核心能力?比赛考核点的设计,也给出了清晰的答案,让人才能够不再迷茫,提早培养自身的竞争力。

比如以往的翻译比赛,主要考察人类译文的准确性、优美性,而此次比赛,还将对机器翻译的掌握,纳入了考核,包括对机器翻译软件内置功能是否熟悉,操作熟练度如何,是否充分运用了技术,做到真正以赛促学,帮助大家掌握先进的机器翻译工具。

c7a7a0a589cfd76b347244aa22377d11.png

(译后编辑能力考察:术语替换题)

3.清晰的产业基石。

大赛由百度翻译提供技术和平台支持,背后也有着深度的考量:中国翻译综合能力的提高,要建立在怎样的机器翻译底座上?

选择百度翻译,一是技术领先,百度于2015年自主研发的全球首个互联网神经网络翻译系统,能够快速提高翻译产能,是较为先进的机器翻译工具。

二是平台能力,百度智能文档翻译平台的创新人机共译模式,将机器翻译(Machine Translation)+ 译后编辑(post-editing)+ 模型自学习相结合,让机器翻译结果越用越准,效率不断提升。

三是应用丰富。百度智能文档翻译平台,提供术语参考、翻译记忆、智能纠错等功能,内置权威术语,查证更省力,在工作中真正为人类译员减负。

从底层技术到上层应用的优势,是百度智能文档翻译平台“被选择”的原因,也为翻译行业和翻译人才接下来的发展提供牢靠的支持。

翻译人才如何跨入AI的大门,从首届全国翻译技术大赛开始,路径正从朦胧走向清晰。

4080087c76e1ebfa34b14cc22675ead9.png

(产业级机器翻译系统流程图)

有底气:

从一群人的比赛,

到全民的新可能

92f51c6aa9c9b4e857975b1a68f2e0f5.png

你可能会问:我又不当译员,机器翻译的发展跟我又有什么关系呢?

当然有。

从基于规则的机器翻译,到大语言模型驱动的机器翻译,机器翻译技术的每一次更迭,都会让全社会、全世界广泛受益。

你读到的一部译本,与海外朋友的一次对话,境外旅游时的无碍沟通,前沿论文的快速传播……翻译成本不断降低,以前需要请一个翻译,现在手机app/翻译笔就能搞定;体验越来越丝滑,原本要分段复制粘贴的学术论文,现在整个丢进百度智能文档翻译,就能直出全部译文,还带还原版式,阅读效率也高多了。

对于个人来说,跨语言沟通、学习和交流,是成长和进步的基础,通过百度翻译这样的智能产品获得更高质量、更低成本的翻译服务,减少了很多不必要的时间和操作,某种程度上来说,是一种人生的提速。

5c7e6597372af9117c4ebd45f8747406.png

对于企业来说,产品出海或跨境贸易,需要在翻译上投入高成本,有时还不能快速到位,一些翻译相关业务场景需要定制化开发,缺乏相应的人才。

《蓝皮书》中提到国内某世界500强企业,需要通过海外媒体报道和电商渠道的消费者评论等信息,进行海外市场经营决策,涵盖近百种语言,每月翻译需求超百亿词,涵盖文本、文档、图片等多种形态,海量而冗杂的翻译任务,全靠人工根本没办法及时跟进最新市场动向。

中国企业要“走出去”,AI+机器翻译,是必不可少的辅助。

百度翻译从模型到应用的丰富能力,背靠百度生态,可与计算机视觉、语音处理等人工智能技术深度融合,全面、及时、深入响应不同行业不同场景的业务需求。

ba6575c4fc76cf280aba4d9f1b3eec50.png

对国家来说,翻译能力是国家软实力的一部分。

中国外文局局长、中国翻译协会会长杜占元指出,国家翻译能力,是通过翻译行为建构对外话语、开展文化传播、塑造国家形象的综合能力,是文化软实力和国际传播能力的重要组成部分,也是发挥大国作用、提升国际话语权的重要保障。

从这个角度看,加强国家翻译能力建设,除了传统手段之外,机器翻译的技术领先性、安全性、可用性愈发重要。

05e66017737f46643c05418e2323f4b1.png

百度在大模型技术、大语言模型(LLM)、自然语言处理(NLP)方面深耕多年的技术储备和领先实力,从芯片、深度学习框架到翻译模型的核心模块自研能力,让百度翻译有望成为首屈一指的产业级机器翻译系统,在翻译行业智能化、数字经济交流中发挥作用。

这些力量融合起来,才推动中国翻译来到新的转折点。而一个沟通无碍、高效的新世界,会让一个人、一个企业、乃至一个国家,都获得新的机会与可能。

1999年,万维网的发明者、互联网之父Tim Berners-Lee,就曾提出过一个概念:social machine(社会机器),即人与机器的协作体。人负责创造,而机器负责执行。当时,最热的机器是家用电脑,全国都兴起一股“电脑热”,各种电脑培训班、电脑操作书籍纷纷问世,和今天的“AI热”差不多。

如果你不会恐惧电脑、抗拒电脑,那当然也不应该恐惧AI。AI时代,我们仍然需要人类译者,语言的通天塔一天没有越过,翻译的火种便会生生不息。

个人对机器翻译的不同态度和选择,将迎来不同的命运,但愿你的选择,映射的是你的希望,而非恐惧。

b694ceac14f25dd3786491b19ec1dcdf.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11580.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

勇创世界一流!移动云为我国数字经济发展提供有力支撑

今年2月,中共中央、国务院印发了《数字中国建设整体布局规划》,通过顶层设计及布局,擘画了我国数字经济发展蓝图。近日在国新办举行的第六届数字中国建设峰会新闻发布会上,相关负责人也对我国数字经济现阶段取得的成绩进行了总结&…

第1章信息化发展

广义的信息技术可以追溯到3500~5000年前人类语言的形成和使用,信息技术持续经历了文字的创造、印刷术的发明、电脉冲和电磁的发现与应用、计算机技术发展、新一代信息技术应用等历程。可以看出,信息技术的发展历程,伴随着人类信息沉淀的丰富、…

2023,VC投资的分水岭

作者:矛哥 首发于公众号:常垒资本(ID:conswall_cap) 题记 人生就是不断地“把握时间,掌握方向”,难过的事情总会过去,也会被遗忘。 我一直觉得,人生就像一条路&#xff0…

李彦宏百度内部讲话:“层层递减”不可取,提高站位看长期

雷递网 乐天 1月6日 2022年底,中国科技互联网公司仿佛有默契地一起释放调整信号,强调新一年要降本增效、更看重稳健经营。 2022年12月末,百度举办全员会(内部称为“简单之约”),百度创始人、董事长兼CEO李彦…

ChatGPT或致全球3亿人失业,人工智能时代下教育会发生什么样的变革?

不久前,谷歌教育发布了一份关于未来教育的研究报告。该报告由谷歌公司和 Canvas8合作,对来自世界24个国家的94位教育专家进行了历时长达2年的调研,探讨了未来教育形态、教育在未来的作用、教育公平、全球人才需求、教学方式、学习生态、工作技…

中国开源创新启示录!

作者 | 郑丽媛、屠敏 出品 | CSDN(ID:CSDNnews) 开源是科技创新的重要模式,也是数字经济发展的底座。2021年,“开源”首次被明确列入“十四五”规划,上升至国家战略层面。2022年1月发布的《“十四五”数字经…

ChatGPT:机器学习的下一个大步骤

Chatgpt | Chat | Gpt | 小智Ai | Chat小智 | Gpt小智 | ChatGPT小智Ai | GPT小智 | GPT小智Ai | Chat小智Ai 丨 机器学习是人工智能领域的重要分支之一,已经广泛应用于各个领域,例如自然语言处理、计算机视觉、智能推荐等。然而,当前的机器…

活着也是修行啊

禅的行囊,比尔波特,美国禅宗居士,讲的是他2006年到中国参访禅宗各代祖师道场的经历。六祖惠能说入世修行,挑水生火做饭走路都是修行。 我个人虽然是佛教华严宗居士,不是禅宗居士,但我仍然很同意六祖惠能的观…

好的用户界面-界面设计的一些技巧

效率工具传送门 推荐20套实战源码 程序员你可以考虑安装的15款谷歌插件 99%的人不知道搜索引擎的6个技巧 12款好用的Visual Studio插件,最后一款良心推荐 如此有用的文章我已记不得是什么时候发现的了,但在看完的那一刻便想将之翻译,分享…

中间件概念-入门

中间件(middleware)是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务器的操作系统之上,管理计算资源和网络通信。中间件(middleware)…

其实真正的互联网公司是很少的很少

(1)商品 商品有很多种类型, 比如说文化商品,如新闻、图书、音乐、影视、游戏 比如说服务商品,如机票、酒店、景点门票、租自行车、出租车 比如说实体商品,如京东上卖的那些实体商品 现在拷问大家一下&#…

召回、精确、准确,这些让人头大的概念一文全讲清楚

本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习真题的第17篇文章,我们来讲讲机器学习模型的评估。 在之前的文章当中我们已经介绍了好几个模型了,有朴素贝叶斯、KNN、KMeans、EM还有线性回归和逻辑…

Activity (一)工作流简介 :概念与由来

个人博客网:https://wushaopei.github.io/ (你想要这里多有) 1、工作流 简单的理解就是工作的流程,这里的流程指的是,完成一个企业中具体业务的一系列工作步骤,所有的步骤合在一起就是业务从开始到结束的流转过程。从计算机系…

套用这套模板,玩转周报、月报、年报更省事

马上就要到年中了,相信不少打工人开始慢慢有些焦虑了。因为半年报又要来了。 对于大部分公司而言,不管大小,半年报是必定的。大点的公司更可怕,日报、周报、月报,还想让你当成福报;小公司稍微好点&#xf…

在数据可视化这条路上,除了天天做图表,还有更重要的3件事

在这个数据大爆炸的时代,如何从成千上万的数据中梳理出一条解决问题提升效益的最优解,成为每个职场人都需面临的挑战。 一、这是个可视化的时代! 知乎上有个热门话题:数据可视化。对此领域的问题已经将近3000条,3.3万…

区块链概念股2019:躁动与尴尬 |链捕手

在今年的区块链行业,加密货币市场风波不断,至年底一片萧条,但对二级市场中的区块链概念股而言,它们在轮番的利好刺激后受到投资者的广泛追捧,整个行业至少经历了三波上涨潮。东方财富Choice数据显示,今年初…

Chrome浏览器Postman插件安装包及安装教程

最近电脑装了新环境,以前本地的postman安装包竟然找不到了,网上费尽心力找了很多资源,终于找到纯净的安装包,绕开套路,现将Postman安装包及安装教程分享给各位,供大家学习交流~ 网盘链接: 百度网盘 请输入…

苹果限制员工使用ChatGPT等外部AI工具,只因担心泄密!

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 众所周知,今天 OpenAI 官方推出了 iOS 平台的 ChatGPT 应用程序。 然而,在路透社和华尔街日报的报道中,却提及了另外一则与之相关消息——苹果已经通…

卖家需掌握的速卖通运营思路

好的产品是基础,所以卖家要注意全球速卖通的选择。如果你想做好全球速卖通选拔,你必须学习一些全球速卖通选拔的技巧。 全球速卖通选择技巧一 首先要知道买家需要什么,当前市场喜欢什么,什么产品会有更好的市场。如果反其道而行之…