翻译像机翻?4点教会你ChatGPT高质量翻译

a7f36c1d1767f41fe3628b11e8ebb4cf.jpeg如果完全靠自己的英文和中文水平,要达到这样的翻译速度和质量那是不太可能的,主要还是得益于ChatGPT的帮助,首先用GPT-4的API粗翻,再用ChatGPT Plus精翻。很多人都用过ChatGPT翻译,但翻译出来的结果比起Google翻译和DeepL这种,似乎翻译质量并没有好太多,但其实是你没有最大化的利用大语言模型的优势,如果你能善用ChatGPT(尤其是GPT-4)这样的大语言模型,可以让你的翻译质量提升一个大台阶。

那么大语言模型相对于传统的翻译工具有什么优势呢?

1. 可以根据Prompt产生不同的结果 使用大语言模型的时候,借助Prompt你可以提出很多个性化的要求,比如说:

  • 可以提供不同的翻译风格,比如你可以将翻译的结果更加口语化 - 你可以将某些专有名词使用特定的翻译(不会闹笑话把“LLM”翻译成“法学硕士”)。
  • 你可以提供上下文让翻译更有针对性,比如说这是一篇 AI 相关的技术文章,尽可能翻译成专业术语。
  • 你可以让它识别错别字,比如在语音转文字时,经常会产生错别字,或者翻译完成也可能会有错别字,这些错误人工纠正很容易疏漏,可以让AI帮你纠正,又快又准。
  • 可以提供背景解释,大语言模型背后有一个超级庞大的知识库,几乎囊括了互联网所有的公开信息,有时候我们在翻译时,遇到一些因为文化背景不一样的内容,很难理解其中的含义,这时候就可以让大语言模型帮你解释,帮助你更好的理解。
  • 等等


当然缺点也有:

1. 价格高(如果是API比较贵,包月的ChatGPT Plus其实性价比还是挺高)

2. 速度慢,比谷歌翻译和DeepL这些速度要慢 这里分享一下我使用ChatGPT帮我翻译字幕的经验。

一、写好Prompt

用ChatGPT的第一条就是写好Prompt,如果你只是写“请将我翻译以下内容为中文”,也能得到一个还不错的结果,但这样只是把ChatGPT当DeepL来用了。但如果你能写一个高质量的Prompt,那么就能得到更好的结果。一个好的Prompt的结构

  • 角色、技能、个性
  • 目标、任务
  • 生成规则
  • 输入输出格式
  • 示例

比如我通常会给它先设定一个角色: “你是一位精通简体中文的专业翻译,写作风格是短小精悍、通俗易懂。” 然后给它的任务:“现在你要帮我将以下英文字幕翻译成中文” 再加上一些规则:- 忽略错别字或者拼写错误 - 翻译时结合上下文意译而不是直译 - 译文通俗、简洁、易懂 - 英文单词前后加上空格 在有些情况下给出示例,比如说:“英文单词前后加上空格,例如"中 English 文"” 有时候会说明输出格式:“提供 5 种不同类型的翻译风格:意译、直译、口语化翻译、创意翻译、文学翻译”。

二、提供足够的上下文,但一次只翻译一段,并且提供多个翻译结果选择使用

ChatGPT时,如果提供足够的上下文,那么有助于ChatGPT更好的理解要翻译的内容,给出更好的结果。所以我在翻译字幕时,会尽可能将完整字幕一次性输入,这样ChatGPT可以看到完整的内容,能更好的纠正错别字、给出更好的翻译结果。但我每次只让ChatGPT翻译一段,因为输出结果太长的问题在于:1. 很容易超出最大上下文长度,比如我输入完整英文字幕,让ChatGPT完整翻译,通常最后一部分会无法正常输出,产生“幻觉”,因为超出了最大上下文长度。2. 输出内容长的话质量要低一些,参考论文《Lost in the Middle: How Language Models Use Long Contexts》但是一次翻译一段的话,缺点就是速度慢一些,翻译完一段又要输入一段。但是对于精翻来说还可以接受,因为本来就需要慢工出细活,逐句斟酌。 另外还有一个很重要的技巧,就是翻译的时候,让ChatGPT一次提供3-5个不同风格的翻译结果,然后你就可以得到很多不同角度的翻译结果,大部分时候,你只要从这几种不同翻译结果里面选一个就可以了。ChatGPT这类大语言模型是一种概率模型,根据概率生成内容,有时候很难一次就得到一个很好的结果,所以要得到好的生成效果,可以让它一次多生成几种结果,然后你可以从中选一个最好的,甚至于你可以让它自己帮你选一个。有的时候,它能随机出来相当不错的翻译结果,所以大部分时候就只要从几个翻译选项中选一个最好的,或者组合一下。

三、追问,帮助更好的理解原文

有时候就算它提供了若干翻译选项供选择,但还是很难理解什么意思,这时候就可以在ChatGPT中追问。比如上一次我在翻译Sam Altman一段关于授权的回复时,他说:“setting the training wheels at the right height and increasing them over time as people learn more and I build up more trust.”,然后ChatGPT的翻译结果是:“适当地设置“训练轮”,并随着人们学到更多知识和我对他们的信任增加而逐步提高。”。说实话我是没看懂,如果我直接就这么翻译,从字面上理解也没问题,但是肯定有很多人像我一样看不懂什么意思。于是我就继续问ChatGPT:“能不能详细解释一下这里的"setting the training wheels at the right height"?” 于是ChatGPT给我详细解释了这里的意思:> “设置合适高度的训练轮”这个短语可以理解为在团队管理和人员培养方面,为新员工或团队成员提供适当的支持和指导,而不是一开始就给予他们太多的责任和压力。这里的“训练轮”可以比喻为在员工成长和学习的初期阶段提供的辅助工具或支持,而“合适的高度”则意味着这种支持和指导应该是适度的,既不能太少也不能太多,以便他们能够逐步学习和适应,最终能够独立完成任务和承担更多的责任。随着时间的推移,这些“训练轮”会逐渐提高,意味着给予员工更多的自由和责任,让他们有更多的机会来展示他们的能力和潜力。我继续问:“请按照上面的解释重新翻译”,于是我得到了一个新的翻译结果:“我们要像调整孩子自行车上的辅助轮那样,为他们设定合适的支持和指导,随着他们的学习和我对他们的信任逐渐增加,我们可以逐步提高这个“辅助轮”的高度。” 这样就容易理解多了,因为“training wheels”是特指自行车的辅助轮,其实去年教孩子学自行车我就知道这单词,但是没有那么熟悉,尤其是一开始被翻译成“训练轮”,我很难将它和自行车的辅助轮联系起来,但是你一追问,那么ChatGPT就能从多个角度帮你分析解释,这样译者就能更好的理解原文的意思和背景,从而提供更为准确的翻译。我觉得现在很多著作的中文翻译很晦涩难懂,很多时候是因为译者自己都没看懂,只能按照字面意思翻译,如果他们借助ChatGPT理解背后的意思,那么就能提供更好的翻译结果。

四、使用时避免上下文超长

ChatGPT这类LLM有个天然缺陷,就是上下文窗口无法太长,比如ChatGPT Plus,按我的经验,GPT-4大约8K的Token就是上限了,差不多~6000英文、~4000中文的样子。如果超出这个长度,后面的内容会出现幻觉,也就是胡说八道,出来的结果跟你输入的完全不相关。避免这个问题有两个小技巧:1. 优先使用Advanced Data Analysis(以前叫Code Interpreter)模型,这个模型上下文窗口明显能长一些2. 多用ChatGPT的编辑功能 如果你在ChatGPT中不停地回复新内容,那么每次生成的时候都会把历史消息都加入发送过去,这样越到后面占用的Token越多,一会就会超出上限。但是如果你每次只是编辑消息的话,它就只修改,不新增。所以我通常第一条消息发Prompt,第二条消息用来编辑,不停的变更要翻译的段落,这样每次都只有2条消息,基本不会超过上下文长度上限。

补充

关于消息编辑的功能使用: 我每次翻译字幕的时候,都把完整字幕输入给GPT,然后告诉它,先不要翻译,只回复OK,后面等我发新的了,你就按照我的XX要求去翻译,提供5个选项。这样我后面只要一直编辑第二条消息(参考图1),将我要翻译的段落放进去,不需要再写Prompt,然后保存发送后就自动给我翻译这一段内容,提供5个选项。并且第一条消息有完整的字幕内容,这样就算后面我发送的只有一段,它也能从第一条消息找到完整的上下文。

1db392c77cf94dbdb22c03caf7e2a2a1.jpeg

另外有时候Whisper识别字幕的时候,会产生错别字,可以直接问ChatGPT是不是有错误,它可以指出是不是有问题。

4bea46fd19e071f62e59f4b6d37afea9.jpeg

附:图一:用来让ChatGPT翻译的Prompt

1226d334a387b44c52cf3db114795e39.jpeg

图二:追问,更好的理解上下文,得到更好的翻译结果

08ef17d5cc8f00c1d495f208ec565e61.jpeg

图三:不同翻译风格的结果

49d55036eac27055ae5dba0aa3d03785.jpeg

图四:使用编辑功能避免上下文超长

ce9d63739eb208cc41cc06d7d1f90182.jpeg


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/141378.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#通过重写Panel改变边框颜色与宽度的方法

在C#中,Panel控件是一个容器控件,用于在窗体或用户控件中创建一个可用于容纳其他控件的面板。Panel提供了一种将相关控件组合在一起并进行布局的方式。以下是Panel控件的详细使用方法: 在窗体上放置 Panel 控件: 在 Visual Studio 的窗体设计器中,从工具箱中拖动并放置一…

离散小波变换(概念与应用)

目录 概念光伏功率预测中,如何用离散小波变换提取高频特征概念 为您简单地绘制一些示意图来描述离散小波变换的基本概念。但请注意,这只是一个简化的示意图,可能不能完全捕捉到所有的细节和特性。 首先,我将为您绘制一个简单的小波函数和尺度函数的图像。然后,我会提供一…

链表oj题1(Leetcode)——移除链表元素,反转链表,链表的中间节点,

链表OJ 一,移除链表元素1.1分析1.2代码 二,找到链表的中间节点2.1分析2.2代码 三,反转链表3.1分析3.2代码 四,找到链表中倒数第k个节点4.1分析4.2代码 一,移除链表元素 移除链表元素 1.1分析 这里的删除要分成两种…

Android Jetpack组件架构 :LiveData的使用和原理

Android Jetpack组件架构: LiveDate的使用和原理 导言 继Lifecycle组件之后我们接下来要介绍的就是LiveDate组件,所谓LiveDate字面意思上就是有声明的数据,当数据有改动时该组件可以感知到这个操作并将该事件通知到其观察者,这样…

屏幕分辨率dpi解析(adb 调试查看)

authordaisy.skye的博客_CSDN博客-嵌入式,Qt,Linux领域博主 ro.sf.lcd_density属性指定了这个机型使用的dpi是多少,dpi全称是dots per inch,对角线每英寸的像素点的个数。 密度 ldpi mdpi hdpi xhdpi xxhdpi 分辨率 240x320 320x480 480x800 7…

2023-9-25 耍杂技的牛

题目链接&#xff1a;耍杂技的牛 #include <iostream> #include <algorithm>using namespace std;typedef pair<int, int> PII;const int N 50010;int n; PII cow[N];int main() {cin >> n;for(int i 0; i < n; i ){int w, s;cin >> w >…

Android 10.0 系统开启和关闭黑白模式主题功能实现

1. 概述 在10.0的rom系统开发定制化中,在系统SystemUI的下拉状态栏中,产品开发功能需求要求添加黑白模式功能开关的功能,就是打开黑白模式,系统颜色就会变成黑白颜色, 关闭黑白模式开关系统就会变成彩色模式,所以就需要了解下系统是怎么设置黑白模式和彩色模式的,然后添…

接口自动化测试之Mock

【软件测试面试突击班】如何逼自己一周刷完软件测试八股文教程&#xff0c;刷完面试就稳了&#xff0c;你也可以当高薪软件测试工程师&#xff08;自动化测试&#xff09; 1.Mock实现原理和实现机制 在某些时候&#xff0c;后端在开发接口的时候&#xff0c;处理逻辑非常复杂&a…

Android跨进程通信:Binder机制原理

目录 1. Binder到底是什么&#xff1f; 2. 知识储备 2.1 进程空间划分 2.2 进程隔离 & 跨进程通信&#xff08; IPC &#xff09; 2.3 内存映射 2.3.1 作用 2.3.2 实现过程 2.3.3 特点 2.3.4 应用场景 2.3.5 实例讲解 ① 文件读 / 写操作 ② 跨进程通信 3. Bi…

C#中的(++)和(--)运算符

目录 背景: 的前加 效果展示:​ 的后加 效果展示 :​ 总结: 背景: 自增和自减运算符存在于C/C/C#/Java等高级语言中&#xff0c;它的作用是在运算结束前(前置自增自减运算符 )或后(后置自增自减运算符 )将 变量的值加(或减)1。 在C#中&#xff0c;和--是自增和自减运…

基于springboot小区疫情防控系统

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战 主要内容&#xff1a;毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询 文末联系获取 项目介绍…

前端Vue3+element-plus表单输入框实现Cron表达式校验

页面如下&#xff1a; 本来想手写正则表达式校验&#xff0c;结果发现很麻烦&#xff0c;cron表达式组成如下&#xff1a; 开发使用框架为vue3element-plus&#xff0c;于是选择cron-validator依赖。使用步骤如下&#xff1a; 1、通过npm install cron-validator命令安装&…

面经分享 | 某康安全开发工程师

本文由掌控安全学院 - sbhglqy 投稿 一、反射型XSS跟DOM型XSS的最大区别 DOM型xss和别的xss最大的区别就是它不经过服务器&#xff0c;仅仅是通过网页本身的JavaScript进行渲染触发的。 二、Oracle数据库了解多吗 平常用的多的是MySQL数据库&#xff0c;像Oracle数据库也有…

想要精通算法和SQL的成长之路 - 最长回文子序列

想要精通算法和SQL的成长之路 - 最长回文子序列 前言一. 最长回文子序列 前言 想要精通算法和SQL的成长之路 - 系列导航 一. 最长回文子序列 原题链接 首先&#xff0c;我们看下动态规划方程的定义&#xff0c;我们用dp[i][j] 来代表&#xff1a;字符串s在下标区间为[i,j]之间…

Unity入门教程(上)

七、运行游戏 再次保存我们的项目文件&#xff08;返回步骤四&#xff09;。保存完成后&#xff0c;让我们把游戏运行起来。 1&#xff0c;确认游戏视图标签页右上方的Maximize on Play图标处于按下状态&#xff0c;然后点击画面上方的播放按钮&#xff08;位于工具栏中间的播…

网络竞品分析:用爬虫技术洞悉竞争对手

概述 网络竞品分析是指通过互联网收集、分析和比较竞争对手的信息&#xff0c;以了解他们的优势和劣势&#xff0c;找出自己的差距和机会&#xff0c;制定有效的竞争策略。网络竞品分析涉及的信息包括竞争对手的产品、价格、渠道、营销、用户反馈等方面。爬虫技术是一种自动化…

看板系统如何异地电脑手机访问?主机内网ip端口映射域名外网访问

看板系统是一种可视化管理系统平台&#xff0c;如生产管理看板、项目管理看板、APP运营看板等将企业或工厂本地项目具体数据转换成图表模式&#xff0c;方便实时管理和汇总&#xff0c;有效提升工作效率和助力生产实践。 单位内部服务器部署了看板管理系统&#xff0c;由于无公…

Wespeaker框架数据集准备(1)

1. 数据集准备(Data preparation) 进入wespeaker目录文件/home/username/wespeaker/examples/voxceleb/v2 对run.sh文件进行编辑 vim run.sh 可以看到run.sh里面的配置内容 #数据集下载&#xff0c;解压 stage1 #插入噪音&#xff0c;制作音频文件 stop_stage2 #数据集放置…

【密码学补充知识】

&#x1f511;密码学&#x1f512;概述 &#x1f4d5; 1.基本概念 明文 &#xff1a; 要交换的信息 密文 &#xff1a; 明文经过一组规则变换成看似没有意义的随机消息。 加密 &#xff1a; 明文经过一组规则变换成密文的过程 解密 &#xff1a; 密文恢复出明文的过程 加…

2023-Chrome插件推荐

Chrome插件推荐 一键管理扩展 链接 https://chromewebstore.google.com/detail/lboblnfejcmcaplhnbkkfcienhlhpnni 介绍 一键开启、禁用Chrome插件。 Checker Plus for Gmail™ 链接 https://jasonsavard.com/zh-CN/Checker-Plus-for-Gmail https://chromewebstore.goo…