400-638-8808
|
微信公众号
ChatGPT 翻译的精度取决于以下几点
我们都知道,GPT 的意思是生成式预训练 Transfomer 模型(Generative Pre-Trained Transformer)。它的能力很大程度上取决于用来训练的数据的数量和质量。GPT4 训练的数据更为庞大,也纳入了更多人类的反馈来提升准确度,因而在翻译能力上有了很大提升。
和 ChatGPT3.5 不同的是,ChatGPT4 在翻译一些小语种的过程中会采用两个步骤—首先会把文本翻译成英语,然后再翻译成目标语言。一些使用人数比较少的小语种,相应的训练数据也比较缺乏,因此翻译的精度也比较低。转化为英语之后,拥有了更庞大的数据支持,翻译的质量也相应得到提升。
下面的表格摘自一篇学术论文,从第一列到第五列依次是语言名称,编码,用该语言作为母语和第二语言的人数,语料库中的数据比例,语料库中的数据比例,以及分类(高资源 H,中等资源 M,低资源 L,以及极低资源 X)。
通常来说,对于那些训练语料非常丰富的语言,比如英语,西班牙语,德语,法语等,翻译的精度比较高,而对于那些没有足够语料的语言,比如印尼语,罗马尼亚语来说,精度就会差很多。
此外,和那些专门的翻译工具,如谷歌翻译,DeepL 等相比,ChatGPT 可以通过提示词来提升翻译的精度。Prompt Engineering 已经成为使用 ChatGPT 等 AI 工具所必须的技能。清晰而准确的提示词有助于 ChatGPT 理解你的请求。在提示词中提供一些背景信息也可以引导 ChatGPT 去调用更相关的数据。在提示词中也可以指定自己想要的风格,比如更加口语化一些或者更加学术话一点。在后面的小结中,我会专门介绍一些能够提升翻译质量的提示词技术。
在不同的领域中,ChatGPT 翻译的精度表现也会有所不同。对于那些比较热门的领域,比如新闻和电子商务来说,翻译的精度比较高。而对于那些比较专业冷门的领域,比如法律文件,医学报告等领域,精度会差一点。
ChatGPT 在口语方面的翻译能力也更强一些,它能够理解包括俚语,习语等非正式语言,善于理解对话的背景,在这方面生成的翻译内容听上去也更加自然。
比较有趣的一点是,ChatGPT 还有一些随机性,如果你觉得翻译的不够好,可以多试几次,也许就会得到比较满意的答案。
虽然 ChatGPT 在机器翻译方面表现出卓越的能力,但是脱离了人工参与的话,在很多情况下翻译出来的文本效果不是很理想,尤其是处理一些冷门的小语种。
人类的语言是很复杂的,包含很多复杂而微妙的东西。一个优秀的译员不仅要拥有高超的语言技巧,还要深入了解不同国家的文化差异。比如对某个国家来说很礼貌的表达如果用机器翻译出来成另一种语言的话,可能听上去很粗鲁。
对于那些在非常专业的领域从事翻译的人来说,还要精通该领域的专业知识。很多专业领域的文献不一定会出现在互联网上,或者获取文献的成本很高,因此也就无法成为 ChatGPT 训练的语料。ChatGPT 在这种情况下的翻译质量是很不理想的。
ChatGPT 和其他翻译工具如 DeepL,谷歌翻译都是基于人工智能技术。
ChatGPT 是一个大语言模型,它不是专门为翻译而设计的,尽管它在很多方面的翻译能力和其他两个翻译工具各有千秋。ChatGPT 训练的数据更为庞大,因而除了翻译以外,它还可以做很多其他工作,比如写论文,写邮件,写代码等等。目前支持 90 多中语言。
DeepL 是一个基于深度学习的机器翻译服务。它的神经网络使用互联网上的多语言文本进行训练,比如书籍和网站,来理解和学习句子的构造和单词在不同语境中的含义。截至 2023 年,它支持 26 种语言的翻译。
谷歌翻译是谷歌开发的一个多语言神经机器翻译服务。它支持 133 种不同的语言,使用多用技术组合来翻译,还提供网站翻译,语音翻译,图像翻译等服务。
简而言之,ChatGPT 更多的是生成类似人类的文本,可以执行各种任务,DeepL 重点是利用深度学习提供高质量的翻译,而谷歌翻译是一个全面的翻译工具,支持大量的语言,提供各种翻译功能。
ChatGPT 和其他两个翻译工具相比,对口语的翻译能力更强一些,这得益于它更庞大的口语场景的训练数据。如果是同声传译的话,用 ChatGPT 的 iOS APP会更加方便,它集成了快捷指令和 Siri,用户只需要通过 Siri 唤醒 ChatGPT,然后就可以跟它愉快地对话了。ChatGPT iOS 版本在语言识别的精度上几乎达到了人类的水平,可以识别超过 90 种语言,甚至还支持某些国家的方言。
对于那些训练数据比较庞大的语言,比如英语、德语等,ChatGPT 的翻译能力丝毫不弱于其他两个翻译工具,尤其是对于 ChatGPT4 而言。但是对于一些非常冷门的小语种,DeepL 或者谷歌翻译可能表现会更好。
此外,ChatGPT 的使用更复杂一些,要优化翻译的效果,需要掌握提示词的技巧。由于它不是专门的翻译工具,因此不像 DeepL 那样可以把两种语言并排对比,方便检查每一句的翻译效果。
而那些专门的翻译工具使用起来更加方便快捷,只要把要翻译的内容进行粘贴立刻就获得想要的翻译文本。
要获得最佳的翻译效果,可以把 ChatGPT 和其他翻译工具结合起来。先用专门的翻译工具进行翻译,如果翻译的效果不理想,可以用 ChatGPT 进行优化。比如很多时候专门的翻译工具翻译出来的文本不地道,显得比较生硬,这时候可以让 ChatGPT 把翻译的文本进行修饰,达到更自然的效果,在文章的后面我会专门进行介绍。
下面我将用 ChatGPT 来翻译英文版的《再别康桥》,看看通过提示词技术能否达到信、达、雅的效果。
在给 ChatGPT 提问的过程中,我们通过给 ChatGPT 指定一个角色,通常能达到更好的效果。比如这样来写提示词:
I want you to act as an English to Chinese translater.
你是一个同时精通汉语和英语的译者/诗人/作家/学者/医生/律师。
As a translator, you are proficient in Chinese and English.
现在你是一个精通汉语和英语的译者/诗人/作家/学者/医生/律师。
下图左边使用最基本的提示词,右边指定了角色为诗人:
指定了角色以后是否更有诗的感觉了呢?
很多时候我们给 ChatGPT 一些背景提示的话,ChatGPT 会调用它完成任务所需要的背景知识,大大提高输出的质量。比如我让它翻译这首英文诗的时候跟它将这首是是《再别康桥》的英文版,它虽不会直接生成徐志摩中文原版的诗,但是它生成的诗跟原版已有些神似,比如在很多地方把“剑桥”都翻译成“康桥”。
给 ChatGPT 指定要翻译的领域也会让它的精准度提高。比如我告诉它这是一首英文诗,它生成的中文诗也会多很多中文诗的味道。你还可指定其他要翻译的领域,比如法律文书,商业计划书,新闻,医学报告等等。
如果给 ChatGPT 一些实例的话,它会更懂你的要求,比如我告诉 ChatGPT 去参考徐志摩的诗歌风格,它生成的内容会更加有徐志摩的味道。
给 ChatGPT 指定一位知名的翻译家也可以提升翻译的质量。比如给 ChatGPT 指定它的角色是中国翻译界泰斗许渊冲。
除此之外,还可以给 ChatGPT 指定想要的风格。或者在翻译过后进行风格的优化。比如让它把复杂的概念简单化:
Use simple language that a person would use in everyday to convey complex ideas so that they are clear and easy to understand.
让它用短句:
Bias toward short sentences.
用比喻和类比使文本更有吸引力:
Use metaphors, analogies and other literary devices to make points relatable and memorable
总之,各种风格都可以随意指定,直到你满意为止。
最后,让我们把所有提示词技巧都用起来,看看最终这首诗翻译的效果:
你是中国著名的新月派现代诗人徐志摩。请翻译下面这首英文诗,要求语言清新秀丽,情感细腻真挚,节奏柔婉轻盈,节节押韵,逐节换韵,每行两顿或三顿。这首诗的写作背景是诗人在剑桥大学文学研究院攻读研究生时,十分钟爱康桥这个地方。那里的西下夕阳、斜倚的垂柳和云霞给诗人留下不可磨灭的印象。诗人在英国留学期间,常常徜徉在康桥这片美丽、宁静的土地上。清晨在河边读书,黄昏里在河里划船,或躺在芳香的草地上看云、寻梦。正是康桥的这种独特美吸引了诗人,慰藉一个远离故乡之孤独心灵。
天下数据手机站 关于天下数据 联系我们 诚聘英才 付款方式 帮助中心 网站备案 解决方案 域名注册 网站地图
天下数据18年专注海外香港服务器、美国服务器、海外云主机、海外vps主机租用托管以及服务器解决方案-做天下最好的IDC服务商
《中华人民共和国增值电信业务经营许可证》 ISP证:粤ICP备07026347号
朗信天下发展有限公司(控股)深圳市朗玥科技有限公司(运营)联合版权
深圳总部:中国.深圳市南山区深圳国际创新谷6栋B座10层 香港总部:香港上環蘇杭街49-51號建安商業大廈7樓
7×24小时服务热线:4006388808香港服务电话:+852 67031102
本网站的域名注册业务代理北京新网数码信息技术有限公司的产品