AI 翻译阅读
这是读书爱好者的好时代。
在互联网时代,获取电子书的门槛已经大大降低,而且成本也相对纸质书更低,特别是外文原版书。以《穷查理宝典》为例,其英文版在 亚马逊 上纸质版价格为 27.90 美元,而电子版价格仅为 9.99 美元。
不过,语言依然是一道门槛。当我们的外文水平或耐心不足以支撑读完一整本原版书时,我们只能等国内出版社引进,才能读到翻译版。这就带来几个问题。
首先,等翻译版意味着时间差,意味着我们无法第一时间接触到那些关键的思想、知识或概念,或者满足自己的好奇心。
比如,之前在 ChatGPT 刚刚兴起时,我想补补 NLP 领域相关的核心知识,找到了《Natural Language Processing with Transformers》。但当时这本书并没有中译本。幸好我英文水平还行,还能慢慢地啃完它。
如果碰到一本自己想读的外文书却没有译本,而后在等翻译版的过程中失去耐心,或者忘记自己想读这本书,无疑是一件很可惜的事。
而且,我们想读的书未必会被引进。特别是一些小众的、年代久远的书,可能永远等不来翻译版。比如《The Path of Least Resistance》。
然后,由于译者水平良莠不齐,翻译质量很难得到保证(读过某些国内翻译的英文教材的读者应该能理解)。更别提可能存在的删减。
而在 AI 时代,我们完全可以自己动手,丰衣足食。遇到想看的书,直接用 AI 翻译成中文版。快速阅读,吸收书中的思想,满足自己的好奇心。
不过,有些人可能怀疑 AI 翻译的质量,认为 AI 翻译也不行。
我的观点是,对于以获取知识和思想为目的的阅读,我们的首要目标应该是理解作者想要表达的内容,而不是关注译文质量。我对译文的要求只是逻辑通顺、文字流畅、不篡改作者原意、不删减。而读过几本 AI 翻译的书籍之后,我发现 AI 的翻译完全能达到以上要求。
而且,我们还可以使用提示词(prompt)增强 AI 的翻译能力,也可以让它按照我们的喜好翻译。例如,我喜欢译文中在专有名词(人名、地名、专业术语等等)后面标注对应的英文,方便后续查找相关英文资料,进一步研究。那么我只要在提示词中写明要求,它会给出满足我要求的译文。
AI 翻译还有一个好玩的地方是,它可以给你一种“边译边读”的体验:你可以一边让它翻译,一边读刚刚它翻译的内容;也可以读完上一次翻译的内容,让它继续翻译,同时自己起身喝杯水、伸个懒腰。这种即时互动的阅读方式,是任何传统翻译无法给我们的。
下面,我将分享一套完整 AI 翻译教程与心得。
免责声明
- 注意版权问题。AI 翻译的译文应该仅供自己学习,请勿传播或用于商业目的。
- 获取电子书不在本文讨论范畴之内。下文假设你已经有一本没有 DRM 电子书,最好是常见的电子书格式,比如说 EPUB、MOBI、PDF、TXT。
- AI 翻译不能保证完全准确。AI 可能会错译、漏译,需要读者在翻译过程中谨慎检查,建议在读译文的同时,偶尔看看原文。
准备工作
模型选择:Gemini 2.5 Pro
一如既往,我个人还是推荐使用 Gemini 2.5 Pro。
首先,它的上手门槛很低——只需要一个 Google 账号,可以免费使用。而且模型本身能力也很强。
更重要的是,Gemini 2.5 Pro 具备以下对于翻译很重要的几个特点。
第一,它具备广泛的世界知识。这是因为 Google 作为世界上最大的搜索引擎,能够收集到巨量、涵盖各个领域的数据集。这意味着它能够准确地理解不同领域的术语和背景,从而给出更贴切的译文。
其次,它是一个多模态模型,能够准确地理解大部分 PDF。这意味着我们不需要手动提取 PDF 中的内容,这在翻译扫描版 PDF 时尤其有用。
再者,它的上下文窗口长达一百万 token,而且抗上下文衰减能力强。这意味着它能轻松阅读并翻译一整本书,并在翻译时保持全局语境的连贯性。
以我最近读的《Outlive》为例。它的英文版 PDF 长达 559 页,上传 PDF 消耗了 14.5 万 token。完整翻译之后,整个上下文窗口也才 32.8 万 token。
最后,它输出窗口也很大,一次性可以输出6.5万 token。这意味着一次输出更多文字,用更少的对话就能翻译全书。这可以极大降低成本,因为每一次对话都会把之前对话中所有内容发送给 AI,多发送一次,成本就会像滚雪球一样增加。当然,我们不需要关心价格,毕竟是免费使用。
不过 Gemini 2.5 Pro 在翻译中也有值得注意的问题:译文中有可能会突然蹦出一两个其他语言的词汇(我甚至见过日语、俄语的词汇)。这个现象比较罕见,不太影响实际阅读。
书籍格式转换
目前,Google AI Studio 只支持上传 PDF 格式的文件,或粘贴纯文本。因此,在开始之前,你需要将 EPUB、MOBI 等格式的书籍统一转换为 PDF 或 TXT。
我推荐使用 Calibre 转换书籍。它是一个免费、开源且功能强大的电子书管理工具,几乎支持导入所有主流电子书格式,并可在这些格式之间相互转换。
首先,访问 Calibre 官网,下载并安装 Calibre。如果你使用 macOS 系统而且使用 Homebrew,那么你可以直接通过 Homebrew 安装:
1
brew install --cask calibre
安装好之后,运行 Calibre,你会看到一个很复古的页面。点击左上角菜单栏的 “Add book” 按钮,从文件系统中导入电子书。
然后,在书籍列表中选中这本书,点击菜单栏 “Add book” 右侧的 “Convert books”(见上图)。在弹出窗口的右上角,找到 “Output format”,选择你想要转换的格式(PDF 或 TXT),然后点击右下角的 “OK” 按钮,开始格式转换。
你可以在 Calibre 主页的右下角 “Jobs” 处看到进度。格式转换完成之后,在书籍列表中选中这本书。右键打开上下文菜单,选择 “Save to disk -> Single format to disk”。在弹出的窗口中选择转换后的格式,把转换后的书籍保存到选定路径下。
对于格式选择,我有两个建议:
- 如果书籍以文字为主,首选 TXT 格式,把书籍内容复制到对话框。毕竟 Gemini 2.5 Pro 最擅长的还是文字处理,这也能最大化利用它的长文输出能力,翻译过程最流畅。
- 如果书籍包含大量图片、图表,或是扫描版 PDF,建议统一转成 PDF 格式,利用 Gemini 2.5 Pro 多模态能力来翻译。Gemini 虽然不能直接翻译图表,但它能用语言描述图表中的内容。
虽说 Gemini 2.5 Pro 可以直接准确翻译 PDF,但是翻译过程体验不是很好,容易漏译。比如,在翻译长章节时,它往往翻译到一半就停下。我猜测是因为它看到一个小标题,误以为那是下一章的标题,于是认为这一章已经翻译结束。因此,翻译 PDF 时建议边译边看看原文,随时检查有无漏译。
因为版权原因,我不能放具体的例子。大家可以自行尝试、对比这两种转换方式,找到自己认为合适的方式。
翻译流程
整个翻译过程非常简单。
1. 设置模型和系统提示词
访问 Google AI Studio,在右侧 Run settings 中,设置模型为 Gemini 2.5 Pro。然后,点击上方工具栏的第一个图标,设置系统提示词(system prompt)。
使用审美与提示词书写中的方法论,我撰写了一份翻译系统提示词。你可以直接复制使用:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
你是一个世界级翻译家,你的所有翻译要符合下面的翻译准则。
## 翻译准则
好的译文:
- 信——对原作,它忠实而深刻
- 达——对读者,它清晰而自然
- 雅——在艺术上,它优雅而得体
- 功能对等——在功能上,它精准而有效
其他要求:
- 在处理专有名词(人名、地名、专业术语等)时,在其后附上括号标注英文原文。如卡尔·萨根 (Carl Sagan)。而对于那些已经普遍接受的规范译名,则无需进行标注,例如:爱因斯坦。
- 对于不确定翻译是否准确的句子,在其后附上括号标注英文原文。
### 信
“信”意味着忠实于原文的内容、思想、情感、风格和语气。译者需要像一个侦探,深入理解作者为什么要用这个词,这句话背后隐藏的情感和立场是什么。
要点:
- 保证信息完整,不能随意增删、扭曲原文的信息。无论是事实、数据,还是微妙的情感色彩,都应尽可能完整地传达。
- 保证风格一致。原文是诙谐的,译文就不应是严肃的;原文是古朴的,译文就不应是现代的。译者需要把握原作的整体风格,并在译文中复现。
### 达
“达”意味着译文通顺流畅,符合目标语言的阅读习惯。行文流畅,宛若原创,这是“达”的理想状态。
一个优秀的译者必然是一个文化使者。他需要处理原文中特有的文化元素(如典故、习俗、俚语)。一篇充满了翻译腔(欧式句法、生硬词汇)的译文,即使每个词的意思都对,也算不上“达”。译文必须读起来地道,自然、流畅,没有生涩之感。好的译文能让读者跨越文化鸿沟,与作品产生共鸣。
要点:
- 译文必须确保逻辑通顺,让读者能够毫不费力地理解内容。
- 当原文中出现目标读者不熟悉的文化典故、习语时(例如,英文中的 "It's raining cats and dogs."),好的译者不会直译为“下猫下狗”,而是会采取读者能理解的方式进行处理,如意译为“倾盆大雨”,或在必要时加以注释,帮助读者理解文化背景。
### 雅
“雅”是在“信”和“达”的基础上,追求文字的精炼和美感。
要点:
- 注意文字的韵律与节奏:美的译文是有音律感的。长短句的交错、词语的搭配、声调的和谐,都会影响阅读的体验。尤其在文学、诗歌翻译中,译者需要像音乐家一样,组织语言的节奏和韵律。
- 对词语的精挑细选,力求用最精准、最富表现力、最有意境的词汇来还原原文的神采
- 营造意境:美的译文能够超越字面,将原文的画面感、氛围和弦外之音巧妙地传达给读者,引发读者的联想和共鸣。
### 功能对等
功能对等意味着,一个好的译文,必须实现其预设的功能。它的“好”体现在“恰如其分”。
比如,
- 广告语翻译:目的不是字面对等,而是要在目标市场引起同样的购买欲。耐克的 "Just do it" 翻译成“想做就做”或保留原文,都是基于功能的选择。
- 法律合同翻译:美感和文采完全不重要,极端精准、无歧义才是唯一的美。
- 儿童读物翻译:语言必须符合儿童的认知水平,生动有趣,易于理解。
2. 上传书籍
对于 TXT 格式的书籍,你可以复制文件中所有内容。然后,在对话框中,先输入提示词“将下面的文字翻译成中文”,再换行,输入一些分隔符(——–),再换行,再粘贴书籍内容。对于 PDF 格式的书籍,你可以点击对话框右侧的加号,上传 PDF 文件。
3. 开始翻译
对于 TXT 格式的书籍,输入上述提示词以及书籍内容之后,点击 “Run” 即可。而对于 PDF,上传成功之后,在对话框输入“请把这份文档翻译成中文。”,然后点击 “Run”。
你可以自定义提示词。不过,一定不要在提示词中出现“翻译书籍”之类的措辞,否则 Gemini 会说有版权问题,拒绝翻译。
开始翻译之后,后续就是一路输入“继续”,直到全书翻译完成。对于 PDF,别忘了边译边读,随时检查是否有中断或者遗漏。
结语
以上是我用 Gemini 2.5 Pro 进行整书级 AI 翻译的实践路径和心得。祝你玩得愉快,阅读愉快。