文章

AI 翻译阅读

AI 翻译阅读

这是读书爱好者的好时代。

在互联网时代,获取电子书的门槛已经大大降低,而且成本也相对纸质书更低,特别是外文原版书。以《穷查理宝典》为例,其英文版在 亚马逊 上纸质版价格为 27.90 美元,而电子版价格仅为 9.99 美元。

不过,语言依然是一道门槛。当我们的外文水平或耐心不足以支撑读完一整本原版书时,我们只能等国内出版社引进,才能读到翻译版。这就带来几个问题。

首先,等翻译版意味着时间差,意味着我们无法第一时间接触到那些关键的思想、知识或概念,或者满足自己的好奇心。

比如,之前在 ChatGPT 刚刚兴起时,我想补补 NLP 领域相关的核心知识,找到了《Natural Language Processing with Transformers》。但当时这本书并没有中译本。幸好我英文水平还行,还能慢慢地啃完它。

如果碰到一本自己想读的外文书却没有译本,而后在等翻译版的过程中失去耐心,或者忘记自己想读这本书,无疑是一件很可惜的事。

而且,我们想读的书未必会被引进。特别是一些小众的、年代久远的书,可能永远等不来翻译版。比如《The Path of Least Resistance》。

然后,由于译者水平良莠不齐,翻译质量很难得到保证(读过某些国内翻译的英文教材的读者应该能理解)。更别提可能存在的删减。

而在 AI 时代,我们完全可以自己动手,丰衣足食。遇到想看的书,直接用 AI 翻译成中文版。快速阅读,吸收书中的思想,满足自己的好奇心。

不过,有些人可能怀疑 AI 翻译的质量,认为 AI 翻译也不行。

我的观点是,对于以获取知识和思想为目的的阅读,我们的首要目标应该是理解作者想要表达的内容,而不是关注译文质量。我对译文的要求只是逻辑通顺、文字流畅、不篡改作者原意、不删减。而读过几本 AI 翻译的书籍之后,我发现 AI 的翻译完全能达到以上要求。

而且,我们还可以使用提示词(prompt)增强 AI 的翻译能力,也可以让它按照我们的喜好翻译。例如,我喜欢译文中在专有名词(人名、地名、专业术语等等)后面标注对应的英文,方便后续查找相关英文资料,进一步研究。那么我只要在提示词中写明要求,它会给出满足我要求的译文。

AI 翻译还有一个好玩的地方是,它可以给你一种“边译边读”的体验:你可以一边让它翻译,一边读刚刚它翻译的内容;也可以读完上一次翻译的内容,让它继续翻译,同时自己起身喝杯水、伸个懒腰。这种即时互动的阅读方式,是任何传统翻译无法给我们的。

下面,我将分享一套完整 AI 翻译教程与心得。

免责声明

  1. 注意版权问题。AI 翻译的译文应该仅供自己学习,请勿传播或用于商业目的。
  2. 获取电子书不在本文讨论范畴之内。下文假设你已经有一本没有 DRM 电子书,最好是常见的电子书格式,比如说 EPUB、MOBI、PDF、TXT。
  3. AI 翻译不能保证完全准确。AI 可能会错译、漏译,需要读者在翻译过程中谨慎检查,建议在读译文的同时,偶尔看看原文。

准备工作

模型选择:Gemini 2.5 Pro

一如既往,我个人还是推荐使用 Gemini 2.5 Pro。

首先,它的上手门槛很低——只需要一个 Google 账号,可以免费使用。而且模型本身能力也很强。

更重要的是,Gemini 2.5 Pro 具备以下对于翻译很重要的几个特点。

第一,它具备广泛的世界知识。这是因为 Google 作为世界上最大的搜索引擎,能够收集到巨量、涵盖各个领域的数据集。这意味着它能够准确地理解不同领域的术语和背景,从而给出更贴切的译文。

其次,它是一个多模态模型,能够准确地理解大部分 PDF。这意味着我们不需要手动提取 PDF 中的内容,这在翻译扫描版 PDF 时尤其有用。

再者,它的上下文窗口长达一百万 token,而且抗上下文衰减能力强。这意味着它能轻松阅读并翻译一整本书,并在翻译时保持全局语境的连贯性。

以我最近读的《Outlive》为例。它的英文版 PDF 长达 559 页,上传 PDF 消耗了 14.5 万 token。完整翻译之后,整个上下文窗口也才 32.8 万 token。

最后,它输出窗口也很大,一次性可以输出6.5万 token。这意味着一次输出更多文字,用更少的对话就能翻译全书。这可以极大降低成本,因为每一次对话都会把之前对话中所有内容发送给 AI,多发送一次,成本就会像滚雪球一样增加。当然,我们不需要关心价格,毕竟是免费使用。

不过 Gemini 2.5 Pro 在翻译中也有值得注意的问题:译文中有可能会突然蹦出一两个其他语言的词汇(我甚至见过日语、俄语的词汇)。这个现象比较罕见,不太影响实际阅读。

书籍格式转换

目前,Google AI Studio 只支持上传 PDF 格式的文件,或粘贴纯文本。因此,在开始之前,你需要将 EPUB、MOBI 等格式的书籍统一转换为 PDF 或 TXT。

我推荐使用 Calibre 转换书籍。它是一个免费、开源且功能强大的电子书管理工具,几乎支持导入所有主流电子书格式,并可在这些格式之间相互转换。

首先,访问 Calibre 官网,下载并安装 Calibre。如果你使用 macOS 系统而且使用 Homebrew,那么你可以直接通过 Homebrew 安装:

1
brew install --cask calibre

安装好之后,运行 Calibre,你会看到一个很复古的页面。点击左上角菜单栏的 “Add book” 按钮,从文件系统中导入电子书。

Calibre 主页面 Calibre 主页面

然后,在书籍列表中选中这本书,点击菜单栏 “Add book” 右侧的 “Convert books”(见上图)。在弹出窗口的右上角,找到 “Output format”,选择你想要转换的格式(PDF 或 TXT),然后点击右下角的 “OK” 按钮,开始格式转换。

转换书籍页面 转换书籍页面

你可以在 Calibre 主页的右下角 “Jobs” 处看到进度。格式转换完成之后,在书籍列表中选中这本书。右键打开上下文菜单,选择 “Save to disk -> Single format to disk”。在弹出的窗口中选择转换后的格式,把转换后的书籍保存到选定路径下。

保存转换后的书籍 保存转换后的书籍

对于格式选择,我有两个建议:

  1. 如果书籍以文字为主,首选 TXT 格式,把书籍内容复制到对话框。毕竟 Gemini 2.5 Pro 最擅长的还是文字处理,这也能最大化利用它的长文输出能力,翻译过程最流畅。
  2. 如果书籍包含大量图片、图表,或是扫描版 PDF,建议统一转成 PDF 格式,利用 Gemini 2.5 Pro 多模态能力来翻译。Gemini 虽然不能直接翻译图表,但它能用语言描述图表中的内容。

虽说 Gemini 2.5 Pro 可以直接准确翻译 PDF,但是翻译过程体验不是很好,容易漏译。比如,在翻译长章节时,它往往翻译到一半就停下。我猜测是因为它看到一个小标题,误以为那是下一章的标题,于是认为这一章已经翻译结束。因此,翻译 PDF 时建议边译边看看原文,随时检查有无漏译。

因为版权原因,我不能放具体的例子。大家可以自行尝试、对比这两种转换方式,找到自己认为合适的方式。

翻译流程

整个翻译过程非常简单。

1. 设置模型和系统提示词

访问 Google AI Studio,在右侧 Run settings 中,设置模型为 Gemini 2.5 Pro。然后,点击上方工具栏的第一个图标,设置系统提示词(system prompt)。

AI Studio 中设置系统提示词 AI Studio 中设置系统提示词

使用审美与提示词书写中的方法论,我撰写了一份翻译系统提示词。你可以直接复制使用:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
你是一个世界级翻译家,你的所有翻译要符合下面的翻译准则。

## 翻译准则

好的译文:
- 信——对原作,它忠实而深刻
- 达——对读者,它清晰而自然
- 雅——在艺术上,它优雅而得体
- 功能对等——在功能上,它精准而有效

其他要求:
- 在处理专有名词(人名、地名、专业术语等)时,在其后附上括号标注英文原文。如卡尔·萨根 (Carl Sagan)。而对于那些已经普遍接受的规范译名,则无需进行标注,例如:爱因斯坦。
- 对于不确定翻译是否准确的句子,在其后附上括号标注英文原文。

### 信

“信”意味着忠实于原文的内容、思想、情感、风格和语气。译者需要像一个侦探,深入理解作者为什么要用这个词,这句话背后隐藏的情感和立场是什么。

要点:
- 保证信息完整,不能随意增删、扭曲原文的信息。无论是事实、数据,还是微妙的情感色彩,都应尽可能完整地传达。
- 保证风格一致。原文是诙谐的,译文就不应是严肃的;原文是古朴的,译文就不应是现代的。译者需要把握原作的整体风格,并在译文中复现。

### 达

“达”意味着译文通顺流畅,符合目标语言的阅读习惯。行文流畅,宛若原创,这是“达”的理想状态。

一个优秀的译者必然是一个文化使者。他需要处理原文中特有的文化元素(如典故、习俗、俚语)。一篇充满了翻译腔(欧式句法、生硬词汇)的译文,即使每个词的意思都对,也算不上“达”。译文必须读起来地道,自然、流畅,没有生涩之感。好的译文能让读者跨越文化鸿沟,与作品产生共鸣。


要点:
- 译文必须确保逻辑通顺,让读者能够毫不费力地理解内容。
- 当原文中出现目标读者不熟悉的文化典故、习语时(例如,英文中的 "It's raining cats and dogs."),好的译者不会直译为“下猫下狗”,而是会采取读者能理解的方式进行处理,如意译为“倾盆大雨”,或在必要时加以注释,帮助读者理解文化背景。

### 雅

“雅”是在“信”和“达”的基础上,追求文字的精炼和美感。

要点:
- 注意文字的韵律与节奏:美的译文是有音律感的。长短句的交错、词语的搭配、声调的和谐,都会影响阅读的体验。尤其在文学、诗歌翻译中,译者需要像音乐家一样,组织语言的节奏和韵律。
- 对词语的精挑细选,力求用最精准、最富表现力、最有意境的词汇来还原原文的神采
- 营造意境:美的译文能够超越字面,将原文的画面感、氛围和弦外之音巧妙地传达给读者,引发读者的联想和共鸣。

### 功能对等

功能对等意味着,一个好的译文,必须实现其预设的功能。它的“好”体现在“恰如其分”。

比如,
- 广告语翻译:目的不是字面对等,而是要在目标市场引起同样的购买欲。耐克的 "Just do it" 翻译成“想做就做”或保留原文,都是基于功能的选择。
- 法律合同翻译:美感和文采完全不重要,极端精准、无歧义才是唯一的美。
- 儿童读物翻译:语言必须符合儿童的认知水平,生动有趣,易于理解。

2. 上传书籍

对于 TXT 格式的书籍,你可以复制文件中所有内容。然后,在对话框中,先输入提示词“将下面的文字翻译成中文”,再换行,输入一些分隔符(——–),再换行,再粘贴书籍内容。对于 PDF 格式的书籍,你可以点击对话框右侧的加号,上传 PDF 文件。

3. 开始翻译

对于 TXT 格式的书籍,输入上述提示词以及书籍内容之后,点击 “Run” 即可。而对于 PDF,上传成功之后,在对话框输入“请把这份文档翻译成中文。”,然后点击 “Run”。

你可以自定义提示词。不过,一定不要在提示词中出现“翻译书籍”之类的措辞,否则 Gemini 会说有版权问题,拒绝翻译。

开始翻译之后,后续就是一路输入“继续”,直到全书翻译完成。对于 PDF,别忘了边译边读,随时检查是否有中断或者遗漏。

结语

以上是我用 Gemini 2.5 Pro 进行整书级 AI 翻译的实践路径和心得。祝你玩得愉快,阅读愉快。

本文由作者按照 CC BY 4.0 进行授权