一行代码将arXiv论文翻译成中文版
By 苏剑林 | 2026-01-28 | 491位读者 |认识比较久的老读者或许都知道,笔者算是一个比较坚定的“古法编程爱好者”——至今仍不用IDE、不用代码补全、编辑器只需语法高亮即可。就连科学空间的博文,都是笔者一个个字敲的HTML源码(当然这有些历史原因),还有 Cool Papers 的从前端到后端的整站代码,也都是笔者手敲的。
但即便是笔者这样的“老顽固”,也不得不承认:对于某些任务,通过Code Agent来完成具有无与伦比的优势——甚至于你想纯手写,都有种无从下手的感觉。这篇文章就介绍一个经典例子,用一行代码翻译arXiv论文。
先说方法 #
首先在本地部署好 kimi-cli ,配置好使用 kimi-k2.5 ,然后还要装一个LaTeX编译环境(笔者用的是MacTeX),最后从arXiv下载论文源码,解压并进入到源码,执行
kimi --print --prompt "你所在目录是一篇英文论文的latex源码,你需要做的是将论文翻译成中文版本,要求所有英文文字内容都翻译成中文,公式不变,表格、图片等只翻译必要的caption,代码框、算法框也只需翻译必要的注释,而人名不必翻译;将翻译后的新源码保存到当前目录下名为“paper_cn”的新目录中,要注意保持源码的可编译性;翻译完后要仔细检查一遍,看有没有漏翻译的章节和文件;最后,用xelatex将翻译结果重新编译成pdf,编译时若遇到中文编码问题,可以考虑用usepackage[fontset=fandol,UTF8]{ctex},返回生成的pdf路径。如果翻译内容较多,应当开启多个subagent来并行翻译。"
然后就可以等待论文翻译完成了。期间,kimi会自动分析目录结构,找到要翻译的文件,翻译完成后会尝试编译,根据编译的错误信息进一步调整翻译结果,直到编译成功得到pdf。如果你连下载源码都想省了,那么可以尝试
kimi --print --prompt "从arXiv上下载id为2502.16982的论文源码,然后解压并将它翻译成中文版本,要求所有英文文字内容都翻译成中文,公式不变,表格、图片等只翻译必要的caption,代码框、算法框也只需翻译必要的注释,而人名不必翻译;将翻译后的新源码保存到解压目录下名为“paper_cn”的新目录中,要注意保持源码的可编译性;翻译完后要仔细检查一遍,看有没有漏翻译的章节和文件;最后,用xelatex将翻译结果重新编译成pdf,编译时若遇到中文编码问题,可以考虑用usepackage[fontset=fandol,UTF8]{ctex},返回生成的pdf路径。如果翻译内容较多,应当开启多个subagent来并行翻译。"
以 kimi-cli 为例,并不全是为了打广告,而是笔者就只用过 kimi-cli ,这还是因为工作的原因“顺手”测试了一下,而不是主动去寻求的AI Agent辅助,足见笔者“老古董”之本质。大家如果有其他用得顺手的AI agent,也可以自行尝试。
效果对比 #
市面上已有的论文翻译网站,笔者认为做得最好的是“幻觉翻译(hjfy.top)”,以下是kimi和hjfy分别对两篇论文进行翻译的结果:
大家可以自行对比一下:
多扯几句 #
关于幻觉翻译的原理,作者曾在他的知乎文章《消耗 3 亿 token,我用大模型翻译了 1 万篇 arXiv 论文》上做过分享,其实朴素的想法估计大家都能想到,就是从论文的LaTeX源码出发(arXiv论文基本都有提供),抽取需要翻译的段落,逐段进行翻译。
然而,真要去实践的话,我们就会体验到那种“无从下手”的感觉,因为LaTeX是一个自由度非常高的语法,甚至于它都不只是一个文档语法,而是隐隐已经成为了一个编程工具,在这个背景下,你要想将“抽取-翻译”人工拆解为有限个步骤,是一件非常困难的事情。如作者所言,他每天仍然针对翻译出错的bad case进行修复,这是一个长期的、繁琐的、没完没了的工作。
而这些“不容易人工拆解成可枚举的步骤”的工作,正是AI Agent所擅长的!AI会自动查找和判断要翻译的文件,然后逐一进行翻译,更妙的是,它还会自动去编译,根据错误信息自行调整文档,直到编译通过为止。如果人工写规则,单就处理编译错误信息这一步就有无休止的工作,其本质难度可能不亚于重写一个LaTeX编译器,其中艰辛可想而知。
除了自动化外,用 kimi-cli 的另一个好处是翻译质量,相比逐段甚至逐句进行翻译,带有全局的上下文信息 kimi-cli 整体的翻译质量会好上不少。当然,问题也有,那就是大模型的通病——幻觉,具体表现是可能存在漏翻、错翻,漏翻的情况,如果在交互式环境下,是可以反复要求kimi检查遗漏之处,直到满意为止,但如果是错翻,那就没什么好办法了。
文章小结 #
本文给出了用 kimi-cli 翻译arXiv论文的一个基本用法,也欢迎大家提供更完善的使用案例。
转载到请包括本文地址:https://kexue.fm/archives/11578
更详细的转载事宜请参考:《科学空间FAQ》
如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。
如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!
如果您需要引用本文,请参考:
苏剑林. (Jan. 28, 2026). 《一行代码将arXiv论文翻译成中文版 》[Blog post]. Retrieved from https://kexue.fm/archives/11578
@online{kexuefm-11578,
title={一行代码将arXiv论文翻译成中文版},
author={苏剑林},
year={2026},
month={Jan},
url={\url{https://kexue.fm/archives/11578}},
}














January 28th, 2026
老苏你是真古法啊