Back to Gpt Academic

Arxiv 论文翻译

docs/features/academic/arxiv_translation.md

latest7.0 KB
Original Source

Arxiv 论文翻译

Arxiv 是全球最大的预印本论文平台,每天都有大量最新的学术研究发布。GPT Academic 提供了一键翻译 Arxiv 论文的功能,不仅能将论文内容翻译成中文,还能保留原有的 LaTeX 排版格式,生成可直接阅读的 PDF 文档。


功能特点

Arxiv 论文翻译功能具有以下优势:

  • 保留原格式:翻译后的论文保持与原文相同的排版结构,包括章节、公式、图表位置
  • 智能分段:自动将长文档分割成合适的片段进行翻译,避免上下文丢失
  • 对照阅读:生成原文与译文的对照版本,方便核对和学习
  • 缓存机制:已翻译过的论文会被缓存,再次请求时直接返回结果,节省时间和 API 费用

前提条件

在使用此功能之前,请确保:

  1. 已配置可用的大语言模型 API:翻译需要消耗较多 Token,建议使用性价比较高的模型如 gpt-3.5-turboqwen-max
  2. 安装 LaTeX 环境(可选但推荐):如果您希望生成翻译后的 PDF 文件,需要安装 TeX Live 或类似的 LaTeX 发行版

!!! info "关于 LaTeX 环境" - Windows 用户:推荐安装 MiKTeXTeX Live - Linux 用户:执行 sudo apt install texlive-full 安装完整版 - Docker 用户:官方 Docker 镜像已内置 LaTeX 环境,无需额外配置

如果不安装 LaTeX,翻译仍可正常进行,但只能获得翻译后的 `.tex` 源文件,无法生成 PDF。

使用方法

获取论文标识

首先,您需要获取想要翻译的 Arxiv 论文的标识信息。您可以使用以下任意一种格式:

格式示例
Arxiv ID2301.00234
论文页面 URLhttps://arxiv.org/abs/2301.00234
PDF 链接https://arxiv.org/pdf/2301.00234.pdf

在 Arxiv 网站上,论文 ID 通常显示在页面 URL 和论文标题下方。例如,对于 URL https://arxiv.org/abs/2301.00234,其中的 2301.00234 就是论文 ID。

执行翻译

  1. 输入论文标识:在 GPT Academic 的输入框中,输入论文的 Arxiv ID 或完整 URL

  2. 选择翻译插件:在函数插件区找到 学术 分类,选择 📚Arxiv论文精细翻译 插件

  3. 开始翻译:点击插件按钮启动翻译流程

<!-- IMAGE: feat_arxiv_01_workflow.png --> <!-- 描述: Arxiv 论文翻译的完整操作流程 --> <!-- 标注: ① 输入框中输入 Arxiv ID(如 2301.00234)② 函数插件区的"学术"分类 ③ "Arxiv论文精细翻译"插件按钮 --> <!-- 尺寸建议: 1000px -->

翻译过程

点击插件后,系统将执行以下步骤(均为自动进行):

  1. 下载源码:从 Arxiv 服务器下载论文的 LaTeX 源文件包
  2. 解析文档:分析 LaTeX 项目结构,识别主文件和各章节
  3. 分段翻译:将文档分割成适当大小的片段,逐段发送给 AI 进行翻译
  4. 合并结果:将翻译后的片段重新合并为完整的 LaTeX 项目
  5. 编译 PDF:调用 LaTeX 编译器生成中文 PDF(如已安装)

整个过程可能需要 3-15 分钟,具体时间取决于论文长度和所选模型的响应速度。翻译进度会实时显示在对话区。

获取结果

翻译完成后,您将获得以下文件(显示在界面右侧的"文件下载区"):

文件类型说明
translate_zh.pdf翻译后的中文 PDF(如 LaTeX 编译成功)
comparison.pdf原文与译文的对照版本
结果压缩包.zip包含所有翻译文件的压缩包,含 .tex 源文件

如果 PDF 编译失败,您仍可下载压缩包获取翻译后的 .tex 源文件,然后在本地使用 LaTeX 编辑器打开和编译。


高级选项

自定义翻译指令

在插件参数输入区,您可以添加自定义指令来调整翻译行为。点击插件按钮前,在 高级参数输入区(如果没有看到,点击"展开"按钮)输入您的特殊要求。

常用的自定义指令示例:

If the term "agent" is used, translate it to "智能体".
If the term "transformer" is used, keep it as "Transformer".
专有名词 "GPT" 保持不变。

这些指令会与默认翻译提示词合并,确保特定术语按您的期望处理。

缓存与云端分享

GPT Academic 提供了翻译结果的缓存和云端分享功能:

  • 缓存机制:系统会在本地缓存翻译结果。如果您或其他人之前已翻译过同一篇论文,再次请求时将直接返回缓存结果,大幅节省时间和 API 费用。

  • 云端分享(需在插件参数中启用):如果您同意将翻译结果分享到公共缓存库,其他用户也可以受益于您的翻译工作。这是一种"人人为我,我为人人"的协作机制。

要启用云端分享,在高级参数中添加 --allow-cloudio 标记。

强制重新翻译

如果您希望忽略缓存、从头开始翻译(例如使用了新的模型或调整了翻译指令),在高级参数中添加 --no-cache 标记即可。


常见问题

???+ question "翻译速度很慢怎么办?" 论文翻译是计算密集型任务,需要多次调用 API。您可以通过以下方式加速:

1. 使用响应更快的模型,如 `gpt-3.5-turbo` 或 `qwen-turbo`
2. 在配置文件中增加 `DEFAULT_WORKER_NUM`(默认 8),允许更多并行请求
3. 配置多个 API Key 实现负载均衡

???+ question "下载论文失败,提示无法获取源码" 可能的原因包括:

1. **论文没有开放源码**:部分 Arxiv 论文作者选择不公开 LaTeX 源码,此时无法使用本功能
2. **网络问题**:检查您的网络连接,如使用代理请确保配置正确
3. **Arxiv 服务限制**:Arxiv 可能暂时限制了自动化访问,稍后重试即可

对于无法获取源码的论文,建议改用 [PDF 论文翻译](pdf_translation.md) 功能。

???+ question "PDF 生成失败但翻译完成了" 这通常是 LaTeX 编译问题。您可以:

1. 下载结果压缩包,获取翻译后的 `.tex` 文件
2. 使用 Overleaf 或本地 LaTeX 编辑器打开并手动修复编译错误
3. 确认系统已安装完整的 LaTeX 环境(包括中文字体支持)

???+ question "部分公式或表格显示异常" 复杂的 LaTeX 结构在翻译过程中可能出现格式问题。建议:

1. 在高级参数中添加指令"保持所有公式和表格的原始格式"
2. 下载 `.tex` 源文件后手动调整有问题的部分
3. 对于公式特别复杂的论文,考虑只翻译文字部分,公式保持原样

相关文档