Back to Pdfmathtranslate

Create new file

docs/README_ko-KR.md

1.9.1124.3 KB
Original Source

Create new file

<div align="center">

English | 简体中文 | 繁體中文 | 日本語 | 한국어

<h2 id="title">PDFMathTranslate</h2> <p> <!-- PyPI --> <a href="https://pypi.org/project/pdf2zh/"> </a> <a href="https://pepy.tech/projects/pdf2zh"> </a> <a href="https://hub.docker.com/repository/docker/byaidu/pdf2zh"> </a> <!-- License --> <a href="./LICENSE"> </a> <a href="https://huggingface.co/spaces/reycn/PDFMathTranslate-Docker"> </a> <a href="https://www.modelscope.cn/studios/AI-ModelScope/PDFMathTranslate"> </a> <a href="https://github.com/Byaidu/PDFMathTranslate/pulls"> </a> <a href="https://gitcode.com/Byaidu/PDFMathTranslate/overview"> </a> <a href="https://t.me/+Z9_SgnxmsmA5NzBl"> </a> </p>

<a href="https://trendshift.io/repositories/12424" target="_blank"></a>

</div>

과학 PDF 문서 번역 및 이중 언어 비교 도구

피드백은 GitHub Issues 또는 Telegram 그룹에서 해주세요.

<h2 id="updates">최근 업데이트</h2>
  • [2024년 12월 24일] Xinference 실행 로컬 LLM 지원 추가 (by @imClumsyPanda)
  • [2024년 11월 26일] CLI가 온라인 파일을 지원하게 되었습니다 (by @reycn)
  • [2024년 11월 24일] 의존성 크기를 줄이기 위해 ONNX 지원 추가 (by @Wybxc)
  • [2024년 11월 23일] 🌟 무료 공공 서비스 온라인! (by @Byaidu)
  • [2024년 11월 23일] 웹 봇을 방지하기 위한 방화벽 추가 (by @Byaidu)
  • [2024년 11월 22일] GUI가 이탈리아어를 지원하고 개선되었습니다 (by @Byaidu, @reycn)
  • [2024년 11월 22일] 배포된 서비스를 다른 사람과 공유할 수 있게 되었습니다 (by @Zxis233)
  • [2024년 11월 22일] Tencent 번역 지원 (by @hellofinch)
  • [2024년 11월 21일] GUI가 이중 언어 문서 다운로드를 지원하게 되었습니다 (by @reycn)
  • [2024년 11월 20일] 🌟 데모가 온라인이 되었습니다! (by @reycn)
<h2 id="preview">미리보기</h2> <div align="center"> </div> <h2 id="demo">공공 서비스 🌟</h2>

무료 서비스 (https://pdf2zh.com/)

설치 없이 무료 공공 서비스를 온라인으로 사용해 볼 수 있습니다.

데모

설치 없이 HuggingFace의 데모ModelScope의 데모를 사용해 볼 수 있습니다. 데모의 컴퓨팅 리소스가 제한되어 있으므로 남용하지 말아주세요.

<h2 id="install">설치 및 사용법</h2>

이 프로젝트를 사용하는 4가지 방법을 제공합니다: 커맨드라인 도구, 포터블, GUI, 및 Docker.

pdf2zh 실행에는 추가 모델(wybxc/DocLayout-YOLO-DocStructBench-onnx)이 필요합니다. 이 모델은 ModelScope에서도 찾을 수 있습니다. 시작할 때 이 모델 다운로드에 문제가 있다면 다음 환경 변수를 사용하세요:

shell
set HF_ENDPOINT=https://hf-mirror.com

PowerShell 사용자의 경우:

shell
$env:HF_ENDPOINT = https://hf-mirror.com
<h3 id="cmd">방법 1. 커맨드라인 도구</h3>
  1. Python이 설치되어 있어야 합니다 (버전 3.10 <= 버전 <= 3.12)

  2. 패키지를 설치합니다:

    bash
    pip install pdf2zh
    
  3. 번역을 실행하고 현재 작업 디렉토리에 파일을 생성합니다:

    bash
    pdf2zh document.pdf
    
<h3 id="portable">방법 2. 포터블</h3>

Python 환경을 미리 설치할 필요가 없습니다.

setup.bat을 다운로드하고 더블클릭하여 실행합니다.

<h3 id="gui">방법 3. GUI</h3>
  1. Python이 설치되어 있어야 합니다 (버전 3.10 <= 버전 <= 3.12)

  2. 패키지를 설치합니다:

    bash
    pip install pdf2zh
    
  3. 브라우저에서 사용을 시작합니다:

    bash
    pdf2zh -i
    
  4. 브라우저가 자동으로 시작되지 않으면 다음 URL을 엽니다:

    bash
    http://localhost:7860/
    

자세한 내용은 GUI 문서를 참조하세요.

<h3 id="docker">방법 4. Docker</h3>
  1. 풀하고 실행합니다:

    bash
    docker pull byaidu/pdf2zh
    docker run -d -p 7860:7860 byaidu/pdf2zh
    
  2. 브라우저에서 엽니다:

    http://localhost:7860/
    

클라우드 서비스에서 Docker 배포용:

<div> <a href="https://www.heroku.com/deploy?template=https://github.com/Byaidu/PDFMathTranslate"> </a> <a href="https://render.com/deploy"> </a> <a href="https://zeabur.com/templates/5FQIGX?referralCode=reycn"> </a> <a href="https://app.koyeb.com/deploy?type=git&builder=buildpack&repository=github.com/Byaidu/PDFMathTranslate&branch=main&name=pdf-math-translate"> </a> </div> <h2 id="usage">고급 옵션</h2>

커맨드라인에서 번역 명령을 실행하여 현재 작업 디렉토리에 번역된 문서 example-mono.pdf와 이중 언어 문서 example-dual.pdf를 생성합니다. 기본적으로 Google 번역 서비스를 사용합니다. 더 많은 지원 번역 서비스는 여기에서 찾을 수 있습니다.

다음 표에 참고용으로 모든 고급 옵션을 나열했습니다:

옵션기능예시
files로컬 파일pdf2zh ~/local.pdf
links온라인 파일pdf2zh http://arxiv.org/paper.pdf
-iGUI 진입pdf2zh -i
-p부분 문서 번역pdf2zh example.pdf -p 1
-li소스 언어pdf2zh example.pdf -li en
-lo대상 언어pdf2zh example.pdf -lo zh
-s번역 서비스pdf2zh example.pdf -s deepl
-t멀티스레드pdf2zh example.pdf -t 1
-o출력 디렉토리pdf2zh example.pdf -o output
-f, -c예외pdf2zh example.pdf -f "(MS.*)"
--share[gradio 공개 링크 얻기]pdf2zh -i --share
--authorized[웹 인증 및 사용자 정의 인증 페이지 추가]pdf2zh -i --authorized users.txt [auth.html]
--prompt[사용자 정의 대형 모델 프롬프트 사용]pdf2zh --prompt [prompt.txt]
--onnx[사용자 정의 DocLayout-YOLO ONNX 모델 사용]pdf2zh --onnx [onnx/model/path]
--serverport[사용자 정의 WebUI 포트 사용]pdf2zh --serverport 7860
--dir[배치 번역]pdf2zh --dir /path/to/translate/
--config구성 파일pdf2zh --config /path/to/config/config.json
<h3 id="partial">전체 또는 부분 문서 번역</h3>
  • 전체 번역
bash
pdf2zh example.pdf
  • 부분 번역
bash
pdf2zh example.pdf -p 1-3,5
<h3 id="language">소스 언어와 대상 언어 지정</h3>

Google Languages Codes, DeepL Languages Codes 참조

bash
pdf2zh example.pdf -li en -lo ko
<h3 id="services">다른 서비스로 번역</h3>

다음 표는 각 번역 서비스에 필요한 환경 변수를 보여줍니다. 각 서비스를 사용하기 전에 이러한 변수를 설정하세요.

번역기서비스환경 변수기본값참고
Google (기본)google없음N/A없음
Bingbing없음N/A없음
DeepLdeeplDEEPL_AUTH_KEY[Your Key]DeepL 참조
DeepLXdeeplxDEEPLX_ENDPOINThttps://api.deepl.com/translateDeepLX 참조
OllamaollamaOLLAMA_HOST, OLLAMA_MODELhttp://127.0.0.1:11434, gemma2Ollama 참조
OpenAIopenaiOPENAI_BASE_URL, OPENAI_API_KEY, OPENAI_MODELhttps://api.openai.com/v1, [Your Key], gpt-4o-miniOpenAI 참조
AzureOpenAIazure-openaiAZURE_OPENAI_BASE_URL, AZURE_OPENAI_API_KEY, AZURE_OPENAI_MODEL[Your Endpoint], [Your Key], gpt-4o-miniAzure OpenAI 참조
ZhipuzhipuZHIPU_API_KEY, ZHIPU_MODEL[Your Key], glm-4-flashZhipu 참조
ModelScopemodelscopeMODELSCOPE_API_KEY, MODELSCOPE_MODEL[Your Key], Qwen/Qwen2.5-Coder-32B-InstructModelScope 참조
SiliconsiliconSILICON_API_KEY, SILICON_MODEL[Your Key], Qwen/Qwen2.5-7B-InstructSiliconCloud 참조
GeminigeminiGEMINI_API_KEY, GEMINI_MODEL[Your Key], gemini-1.5-flashGemini 참조
AzureazureAZURE_ENDPOINT, AZURE_API_KEYhttps://api.translator.azure.cn, [Your Key]Azure 참조
TencenttencentTENCENTCLOUD_SECRET_ID, TENCENTCLOUD_SECRET_KEY[Your ID], [Your Key]Tencent 참조
DifydifyDIFY_API_URL, DIFY_API_KEY[Your DIFY URL], [Your Key]Dify 참조, Dify의 워크플로우 입력에서 lang_out, lang_in, text 세 변수를 정의해야 합니다.
AnythingLLManythingllmAnythingLLM_URL, AnythingLLM_APIKEY[Your AnythingLLM URL], [Your Key]anything-llm 참조
Argos Translateargosargos-translate 참조
GrokgrokGORK_API_KEY, GORK_MODEL[Your GORK_API_KEY], grok-2-1212Grok 참조
DeepSeekdeepseekDEEPSEEK_API_KEY, DEEPSEEK_MODEL[Your DEEPSEEK_API_KEY], deepseek-chatDeepSeek 참조
OpenAI-LikedopenailikedOPENAILIKED_BASE_URL, OPENAILIKED_API_KEY, OPENAILIKED_MODELurl, [Your Key], model name없음

위 표에 없는 OpenAI API와 호환되는 대형 언어 모델의 경우, 표의 OpenAI와 동일한 방식으로 환경 변수를 설정할 수 있습니다.

-s service 또는 -s service:model을 사용하여 번역 서비스를 지정합니다:

bash
pdf2zh example.pdf -s openai:gpt-4o-mini

또는 환경 변수로 모델을 지정합니다:

bash
set OPENAI_MODEL=gpt-4o-mini
pdf2zh example.pdf -s openai

PowerShell 사용자의 경우:

shell
$env:OPENAI_MODEL = gpt-4o-mini
pdf2zh example.pdf -s openai
<h3 id="exceptions">예외 지정</h3>

정규식을 사용하여 보존해야 할 수식 폰트와 문자를 지정합니다:

bash
pdf2zh example.pdf -f "(CM[^RT].*|MS.*|.*Ital)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"

기본적으로 Latex, Mono, Code, Italic, SymbolMath 폰트를 보존합니다:

bash
pdf2zh example.pdf -f "(CM[^R]|MS.M|XY|MT|BL|RM|EU|LA|RS|LINE|LCIRCLE|TeX-|rsfs|txsy|wasy|stmary|.*Mono|.*Code|.*Ital|.*Sym|.*Math)"
<h3 id="threads">스레드 수 지정</h3>

-t를 사용하여 번역에 사용할 스레드 수를 지정합니다:

bash
pdf2zh example.pdf -t 1
<h3 id="prompt">사용자 정의 프롬프트</h3>

--prompt를 사용하여 LLM에서 사용할 프롬프트를 지정합니다:

bash
pdf2zh example.pdf -pr prompt.txt

prompt.txt 예시:

txt
[
    {
        "role": "system",
        "content": "You are a professional,authentic machine translation engine.",
    },
    {
        "role": "user",
        "content": "Translate the following markdown source text to ${lang_out}. Keep the formula notation {{v*}} unchanged. Output translation directly without any additional text.\nSource Text: ${text}\nTranslated Text:",
    },
]

사용자 정의 프롬프트 파일에서는 다음 세 가지 변수를 사용할 수 있습니다:

변수내용
lang_in소스 언어
lang_out대상 언어
text번역할 텍스트
<h2 id="todo">API</h2>

Python

python
from pdf2zh import translate, translate_stream

params = {"lang_in": "en", "lang_out": "ko", "service": "google", "thread": 4}
file_mono, file_dual = translate(files=["example.pdf"], **params)[0]
with open("example.pdf", "rb") as f:
    stream_mono, stream_dual = translate_stream(stream=f.read(), **params)

HTTP

bash
pip install pdf2zh[backend]
pdf2zh --flask
pdf2zh --celery worker
bash
curl http://localhost:11008/v1/translate -F "[email protected]" -F "data={\"lang_in\":\"en\",\"lang_out\":\"ko\",\"service\":\"google\",\"thread\":4}"
{"id":"d9894125-2f4e-45ea-9d93-1a9068d2045a"}

curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a
{"info":{"n":13,"total":506},"state":"PROGRESS"}

curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a
{"state":"SUCCESS"}

curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a/mono --output example-mono.pdf

curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a/dual --output example-dual.pdf

curl http://localhost:11008/v1/translate/d9894125-2f4e-45ea-9d93-1a9068d2045a -X DELETE
<h2 id="acknowledgement">감사의 말</h2> <h2 id="contrib">기여자</h2> <a href="https://github.com/Byaidu/PDFMathTranslate/graphs/contributors"> </a>

<h2 id="star_hist">스타 히스토리</h2> <a href="https://star-history.com/#Byaidu/PDFMathTranslate&Date"> <picture> <source media="(prefers-color-scheme: dark)" srcset="https://api.star-history.com/svg?repos=Byaidu/PDFMathTranslate&type=Date&theme=dark" /> <source media="(prefers-color-scheme: light)" srcset="https://api.star-history.com/svg?repos=Byaidu/PDFMathTranslate&type=Date" /> </picture> </a>