readme/README_ko.md
English | ็ฎไฝไธญๆ | ็น้ซไธญๆ | ๆฅๆฌ่ช | ํ๊ตญ์ด | Franรงais | ะ ัััะบะธะน | Espaรฑol | ุงูุนุฑุจูุฉ
<!-- icon --> </div>PaddleOCR๋ ๋ฌธ์์ ์ด๋ฏธ์ง๋ฅผ ์ ๊ณ ์ต๊ณ ์์ค์ ์ ํ๋๋ก ๊ตฌ์กฐํ๋ LLM ์ง์ ๋ฐ์ดํฐ(JSON/Markdown)๋ก ๋ณํํฉ๋๋ค. 70,000๊ฐ ์ด์์ Star์ Dify, RAGFlow, Cherry Studio ๋ฑ ์ต์์ ํ๋ก์ ํธ์ ์ ๋ขฐ๋ฅผ ๋ฐ๋ PaddleOCR๋ ์ง๋ฅํ RAG ๋ฐ ์์ด์ ํธ ๊ธฐ๋ฐ ์ ํ๋ฆฌ์ผ์ด์ ๊ตฌ์ถ์ ํต์ฌ ๊ธฐ๋ฐ์ ๋๋ค.
๋ณต์กํ ์๊ฐ ์๋ฃ๋ฅผ LLM ์๋์ ๋ง๋ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ก ๋ณํํฉ๋๋ค.
๊ณ ์ ๋ค๊ตญ์ด ํ ์คํธ ํ์ง์ ๊ธ๋ก๋ฒ ํ์ค.
PaddleOCR-VL ์๋ฆฌ์ฆ, PP-StructureV3, PP-DocTranslation์ด ์ด์ ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ DOCX๋ก ๋ด๋ณด๋ด Microsoft Word์์ ํธ๋ฆฌํ๊ฒ ํ์ธํ๊ณ ํธ์งํ ์ ์์ต๋๋ค.PaddleOCR.js๋ฅผ ์ถ์ํ์ฌ ๋ธ๋ผ์ฐ์ ์์ PP-OCRv5๋ฅผ ์คํํ ์ ์์ต๋๋ค.PaddleOCR-VL ์ถ์:
๋ชจ๋ธ ์๊ฐ:
ํต์ฌ ๊ธฐ๋ฅ:
PP-OCRv5 ๋ค๊ตญ์ด ์ธ์ ๋ชจ๋ธ ์ถ์:
์ฃผ์ ๋ชจ๋ธ ์ถ๊ฐ:
๋ฐฐํฌ ๊ธฐ๋ฅ ์ ๊ทธ๋ ์ด๋:
๋ฒค์น๋งํฌ ์ง์:
๋ฒ๊ทธ ์์ :
use_chart_parsing)์ด ๋ค๋ฅธ ํ์ดํ๋ผ์ธ๊ณผ ๋ถ์ผ์นํ๋ ๋ฌธ์ ๋ฅผ ์์ ํ์์ต๋๋ค.๊ธฐํ ๊ฐ์ ์ฌํญ:
PaddleOCR ๊ณต์ ์น์ฌ์ดํธ์์๋ ๋ณ๋ ์ค์ ์์ด ํด๋ฆญ ํ ๋ฒ์ผ๋ก ์ฒดํํ ์ ์๋ ์ธํฐ๋ํฐ๋ธ ์ฒดํ ์ผํฐ์ API๋ฅผ ์ ๊ณตํฉ๋๋ค.
๐ ๊ณต์ ์น์ฌ์ดํธ ๋ฐฉ๋ฌธ
๋ก์ปฌ ์ฌ์ฉ์ ์ํด ํ์์ ๋ฐ๋ผ ๋ค์ ๋ฌธ์๋ฅผ ์ฐธ์กฐํ์ธ์:
โญ ์ด ์ ์ฅ์์ Star๋ฅผ ๋๋ฌ ๊ฐ๋ ฅํ OCR ๋ฐ ๋ฌธ์ ํ์ฑ ๊ธฐ๋ฅ์ ํฌํจํ ํฅ๋ฏธ๋ก์ด ์ ๋ฐ์ดํธ์ ์๋ก์ด ๋ฆด๋ฆฌ์ค๋ฅผ ํ์ธํ์ธ์! โญ
<div align="center"> <p> </p> </div>| PaddlePaddle ์์ฑ ๊ณต์ ๊ณ์ | ๊ธฐ์ ํ ๋ก ๊ทธ๋ฃน ์ฐธ์ฌ |
|---|---|
PaddleOCR๊ฐ ์ค๋๋ ์ ๋ชจ์ต์ ๊ฐ์ถ๊ธฐ๊น์ง ๋๋ผ์ด ์ปค๋ฎค๋ํฐ์ ํ์ด ์์์ต๋๋ค! ๐ ์ค๋ ํํธ๋, ์๋ก์ด ํ๋ ฅ์, ๊ทธ๋ฆฌ๊ณ PaddleOCR์ ์ด์ ์ ์์์ฃผ์ ๋ชจ๋ ๋ถ๋ค๊ป ์ง์ฌ์ผ๋ก ๊ฐ์ฌ๋๋ฆฝ๋๋ค - ์ฌ๊ธฐ์ ์ด๋ฆ์ด ์ธ๊ธ๋์ง ์์ ๋ถ๋ค๊น์ง ํฌํจํ์ฌ. ์ฌ๋ฌ๋ถ์ ์ง์์ด ์ฐ๋ฆฌ์ ์๋๋ ฅ์ ๋๋ค!
<div align="center">| ํ๋ก์ ํธ ์ด๋ฆ | ์ค๋ช |
|---|---|
| Dify <a href="https://github.com/langgenius/dify"></a> | ์์ด์ ํธ ์ํฌํ๋ก์ฐ ๊ฐ๋ฐ์ ์ํ ํ๋ก๋์ ์ง์ ํ๋ซํผ. |
| RAGFlow <a href="https://github.com/infiniflow/ragflow"></a> | ์ฌ์ธต ๋ฌธ์ ์ดํด ๊ธฐ๋ฐ RAG ์์ง. |
| pathway <a href="https://github.com/pathwaycom/pathway"></a> | ์คํธ๋ฆผ ์ฒ๋ฆฌ, ์ค์๊ฐ ๋ถ์, LLM ํ์ดํ๋ผ์ธ ๋ฐ RAG๋ฅผ ์ํ Python ETL ํ๋ ์์ํฌ. |
| MinerU <a href="https://github.com/opendatalab/MinerU"></a> | ๋ค์ํ ์ ํ์ ๋ฌธ์๋ฅผ Markdown์ผ๋ก ๋ณํํ๋ ๋๊ตฌ. |
| Umi-OCR <a href="https://github.com/hiroi-sora/Umi-OCR"></a> | ๋ฌด๋ฃ, ์คํ์์ค, ์ผ๊ด ์คํ๋ผ์ธ OCR ์ํํธ์จ์ด. |
| cherry-studio <a href="https://github.com/CherryHQ/cherry-studio"></a> | ์ฌ๋ฌ LLM ์ ๊ณต์ ์ฒด๋ฅผ ์ง์ํ๋ ๋ฐ์คํฌํฑ ํด๋ผ์ด์ธํธ. |
| haystack<a href="https://github.com/deepset-ai/haystack"></a> | ์ปค์คํฐ๋ง์ด์ง ๊ฐ๋ฅํ ํ๋ก๋์ ์ง์ LLM ์ ํ๋ฆฌ์ผ์ด์ ๊ตฌ์ถ์ ์ํ AI ์ค์ผ์คํธ๋ ์ด์ ํ๋ ์์ํฌ. |
| OmniParser<a href="https://github.com/microsoft/OmniParser"></a> | ์์ ๋น์ ๊ธฐ๋ฐ GUI ์์ด์ ํธ๋ฅผ ์ํ ํ๋ฉด ํ์ฑ ๋๊ตฌ. |
| QAnything<a href="https://github.com/netease-youdao/QAnything"></a> | ๋ชจ๋ ๊ฒ์ ๊ธฐ๋ฐํ ์ง์์๋ต. |
| ๋ ๋ง์ ํ๋ก์ ํธ ๋ณด๊ธฐ | PaddleOCR ๊ธฐ๋ฐ ์ถ๊ฐ ํ๋ก์ ํธ |
์ด ํ๋ก์ ํธ๋ Apache 2.0 ๋ผ์ด์ ์ค๋ก ๋ฐฐํฌ๋ฉ๋๋ค.
@misc{cui2025paddleocr30technicalreport,
title={PaddleOCR 3.0 Technical Report},
author={Cheng Cui and Ting Sun and Manhui Lin and Tingquan Gao and Yubo Zhang and Jiaxuan Liu and Xueqing Wang and Zelun Zhang and Changda Zhou and Hongen Liu and Yue Zhang and Wenyu Lv and Kui Huang and Yichao Zhang and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2507.05595},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2507.05595},
}
@misc{cui2025paddleocrvlboostingmultilingualdocument,
title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2510.14528},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.14528},
}
@misc{cui2026paddleocrvl15multitask09bvlm,
title={PaddleOCR-VL-1.5: Towards a Multi-Task 0.9B VLM for Robust In-the-Wild Document Parsing},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2026},
eprint={2601.21957},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.21957},
}