readme/README_cn.md
English | 简体中文| 繁體中文 | 日本語 | 한국어 | Français | Русский | Español | العربية
<!-- icon --> </div>PaddleOCR 以业界领先的精准度,将 PDF 文档和图像转换为结构化、LLM 友好的数据格式(JSON/Markdown)。凭借 70,000+ Stars 的成绩,PaddleOCR 已获得 Dify、RAGFlow、Cherry Studio 等顶级项目的广泛信赖,是构建智能 RAG 和 Agentic 应用的核心基础组件。
为大模型时代将杂乱的文档视觉信息转化为结构化数据。
快速、精准的多语言文本检测与识别,被全球开发者广泛采用。
PaddleOCR-VL 系列、PP-StructureV3 和 PP-DocTranslation 现已支持将解析结果导出为 DOCX,便于在 Microsoft Word 中查看和编辑。PaddleOCR.js,支持在浏览器中运行 PP-OCRv5。发布PaddleOCR-VL:
模型介绍:
特性:
发布PP-OCRv5小语种识别模型:
重要模型新增:
部署能力升级:
Benchmark支持:
Bug修复:
use_chart_parsing 等开关行为与其他产线不统一的问题。其他升级:
PaddleOCR官方网站提供交互式体验中心和APIs——无需设置,一键体验。
👉 访问官方网站
对于本地使用,请根据您的需求参考以下文档:
⭐ 收藏本仓库,持续关注最新动态与版本发布,包括强大的 OCR 及文档解析等新功能特性。 ⭐
<div align="center"> <p> </p> </div>| PaddlePaddle 微信公众号 | 加入技术讨论群 |
|---|---|
PaddleOCR 的发展离不开社区贡献!💗衷心感谢所有开发者、合作伙伴与贡献者!
| 项目名称 | 简介 |
|---|---|
| RAGFlow <a href="https://github.com/infiniflow/ragflow"></a> | 基于RAG的AI工作流引擎 |
| pathway <a href="https://github.com/pathwaycom/pathway"></a> | 用于流处理、实时分析、LLM流水线和RAG的Python ETL框架 |
| MinerU <a href="https://github.com/opendatalab/MinerU"></a> | 多类型文档转换Markdown工具 |
| Umi-OCR <a href="https://github.com/hiroi-sora/Umi-OCR"></a> | 开源批量离线OCR软件 |
| cherry-studio <a href="https://github.com/CherryHQ/cherry-studio"></a> | 一个支持多个LLM提供商的桌面客户端 |
| OmniParser<a href="https://github.com/microsoft/OmniParser"></a> | 基于纯视觉的GUI智能体屏幕解析工具 |
| QAnything<a href="https://github.com/netease-youdao/QAnything"></a> | 基于任意内容的问答系统 |
| PDF-Extract-Kit <a href="https://github.com/opendatalab/PDF-Extract-Kit"></a> | 高效复杂PDF文档提取工具包 |
| Dango-Translator<a href="https://github.com/PantsuDango/Dango-Translator"></a> | 屏幕实时翻译工具 |
| 更多项目 | 更多基于PaddleOCR的项目 |
本项目采用Apache 2.0许可证发布。
@misc{cui2025paddleocr30technicalreport,
title={PaddleOCR 3.0 Technical Report},
author={Cheng Cui and Ting Sun and Manhui Lin and Tingquan Gao and Yubo Zhang and Jiaxuan Liu and Xueqing Wang and Zelun Zhang and Changda Zhou and Hongen Liu and Yue Zhang and Wenyu Lv and Kui Huang and Yichao Zhang and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2507.05595},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2507.05595},
}
@misc{cui2025paddleocrvlboostingmultilingualdocument,
title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2510.14528},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.14528},
}
@misc{cui2026paddleocrvl15multitask09bvlm,
title={PaddleOCR-VL-1.5: Towards a Multi-Task 0.9B VLM for Robust In-the-Wild Document Parsing},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2026},
eprint={2601.21957},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.21957},
}