readme/README_tcn.md
English | 简体中文| 繁體中文 | 日本語 | 한국어 | Français | Русский | Español | العربية
<!-- icon --> </div>PaddleOCR 以業界領先的精準度,將 PDF 文件和圖像轉換為結構化、LLM 友好的資料格式(JSON/Markdown)。憑藉 70,000+ Stars 的成績,PaddleOCR 已獲得 Dify、RAGFlow、Cherry Studio 等頂級專案的廣泛信賴,是建構智慧 RAG 和 Agentic 應用的核心基礎元件。
為大模型時代將雜亂的文檔視覺信息轉化為結構化數據。
快速、多語言文本檢測與識別的全球黃金標準。
PaddleOCR-VL 系列、PP-StructureV3 和 PP-DocTranslation 現已支持將解析結果導出為 DOCX,便於在 Microsoft Word 中查看和編輯。PaddleOCR.js,支持在瀏覽器中運行 PP-OCRv5。發布PaddleOCR-VL:
模型介紹:
特性:
發布PP-OCRv5小語種識別模型:
重要模型新增:
部署能力升級:
Benchmark支持:
Bug修復:
use_chart_parsing 等開關行為與其他產線不統一的問題。其他升級:
PaddleOCR官方網站提供交互式體驗中心和APIs——無需設置,一鍵體驗。
👉 訪問官方網站
對於本地使用,請根據您的需求參考以下文檔:
⭐ 收藏本倉庫,持續關注最新動態與版本發布,包括強大的 OCR 及文檔解析等新功能特性。 ⭐
<div align="center"> <p> </p> </div>| PaddlePaddle 微信公眾號 | 加入技術討論群 |
|---|---|
PaddleOCR 的發展離不開社區貢獻!💗衷心感謝所有開發者、合作夥伴與貢獻者!
| 項目名稱 | 簡介 |
|---|---|
| RAGFlow <a href="https://github.com/infiniflow/ragflow"></a> | 基於RAG的AI工作流引擎 |
| pathway <a href="https://github.com/pathwaycom/pathway"></a> | 用於流處理、實時分析、LLM流水線和RAG的Python ETL框架 |
| MinerU <a href="https://github.com/opendatalab/MinerU"></a> | 多類型文檔轉換Markdown工具 |
| Umi-OCR <a href="https://github.com/hiroi-sora/Umi-OCR"></a> | 開源批量離線OCR軟件 |
| cherry-studio <a href="https://github.com/CherryHQ/cherry-studio"></a> | 一個支持多個LLM提供商的桌面客戶端 |
| OmniParser<a href="https://github.com/microsoft/OmniParser"></a> | 基於純視覺的GUI智能體屏幕解析工具 |
| QAnything<a href="https://github.com/netease-youdao/QAnything"></a> | 基於任意內容的問答系統 |
| PDF-Extract-Kit <a href="https://github.com/opendatalab/PDF-Extract-Kit"></a> | 高效複雜PDF文檔提取工具包 |
| Dango-Translator<a href="https://github.com/PantsuDango/Dango-Translator"></a> | 屏幕實時翻譯工具 |
| 更多項目 | 更多基於PaddleOCR的項目 |
本項目採用Apache 2.0許可證發布。
@misc{cui2025paddleocr30technicalreport,
title={PaddleOCR 3.0 Technical Report},
author={Cheng Cui and Ting Sun and Manhui Lin and Tingquan Gao and Yubo Zhang and Jiaxuan Liu and Xueqing Wang and Zelun Zhang and Changda Zhou and Hongen Liu and Yue Zhang and Wenyu Lv and Kui Huang and Yichao Zhang and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2507.05595},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2507.05595},
}
@misc{cui2025paddleocrvlboostingmultilingualdocument,
title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2510.14528},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.14528},
}
@misc{cui2026paddleocrvl15multitask09bvlm,
title={PaddleOCR-VL-1.5: Towards a Multi-Task 0.9B VLM for Robust In-the-Wild Document Parsing},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2026},
eprint={2601.21957},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.21957},
}