readme/README_fr.md
English | 简体中文 | 繁體中文 | 日本語 | 한국어 | Français | Русский | Español | العربية
<!-- icon --> </div>PaddleOCR convertit des documents et des images en données structurées prêtes pour les LLM (JSON/Markdown) avec une précision de pointe dans l'industrie. Avec plus de 70k étoiles et la confiance de projets de premier plan tels que Dify, RAGFlow et Cherry Studio, PaddleOCR est le socle fondamental pour construire des applications RAG intelligentes et des applications Agentiques.
Transformer des visuels désordonnés en données structurées pour l'ère des LLM.
L'étalon-or mondial pour la détection de texte multilingue à haute vitesse.
PaddleOCR-VL, PP-StructureV3 et PP-DocTranslation prennent désormais en charge l'export des résultats d'analyse au format DOCX pour une consultation et une édition pratiques dans Microsoft Word.PaddleOCR.js, qui permet d'exécuter PP-OCRv5 directement dans le navigateur.Publication de PaddleOCR-VL :
Présentation du modèle :
Fonctionnalités principales :
Publication du modèle de reconnaissance multilingue PP-OCRv5 :
Ajouts significatifs de modèles :
Améliorations des capacités de déploiement :
Support des benchmarks :
Corrections de bugs :
use_chart_parsing) dans les fichiers de configuration PP-StructureV3 par rapport aux autres pipelines.Autres améliorations :
Le site officiel de PaddleOCR propose un Centre d'expérience interactif et des API — aucune configuration requise, un seul clic pour découvrir.
Pour une utilisation locale, veuillez consulter la documentation suivante en fonction de vos besoins :
⭐ Mettez une étoile à ce dépôt pour suivre les mises à jour passionnantes et les nouvelles versions, y compris les puissantes capacités d'OCR et d'analyse de documents ! ⭐
<div align="center"> <p> </p> </div>| Compte officiel WeChat de PaddlePaddle | Rejoindre le groupe de discussion technique |
|---|---|
PaddleOCR n'en serait pas là aujourd'hui sans son incroyable communauté ! 💗 Un immense merci à tous nos partenaires de longue date, aux nouveaux collaborateurs et à tous ceux qui ont mis leur passion dans PaddleOCR — que nous vous ayons cités ou non. Votre soutien alimente notre feu !
<div align="center">| Nom du projet | Description |
|---|---|
| Dify <a href="https://github.com/langgenius/dify"></a> | Plateforme prête pour la production pour le développement de flux de travail agentiques. |
| RAGFlow <a href="https://github.com/infiniflow/ragflow"></a> | Moteur RAG basé sur la compréhension approfondie des documents. |
| pathway <a href="https://github.com/pathwaycom/pathway"></a> | Framework Python ETL pour le traitement de flux, l'analytique en temps réel, les pipelines LLM et le RAG. |
| MinerU <a href="https://github.com/opendatalab/MinerU"></a> | Outil de conversion de documents multi-types en Markdown. |
| Umi-OCR <a href="https://github.com/hiroi-sora/Umi-OCR"></a> | Logiciel OCR hors ligne par lots, gratuit et open-source. |
| cherry-studio <a href="https://github.com/CherryHQ/cherry-studio"></a> | Un client de bureau prenant en charge plusieurs fournisseurs de LLM. |
| haystack<a href="https://github.com/deepset-ai/haystack"></a> | Framework d'orchestration IA pour construire des applications LLM personnalisables et prêtes pour la production. |
| OmniParser<a href="https://github.com/microsoft/OmniParser"></a> | OmniParser : Outil d'analyse d'écran pour agent GUI basé sur la vision pure. |
| QAnything<a href="https://github.com/netease-youdao/QAnything"></a> | Questions et réponses basées sur n'importe quoi. |
| En savoir plus sur les projets | Plus de projets basés sur PaddleOCR |
Ce projet est publié sous la licence Apache 2.0.
@misc{cui2025paddleocr30technicalreport,
title={PaddleOCR 3.0 Technical Report},
author={Cheng Cui and Ting Sun and Manhui Lin and Tingquan Gao and Yubo Zhang and Jiaxuan Liu and Xueqing Wang and Zelun Zhang and Changda Zhou and Hongen Liu and Yue Zhang and Wenyu Lv and Kui Huang and Yichao Zhang and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2507.05595},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2507.05595},
}
@misc{cui2025paddleocrvlboostingmultilingualdocument,
title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2510.14528},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.14528},
}
@misc{cui2026paddleocrvl15multitask09bvlm,
title={PaddleOCR-VL-1.5: Towards a Multi-Task 0.9B VLM for Robust In-the-Wild Document Parsing},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2026},
eprint={2601.21957},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.21957},
}