readme/README_ar.md
English | 简体中文 | 繁體中文 | 日本語 | 한국어 | Français | Русский | Español | العربية
<!-- icon --> </div>يحوّل PaddleOCR المستندات والصور إلى بيانات منظمة جاهزة للنماذج اللغوية الكبيرة (JSON/Markdown) بدقة رائدة في المجال. بأكثر من 70 ألف نجمة وثقة مشاريع رائدة مثل Dify وRAGFlow وCherry Studio، يُعد PaddleOCR الأساس المتين لبناء تطبيقات RAG والتطبيقات الوكيلية الذكية.
تحويل المرئيات المعقدة إلى بيانات منظمة لعصر النماذج اللغوية الكبيرة.
المعيار الذهبي العالمي للكشف السريع عن النصوص متعددة اللغات.
PaddleOCR-VL وPP-StructureV3 وPP-DocTranslation تدعم الآن تصدير نتائج التحليل إلى DOCX لسهولة العرض والتحرير في Microsoft Word.PaddleOCR.js، وهي حزمة SDK الرسمية للاستدلال في المتصفح، وتدعم تشغيل PP-OCRv5 مباشرة داخل المتصفح.إصدار PaddleOCR-VL:
تقديم النموذج:
الميزات الأساسية:
إصدار نموذج التعرف متعدد اللغات PP-OCRv5:
إضافات نموذجية مهمة:
ترقيات قدرات النشر:
دعم المعايير المرجعية:
إصلاح الأخطاء:
use_chart_parsing) في ملفات تكوين PP-StructureV3 مقارنة بخطوط الأنابيب الأخرى.تحسينات أخرى:
يوفر الموقع الرسمي لـ PaddleOCR مركز تجربة تفاعلي وواجهات برمجة التطبيقات (APIs) — لا حاجة لأي إعداد، فقط انقر لتجربة الخدمة.
للاستخدام المحلي، يُرجى الرجوع إلى الوثائق التالية بناءً على احتياجاتك:
⭐ قم بتمييز هذا المستودع بنجمة لمتابعة التحديثات والإصدارات الجديدة المثيرة، بما في ذلك إمكانيات التعرف الضوئي على الحروف وتحليل المستندات القوية! ⭐
<div align="center"> <p> </p> </div>| حساب PaddlePaddle الرسمي على WeChat | انضم إلى مجموعة النقاش التقني |
|---|---|
لم يكن PaddleOCR ليصل إلى ما هو عليه اليوم لولا مجتمعه المذهل! 💗 شكر جزيل لجميع شركائنا القدامى والمتعاونين الجدد وكل من بذل شغفه في PaddleOCR — سواء ذكرنا اسمه أم لا. دعمكم هو وقود حماسنا!
<div align="center">| اسم المشروع | الوصف |
|---|---|
| Dify <a href="https://github.com/langgenius/dify"></a> | منصة جاهزة للإنتاج لتطوير سير العمل الوكيلي. |
| RAGFlow <a href="https://github.com/infiniflow/ragflow"></a> | محرك RAG قائم على الفهم العميق للمستندات. |
| pathway <a href="https://github.com/pathwaycom/pathway"></a> | إطار عمل Python ETL لمعالجة التدفقات والتحليلات الآنية وخطوط أنابيب النماذج اللغوية الكبيرة وRAG. |
| MinerU <a href="https://github.com/opendatalab/MinerU"></a> | أداة تحويل المستندات متعددة الأنواع إلى Markdown. |
| Umi-OCR <a href="https://github.com/hiroi-sora/Umi-OCR"></a> | برنامج OCR مجاني، مفتوح المصدر، للمعالجة الدفعية دون اتصال بالإنترنت. |
| cherry-studio <a href="https://github.com/CherryHQ/cherry-studio"></a> | تطبيق سطح مكتب يدعم مزودي نماذج لغوية كبيرة متعددين. |
| haystack<a href="https://github.com/deepset-ai/haystack"></a> | إطار عمل لتنظيم الذكاء الاصطناعي لبناء تطبيقات نماذج لغوية كبيرة قابلة للتخصيص وجاهزة للإنتاج. |
| OmniParser<a href="https://github.com/microsoft/OmniParser"></a> | OmniParser: أداة تحليل الشاشة لوكيل واجهة المستخدم الرسومية القائم على الرؤية البحتة. |
| QAnything<a href="https://github.com/netease-youdao/QAnything"></a> | الأسئلة والأجوبة المبنية على أي شيء. |
| تعرّف على المزيد من المشاريع | المزيد من المشاريع المبنية على PaddleOCR |
هذا المشروع مُصدر بموجب رخصة Apache 2.0.
@misc{cui2025paddleocr30technicalreport,
title={PaddleOCR 3.0 Technical Report},
author={Cheng Cui and Ting Sun and Manhui Lin and Tingquan Gao and Yubo Zhang and Jiaxuan Liu and Xueqing Wang and Zelun Zhang and Changda Zhou and Hongen Liu and Yue Zhang and Wenyu Lv and Kui Huang and Yichao Zhang and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2507.05595},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2507.05595},
}
@misc{cui2025paddleocrvlboostingmultilingualdocument,
title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2510.14528},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.14528},
}
@misc{cui2026paddleocrvl15multitask09bvlm,
title={PaddleOCR-VL-1.5: Towards a Multi-Task 0.9B VLM for Robust In-the-Wild Document Parsing},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2026},
eprint={2601.21957},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.21957},
}