readme/README_ru.md
English | 简体中文 | 繁體中文 | 日本語 | 한국어 | Français | Русский | Español | العربية
<!-- icon --> </div>PaddleOCR преобразует документы и изображения в структурированные данные, готовые для использования с LLM (JSON/Markdown), с точностью мирового уровня. Имея более 70 тысяч звёзд и доверие таких ведущих проектов, как Dify, RAGFlow и Cherry Studio, PaddleOCR является основой для создания интеллектуальных приложений RAG и Agentic.
Преобразование сложных визуальных данных в структурированные данные для эпохи LLM.
Мировой золотой стандарт высокоскоростного многоязычного обнаружения текста.
PaddleOCR-VL, PP-StructureV3 и PP-DocTranslation теперь поддерживают экспорт результатов разбора в формат DOCX для удобного просмотра и редактирования в Microsoft Word.PaddleOCR.js, который поддерживает запуск PP-OCRv5 прямо в браузере.Выпуск PaddleOCR-VL:
Описание модели:
Основные возможности:
Выпуск PP-OCRv5 — многоязычной модели распознавания:
Значительные дополнения моделей:
Улучшения возможностей развёртывания:
Поддержка бенчмарков:
Исправления ошибок:
use_chart_parsing) в файлах конфигурации PP-StructureV3 по сравнению с другими конвейерами.Прочие улучшения:
Официальный сайт PaddleOCR предоставляет интерактивный Центр опыта и API — без необходимости настройки, просто один клик для ознакомления.
Для локального использования обратитесь к следующей документации в соответствии с вашими потребностями:
⭐ Добавьте этот репозиторий в избранное, чтобы быть в курсе захватывающих обновлений и новых выпусков, включая мощные возможности OCR и разбора документов! ⭐
<div align="center"> <p> </p> </div>| Официальный аккаунт PaddlePaddle в WeChat | Присоединиться к группе технических обсуждений |
|---|---|
PaddleOCR не достиг бы своего нынешнего уровня без своего невероятного сообщества! 💗 Огромная благодарность всем нашим давним партнёрам, новым соавторам и всем, кто вложил свою душу в PaddleOCR — независимо от того, упомянуты вы здесь или нет. Ваша поддержка питает наш огонь!
<div align="center">| Название проекта | Описание |
|---|---|
| Dify <a href="https://github.com/langgenius/dify"></a> | Готовая к производству платформа для разработки агентных рабочих процессов. |
| RAGFlow <a href="https://github.com/infiniflow/ragflow"></a> | RAG-движок на основе глубокого понимания документов. |
| pathway <a href="https://github.com/pathwaycom/pathway"></a> | Python ETL-фреймворк для потоковой обработки, аналитики в реальном времени, конвейеров LLM и RAG. |
| MinerU <a href="https://github.com/opendatalab/MinerU"></a> | Инструмент для конвертации документов различных типов в Markdown. |
| Umi-OCR <a href="https://github.com/hiroi-sora/Umi-OCR"></a> | Бесплатное программное обеспечение для пакетного офлайн-OCR с открытым исходным кодом. |
| cherry-studio <a href="https://github.com/CherryHQ/cherry-studio"></a> | Настольный клиент с поддержкой нескольких провайдеров LLM. |
| haystack<a href="https://github.com/deepset-ai/haystack"></a> | Фреймворк оркестрации AI для создания настраиваемых, готовых к производству приложений LLM. |
| OmniParser<a href="https://github.com/microsoft/OmniParser"></a> | OmniParser: инструмент разбора экрана для агента GUI на основе чистого зрения. |
| QAnything<a href="https://github.com/netease-youdao/QAnything"></a> | Вопросы и ответы на основе чего угодно. |
| Узнать о других проектах | Другие проекты на основе PaddleOCR |
Этот проект выпущен под лицензией Apache 2.0.
@misc{cui2025paddleocr30technicalreport,
title={PaddleOCR 3.0 Technical Report},
author={Cheng Cui and Ting Sun and Manhui Lin and Tingquan Gao and Yubo Zhang and Jiaxuan Liu and Xueqing Wang and Zelun Zhang and Changda Zhou and Hongen Liu and Yue Zhang and Wenyu Lv and Kui Huang and Yichao Zhang and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2507.05595},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2507.05595},
}
@misc{cui2025paddleocrvlboostingmultilingualdocument,
title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2510.14528},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.14528},
}
@misc{cui2026paddleocrvl15multitask09bvlm,
title={PaddleOCR-VL-1.5: Towards a Multi-Task 0.9B VLM for Robust In-the-Wild Document Parsing},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2026},
eprint={2601.21957},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.21957},
}