readme/README_ja.md
English | 简体中文 | 繁體中文 | 日本語 | 한국어 | Français | Русский | Español | العربية
<!-- icon --> </div>PaddleOCRは、ドキュメントや画像を業界最高水準の精度で構造化されたLLM対応データ(JSON/Markdown)に変換します。70,000以上のStarを獲得し、Dify、RAGFlow、Cherry Studioなどの一流プロジェクトで採用されているPaddleOCRは、インテリジェントなRAGおよびエージェントアプリケーション構築の基盤です。
LLM時代に向けて、雑然とした視覚データを構造化データに変換
高速・多言語テキスト検出のグローバルスタンダード
PaddleOCR-VL シリーズ、PP-StructureV3、PP-DocTranslation で、解析結果を DOCX として出力できるようになり、Microsoft Word での閲覧・編集が容易に。PaddleOCR.js を公開し、ブラウザ上で PP-OCRv5 を実行可能。PaddleOCR-VLをリリース:
モデル紹介:
主要機能:
PP-OCRv5多言語認識モデルをリリース:
モデルの大幅な追加:
デプロイメント機能のアップグレード:
ベンチマークサポート:
バグ修正:
use_chart_parsing)の他のパイプラインとの不整合を修正。その他の改善:
PaddleOCR公式ウェブサイトでは、インタラクティブな体験センターとAPIを提供しています。セットアップ不要、ワンクリックで体験できます。
ローカルでの使用については、ニーズに応じて以下のドキュメントを参照してください:
⭐ このリポジトリにStarを付けて、強力なOCRおよびドキュメント解析機能を含むエキサイティングなアップデートや新リリースを見逃さないようにしましょう! ⭐
<div align="center"> <p> </p> </div>| PaddlePaddle WeChat公式アカウント | 技術ディスカッショングループに参加 |
|---|---|
PaddleOCRが今日あるのは、素晴らしいコミュニティのおかげです!💗 長年のパートナー、新たな協力者、そしてPaddleOCRに情熱を注いでくださったすべての皆様に心から感謝いたします。名前を挙げきれなかった方も含めて、皆様のサポートが私たちの原動力です!
<div align="center">| プロジェクト名 | 説明 |
|---|---|
| Dify <a href="https://github.com/langgenius/dify"></a> | エージェントワークフロー開発のためのプロダクション対応プラットフォーム。 |
| RAGFlow <a href="https://github.com/infiniflow/ragflow"></a> | 深いドキュメント理解に基づくRAGエンジン。 |
| pathway <a href="https://github.com/pathwaycom/pathway"></a> | ストリーム処理、リアルタイム分析、LLMパイプライン、RAG向けのPython ETLフレームワーク。 |
| MinerU <a href="https://github.com/opendatalab/MinerU"></a> | マルチタイプドキュメントからMarkdownへの変換ツール。 |
| Umi-OCR <a href="https://github.com/hiroi-sora/Umi-OCR"></a> | 無料・オープンソースのバッチオフラインOCRソフトウェア。 |
| cherry-studio <a href="https://github.com/CherryHQ/cherry-studio"></a> | 複数のLLMプロバイダーをサポートするデスクトップクライアント。 |
| haystack<a href="https://github.com/deepset-ai/haystack"></a> | カスタマイズ可能なプロダクション対応LLMアプリケーションを構築するためのAIオーケストレーションフレームワーク。 |
| OmniParser<a href="https://github.com/microsoft/OmniParser"></a> | 純粋なビジョンベースのGUIエージェント向け画面解析ツール。 |
| QAnything<a href="https://github.com/netease-youdao/QAnything"></a> | あらゆるものに基づく質問応答。 |
| その他のプロジェクトを見る | PaddleOCRに基づくその他のプロジェクト |
このプロジェクトはApache 2.0ライセンスの下で公開されています。
@misc{cui2025paddleocr30technicalreport,
title={PaddleOCR 3.0 Technical Report},
author={Cheng Cui and Ting Sun and Manhui Lin and Tingquan Gao and Yubo Zhang and Jiaxuan Liu and Xueqing Wang and Zelun Zhang and Changda Zhou and Hongen Liu and Yue Zhang and Wenyu Lv and Kui Huang and Yichao Zhang and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2507.05595},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2507.05595},
}
@misc{cui2025paddleocrvlboostingmultilingualdocument,
title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2025},
eprint={2510.14528},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.14528},
}
@misc{cui2026paddleocrvl15multitask09bvlm,
title={PaddleOCR-VL-1.5: Towards a Multi-Task 0.9B VLM for Robust In-the-Wild Document Parsing},
author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
year={2026},
eprint={2601.21957},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2601.21957},
}