Back to Paddleocr

Index.Ja

docs/index/index.ja.md

3.5.015.2 KB
Original Source
<div align="center"> <p align="center"> <a href="https://discord.gg/z9xaRVjdbD"></a> <a href="https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE"></a> <a href="https://github.com/PaddlePaddle/PaddleOCR/releases"></a> <a href=""></a> <a href=""></a> <a href="https://pypi.org/project/PaddleOCR/"></a> <a href="https://github.com/PaddlePaddle/PaddleOCR/stargazers"></a> </p> </div>

紹介

PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な OCR ツールを作成することを目的とし、ユーザーがより優れたモデルをトレーニングし、実践的に対応できるようになるために役立つAIOCRです。

<div align="center"> </div>

📣 最新アップデート

  • 🔥2022.8.24 リリース PaddleOCR release/2.6

    • PP-Structurev2がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、 レイアウトの復旧 さらに1 行のコマンドをPDFへ転換、そして Wordに変換可能。
    • レイアウト分析 の最適化:モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。
    • 表認識 最適化:3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。
    • キー情報抽出 最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。
  • 🔥2022.7 リリース OCR scene application collection

    • デジタルチューブ、液晶画面、ナンバー プレート、手書き認識モデル、高精度 SVTR モデルなど、9つの垂直モデルをリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。
  • 🔥2022.5.9 リリース PaddleOCR release/2.5

    • PP-OCRv3リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。
    • PPOCRLabelv2リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。
    • インタラクティブな電子書籍 "OCR に没入"、 をリリース。 OCRフルスタック技術の最先端の理論とコードの実践をカバー。
  • もっと

🌟 PaddleOCRとは?

PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション PP-OCRPP-Structure を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。

<div align="center"> </div>

⚡ 今すぐトライアル

bash
pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=japan # change for i18n abbr

Python環境がない場合は 環境の準備に従ってください。チュートリアル から始めることをお勧めします。

<a name="本"></a>

📚 電子書籍:OCRに入る

<a name="コミュニティ"></a>

👫コミュニティー

他国の開発者の方は PaddleOCR Discussions を国際的なコミュニティ プラットフォームとして使用します。みなさんのアイデアや質問がある場合、ここで英語で話し合うことができます。

<a name="対応中国機種一覧"></a>

🛠️ シリーズ モデル式一覧

モデル紹介モデル名推奨のシーン検出モデル認識モデル
日本語超軽量 PP-OCRv3 モデル(14.8M)japan_PP-OCRv3_xxモバイル & サーバー推論モデル/トレーニングモデル推論モデル/トレーニングモデル
英語超軽量PP-OCRv3モデル(13.4M)en_PP-OCRv3_xxモバイル & サーバー推論モデル / トレーニングモデル推論モデル / トレーニングモデル
中国語と英語の超軽量 PP-OCRv3 モデル(16.2M)ch_PP-OCRv3_xxモバイル & サーバー推論モデル / トレーニングモデル推論モデル / トレーニングモデル

<a name="チュートリアル"></a>

📖 チュートリアル

<a name="language_requests"></a>

🇺🇳 新しい言語リクエストのガイドライン

新言語モデルをリクエストしたい場合、多言語モデルのアップグレードへの投票で投票してください。投票結果に応じて定期的にモデルがアップグレードされます。友達を招待して一緒に投票しましょう!

シナリオに基づいて新しい言語モデルをトレーニング する必要がある場合は、多言語モデル トレーニング プロジェクト のチュートリアルがデータセットの準備にご利用でき、 プロセス全体を段階的に表示することができます。

元の多言語 OCR 開発計画 には、まだ多くの有用なコーパスと辞書が表示されています

<a name="ビジュアリゼーション"></a>

👀 ビジュアリゼーション more

<details open> <summary>PP-OCRv3 多言語モデル</summary> <div align="center"> </div> </details> <details open> <summary>PP-OCRv3 英語 モデル</summary> <div align="center"> </div> </details> <details open> <summary>PP-OCRv3 中国語 モデル</summary> <div align="center"> </div> </details> <details open> <summary>PP-Structurev2</summary> 1. レイアウト分析+テーブル認識 <div align="center"> </div> 2. SER (セマンティックエンティティ認識) <div align="center"> </div> <div align="center"> </div> <div align="center"> </div> 3. RE (関係抽出) <div align="center"> </div> <div align="center"> </div> <div align="center"> </div> </details>

<a name="ライセンス"></a>

📄 ライセンス

このプロジェクトは以下の場所でリリースされています <a href="https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE">Apache 2.0 license</a>