Back to Paddleocr

Overview

docs/version3.x/paddlex/overview.md

3.5.011.2 KB
Original Source

1. 低代码全流程开发简介

飞桨低代码开发工具 PaddleX,依托于 PaddleOCR 的先进技术,支持了 OCR 领域的低代码全流程开发能力。通过低代码开发,可实现简单且高效的模型使用、组合与定制。这将显著减少模型开发的时间消耗降低其开发难度,大大加快模型在行业中的应用和推广速度。特色如下:

  • 🎨 模型丰富一键调用:将文本图像智能分析、通用 OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的48个模型整合为 10 条模型产线,通过极简的Python API一键调用,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计200+模型,形成30+单功能模块,方便开发者进行模型组合使用。

  • 🚀 提高效率降低门槛:提供基于统一命令图形界面两种方式,实现模型简洁高效的使用、组合与定制。支持高性能推理、服务化部署和端侧部署等多种部署方式。此外,对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等,进行模型开发时,都可以无缝切换

说明:PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程,其中包含能够独立完成某类任务的单模型(单功能模块)组合。

2. OCR相关能力支持

PaddleX 中 OCR 相关的 10 条产线均支持本地快速推理,部分产线支持在线体验,您可以快速体验各个产线的预训练模型效果,如果您对产线的预训练模型效果满意,可以直接对产线进行高性能推理/服务化部署/端侧部署,如果不满意,您也可以使用产线的二次开发能力,提升效果。完整的产线开发流程请参考PaddleX产线使用概览或各产线使用教程。

此外,PaddleX为开发者提供了基于云端图形化开发界面的全流程开发工具, 详细请参考教程《零门槛开发产业级AI模型》

<table > <tr> <th>模型产线</th> <th>在线体验</th> <th>快速推理</th> <th>高性能推理</th> <th>服务化部署</th> <th>端侧部署</th> <th>二次开发</th> <th><a href = "https://aistudio.baidu.com/pipeline/mine">星河零代码产线</a></td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/doc_preprocessor.html">文档图像预处理</a></td> <td>🚧</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>🚧</td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/OCR.html">通用OCR</a></td> <td><a href = "https://aistudio.baidu.com/community/app/91660/webUI?source=appMineRecent">链接</a></td> <td>✅</td> <td>✅</td> <td>✅</td> <td>✅</td> <td>✅</td> <td>✅</td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/table_recognition.html">通用表格识别</a></td> <td><a href = "https://aistudio.baidu.com/community/app/91661?source=appMineRecent">链接</a></td> <td>✅</td> <td>✅</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>✅</td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/table_recognition_v2.html">通用表格识别v2</a></td> <td>🚧</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>🚧</td> </tr> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/formula_recognition.html">公式识别</a></td> <td><a href = "https://aistudio.baidu.com/community/app/387976/webUI?source=appCenter">链接</a></td> <td>✅</td> <td>✅</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>✅</td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/seal_recognition.html">印章文本识别</a></td> <td><a href = "https://aistudio.baidu.com/community/app/387977/webUI?source=appCenter">链接</a></td> <td>✅</td> <td>✅</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>✅</td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/layout_parsing.html">通用版面解析</a></td> <td>🚧</td> <td>✅</td> <td>✅</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>🚧</td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/ocr_pipelines/layout_parsing_v2.html">通用版面解析v2</a></td> <td>🚧</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>🚧</td> <td>🚧</td> <td>🚧</td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/information_extraction_pipelines/document_scene_information_extraction.html">文档场景信息抽取v3</a></td> <td><a href = "https://aistudio.baidu.com/community/app/182491/webUI?source=appCenter">链接</a></td> <td>✅</td> <td>✅</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>✅</td> </tr> <tr> <td><a href="https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/information_extraction_pipelines/document_scene_information_extraction.html">文档场景信息抽取v4</a></td> <td>🚧</td> <td>✅</td> <td>✅</td> <td>✅</td> <td>🚧</td> <td>✅</td> <td>🚧</td> </tr> </table>

❗注:以上功能均基于GPU/CPU实现。PaddleX还可在昆仑芯、昇腾、寒武纪和海光等主流硬件上进行快速推理和二次开发。下表详细列出了模型产线的支持情况,具体支持的模型列表请参阅 模型列表(NPU) // 模型列表(XPU) // 模型列表(MLU) // 模型列表DCU。同时我们也在适配更多的模型,并在主流硬件上推动高性能和服务化部署的实施。

🚀 国产化硬件能力支持

<table> <tr> <th>模型产线</th> <th>昇腾 910B</th> <th>昆仑芯 R200/R300</th> <th>寒武纪 MLU370X8</th> <th>海光 Z100/K100AI</th> </tr> <tr> <td>通用OCR</td> <td>✅</td> <td>✅</td> <td>✅</td> <td>✅</td> </tr> <tr> <td>通用表格识别</td> <td>✅</td> <td>🚧</td> <td>🚧</td> <td>🚧</td> </tr> </table>

3. OCR相关模型产线列表和教程

4. OCR相关单功能模块列表和教程