langchain-paddleocr/README_cn.md
本 Python 包在 LangChain 生态系统中提供对 PaddleOCR 功能的访问。
pip install langchain-paddleocr
PaddleOCRVLLoaderPaddleOCRVLLoader 允许你:
PaddleOCRVLLoader 的基本用法如下:
from langchain_paddleocr import PaddleOCRVLLoader
from pydantic import SecretStr
loader = PaddleOCRVLLoader(
file_path="path/to/document.pdf",
api_url="your-api-endpoint",
access_token=SecretStr("your-access-token") # 如果使用环境变量 `PADDLEOCR_ACCESS_TOKEN`,则此项为可选
)
docs = loader.load()
for doc in docs[:2]:
print(f"Content: {doc.page_content[:200]}...")
print(f"Source: {doc.metadata['source']}")
print("---")
完整文档请参阅 LangChain 文档。