Back to Oh My Openagent

网页阅读

packages/shared-skills/skills/ultimate-browsing/references/agent-reach/web.md

4.13.01.9 KB
Original Source

网页阅读

通用网页、微信公众号、RSS。

通用网页 (Jina Reader)

bash
# 读取任意网页内容
curl -s "https://r.jina.ai/URL"

# 示例
curl -s "https://r.jina.ai/https://example.com/article"

适用场景: 大多数网页可以直接用 Jina Reader 读取。

Web Reader (MCP)

bash
# 读取网页内容 (Markdown 格式)
mcporter call 'web-reader.webReader(url: "https://example.com")'

# 保留图片
mcporter call 'web-reader.webReader(url: "https://example.com", retain_images: true)'

# 纯文本格式
mcporter call 'web-reader.webReader(url: "https://example.com", return_format: "text")'

适用场景: 需要更精确控制输出格式时使用。

微信公众号 / WeChat Articles

搜索公众号文章(通过 Exa)

bash
# 搜索微信公众号文章
mcporter call 'exa.web_search_exa(query: "搜索关键词", numResults: 5, includeDomains: ["mp.weixin.qq.com"])'

阅读公众号文章全文(通过 Exa)

bash
# 抓取文章全文
mcporter call 'exa.crawling_exa(urls: ["https://mp.weixin.qq.com/s/ARTICLE_ID"], maxCharacters: 10000)'

可选:Camoufox 阅读(反爬更强)

bash
agent-reach run wechat-article "https://mp.weixin.qq.com/s/ARTICLE_ID"   # Camoufox-backed WeChat reader

注意: Jina Reader 无法读取微信文章(被 CAPTCHA 拦截),推荐用 Exa。

RSS (feedparser)

python
python3 -c "
import feedparser
for e in feedparser.parse('FEED_URL').entries[:5]:
    print(f'{e.title} — {e.link}')
"

适用场景: 订阅博客、新闻源、播客等 RSS feed。

选择指南

场景推荐工具
通用网页Jina Reader (curl r.jina.ai)
需要图片/格式控制web-reader MCP
微信公众号Exa (搜索+阅读) / Camoufox (可选阅读)
RSS 订阅feedparser
微博/知乎等Jina Reader