packages/shared-skills/skills/ultimate-browsing/references/agent-reach/web.md
通用网页、微信公众号、RSS。
# 读取任意网页内容
curl -s "https://r.jina.ai/URL"
# 示例
curl -s "https://r.jina.ai/https://example.com/article"
适用场景: 大多数网页可以直接用 Jina Reader 读取。
# 读取网页内容 (Markdown 格式)
mcporter call 'web-reader.webReader(url: "https://example.com")'
# 保留图片
mcporter call 'web-reader.webReader(url: "https://example.com", retain_images: true)'
# 纯文本格式
mcporter call 'web-reader.webReader(url: "https://example.com", return_format: "text")'
适用场景: 需要更精确控制输出格式时使用。
# 搜索微信公众号文章
mcporter call 'exa.web_search_exa(query: "搜索关键词", numResults: 5, includeDomains: ["mp.weixin.qq.com"])'
# 抓取文章全文
mcporter call 'exa.crawling_exa(urls: ["https://mp.weixin.qq.com/s/ARTICLE_ID"], maxCharacters: 10000)'
agent-reach run wechat-article "https://mp.weixin.qq.com/s/ARTICLE_ID" # Camoufox-backed WeChat reader
注意: Jina Reader 无法读取微信文章(被 CAPTCHA 拦截),推荐用 Exa。
python3 -c "
import feedparser
for e in feedparser.parse('FEED_URL').entries[:5]:
print(f'{e.title} — {e.link}')
"
适用场景: 订阅博客、新闻源、播客等 RSS feed。
| 场景 | 推荐工具 |
|---|---|
| 通用网页 | Jina Reader (curl r.jina.ai) |
| 需要图片/格式控制 | web-reader MCP |
| 微信公众号 | Exa (搜索+阅读) / Camoufox (可选阅读) |
| RSS 订阅 | feedparser |
| 微博/知乎等 | Jina Reader |