Back to Daily Stock Analysis

数据源稳定性与故障处理图示

docs/data-source-stability.md

3.24.19.3 KB
Original Source

数据源稳定性与故障处理图示

本文面向用户、部署者和维护者,说明 DSA 已接入的数据源如何参与分析、选股和大盘复盘,以及当数据源失败时系统会怎么降级。

核心原则:先用项目已经接入并验证过的数据源,把失败路径讲清楚;新增外部数据源应放在第二阶段,避免先扩大维护面。

一句话答复用户

如果遇到“数据源失败”,通常不是系统只能用一个源,而是免费源被限流、上游接口临时变更、网络抖动或当前市场/标的不支持。DSA 已经内置多数据源 fallback,会按场景自动尝试下一个源;如果你希望更稳定,建议至少配置一个 token 型稳定源:

  • A 股个股与 AlphaSift:优先配置 TUSHARE_TOKEN,并保留 AkShare / Efinance / Tencent / Baostock / YFinance 兜底。
  • A 股大盘复盘:配置 TICKFLOW_API_KEY 后,指数和市场宽度会优先尝试 TickFlow,失败后回退现有免费源。
  • 港股 / 美股:配置 LONGBRIDGE_* 后优先使用 Longbridge,YFinance、Finnhub、AlphaVantage 继续兜底。
  • 热点题材:AlphaSift 热点默认走 DSA EastMoney provider,并使用本地 last-good cache 降低实时接口失败影响。

已接入数据源矩阵

场景已接入源默认使用方式失败处理
A 股日线 / 技术面Efinance、Tencent、AkShare、Tushare、Pytdx、Baostock、YFinanceDataFetcherManager 按优先级尝试;配置 TUSHARE_TOKEN 后 Tushare 自动进入候选源单源失败后尝试下一个源;连续失败会短期熔断该源
A 股实时行情Tencent、AkShare Sina、Efinance、AkShare EM、TushareREALTIME_SOURCE_PRIORITY 控制顺序,默认偏向 Tencent / Sina 这类轻量源失败源记录 fallback_from,成功源继续返回
A 股大盘复盘TickFlow、AkShare、Tushare、Efinance配置 TICKFLOW_API_KEY 后,主指数和市场宽度优先尝试 TickFlowTickFlow 权限不足或失败时回退 AkShare / Tushare / Efinance 链路
AlphaSift 选股快照Tushare、Sina、Efinance、AkShare EM、EastMoney DatacenterTUSHARE_TOKEN 时自动把 tushare 放入快照优先级;否则使用免费源链路AlphaSift 维护 source health;DSA 状态接口透出 snapshot/daily health
AlphaSift 日线补特征DSA DataFetcherManagerAlphaSift 调用 DSA provider context,优先复用 DSA 日线与缓存链路DSA 链路失败后才回到 AlphaSift 原始日线源
AlphaSift 热点题材DSA EastMoney provider、AlphaSift hotspot、last-good cache未指定 provider 时默认使用 DSA EastMoney provider实时失败时回退热点缓存;无缓存时返回稳定空态和可读错误
港股 / 美股Longbridge、YFinance、AkShare、Tushare、Finnhub、AlphaVantage、Stooq配置 Longbridge 凭证后参与港美股日线/实时兜底;YFinance 保持基础兜底Longbridge 冷却或失败时回退 YFinance / 其他可用源

总体链路图

mermaid
flowchart TD
    Q[用户触发分析/选股/大盘复盘] --> S{场景}

    S --> D[个股日线与技术面]
    S --> R[实时行情]
    S --> A[AlphaSift 选股/热点]
    S --> M[大盘复盘]

    D --> C[本地 stock_daily 缓存]
    C -->|命中且新鲜| COK[复用缓存]
    C -->|缺失或过期| DM{市场}
    DM -->|A 股| CN[Tushare if token -> Efinance/Tencent -> AkShare -> Pytdx -> Baostock -> YFinance]
    DM -->|港股| HK[Longbridge if configured -> AkShare/Tushare -> YFinance]
    DM -->|美股| US[Longbridge/YFinance -> Finnhub/AlphaVantage -> Stooq]

    R --> RP[REALTIME_SOURCE_PRIORITY]
    RP --> RS[Tencent -> AkShare Sina -> Efinance -> AkShare EM]
    RP --> RT[Tushare can be placed first when token/points are available]

    A --> AS[Snapshot: Tushare/Sina/Efinance/AkShare EM/EM Datacenter]
    A --> AD[Daily features: DSA DataFetcherManager]
    A --> AH[Hotspots: DSA EastMoney provider]
    AH --> AC[hotspots.json / hotspot_details last-good cache]

    M --> TF{TICKFLOW_API_KEY configured?}
    TF -->|yes| TFM[TickFlow indices and market breadth]
    TF -->|no or failed| MF[AkShare/Tushare/Efinance fallback]

    CN --> QL[质量标记: source/fallback/stale/fetch_failed]
    HK --> QL
    US --> QL
    RS --> QL
    RT --> QL
    AS --> QL
    AD --> QL
    AC --> QL
    TFM --> QL
    MF --> QL

失败与降级图

mermaid
flowchart LR
    A[请求某个数据块] --> B{当前源成功且数据有效?}
    B -->|是| OK[返回数据并记录 source]
    B -->|否| E[记录失败原因]
    E --> F{还有下一个可用源?}
    F -->|有| N[切换到下一源]
    N --> B
    F -->|没有| C{有 last-good cache?}
    C -->|有| STALE[返回 stale/fallback 数据并提示降级]
    C -->|没有| FAIL[返回 fetch_failed/稳定空态]

    E --> H{同源连续失败达到阈值?}
    H -->|是| CB[短期熔断该源]
    H -->|否| KEEP[保留在候选链中]
    CB --> SKIP[后续请求先跳过该源]
    SKIP --> RECOVER[冷却后半开探测恢复]

当前日线源熔断策略为连续失败 3 次后短期冷却约 5 分钟。它的目的不是永久禁用数据源,而是避免一个短时间不可用的源拖慢整批分析。

AlphaSift 选股与热点链路

mermaid
flowchart TD
    UI[Web 选股/热点入口] --> API[/api/v1/alphasift/]

    API --> SCREEN{screen}
    SCREEN --> ENV[注入 DSA LLM 与数据源运行环境]
    ENV --> SNAP[AlphaSift snapshot 源优先级]
    SNAP --> TS{TUSHARE_TOKEN?}
    TS -->|yes| SP1[tushare -> sina -> efinance -> akshare_em -> em_datacenter]
    TS -->|no| SP2[sina -> efinance -> akshare_em -> em_datacenter]
    ENV --> DAILY[DSA provider context]
    DAILY --> DFM[DataFetcherManager: Tushare/Efinance/Tencent/AkShare/Pytdx/Baostock/YFinance]
    DFM --> RESULT[候选股 + source_errors/warnings/llm_parse_errors]

    API --> HOT{hotspots}
    HOT --> HP{provider specified?}
    HP -->|no| EM[DSA EastMoney provider]
    HP -->|yes| CUSTOM[指定 provider/env provider]
    EM --> LIVE[实时热点题材]
    LIVE -->|成功| HCACHE[写入热点 last-good cache]
    LIVE -->|失败| OLD[读取 hotspots.json / hotspot_details]
    OLD -->|无缓存| EMPTY[稳定空态 + eastmoney_hotspot_unavailable]

推荐配置档

免费模式

适合个人试用,依赖免费源自动 fallback。优点是不需要 token;缺点是更容易遇到上游限流或临时接口变化。

env
REALTIME_SOURCE_PRIORITY=tencent,akshare_sina,efinance,akshare_em
ENABLE_EASTMONEY_PATCH=true

A 股稳定模式

适合经常跑选股、批量分析或对外服务。Tushare 用于增强 A 股稳定性,TickFlow 用于增强 A 股大盘复盘;免费源继续作为兜底。

env
TUSHARE_TOKEN=your_tushare_token
TICKFLOW_API_KEY=your_tickflow_key

REALTIME_SOURCE_PRIORITY=tushare,tencent,akshare_sina,efinance,akshare_em
SNAPSHOT_SOURCE_PRIORITY=tushare,sina,efinance,akshare_em,em_datacenter

# AlphaSift 选股运行期默认值;显式配置时会保留你的值
DAILY_FETCH_RETRIES=3
DAILY_FETCH_MAX_WORKERS=1

注意:TickFlow 当前在 DSA 中是大盘复盘专用窄接口,不参与普通个股日线或实时行情;不要把它当成所有个股行情的通用替代源。

港股 / 美股稳定模式

适合港美股组合、持仓和个股分析。Longbridge 配置后优先参与港美股链路;YFinance、Finnhub、AlphaVantage 作为兜底。

env
LONGBRIDGE_OAUTH_CLIENT_ID=your_client_id
LONGBRIDGE_OAUTH_TOKEN_CACHE_B64=your_token_cache_base64

FINNHUB_API_KEY=your_finnhub_key
ALPHAVANTAGE_API_KEY=your_alphavantage_key

如果仍使用 Legacy Longbridge 凭证,也可以继续配置:

env
LONGBRIDGE_APP_KEY=your_app_key
LONGBRIDGE_APP_SECRET=your_app_secret
LONGBRIDGE_ACCESS_TOKEN=your_access_token

用户可见提示建议

对外沟通时建议区分三类情况:

情况建议提示
单个源失败但 fallback 成功本次使用了降级数据源,分析仍可继续;报告中会标记实际成功源。
多个源失败但有缓存实时源不可用,本次使用上一次成功缓存;结论会降低置信度。
全部源失败且无缓存当前数据不可用,请稍后重试,或配置 Tushare / TickFlow / Longbridge 等 token 型数据源。

后续可做的产品化增强

  1. 数据源 Doctor 页面:展示每个源最近成功时间、失败原因、熔断状态和下一次恢复探测时间。
  2. 一键推荐配置:根据市场选择生成 .env 片段,例如“A 股稳定模式”“港美股稳定模式”“免费模式”。
  3. AlphaSift 状态面板:直接展示 snapshot/daily source health,让用户知道是 Sina、Efinance、AkShare 还是 Tushare 出问题。
  4. 批量任务限速策略:对免费源自动降低并发,优先复用本地日线缓存,减少触发上游限流。
  5. 可选商业源接入:只有在现有 Tushare / TickFlow / Longbridge / Finnhub / AlphaVantage 仍不能覆盖需求时,再考虑新增 Twelve Data、Massive/Polygon、Nasdaq Data Link 等源。

官方资料