docs/data-source-stability.md
本文面向用户、部署者和维护者,说明 DSA 已接入的数据源如何参与分析、选股和大盘复盘,以及当数据源失败时系统会怎么降级。
核心原则:先用项目已经接入并验证过的数据源,把失败路径讲清楚;新增外部数据源应放在第二阶段,避免先扩大维护面。
如果遇到“数据源失败”,通常不是系统只能用一个源,而是免费源被限流、上游接口临时变更、网络抖动或当前市场/标的不支持。DSA 已经内置多数据源 fallback,会按场景自动尝试下一个源;如果你希望更稳定,建议至少配置一个 token 型稳定源:
TUSHARE_TOKEN,并保留 AkShare / Efinance / Tencent / Baostock / YFinance 兜底。TICKFLOW_API_KEY 后,指数和市场宽度会优先尝试 TickFlow,失败后回退现有免费源。LONGBRIDGE_* 后优先使用 Longbridge,YFinance、Finnhub、AlphaVantage 继续兜底。| 场景 | 已接入源 | 默认使用方式 | 失败处理 |
|---|---|---|---|
| A 股日线 / 技术面 | Efinance、Tencent、AkShare、Tushare、Pytdx、Baostock、YFinance | DataFetcherManager 按优先级尝试;配置 TUSHARE_TOKEN 后 Tushare 自动进入候选源 | 单源失败后尝试下一个源;连续失败会短期熔断该源 |
| A 股实时行情 | Tencent、AkShare Sina、Efinance、AkShare EM、Tushare | REALTIME_SOURCE_PRIORITY 控制顺序,默认偏向 Tencent / Sina 这类轻量源 | 失败源记录 fallback_from,成功源继续返回 |
| A 股大盘复盘 | TickFlow、AkShare、Tushare、Efinance | 配置 TICKFLOW_API_KEY 后,主指数和市场宽度优先尝试 TickFlow | TickFlow 权限不足或失败时回退 AkShare / Tushare / Efinance 链路 |
| AlphaSift 选股快照 | Tushare、Sina、Efinance、AkShare EM、EastMoney Datacenter | 有 TUSHARE_TOKEN 时自动把 tushare 放入快照优先级;否则使用免费源链路 | AlphaSift 维护 source health;DSA 状态接口透出 snapshot/daily health |
| AlphaSift 日线补特征 | DSA DataFetcherManager | AlphaSift 调用 DSA provider context,优先复用 DSA 日线与缓存链路 | DSA 链路失败后才回到 AlphaSift 原始日线源 |
| AlphaSift 热点题材 | DSA EastMoney provider、AlphaSift hotspot、last-good cache | 未指定 provider 时默认使用 DSA EastMoney provider | 实时失败时回退热点缓存;无缓存时返回稳定空态和可读错误 |
| 港股 / 美股 | Longbridge、YFinance、AkShare、Tushare、Finnhub、AlphaVantage、Stooq | 配置 Longbridge 凭证后参与港美股日线/实时兜底;YFinance 保持基础兜底 | Longbridge 冷却或失败时回退 YFinance / 其他可用源 |
flowchart TD
Q[用户触发分析/选股/大盘复盘] --> S{场景}
S --> D[个股日线与技术面]
S --> R[实时行情]
S --> A[AlphaSift 选股/热点]
S --> M[大盘复盘]
D --> C[本地 stock_daily 缓存]
C -->|命中且新鲜| COK[复用缓存]
C -->|缺失或过期| DM{市场}
DM -->|A 股| CN[Tushare if token -> Efinance/Tencent -> AkShare -> Pytdx -> Baostock -> YFinance]
DM -->|港股| HK[Longbridge if configured -> AkShare/Tushare -> YFinance]
DM -->|美股| US[Longbridge/YFinance -> Finnhub/AlphaVantage -> Stooq]
R --> RP[REALTIME_SOURCE_PRIORITY]
RP --> RS[Tencent -> AkShare Sina -> Efinance -> AkShare EM]
RP --> RT[Tushare can be placed first when token/points are available]
A --> AS[Snapshot: Tushare/Sina/Efinance/AkShare EM/EM Datacenter]
A --> AD[Daily features: DSA DataFetcherManager]
A --> AH[Hotspots: DSA EastMoney provider]
AH --> AC[hotspots.json / hotspot_details last-good cache]
M --> TF{TICKFLOW_API_KEY configured?}
TF -->|yes| TFM[TickFlow indices and market breadth]
TF -->|no or failed| MF[AkShare/Tushare/Efinance fallback]
CN --> QL[质量标记: source/fallback/stale/fetch_failed]
HK --> QL
US --> QL
RS --> QL
RT --> QL
AS --> QL
AD --> QL
AC --> QL
TFM --> QL
MF --> QL
flowchart LR
A[请求某个数据块] --> B{当前源成功且数据有效?}
B -->|是| OK[返回数据并记录 source]
B -->|否| E[记录失败原因]
E --> F{还有下一个可用源?}
F -->|有| N[切换到下一源]
N --> B
F -->|没有| C{有 last-good cache?}
C -->|有| STALE[返回 stale/fallback 数据并提示降级]
C -->|没有| FAIL[返回 fetch_failed/稳定空态]
E --> H{同源连续失败达到阈值?}
H -->|是| CB[短期熔断该源]
H -->|否| KEEP[保留在候选链中]
CB --> SKIP[后续请求先跳过该源]
SKIP --> RECOVER[冷却后半开探测恢复]
当前日线源熔断策略为连续失败 3 次后短期冷却约 5 分钟。它的目的不是永久禁用数据源,而是避免一个短时间不可用的源拖慢整批分析。
flowchart TD
UI[Web 选股/热点入口] --> API[/api/v1/alphasift/]
API --> SCREEN{screen}
SCREEN --> ENV[注入 DSA LLM 与数据源运行环境]
ENV --> SNAP[AlphaSift snapshot 源优先级]
SNAP --> TS{TUSHARE_TOKEN?}
TS -->|yes| SP1[tushare -> sina -> efinance -> akshare_em -> em_datacenter]
TS -->|no| SP2[sina -> efinance -> akshare_em -> em_datacenter]
ENV --> DAILY[DSA provider context]
DAILY --> DFM[DataFetcherManager: Tushare/Efinance/Tencent/AkShare/Pytdx/Baostock/YFinance]
DFM --> RESULT[候选股 + source_errors/warnings/llm_parse_errors]
API --> HOT{hotspots}
HOT --> HP{provider specified?}
HP -->|no| EM[DSA EastMoney provider]
HP -->|yes| CUSTOM[指定 provider/env provider]
EM --> LIVE[实时热点题材]
LIVE -->|成功| HCACHE[写入热点 last-good cache]
LIVE -->|失败| OLD[读取 hotspots.json / hotspot_details]
OLD -->|无缓存| EMPTY[稳定空态 + eastmoney_hotspot_unavailable]
适合个人试用,依赖免费源自动 fallback。优点是不需要 token;缺点是更容易遇到上游限流或临时接口变化。
REALTIME_SOURCE_PRIORITY=tencent,akshare_sina,efinance,akshare_em
ENABLE_EASTMONEY_PATCH=true
适合经常跑选股、批量分析或对外服务。Tushare 用于增强 A 股稳定性,TickFlow 用于增强 A 股大盘复盘;免费源继续作为兜底。
TUSHARE_TOKEN=your_tushare_token
TICKFLOW_API_KEY=your_tickflow_key
REALTIME_SOURCE_PRIORITY=tushare,tencent,akshare_sina,efinance,akshare_em
SNAPSHOT_SOURCE_PRIORITY=tushare,sina,efinance,akshare_em,em_datacenter
# AlphaSift 选股运行期默认值;显式配置时会保留你的值
DAILY_FETCH_RETRIES=3
DAILY_FETCH_MAX_WORKERS=1
注意:TickFlow 当前在 DSA 中是大盘复盘专用窄接口,不参与普通个股日线或实时行情;不要把它当成所有个股行情的通用替代源。
适合港美股组合、持仓和个股分析。Longbridge 配置后优先参与港美股链路;YFinance、Finnhub、AlphaVantage 作为兜底。
LONGBRIDGE_OAUTH_CLIENT_ID=your_client_id
LONGBRIDGE_OAUTH_TOKEN_CACHE_B64=your_token_cache_base64
FINNHUB_API_KEY=your_finnhub_key
ALPHAVANTAGE_API_KEY=your_alphavantage_key
如果仍使用 Legacy Longbridge 凭证,也可以继续配置:
LONGBRIDGE_APP_KEY=your_app_key
LONGBRIDGE_APP_SECRET=your_app_secret
LONGBRIDGE_ACCESS_TOKEN=your_access_token
对外沟通时建议区分三类情况:
| 情况 | 建议提示 |
|---|---|
| 单个源失败但 fallback 成功 | 本次使用了降级数据源,分析仍可继续;报告中会标记实际成功源。 |
| 多个源失败但有缓存 | 实时源不可用,本次使用上一次成功缓存;结论会降低置信度。 |
| 全部源失败且无缓存 | 当前数据不可用,请稍后重试,或配置 Tushare / TickFlow / Longbridge 等 token 型数据源。 |
.env 片段,例如“A 股稳定模式”“港美股稳定模式”“免费模式”。