flink-learning-project/flink-learning-project-real-time-data-warehouse/README.md
本模块实现了实时数据仓库的分层架构(ODS → DWD → DWS),展示了 Flink 在实时数仓场景的典型应用。
┌──────────────────────────────────────────────────────┐
│ ADS(应用层) │
│ 数据服务/API/实时大屏 │
├──────────────────────────────────────────────────────┤
│ DWS(汇总层) │
│ DwsOrderStatsJob: 按类别、5分钟窗口汇总统计 │
├──────────────────────────────────────────────────────┤
│ DWD(明细层) │
│ OdsToKafkaJob: 数据清洗、标准化、脏数据分流 │
├──────────────────────────────────────────────────────┤
│ ODS(原始层) │
│ Kafka 原始订单数据 │
└──────────────────────────────────────────────────────┘
| 知识点 | 说明 | 所在类 |
|---|---|---|
| Side Output | 脏数据分流 | OdsToKafkaJob |
| KafkaSink | 新版 Kafka Sink API | OdsToKafkaJob |
| ProcessFunction | 数据清洗与校验 | OdsToKafkaJob |
| AggregateFunction | 复杂累加器多维聚合 | DwsOrderStatsJob |
| Set 去重 | UV 去重技术 | DwsOrderStatsJob |
| TumblingWindow | 滚动窗口汇总 | DwsOrderStatsJob |