1. 数仓概念

2. 项目需求及架构设计
2.1 项目需求分析
2.1.1 项目需求

2.1.2 离线需求

2.1.3 实时需求

2.2 项目框架
2.2.1 技术选型

2.2.2 系统数据流程设计
2.2.3 测试集群服务器规划
| 服务名称 | 子服务 | 服务器 hadoop111 | 服务器 hadoop112 | 服务器 hadoop113 |
| HDFS | NameNode | √ | ||
| DataNode | √ | √ | ||
| SecondaryNameNode | √ | |||
| Yarn | Resourcemanager | √ | ||
| NodeManager | √ | √ | ||
| Zookeeper | Zookeeper Server | √ | √ | √ |
| Flume(采集日志) | Flume | √ | ||
| Kafka | Kafka | √ | √ | √ |
| Flume(Kafka日志) | Flume |
