Hadoop生态架构

Hadoop生态架构

image-20230901120626764

  1. HDFS:可提供高吞吐量的分布式文件系统
  2. yarn:用于任务调度和集群资源管理的框架
  3. MapReduce:用于大型数据集并行处理的系统
  4. ZooKeeper:高性能的分布式应用程序协调服务
  5. Flume:日志搜集系统,将日志文件从不同源收集、聚合移动到一个集中的数据中心存储
  6. Sqoop:

2. 数据仓库