大数据大数据Hadoop生态架构你我皆温柔2023-12-142023-12-14Hadoop生态架构 HDFS:可提供高吞吐量的分布式文件系统 yarn:用于任务调度和集群资源管理的框架 MapReduce:用于大型数据集并行处理的系统 ZooKeeper:高性能的分布式应用程序协调服务 Flume:日志搜集系统,将日志文件从不同源收集、聚合移动到一个集中的数据中心存储 Sqoop: 2. 数据仓库