内容简介
本书系统介绍了 Hadoop 生态系统主要组件的基本概念、特点、主要组成、运行机制及存在的问题等内
容。全书共 11 章,内容包含大数据基本概念、大数据处理平台 Hadoop、分布式文件系统 HDFS、HDFS 2.0
新特性、分布式计算框架 MapReduce、数据仓库 Hive、分布式数据库 HBase、数据迁移工具 Sqoop、日志采
集系统 Flume、NoSQL 数据库及数据可视化等内容。每一部分都有相应的实验指导,以便读者更好地学习和
掌握 Hadoop 核心技术,进一步提高实践操作能力。
本书可作为高等院校大数据、计算机类、信息管理等专业大数据课程教材,也可作为相关技术人员参考
用书。