本書通過大量實例介紹大數據平臺技術,分4篇。大數據存儲篇包括第1~3章,內容包括大數據技術概述、數據采集和大數據、大數據框架的安裝和配置;大數據管理篇包括第4~7章,內容包括HDFS、Hadoop分布式計算模型、分布式協(xié)調服務ZooKeeper、Hadoop的集群資源管理系統(tǒng)YARN;大數據分析篇包括第8~10章,內容包括數據庫MySQL和數據倉庫Hive、NoSQL數據庫HBase、基于內存的分布式計算框架Spark;大數據應用篇包括第11、12章,內容包括數據可視化、大數據應用綜合案例。 本書可作為高等學校數據科學與大數據技術、計算機科學與技術、人工智能等理工類專業(yè)大數據平臺技術課程的教材,也可供廣大計算機愛好者及軟件開發(fā)人員參考。