《Hadoop海量數據處理》從Hadoop的基礎知識講起,逐步深入Hadoop分布式文件系統(tǒng)(HDFS)和MapReduce分布式編程框架的核心技術,幫助讀者全面、系統(tǒng)、深入地理解Hadoop海量數據處理技術的精髓。本書在講解技術原理時穿插大量的典型示例,并詳解兩個典型項目實戰(zhàn)案例,幫助讀者提高實際項目開發(fā)水平。《Hadoop海量數據處理》共15章,分為4篇。第1篇Hadoop基礎知識,包括大數據概述、Hadoop概述、Hadoop環(huán)境搭建與配置;第2篇Hadoop分布式存儲技術,包括HDFS概述、HDFS基礎操作、HDFS的讀寫原理和工作機制、Hadoop 3.x的新特性;第3篇MapReduce分布式編程框架,包括MapReduce概述、MapReduce開發(fā)基礎、MapReduce框架的原理、MapReduce數據壓縮、YARN資源調度器、Hadoop企業(yè)級優(yōu)化;第4篇項目實戰(zhàn),包括Hadoop高可用集群搭建實戰(zhàn)和統(tǒng)計TopN經典項目案例實戰(zhàn)?!禜adoop海量數據處理》通俗易懂、案例豐富、實用性強,適合Hadoop初學者和進階人員閱讀,也適合大數據工程師、數據分析工程師和數據科學家等大數據技術從業(yè)人員和愛好者閱讀,還適合作為高等院校和相關培訓機構的大數據教材。