本書作為 Hadoop 大數(shù)據(jù)技術的項目化實戰(zhàn)教材,以任務驅動為導向,深入淺出地介紹了 Hadoop 及其周邊框架的應用,涵蓋了當前 Hadoop 生態(tài)系統(tǒng)中的主流大數(shù)據(jù)技術。全書共 12 個項目,包括云計算和大數(shù)據(jù)基礎概論、CentOS 的安裝與網絡配置、MPI 集群部署及應用、Hadoop 集群部署及應用、MapReduce 基本原理及應用、HBase 數(shù)據(jù)庫的搭建及使用、Hive 數(shù)據(jù)倉庫的安裝及應用、Pig 數(shù)據(jù)分析、Sqoop 數(shù)據(jù)遷移、Flume 日志收集系統(tǒng)、Spark 部署及數(shù)據(jù)分析、大數(shù)據(jù)技術編程實例。本書秉承“實踐為主、理論夠用、注重實用”原則,在任務實施中融入各個知識點與課程教學內容,以便讀者能更好地學習和掌握大數(shù)據(jù)關鍵技術。本書既可以作為高職高專院校和應用型本科院校計算機相關專業(yè)的教材,還可以作為 IT 類培訓機構培訓云計算和大數(shù)據(jù)技術等相關課程的實訓教材,并可以作為相關技術人員的參考書。