《數(shù)據(jù)館員的Hadoop簡明手冊》旨在協(xié)助初級數(shù)據(jù)館員們能夠迅速了解Hadoop的知識、用途及整體概貌,作為進一步實踐操作之前的入門基礎讀物。本手冊力求簡單、通俗、易懂,既不泛泛之談,也不過早深入細節(jié),而是力求把握重點。事實上,唯有實踐才能真正理解Hadoop的有趣之處和局限之處,但在實踐之前,或者考慮選擇架構之前,如果有這么一本手冊,會容易理解、溝通及評估?!稊?shù)據(jù)館員的Hadoop簡明手冊》包括5個部分。第1章概述分布式大數(shù)據(jù)的基本概念,以及開源軟件Hadoop的歷史、生態(tài)體系及主要版本的變化。第2章概述核心架構中的計算資源分配、列式計算的工具及索引。第3章概述分布式計算的MapReduce方案,這也是*為通用的一種方案,能滿足海量數(shù)據(jù)的處理。第4章概述如何優(yōu)化Hadoop的案例。*后,附錄介紹Hado叩家族產品。