新書推薦:

《
大陆银行(全两册)(上海市档案馆藏近代中国金融变迁档案史料续编(机构卷))
》
售價:HK$
624.8

《
断头王后:玛丽·安托奈特传(裸脊锁线版,德语直译新译本,内文附多张传主彩插)
》
售價:HK$
61.6

《
东南亚华人宗祠建筑艺术研究
》
售價:HK$
97.9

《
甲骨文字综理表
》
售價:HK$
217.8

《
礼法融通:中国传统离婚制度及观念
》
售價:HK$
86.9

《
城市群交通系统风险与应急管理
》
售價:HK$
204.6

《
华南主要观赏树木图鉴
》
售價:HK$
173.8

《
努斯:希腊罗马哲学研究(第8辑)--宇宙与自然:古希腊自然哲学诸面向
》
售價:HK$
85.8
|
編輯推薦: |
本书以Hadoop 及其周边框架为主线,介绍了整个Hadoop 生态系统主流的大数据组件以及平台运维。本书从零开始逐一讲解大数据体系中的各种技术,通过丰富的实战案例阐述重点、难点知识,为初学者进入大数据领域打好基础。书中各个项目设计合理,在每个项目开头设置导读,首先介绍知识点,然后紧跟实践操作,最后在每个项目末尾通过课后练习帮助读者巩固所学知识。
本书既可作为Hadoop 新手入门的指导用书,也可作为职业院校大数据技术、云计算应用技术和人工智能应用技术等计算机类专业的教材,还可供从事计算机相关工作的技术人员参考。
|
內容簡介: |
本书以Hadoop 及其周边框架为主线,介绍了整个Hadoop 生态系统主流的大数据组件以及平台运维。本书从零开始逐一讲解大数据体系中的各种技术,通过丰富的实战案例阐述重点、难点知识,为初学者进入大数据领域打好基础。书中各个项目设计合理,在每个项目开头设置导读,首先介绍知识点,然后紧跟实践操作,最后在每个项目末尾通过课后练习帮助读者巩固所学知识。
本书既可作为Hadoop 新手入门的指导用书,也可作为职业院校大数据技术、云计算应用技术和人工智能应用技术等计算机类专业的教材,还可供从事计算机相关工作的技术人员参考。
|
目錄:
|
项目1 大数据及Hadoop 概述 1
任务1.1 大数据概述 2
任务1.2 Hadoop 概述 5
课后练习 8
项目2 Hadoop 分布式集群安装及部署 10
任务2.1 Linux 系统基础环境安装及配置 11
任务2.2 伪分布式系统安装 22
任务2.3 完全分布系统安装 33
课后练习 47
项目3 分布式文件系统HDFS 49
任务3.1 HDFS 概述 50
任务3.2 HDFS 命令行客户端 54
课后练习 62
项目4 分布式计算框架MapReduce 64
任务4.1 认识MapReduce 65
任务4.2 分布式资源调度平台Yarn 72
课后练习 77
项目5 分布式协调框架ZooKeeper 79
任务5.1 认识ZooKeeper 80
Hadoop 大数据平台构建
Ⅳ
任务5.2 部署ZooKeeper 集群 86
任务5.3 ZooKeeper Shell 93
课后练习 97
项目6 Hadoop 高可用集群 99
任务6.1 认识Hadoop 高可用 100
任务6.2 部署Hadoop HA 集群 103
课后练习 117
项目7 分布式存储数据库HBase 119
任务7.1 初识HBase 120
任务7.2 部署HBase 集群 125
任务7.3 HBase Shell 操作 131
课后练习 138
项目8 数据仓库Hive 140
任务8.1 Hive 简介 141
任务8.2 Hive 安装部署 146
任务8.3 Hive 操作 156
任务8.4 Hive 和HBase 整合 167
课后练习 170
项目9 数据迁移工具Sqoop 172
任务9.1 部署Sqoop 173
任务9.2 Sqoop 应用 178
课后练习 186
项目10 日志采集工具Flume 188
任务10.1 认识Flume 189
任务10.2 Flume 安装部署 193
任务10.3 Flume 多点采集数据 200
课后练习 205
目 录
V
目 录
项目11 分布式消息队列Kafka 207
任务11.1 认识Kafka 208
任务11.2 部署Kafka 集群 212
任务11.3 Kafka 和Flume 整合 219
课后练习 221
项目12 内存计算框架Spark 223
任务12.1 认识Spark 224
任务12.2 部署Spark 228
课后练习 234
项目13 内存计算框架Flink 237
任务13.1 认识Flink 238
任务13.2 部署Flink 243
课后练习 255
项目14 大数据平台的管理与监控 257
任务14.1 大数据平台的管理与监控概述 258
任务14.2 Nagios 监控 259
任务14.3 Ganglia 监控 279
任务14.4 Prometheus 监控 297
课后练习 306
参考文献 308
|
內容試閱:
|
在信息化浪潮席卷全球的今天,大数据已经成为推动社会进步和科技创新的重要
技术。大数据不仅改变了人们的生活方式,而且对各行各业产生了深远的影响。在这
样的背景下,掌握大数据平台的构建技术,已经成了信息科技领域从业者不可或缺的
一项技能。
本书采用项目式编写模式,以大数据生态体系为基础,详细阐述了大数据平台构
建的全过程。全书共分14 个项目,包括大数据及Hadoop 概述、Hadoop 分布式集群
安装及部署、分布式文件系统HDFS、分布式计算框架MapReduce、分布式协调框架
ZooKeeper、Hadoop 高可用集群、分布式存储数据库HBase、数据仓库Hive、数据迁移
工具Sqoop、日志采集工具Flume、分布式消息队列Kafka、内存计算框架Spark、内
存计算框架Flink、大数据平台的管理与监控。内容涉及Hadoop 伪分布模式、集群模
式、高可用模式的搭建,使用ZooKeeper、HBase、Hive 等组件搭建大数据平台,使用
Nagios、Ganglia、Prometheus 和Grafana 工具对大数据平台进行高效运维。
本书内容注重理论与实践相结合,通过丰富的实例解析和项目实战演练,帮助读
者提升解决实际问题的能力,培养读者独立构建和运维大数据平台的技能。同时,各
个项目的设计环节也包括了大数据平台构建中的一些新特性,可以拓宽学习者视野,
使其适应未来数字化、智能化社会的需求。
本书还配套了包含平台搭建、平台运维、案例分析等内容的微课视频,能够直观
地展示操作过程和技术细节;提供多种类型、多种规模的数据集,供读者在平台上进
行数据处理、分析和挖掘实践,以加深对大数据处理流程的理解。
本书为校企合作开发教材,由孟瑞军、哈里白和高荣贵任主编,宋海燕任副主
编。孟瑞军编写了项目10、项目11 和项目14,哈里白编写了项目1 至项目4,高
荣贵编写了项目7 至项目9,宋海燕编写了项目5、项目6、项目12 和项目13,并整
理了课后习题参考答案,江苏一道云科技发展有限公司在本书的编写过程中提供了大
Hadoop 大数据平台构建
Ⅱ
量的技术支持和真实运维案例。
由于技术和行业的发展日新月异,加之编者水平有限,书中难免存在疏漏之处,
恳请广大读者批评、指正。感谢在本书编写及出版过程中提供帮助、支持和鼓励的领
导、同事及传智播客、尚硅谷的企业工程师们。我们将持续更新和完善本书内容,以
期更好地服务于大数据教育与实践的发展。
编 者
2024 年4 月
习题参考答案工具安装包
|
|