新書推薦:

《
叙事话语·新叙事话语
》
售價:HK$
74.8

《
奴隶船:海上奴隶贸易400年
》
售價:HK$
75.9

《
纸上博物馆·美索不达米亚:文明的诞生(破译古老文明的密码,法国伽利玛原版引进,150+资料图片)
》
售價:HK$
85.8

《
米塞斯的经济学课:讲座与演讲精选集
》
售價:HK$
74.8

《
人工智能大模型导论 科大讯飞校企合编教材
》
售價:HK$
75.9

《
做财富的朋友:巴菲特慢慢变富的投资智慧
》
售價:HK$
82.5

《
一群数学家分蛋糕:提升逻辑力的100道谜题
》
售價:HK$
60.5

《
无解的困局:大明最后的60年
》
售價:HK$
66.0
|
內容簡介: |
本书围绕 Hadoop 大数据平台及其生态系统组件的部署与运维,采用 “任务驱动+知识准备+任务实施+考核评价" 的项目化模式组织各单元的内容。全书分为 11 个单元,主要内容包括大数据简介、Hadoop伪分布式安装部署、Hadoop 集群部署与监控、HDFS 分布式存储、使用 MapReduce 实现电商销售数据的统计、Hadoop 高可用集群规划部署、分布式数据库 HBase 部署与应用、数据仓库 Hive 部署与应用、Spark计算框架部署、Flink流式计算框架部署与操作、020外卖服务大数据平台部署运维综合实训。本书可作为高等职业院校大数据及计算机相关专业的专业课教材, 也可作为大数据培训班的辅导教材, 还可供从事大数据技术及应用的专业人员和广大大数据平台爱好者自学选用参考。
|
關於作者: |
郭建磊,女,高级信息系统项目管理师,曾在国内大型IT企业具有九年多的工作经验,实战经验丰富。进入高职院校工作后担任大数据技术专业负责人,荣获全国职业院校技能大赛\大数据技术与应用”赛项优秀指导教师。指导学生获得大数据国赛一等奖1项、国赛二等奖1项,省赛一等奖2项,近三年以来,指导学生在省级以上大数据技能竞赛共获奖18项。本书作者也是高职专科大数据技术专业国家教学标准主要执笔人之一。
|
目錄:
|
单元1大数据简介任务认识大数据 .1.1.1大数据的概念及特点1.1.2大数据的发展背景1.1.3大数据技术的发展历程1.1.4大数据的意义和应用现状1.1.5大数据的未来1.1.6大数据人才需求与岗位介绍单元 2Hadoop 伪分布式安装部署任务2.1 搭建Hadoop伪分布式2.1.1 Hadoop的发展 历程 与应用现状2.1.2Hadoop 的优 点与核心 组成2.1.3Hadoop 的安装方式2.1.4Hadoop 各版本选择2.1.5Hadoop 伪分布式搭建的基本流程.任务 2.2启动与访问 Hadoop2.2.1Hadoop 启动/停止 的操作命令2.2.2基于 Web UI 监控 Hadoop 平 台单元 3Hadoop 集群部署与监控 任务3.1 搭建Hadoop集群 3.1.1 集群概述3 .1.2 Hadoop 集群的 特点3.1.3 H adoop 集群规 划3.1.4 Hadoop 集群部署 的过程 ..任务 3.2监控 Hadoop 集群..单元 4HDFS 分布式存储 任务4.1 认识HDFS4.1.1 HDFS的原理4.1.2 HDFS 读写文件 的流程4.1.3 HDFS 的特点及其不适合的 应用场景任务 4.2 HDFS 的文件 系统操作任务 4.3 HDFS 的系统管理操作4.3.1HDFS 的安全模 式操作4.3.2HDFS 增加扩容操作..............4.3.3HDFS 数据平衡 4.3.4HDFS 存储策略..4.3.5HDFS 快照 任务4.4 部署本地开发环境4.4.1 认识JDK 4.4.2 认 识 Maven4.4.3 认 识 IDEA任务 4.5 HDFS 的 Java API 操作 单元5使用MapReduce 实现电商销售数据的统计任务 5.1认识 MapReduce5.1.1MapReduce 的概 念与原理5.1.2MapReduce 的体 系 架构5.1.3MapReduce 的发展现状5.1.4YARN 的运行机制任务 5.2使用 MapReduce 实现词频的统计5.2.1MapReduce 数据处理的流程.5.2.2MapReduce 相关 Java API 及应用5.2.3MapReduce 驱动类任务 5.3使用 MapReduce 完成电商销售数据的统计5.3.1MapReduce 完成电 商销售数 据统计的 流程 5.3.2自定义分区5.3.3自 定 义 数 据 类 型任务 5.4MapReduce 任务监控..5.4.1MapReduce 任务监控的方式5.4.2 任务失败的几种情况5.4.3 MapReduce日志文件单元 6Hadoop 高可用集群规划部署任务 6.1 部署与访问 ZooKeeper6.1.1ZooKeeper 概述及其特性6.1.2ZooKeeper 的应 用场 景6.1.3ZooKeeper 的工作原理6.1.4ZooKeeper 的部 署方式任务 6.2 部署 Hadoop 高可用集群6.2.1Hadoop 高可 用集群的 工作原理..6.2.2Hadoop 高可用集 群的主要配置项及含义.单元 7分布式数据库HBase 部署与应用任务 7.1搭建伪分布式 HBase7.1.1HBase 的原理 7.1.2HBase 的体系架构 7.1.3HBase 与 JDK、Hadoop 版本的兼容关系7.1.4HBase 伪分布式部署准备 ...任务 7.2部署 HBase 完全分布式集群7.2.1HBase 集群规划7.2.2HBase 的主要配置项及含义.7.2.3HBase 访问命令7.2.4基于 Web UI 监控 HBase 的 状 态任务 7.3HBase 集群运维 7.3.1HBase 监控工具介绍7.3.2HBase 集群优化单元 8数据仓库Hive 部署与应用 任务 8.1部署 Hive 本地模式8.1.1Hive 介绍8.1.2Hive 的安装方式任务 8.2部署 Hive 远程模式·....单元 9Spark 计算框架部署..任务 9.1 部署与操作 Spark Local任务 9.2 部署与操作 Spark Standalone9.2.1Spark 运行流程9.2.2Spark 配置文件与配置参数任务 9.3 部署与操作 Spark on YARN单元 10Flink 流式计算框架部署与操作.任务 10.1部署本地模式 Flink10.1.1Flink 介绍10.1.2Flink 的部署模式任务 10.2 部署独立模式Flink集群10.2.1 Flink的体系架构10.2.2Flink 集群的运行模式任务 10.3部署并运行 Flink on YARN 集群10.3.1Flink on YARN 的运行方法10.3.2故 障调试与恢复单元 110 20 外卖服务大数据平台部署运维综合实训...
|
|