登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』大数据技术基础与实战

書城自編碼: 3688202
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 薛志东 张双双 卢?Z祥 等
國際書號(ISBN): 9787115567192
出版社: 人民邮电出版社
出版日期: 2021-09-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 74.8

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
世界花纹与图案大典
《 世界花纹与图案大典 》

售價:HK$ 357.6
周制与秦制
《 周制与秦制 》

售價:HK$ 153.6
花路
《 花路 》

售價:HK$ 105.6
万亿指数
《 万亿指数 》

售價:HK$ 105.6
中世纪英国的财政、军事与外交(中外文明传承与交流研究书系)
《 中世纪英国的财政、军事与外交(中外文明传承与交流研究书系) 》

售價:HK$ 93.6
缺席者的历史:以色列十个遗失的部落
《 缺席者的历史:以色列十个遗失的部落 》

售價:HK$ 93.6
晚清洋务运动始末
《 晚清洋务运动始末 》

售價:HK$ 95.8
美索不达米亚神话
《 美索不达米亚神话 》

售價:HK$ 83.8

 

建議一齊購買:

+

HK$ 60.5
《 数学分析(第五版)(上册) 》
+

HK$ 91.1
《 概率论(第三版) 》
+

HK$ 127.4
《 工程项目管理(第二版) 》
+

HK$ 69.6
《 医学统计学与SPSS软件实现方法(第二版) 》
+

HK$ 64.7
《 大学生心理健康教育(第三版) 》
+

HK$ 100.1
《 战略管理:概念与案例(第12版)(工商管理经典译丛) 》
編輯推薦:
1.全书通过实践操作讲解大数据开发的基础知识,不仅提供相应命令、配置文件,还提供模拟环境演示等,尽可能通过案例和实操,降低大数据学习的门槛,力求让读者学以致用。2.内容全:大数据技术概述、Linux基础与集群搭建、Hadoop集群配置、Hadoop分布式文件系统、MapReduce分布式编程、Hive大数据仓库、HBase数据库部署与操作、数据获取与采集、基于Spark的内存计算以及利用大数据平台处理图像及视频
內容簡介:
本书从技术实战的角度,带领读者一步一步掌握大数据的相关技能。本书不仅提供相应命令、配置文件,还提供模拟环境演示等,并尽可能通过案例和实操降低大数据学习的门槛,力求让读者学以致用。本书主要内容包括大数据技术概述、Linux基础与集群搭建、Hadoop集群配置、HDFS、MapReduce分布式编程、Hive大数据仓库、HBase数据库部署与操作、数据获取与Flume应用、基于Spark的内存计算,以及利用大数据平台处理图像及视频。
關於作者:
薛志东,博士,研究员,现在华中科技大学软件学院工作,长期从事大数据相关教学与科研工作。先后讲授多门本科生、研究生课程,承担多项国家自然科学基金、湖北省自然科学基金、华为技术公司委托等重要项目。目前的研究主要涉及大数据处理相关领域等,如基于云计算的图像与视频等信息处理技术、医学与生物信息处理与分析、文本挖掘、深度学习、GPU开发等;同时对移动应用、康复游戏、无人机、机器人应用软件开发等有浓厚的兴趣。
目錄
第1章 大数据技术概述 11.1 大数据的概念与基本特性 11.2 大数据处理流程 21.3 Hadoop大数据技术 31.3.1 Hadoop简介 31.3.2 Hadoop的发行版本 51.4 实践环境准备 7习题 15第2章 Linux基础与集群搭建 162.1 Linux常用命令 162.1.1 用户和用户组 162.1.2 文件与目录 182.1.3 主机名 242.1.4 分区管理 252.2 网络配置 272.2.1 基本网络配置 272.2.2 集群网络配置 282.3 Linux集群配置 312.3.1 SSH免密码登录 312.3.2 Java环境安装 332.3.3 MySQL服务 342.3.4 配置时钟同步 352.4 快速配置Linux集群 372.4.1 导入虚拟机 372.4.2 快速配置 39习题 42第3章 Hadoop集群配置 433.1 Hadoop集群安装 433.1.1 基础环境准备 433.1.2 配置Java环境 493.1.3 安装Hadoop 513.1.4 启动Hadoop 583.2 Hadoop集群初始化和日志查看 623.2.1 初始化文件系统 623.2.2 集群的启动与停止 623.2.3 查看日志 63习题 64第4章 HDFS 654.1 HDFS简介 654.1.1 HDFS的基本概念 654.1.2 HDFS文件的读取 664.1.3 HDFS文件的写入 674.1.4 HDFS 数据备份 684.2 HDFS基本命令 694.3 HDFS数据平衡优化 724.3.1 编程原则 734.3.2 平衡逻辑 734.3.3 数据平衡案例 744.4 HDFS API的使用方法 75习题 81第5章 MapReduce分布式编程 825.1 MapReduce简介 825.2 词频统计编程实例 835.3 MapReduce Shuffle过程开发 895.3.1 MapReduce数据类型 905.3.2 Partitioner负载平衡编程 905.3.3 Sort排序编程 925.3.4 Combiner减少中间数据编程 935.4 MapReduce的性能优化 945.4.1 Hadoop配置参数调优 945.4.2 使用合适的数据类型 955.4.3 基准性能测试工具 965.5 YARN数据处理框架 995.5.1 YARN常用命令 1005.5.2 使用Web GUI监控实例 1025.6 MapReduce实战:绘制频度分布 1045.6.1 实战概述 1045.6.2 实战步骤 1045.6.3 源码分析 109习题 114第6章 Hive大数据仓库 1156.1 Hive简介 1156.2 Hive安装及配置 1166.3 从创建数据库到创建表 1186.3.1 数据类型 1186.3.2 创建数据库 1196.3.3 创建表 1196.3.4 删除表 1216.3.5 修改表 1216.4 数据查询及自定义函数运算 1236.4.1 HiveQL操作 1236.4.2 JOIN语句 1246.4.3 内置操作符和函数 1256.5 Hive自定义函数编程 1286.5.1 数据准备 1286.5.2 编程实现 1296.5.3 使用自定义函数 1306.6 Hive实战 1326.6.1 数据准备 1336.6.2 实战步骤 133习题 136第7章 HBase数据库部署与操作 1387.1 HBase简介 1387.1.1 HBase表 1387.1.2 HBase基本知识 1387.2 HBase的安装 1397.2.1 必要条件 1397.2.2 安装配置HBase 1407.2.3 启动HBase 1427.3 HBase Shell操作 1437.3.1 普通命令 1457.3.2 DDL操作 1467.3.3 DML操作 1487.3.4 工具命令 1507.3.5 复制命令 1517.4 HBase客户端API 1517.4.1 CRUD操作 1517.4.2 批量处理 1557.4.3 行锁 1567.4.4 扫描 1577.4.5 数据过滤 1587.5 HBase客户端选择及配置优化 1597.6 HBase与MapReduce集成 1597.7 HBase集群监控 1607.8 HBase实战:公有云网盘系统管理 1647.8.1 部署公有云网盘 1657.8.2 网盘核心代码分析 168习题 171第8章 数据获取与Flume应用 1728.1 公开数据资源获取 1728.2 使用网络爬虫获取数据 1738.2.1 爬虫的工作原理 1738.2.2 爬虫的搜索策略 1748.2.3 爬虫的简单应用 1758.3 使用Flume获取数据 1778.3.1 Flume简介 1778.3.2 Flume运行机制 1778.3.3 Flume安装部署 1798.3.4 Flume简单应用 1808.4 综合案例 182习题 186第9章 基于Spark的内存计算 1879.1 Spark简介 1879.2 Spark快速部署 1889.2.1 Spark单机模式部署 1889.2.2 Spark分布式集群部署 1899.3 Spark程序 1929.3.1 Spark Shell 1929.3.2 在IDEA中编写词频统计 1939.4 Spark RDD编程 1979.4.1 RDD简介 1979.4.2 RDD的操作算子 1989.4.3 RDD的持久化 2049.5 Spark生态系统 2059.5.1 Spark Core 2069.5.2 Spark SQL 2069.5.3 Spark Streaming 2069.5.4 MLlib 2069.5.5 GraphX 2079.6 Spark应用案例 2079.6.1 案例概述 2079.6.2 代码实现 2089.6.3 运行结果 208习题 209第10章 利用大数据平台处理图像 21010.1 图像的基本概念 21010.2 Hadoop处理图像的问题与对策 21110.2.1 Hadoop直接处理图像存在的问题 21110.2.2 解决途径 21210.3 HIPI安装与部署 21210.4 使用HIPI进行图像处理 21410.5 HIPI工具hibDownload 22210.5.1 编译hibDownload 22210.5.2 hibDownload的使用方法 22210.5.3 hibDownload的工作原理 22210.5.4 hibDownload的使用示例 230习题 235参考文献 236

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.