《Hadoop MapReduce实战手册》 - [斯里]佩雷拉，[斯里]冈纳拉森著，杨卓荦译 - Meg Book Store - 香港.大書城

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書

『簡體書』Hadoop MapReduce实战手册

書城自編碼： 2539509
分類：簡體書→大陸圖書→計算機/網絡→软件工程/开发项目管理
作者： [斯里]佩雷拉，[斯里]冈纳拉森著，杨卓荦译
國際書號(ISBN)： 9787115384379
出版社：人民邮电出版社
出版日期： 2015-03-01
版次： 1 印次： 1
頁數/字數： 234/306000
書度/開本：大16开釘裝：平装

售價：HK$ 90.7

我要買件

** 我創建的書架 **
未登入.

新書推薦：

广东当代金融史：全三册

《广东当代金融史：全三册》
售價：HK$ 717.6

养育的觉醒：全面激发孩子自驱力，教你如何心平气和做妈妈

《养育的觉醒：全面激发孩子自驱力，教你如何心平气和做妈妈》
售價：HK$ 58.8

1368：历史岔道口的抉择与国运盛衰

《 1368：历史岔道口的抉择与国运盛衰》
售價：HK$ 69.6

全球城市发展报告2023：基于全球城市网络的合作与竞争

《全球城市发展报告2023：基于全球城市网络的合作与竞争》
售價：HK$ 273.6

为什么只见树木不见森林：从简单现象到复杂系统

《为什么只见树木不见森林：从简单现象到复杂系统》
售價：HK$ 94.8

大英帝国的兴衰：全景式俯瞰英国千年历史沧桑剧变，回首日不落帝国的初升、辉煌与没落

《大英帝国的兴衰：全景式俯瞰英国千年历史沧桑剧变，回首日不落帝国的初升、辉煌与没落》
售價：HK$ 117.6

意大利文艺复兴新艺术史

《意大利文艺复兴新艺术史》
售價：HK$ 958.8

2023年《咬文嚼字》合订本（精）

《 2023年《咬文嚼字》合订本（精）》
售價：HK$ 93.6

建議一齊購買：

+

HK$ 182.9
《 Hive编程指南》

+

HK$ 155.5
《 Hadoop高级编程——构建与实现大数据解决方案》

+

HK$ 233.1
《 Hadoop实战（第2版）（畅销书全新升级、技术更新、内容更全、实战性更强、细节更完善！）》

+

HK$ 235.9
《 HBase权威指南（“十二五”国家重点图书出版规划项目）》

+

HK$ 127.4
《 MapReduce设计模式》

+

HK$ 183.2
《 Hadoop权威指南（第3版）》

編輯推薦：

本书是使用Hadoop生态系统处理大规模复杂数据集的一站式指南。本书先为读者介绍了简单的示例，然后深入到解决深度大数据问题的用例。
本书将教会读者如何驾驭Hadoop生态系统中的各组件，包括HBase、Hadoop、Pig以及Mahout，然后让读者学会如何安装云环境来完成Hadoop MapReduce计算。本书还将用最真实的示例教会读者如何处理大规模复杂数据集。
本书将教会读者：
如何安装Hadoop MapReduce和HDFS，开始运行示例程序；
如何安全地配置和管理Hadoop和HDFS；
理解Hadoop内部实现，以及如何扩展Hadoop来满足用户需求；
如何使用HBase、Hive、Pig、Mahout和Nutch简单且有效地完成一些事情；
如何使用MapReduce解决各种分析问题；
解决复杂问题，如聚类、寻找关联、在线营销及推荐；
如何使用云环境完成Hadoop计算。

內容簡介：

这是一本学习Hadoop MapReduce的一站式指南，完整介绍了Hadoop生态体系，包括Hadoop平台安装、部署、运维等，Hadoop生态系统成员Hive、Pig、HBase、Mahout等。最重要的是，书中包含丰富的示例和多样的实际应用场景，以一种简单而直接的方式呈现了90个实战攻略，并给出一步步的指导。本书从获取Hadoop并在集群中运行讲起，依次介绍了高级HDFS，高级Hadoop MapReduce管理，开发复杂的Hadoop MapReduce应用程序，Hadoop的生态系统，统计分析，搜索与索引，聚类、推荐和寻找关联，海量文本数据处理，云部署等内容。

關於作者：

Srinath Perera是WSO2公司的高级软件架构师，与CTO一同全观整个WSO2平台架构。同时，他也是斯里兰卡软件基金会的一位研究科学家，并作为访问学者在莫勒图沃大学计算机科学与工程系授课。他是Apache Axis2开源软件项目的联合创始人，他自2002年以来一直参与Apache Web Service项目，并且是Apache软件基金会和Apache Web服务项目PMC的成员。Srinath也是Apache Axis、Axis2和Geronimo开源项目的committer。
他在美国印第安纳大学伯明顿分校获得博士和硕士学位，在斯里兰卡莫勒图沃大学获得了计算科学与工程学士学位。
Srinath已经撰写了许多技术文章和同行评审的研究文章，可以从他的个人网站找到更多细节。他还经常在技术会议上做演讲。
他长期研究大规模分布式系统。他的日常工作与大数据技术（如Hadoop和Cassandra）结合很紧密。他还在莫勒图沃大学研究生班教授并行计算，主要是基于Hadoop。
Thilina Gunarathne是印第安纳大学信息与计算学院博士。他在使用Apache Hadoop以及大规模数据密集型计算技术方面有着丰富的经验。他目前的主要工作是致力于研发在云环境执行可扩展的、高效的大规模数据密集型计算的技术。
Thilina发表了很多论文，并且同行评审了很多分布式计算和并行计算领域的研究论文，包括一些在云环境扩展MapReduce模型进行有效的数据挖掘和数据分析的论文。Thilina经常在学术界和工业界会议上发表演讲。
Thilina自2005年以来，在Apache软件基金会下贡献了若干个开源项目，并成为committer和PMC成员。在开始研究生学习之前，Thilina在WSO2公司担任高级软件工程师，专注于开源中间件开发。Thilina 2006年在斯里兰卡莫勒图沃大学获得计算机科学与工程学士学位，2009年在美国印第安纳大学伯明顿分校获得计算机科学硕士学位，2013年获得分布式和并行计算领域博士学位。
译者介绍
杨卓荦阿里巴巴集团数据平台事业部资深研发工程师。2011年起，在阿里巴巴从事Hadoop五年，集团SQL on Hadoop负责人，HadoopYarnHive contributor，开源软件爱好者。

目錄：

第1章　搭建Hadoop并在集群中运行
　1.1 简介
　1.2 在你的机器上安装Hadoop
　1.3 写WordCountMapReduce示例程序，打包并使用独立的Hadoop运行它
　1.4 给WordCount MapReduce程序增加combiner步骤
　1.5 安装HDFS
　1.6 使用HDFS监控UI
　1.7 HDFS的基本命令行文件操作
　1.8 在分布式集群环境中设置Hadoop
　1.9 在分布式集群环境中运行WordCount程序
　1.10 使用MapReduce监控UI
第2章　HDFS进阶
　2.1 简介
　2.2 HDFS基准测试
　2.3 添加一个新的DataNode
　2.4 DataNode下架
　2.5 使用多个磁盘卷以及限制HDFS的磁盘使用情况
　2.6 设置HDFS块大小
　2.7 设置文件冗余因子
　2.8 使用HDFS的Java API
　2.9 使用HDFS的C API（libhdfs）
　2.10 挂载HDFS（Fuse-DFS）
　2.11 在HDFS中合并文件
第3章　高级Hadoop MapReduce运维
　3.1 简介
　3.2 调优集群部署的Hadoop配置
　3.3 运行基准测试来验证Hadoop的安装
　3.4 复用Java虚拟机以提高性能
　3.5 容错和推测执行
　3.6 调试脚本—分析任务失败
　3.7 设置失败百分比以及跳过不良记录
　3.8 共享用户的Hadoop集群—使用公平调度器和其他调度器
　3.9 Hadoop的安全性——整合使用Kerberos
　3.10 使用Hadoop的工具接口
第4章　开发复杂的Hadoop MapReduce应用程序
　4.1 简介
　4.2 选择合适的Hadoop数据类型
　4.3 实现自定义的Hadoop Writable数据类型
　4.4 实现自定义Hadoop key类型
　4.5 从mapper中输出不同值类型的数据
　4.6 为输入数据格式选择合适的Hadoop InputFormat
　4.7 添加新的输入数据格式的支持—实现自定义的InputFormat
　4.8 格式化MapReduce计算的结果—使用Hadoop的OutputFormat
　4.9 Hadoop的中间（map到reduce）数据分区
　4.10 将共享资源传播和分发到MapReduce作业的任务中—Hadoop DistributedCache
　4.11 在Hadoop上使用传统应用程序—Hadoop Streaming
　4.12 添加MapReduce作业之间的依赖关系
　4.13 用于报告自定义指标的Hadoop计数器
第5章　Hadoop生态系统
　5.1 简介
　5.2 安装HBase
　5.3 使用Java客户端API随机存取数据
　5.4 基于HBase（表输入输出）运行MapReduce作业
　5.5 安装Pig
　5.6 运行第一条Pig命令
　5.7 使用Pig执行集合操作（join，union）与排序
　5.8 安装Hive
　5.9 使用Hive运行SQL风格的查询
　5.10 使用Hive执行join
　5.11 安装Mahout
　5.12 使用Mahout运行K-means
　5.13 可视化K-means结果
第6章　分析
　6.1 简介
　6.2 使用MapReduce的简单分析
　6.3 使用MapReduce执行Group-By
　6.4 使用MapReduce计算频率分布和排序
　6.5 使用GNU Plot绘制Hadoop计算结果
　6.6 使用MapReduce计算直方图
　6.7 使用MapReduce计算散点图
　6.8 用Hadoop解析复杂的数据集
　6.9 使用MapReduce连接两个数据集
第7章　搜索和索引
　7.1 简介
　7.2 使用Hadoop MapReduce生成倒排索引
　7.3 使用ApacheNutch构建域内网络爬虫
　7.4 使用Apache Solr索引和搜索网络文档
　7.5 配置Apache HBase作为ApacheNutch的后端数据存储
　7.6 在Hadoop集群上部署Apache HBase
　7.7 使用HadoopHBase集群构建Apache Nutch全网爬虫服务
　7.8 用于索引和搜索的ElasticSearch
　7.9 生成抓取网页的内链图
第8章　聚类、推荐和关系发现
　8.1 简介
　8.2 基于内容的推荐
　8.3 层次聚类
　8.4 对亚马逊销售数据集进行聚类操作
　8.5 基于协同过滤的推荐
　8.6 使用朴素贝叶斯分类器的分类
　8.7 使用Adwords平衡算法给广告分配关键字
第9章　海量文本数据处理
　9.1 简介
　9.2 使用Hadoop Streaming和Python预处理数据（抽取、清洗和格式转换）
　9.3 使用Hadoop Streaming进行数据去重
　9.4 使用importtsv和批量加载工具把大型数据集加载到ApacheHBase
　数据存储中
　9.5 创建用于文本数据的TF向量和TF-IDF向量
　9.6 聚类文本数据
　9.7 使用隐含狄利克雷分布（LDA）发现主题
　9.8 使用Mahout的朴素贝叶斯分类器分类文件
第10章　云端部署——在云上使用Hadoop
　10.1 简介
　10.2 使用亚马逊弹性MapReduce运行Hadoop MapReduce计算
　10.3 使用亚马逊EC2竞价实例来执行EMR作业流以节约开支
　10.4 使用EMR执行Pig脚本
　10.5 使用EMR执行Hive脚本
　10.6 使用命令行界面创建亚马逊EMR作业流
　10.7 使用EMR在亚马逊EC2云上部署Apache HBase集群
　10.8 使用EMR引导操作来配置亚马逊EMR作业的虚拟机
　10.9 使用Apache Whirr在云环境中部署Apache Hadoop集群
　10.10 使用Apache Whirr在云环境中部署Apache HBase集群

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.