《实战大数据分布式大数据分析处理系统开发与应用》 - 井超杨俊乔钢柱 - Meg Book Store - 香港.大書城

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書

『簡體書』实战大数据分布式大数据分析处理系统开发与应用

書城自編碼： 3831527
分類：簡體書→大陸圖書→計算機/網絡→數據庫
作者：井超杨俊乔钢柱
國際書號(ISBN)： 9787111720652
出版社：机械工业出版社
出版日期： 2023-02-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 99.9

我要買件

** 我創建的書架 **
未登入.

新書推薦：

叔本华暮年之思

《叔本华暮年之思》
售價：HK$ 69.6

故纸留痕：抗日战争时期澳门报刊资料选辑

《故纸留痕：抗日战争时期澳门报刊资料选辑》
售價：HK$ 345.6

玩转Photoshop（零基础快速上手，全彩赠视频）

《玩转Photoshop（零基础快速上手，全彩赠视频）》
售價：HK$ 57.6

故事力：TED演讲者助力，当代青年克服表达难题（两位TED专业讲者教你掌握故事五大力）

《故事力：TED演讲者助力，当代青年克服表达难题（两位TED专业讲者教你掌握故事五大力）》
售價：HK$ 81.6

中国民间神话故事绘（套装共15册）

《中国民间神话故事绘（套装共15册）》
售價：HK$ 456.0

无限可能的身体

《无限可能的身体》
售價：HK$ 72.0

中国人工智能系列研究报告：大型语言模型的教育应用

《中国人工智能系列研究报告：大型语言模型的教育应用》
售價：HK$ 69.6

北洋大学与近代中国（第2辑）

《北洋大学与近代中国（第2辑）》
售價：HK$ 153.6

建議一齊購買：

+

HK$ 208.6
《数据治理：工业企业数字化转型之道》

+

HK$ 148.8
《使用GitOps实现Kubernetes的持续部署：模式、流程及工具》

+

HK$ 111.3
《 ClickHouse性能之巅：从架构设计解读性能之谜》

+

HK$ 136.3
《物联网大数据分析实战》

編輯推薦：

面向大数据开发工程师、大数据运维工程师五大实战项目，详解大数据分析处理系统（离线/实时）的技术构成与开发实现随书配备10GB学习资源，包括虚拟机集群、安装包、配置文件、程序源代码

內容簡介：

实战大数据——分布式大数据分析处理系统开发与应用，从大数据技术基础概念出发，介绍了大数据分析的流程和大数据分析处理系统的组成，以及大数据集群的搭建，并在此基础上讲解了多种不同技术构成的离线/实时数据分析系统实战项目。全书共10章，包括大数据概述、大数据分析的基本流程与工具、分布式大数据分析处理系统概述、构建大数据集群环境、构建基于LayUI的集群管理系统、基于HBase的大数据离线分析系统、基于Hive+Hadoop+Spark的大数据离线分析系统、基于MySQL+Spark的大数据离线分析系统、基于Redis+Kafka+Spark的大数据实时分析系统、基于Flume+Kafka+Flink的大数据实时分析系统。实战大数据—— 分布式大数据分析处理系统开发与应用，适合从事大数据系统搭建与运维、大数据分析等岗位的技术人员阅读，也适合高等院校大数据相关专业的学生使用。

目錄：

前言第1章大数据概述11.1 大数据的基本概念11.1.1 何谓大数据11.1.2 大数据的产生阶段21.1.3 大数据的核心技术和计算模式21.2 大数据的应用21.2.1 大数据的应用场景21.2.2 大数据系统的作用21.3 大数据技术生态圈31.3.1 Linux操作系统31.3.2 Hadoop生态系统61.3.3 Spark对Hadoop的完善81.4 大数据技术的新发展91.4.1 Hadoop 3.0的新特性91.4.2 大数据引擎Flink101.4.3 智能化大数据分析处理11本章小结12第2章大数据分析的基本流程与工具132.1 数据采集132.1.1 网络爬虫采集数据132.1.2 使用Excel爬取数据142.2 数据存储162.2.1 关系型数据的存储—基于MySQL162.2.2 非关系型数据的存储—基于Redis、HBase172.3 数据分析与数据处理182.3.1 数据分析常用工具—pandas192.3.2 分布式计算框架192.3.3 分布式数据挖掘和深度学习202.4 数据可视化222.4.1 Python数据可视化库Matplotlib222.4.2 Python数据可视化库pyecharts222.4.3 数据可视化图表库ECharts232.4.4 数据可视化工具Apache Superset24本章小结24第3章分布式大数据分析处理系统概述253.1 什么是分布式大数据分析处理系统253.2 分布式大数据分析处理系统的作用263.3 分布式大数据分析处理系统的应用场景263.4 分布式大数据分析处理系统的构成303.4.1 数据采集子系统303.4.2 数据存储系统303.4.3 数据分析处理系统313.4.4 数据可视化系统323.5 分布式大数据分析处理系统的实现323.5.1 系统前端—HTML、CSS、jQuery323.5.2 系统后端—SpringBoot、SSM333.5.3 Web服务器端—Tomcat35本章小结35第4章构建大数据集群环境364.1 部署大数据处理环境364.1.1 搭建Hadoop集群364.1.2 ZooKeeper的安装部署424.1.3 Kafka的安装部署454.1.4 Spark集群搭建474.2 部署大数据存储环境494.2.1 MySQL的安装部署494.2.2 Hive的安装部署504.2.3 HBase的安装部署514.2.4 Redis的安装部署55本章小结57第5章构建基于LayUI的集群管理系统585.1 集群管理系统概述585.1.1 需求分析585.1.2 系统架构—系统+集群+UI595.2 系统开发的前期准备操作605.2.1 本机环境配置605.2.2 集群环境配置625.2.3 构建项目工程结构745.3 系统的代码实现755.3.1 Controller层实现755.3.2 构造系统所需工具包905.3.3 核心类实现975.4 构造系统UI界面—基于LayUI100本章小结105第6章基于HBase的大数据离线分析系统1066.1 系统架构概述1066.1.1 需求分析1066.1.2 系统架构—HBase+SpringBoot+ECharts1076.2 采集股份转让数据1086.2.1 使用爬虫抓取数据1086.2.2 数据采集模块测试1116.3 数据存储和处理模块实现1136.3.1 数据库设计1136.3.2 使用HBase存储并处理数据1146.3.3 数据存储和处理模块测试1196.4 数据可视化模块实现1206.4.1 数据可视化模块后端设计—基于SpringBoot1206.4.2 数据可视化模块前端设计—基于ECharts1226.4.3 数据可视化页面展示125本章小结126第7章基于Hive+Hadoop+Spark的大数据离线分析系统1277.1 系统架构概述1277.1.1 需求分析1277.1.2 数据存储—Hive+Hadoop1297.1.3 数据处理与可视化—Spark+SSM+ECharts1297.2 采集旅游相关数据1307.2.1 使用爬虫采集城市、景点数据1307.2.2 数据采集模块测试1337.3 数据存储模块实现1357.3.1 数据库设计1357.3.2 使用HDFS和Hive存储数据1377.3.3 数据存储模块测试1387.4 数据分析处理模块实现1397.4.1 Spark处理数据1397.4.2 分词处理和情感分析—基于jieba+SnowNLP库1397.4.3 数据分析处理模块测试1427.5 数据可视化模块实现1437.5.1 数据可视化模块后端设计—基于SSM1437.5.2 数据可视化模块前端设计—基于ECharts1547.5.3 数据可视化页面展示161本章小结167第8章基于MySQL+Spark的大数据离线分析系统1688.1 系统架构概述1688.1.1 需求分析1688.1.2 数据存储—MySQL1708.1.3 数据处理与可视化—Spark Streaming +Apache Superset1708.2 采集电商数据1708.2.1 使用爬虫爬取商品信息1708.2.2 数据采集模块测试1828.3 数据分析处理模块实现1838.3.1 数据库设计1838.3.2 Spark处理商品数据1858.3.3 数据分析处理模块测试1928.4 数据可视化模块实现1938.4.1 使用Apache Superset绘制数据可视化图表1938.4.2 数据可视化页面展示193本章小结196第9章基于Redis+Kafka+Spark的大数据实时分析系统1979.1 系统架构概述1979.1.1 需求分析1979.1.2 数据存储—Redis1989.1.3 数据处理与可视化—Kafka+Spark Streaming+SSM+ECharts1999.2 采集汽车网站数据1999.2.1 使用爬虫获取汽车和用户数据1999.2.2 数据采集模块测试2019.3 数据存储模块实现2019.3.1

內容試閱：

前言当今时代，物联网、大数据、云计算、人工智能等热词铺天盖地地向人们袭来。其中，大数据技术已经广泛应用于金融、医疗、教育、电信以及电商等领域。2020年，国家推出了“新基建”战略，将5G、大数据中心、人工智能和工业互联网列为新型基础设施建设的重点。在国家政策的引领下，各行各业都将大数据产业列为优先发展目标，大数据时代已经到来。大数据是信息产业持续高速增长的新引擎，已成为提高企业核心竞争力的关键因素。大数据时代科学研究的方法手段发生了重大变革，对大数据的处理分析已经成为新一代信息技术融合应用的关键。各行各业对于大数据人才的需求呈现井喷式增长，高校大数据相关专业的建设也呈现这一态势。众多企事业单位都迫切需要具备理论基础和实践技能的大数据人才。相应地，对适合此类人才培养的大数据技术应用型图书的需求也非常迫切。本书从大数据技术相关概念出发，系统介绍了大数据分析的流程和大数据分析处理系统的组成，详细讲解了大数据集群的搭建过程，并以大数据集群为基础深入剖析了多个离线数据分析和实时数据分析的实战项目案例，涵盖了生产生活中的多个大数据应用场景。本书理论结合实际，特别突出了实践特色，能够很好地满足高校大数据人才培养需求和大数据相关岗位工程师的技能提升需求。全书共10章，第1章对大数据相关内容进行概述，第2章介绍了大数据分析的基本流程与工具，第3章介绍了分布式大数据分析处理系统，第4章介绍了构建大数据集群环境的方法和步骤，第5章介绍了如何构建基于LayUI的集群管理系统，第6章介绍了基于HBase的大数据离线分析系统，第7章介绍了基于Hive+Hadoop+Spark的大数据离线分析系统，第8章介绍了基于MySQL+Spark的大数据离线分析系统，第9章介绍了基于Redis+Kafka+Spark的大数据实时分析系统，第10章介绍了基于Flume+Kafka+Flink的大数据实时分析系统。本书前4章作为理论体系，介绍了大数据分析系统的基本概念、基本原理、基本组成和构建方法。第5章用Java语言编写了一个集群管理系统。第6～8章介绍了三个不同应用场景下的大数据离线分析系统。第9、10章介绍了两个不同应用场景下的大数据实时分析系统。本书可以帮助读者建立对大数据技术概念的整体认知，通过丰富的实践案例帮助读者掌握主流大数据技术的实际应用，具有较强的实用性和指导性。本书也可作为有一定大数据基础的读者的参考书，方便查阅相应技术、配置方式等。本书配有电子课件、源代码、视频和附带的集群，供读者学习使用。在本书编写过程中，杨俊负责撰写第10章，乔钢柱负责撰写第3章，其余章节均为井超撰写。在本书写作过程中，特别感谢郭媛、刘甜甜、李沛洋、王晗、朱忠诺、张龙浩、王秀峰等人提供的协助。在此，也向机械工业出版社的谢辉、王斌等编辑表示衷心的感谢。

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　大陸用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.