登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』大数据技术原理与应用

書城自編碼: 3797685
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 程秀峰,严中华
國際書號(ISBN): 9787030729576
出版社: 科学出版社
出版日期: 2022-09-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 97.5

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
狞厉与肃穆 :中国古代青铜器的纹样
《 狞厉与肃穆 :中国古代青铜器的纹样 》

售價:HK$ 261.6
古代中医养生典籍精选
《 古代中医养生典籍精选 》

售價:HK$ 202.8
今天的我们如何做父亲:梁启超谈家庭教育
《 今天的我们如何做父亲:梁启超谈家庭教育 》

售價:HK$ 93.6
中国佛教美学典藏·佛教绘画部·经卷佛画
《 中国佛教美学典藏·佛教绘画部·经卷佛画 》

售價:HK$ 816.0
中国佛教美学典藏·佛教绘画部·石窟壁画
《 中国佛教美学典藏·佛教绘画部·石窟壁画 》

售價:HK$ 660.0
中国佛教美学典藏·佛教绘画部·绢帛佛画
《 中国佛教美学典藏·佛教绘画部·绢帛佛画 》

售價:HK$ 480.0
中国色:手艺里的中国色彩美学
《 中国色:手艺里的中国色彩美学 》

售價:HK$ 105.6
中国文化文物和旅游统计年鉴2023
《 中国文化文物和旅游统计年鉴2023 》

售價:HK$ 357.6

 

建議一齊購買:

+

HK$ 111.3
《 机器学习算法与实现 —— Python编程与应用实例 》
+

HK$ 82.5
《 现代心理与教育统计学(第5版) 》
+

HK$ 62.4
《 传播学教程 第二版(21世纪新闻传播学系列教材;“十一五”国家级规划教材) 》
+

HK$ 73.0
《 法理学(第五版) 》
+

HK$ 70.8
《 设施农业工程实践案例解析(李建明) 》
+

HK$ 68.8
《 会计学(第4版) 》
內容簡介:
《大数据技术原理与应用》从大数据基础原理、大数据分析方法和大数据行业应用三个部分介绍大数据技术。《大数据技术原理与应用》共12章,内容包含大数据的基本概念,分布式基础架构Hadoop,分布式文件系统HDFS,NoSQL数据库,分布式计算框架MapReduce,大数据基本分析方法(聚类、分类与预测),大数据在搜索引擎、推荐系统以及其他行业的应用。《大数据技术原理与应用》在前7章设置8个实验,帮助读者初步掌握大数据技术、大数据分析与大数据应用的相关知识与操作技能。
目錄
目录前言第1章 大数据概述 11.1 什么是大数据 11.1.1 关于大数据的预言 11.1.2 触发大数据产生的三种技术 21.1.3 大数据形成中遇到的问题及解决方案 31.1.4 各方对大数据的定义 41.2 大数据的类型与特征 41.2.1 按照数据结构分类 41.2.2 按照生产主体分类 61.2.3 按照作用方式分类 61.2.4 大数据的特征 71.3 大数据的思维方式 81.4 大数据的技术流程 91.4.1 总体处理流程 91.4.2 数据采集与数据预处理 101.4.3 数据存储 101.4.4 数据分析与数据挖掘 111.5 主流的大数据平台 111.5.1 Hadoop 121.5.2 Spark 121.5.3 Storm 131.5.4 Flink 131.5.5 主流的大数据平台比较 141.6 大数据集群的部署方式 141.6.1 分布式 141.6.2 云架构 151.7 实验1:熟悉虚拟环境、Linux、Java 171.7.1 安装VMware 171.7.2 Linux基本命令 211.7.3 在Linux中安装Java环境 221.8 习题与思考 23第2章 分布式基础架构Hadoop 242.1 什么是Hadoop 242.2 Hadoop的发展历史 252.3 Hadoop的基本特性 272.4 深入了解Hadoop 282.4.1 Hadoop的体系结构 282.4.2 Hadoop的并行开发 302.4.3 Hadoop的生态系统 312.5 Hadoop与其他技术和框架 332.5.1 Hadoop与关系型数据库 332.5.2 Hadoop与云计算 342.6 实验2:快速搭建Hadoop集群环境 342.6.1 准备工作 342.6.2 安装配置虚拟机 352.6.3 配置固定IP并测试 352.6.4 克隆虚拟机 362.6.5 配置SSH无密码登录 362.6.6 配置时间同步服务 372.6.7 安装JDK 382.6.8 上传、解压Hadoop安装包 382.6.9 配置Hadoop 382.6.10 启动集群 412.6.11 查看集群监控 412.7 习题与思考 42第3章 分布式文件系统HDFS 433.1 什么是HDFS 433.1.1 文件系统和计算机集群 433.1.2 分布式文件系统 433.1.3 HDFS 453.1.4 HDFS的优点和缺点 483.2 HDFS中的概念 483.2.1 块 493.2.2 三级寻址和元数据 493.2.3 命名空间 503.2.4 名称节点 513.2.5 第二名称节点 523.2.6 数据节点 533.2.7 客户端 543.2.8 心跳机制 543.2.9 块缓存 543.3 HDFS的存储原理 553.3.1 冗余存储机制 553.3.2 数据存取策略 553.3.3 数据的错误与恢复 563.4 HDFS的数据读写过程 573.4.1 RPC实现流程 573.4.2 文件的读流程 583.4.3 文件的写流程 593.5 HDFS的命令、界面及API 603.5.1 HDFS的主要命令 603.5.2 HDFS的Web界面 613.5.3 HDFS常用的Java API 613.6 实验3:HDFS编程实践 623.6.1 在Eclipse中创建项目 633.6.2 为项目添加需要用到的JAR包 633.6.3 编写Java应用程序 633.6.4 编译运行程序 653.6.5 应用程序的部署 653.7 习题与思考 67第4章 NoSQL数据库 684.1 关系型数据库 684.1.1 关系模型 694.1.2 设计数据库 714.1.3 使用数据库 724.1.4 数据库恢复和数据保护 734.2 非关系型数据库NoSQL 744.2.1 关系型数据库和NoSQL的比较 754.2.2 NoSQL的基础理论 764.3 NoSQL数据库的分类 794.3.1 列族数据库 804.3.2 键值数据库 824.3.3 文档数据库 834.3.4 图数据库 844.3.5 四种NoSQL数据库的比较 854.4 列族数据库—HBase 854.4.1 HBase概述 854.4.2 HBase的数据模型 864.4.3 HBase的实现原理 884.4.4 HBase的系统架构 914.5 实验4:HBase的基本操作 924.5.1 HBase的安装 924.5.2 HBase的配置 934.5.3 使用Shell命令操作HBase 954.5.4 用程序操作HBase 964.6 文档数据库MongoDB 1004.6.1 MongoDB概述 1004.6.2 MongoDB的体系结构 1014.6.3 MongoDB的数据类型 1044.7 实验5:MongoDB的基本操作 1074.7.1 MongoDB的安装 1074.7.2 MongoDB的基本操作 1084.7.3 MongoDB的索引操作 1144.7.4 MongoDB的聚合操作 1154.8 习题与思考 117第5章 MapReduce原理 1185.1 什么是MapReduce 1185.1.1 MapReduce模型 1185.1.2 MapReduce函数 1205.2 MapReduce的体系架构 1225.2.1 MapReduce的工作主体 1225.2.2 MapReduce的工作流程 1245.2.3 MapReduce的执行过程 1255.2.4 Map任务和Reduce任务 1275.3 Shuffle的具体过程 1275.3.1 Shuffle过程简介 1285.3.2 输入数据和执行Map任务 1295.3.3 Partition操作 1295.3.4 Sort操作 1305.3.5 Combine操作 1305.3.6 Merge操作 1315.4 MapReduce的数学应用 1325.4.1 在关系代数运算中的应用 1325.4.2 分组与聚合运算 1335.4.3 矩阵-向量乘法 1335.4.4 矩阵乘法 1345.5 习题与思考 135第6章 MapReduce实践案例 1366.1 实验6:WordCount 1366.1.1 实验需求 1366.1.2 实验设计 1366.1.3 执行过程 1376.1.4 实验分析 1386.1.5 WordCount编程实践 1396.2 实验7:MapReduce统计气象数据 1426.2.1 实验需求 1426.2.2 数据格式 1426.2.3 实验分析 1436.3 习题与思考 147第7章 基于大数据的聚类分析 1487.1 聚类分析概述 1487.1.1 聚类分析的定义 1487.1.2 聚类算法的分类 1497.1.3 相似性的测度 1507.2 基于划分的聚类算法k-means 1537.2.1 k-means聚类算法 1537.2.2 k-means聚类算法的拓展 1557.3 层次聚类算法 1577.3.1 AGNES算法 1587.3.2 DIANA算法 1607.4 实验8:k-means算法的MapReduce实现 1617.4.1 实验内容与实验要求 1617.4.2 实验数据与实验目标 1627.4.3 实现思路 1627.4.4 代码实现 1637.4.5 实验结果 1647.5 习题与思考 166第8章 基于大数据的分类分析 1678.1 分类问题概述 1678.1.1 学习阶段 1678.1.2 分类阶段 1688.2 k-最近邻算法 1698.2.1 KNN算法原理 1698.2.2 KNN算法的特点及改进 1728.3 决策树分类方法 1738.3.1 决策树概述 1738.3.2 信息论 1778.3.3 ID3算法 1798.3.4 算法改进:C4.5算法 1838.4 贝叶斯分类方法 1878.4.1 贝叶斯定理 1888.4.2 朴素贝叶斯分类器 1898.4.3 朴素贝叶斯分类方法的改进 1928.5 习题与思考 195第9章 基于大数据的预测分析 1969.1 大数据预测方法概述 1969.1.1 预测的定义 1969.1.2 预测方法的划分 1969.1.3 预测的基本步骤 1999.2 回归分析预测 2019.2.1 回归分析概述 2019.2.2 线性回归 2019.2.3 多项式回归 2049.2.4 逻辑斯谛回归 2059.3 时间序列预测 2089.3.1 时间序列概述 2089.3.2 时间序列平滑法 2109.4 习题与思考 215第10章 大数据在搜索引擎中的应用 21610.1 应用现状概述 21610.1.1 搜索引擎的概念 21610.1.2 国内外搜索引擎的应用现状 21610.1.3 大数据与搜索引擎优化 21710.2 基本实现原理 21710.3 搜索引擎的大数据时代 22110.3.1 谷歌的大数据应用 22110.3.2 百度的大数据应用 22210.3.3 雅虎的大数据应用 22410.4 习题与思考 224第11章 大数据在推荐系统中的应用 22611.1 应用现状概述 22611.1.1 推荐系统的概念 22611.1.2 推荐系统的应用 22711.2 基本实现原理 22711.2.1 推荐系统模型 22711.2.2 推荐系统的主要算法 22811.2.3 协同过滤实践 23311.3 应用案例 23611.3.1 智能推荐引擎 23711.3.2 智能推荐引擎系统架构 23711.3.3 用户画像 23811.4 习题与思考 238第12章 大数据在其他行业中的应用 23912.1 大数据行业应用

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.