《大数据分析原理和应用》 - 海沫 - 电子工业出版社 - 香港大書城 - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

會員書架精選

2024年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書

『簡體書』大数据分析原理和应用

書城自編碼： 3862699
分類：簡體書→大陸圖書→教材→研究生/本科/专科教材
作者：海沫
國際書號(ISBN)： 9787121453113
出版社：电子工业出版社
出版日期： 2023-04-01

頁數/字數： /
釘裝：平塑

售價：HK$ 67.9

我要買件

share:

** 我創建的書架 **
未登入.

新書推薦：

半小时漫画中国史（全5册）

《半小时漫画中国史（全5册）》
售價：HK$ 274.5

7步吃透商业提案写作

《 7步吃透商业提案写作》
售價：HK$ 65.9

大国谍影

《大国谍影》
售價：HK$ 96.8

从荒诞到反抗：导读加缪《局外人》和《鼠疫》（谜文库）

《从荒诞到反抗：导读加缪《局外人》和《鼠疫》（谜文库）》
售價：HK$ 65.8

给孩子的考古

《给孩子的考古》
售價：HK$ 63.8

文明的重建：战后德国五十年（译林思想史）从大屠杀刽子手到爱好和平的民主主义者，揭秘战后德国五十年奇迹般的复兴之路！

《文明的重建：战后德国五十年（译林思想史）从大屠杀刽子手到爱好和平的民主主义者，揭秘战后德国五十年奇迹般的复兴之路！》
售價：HK$ 108.9

推荐系统核心技术与实践

《推荐系统核心技术与实践》
售價：HK$ 108.9

乌合之众：群体心理研究

《乌合之众：群体心理研究》
售價：HK$ 74.8

建議一齊購買：

+

HK$ 123.8
《中药学·全国中医药行业高等教育“十四五”规划教材》

+

HK$ 172.8
《光学（第五版）》

+

HK$ 70.0
《马克思主义政治经济学概论（第二版）—马克思主义理论研究和建设》

+

HK$ 52.5
《大学生职业生涯规划与就业指导》

+

HK$ 66.7
《发展心理学第三版》

+

HK$ 58.7
《美育学概论》

內容簡介：

本书从大数据分析的原理、技术和应用的角度，围绕着大数据分析的基础知识、大数据分析平台的核心原理、大数据分析的关键技术、大数据分析的应用四个方面进行讲述，使学生能掌握大数据分析的基本原理和核心技术，同时通过大数据分析在上市公司信用风险预测研究中的应用案例使学生熟悉大数据分析的原理和技术的实际应用，并能搭建大数据分析平台分析大规模数据集。其中，大数据分析的基础知识包括：大数据产生的背景、大数据的概念、特点、价值、大数据带来的思维变革；大数据分析平台的核心原理包括：两种常用开源大数据分析平台——Hadoop和Spark的起源、发展及应用现状，理解两种平台各自的体系架构、基本运行机制及适用范围，掌握其安装部署过程及基本使用方法，为大数据分析的应用打下基础；大数据分析的关键技术包括：Hadoop分布式文件系统、MapReduce并行编程模型、Hadoop 2.0的资源管理调度框架——YARN、大数据的获取和预处理、大数据的聚类和分类算法。

關於作者：

海沫，博士。中央财经大学信息学院副教授，硕士生导师，校级精品慕课《大数据分析原理与应用》负责人，CCF高级会员。2008年7月毕业于中科院计算所，获工学博士学位。2013年获北京市青年英才计划资助。2017年9月至2018年9月在美国加州大学尔湾分校Donald Bren School of Information and Computer Science访学。主要从事对等网络、分布式算法、大数据处理、社交网络分析、区块链网络和机器学习等领域的研究，在国内外核心期刊和国际会议上发表学术论文60余篇。近年来积极探索教学改革，主持或参与教改项目5项，发表教改论文5篇，参编教材3部。

目錄：

第4章 MapReduce并行编程模型834.1 MapReduce的概述834.1.1 分布式并行编程834.1.2 MapReduce的简介844.1.3 Map函数和Reduce函数864.2 MapReduce的体系结构874.2.1 MapReduce 1.0体系结构的总体框架874.2.2 Hadoop 2.0的体系结构884.2.3 MapReduce的容错性894.3 MapReduce的工作流程894.3.1 MapReduce工作流程的概述894.3.2 MapReduce的执行过程904.3.3 Shuffle过程详解934.4 MapReduce的实例分析994.4.1 WordCount994.4.2 倒排索引1024.4.3 Top-K1064.5 MapReduce的编程实践1074.5.1 任务要求1074.5.2 编写Map处理逻辑1074.5.3 编写Reduce处理逻辑1084.5.4 编写main方法1094.5.5 实验过程1094.6 MapReduce的优缺点分析1134.6.1 MapReduce的优点1134.6.2 MapReduce的缺点1134.7 本章小结1144.8 本章习题114第5章 Hadoop 2.0的资源管理调度框架——YARN1175.1 YARN的产生背景1175.1.1 MapReduce 1.0中存在的问题1175.1.2 YARN的产生1185.2 YARN的设计思路1195.3 YARN的体系结构1205.3.1 YARN的体系结构总体框架1205.3.2 YARN各组件功能的介绍1215.3.3 YARN的容错性1225.4 YARN的工作流程1235.5 YARN的优缺点分析1245.5.1 YARN的优点1245.5.2 YARN的缺点1265.6 本章小结1265.7 本章习题127第6章大数据的获取和预处理1306.1 大数据的获取1306.1.1 爬虫的基础知识1306.1.2 Scrapy爬虫的原理与流程1396.1.3 Scrapy的爬虫实例1416.2 数据清洗1466.2.1 数据清洗的概述1466.2.2 数据清洗的原理1466.2.3 数据清洗的流程1476.2.4 Pandas数据清洗的实例1486.3 数据归约1536.3.1 维归约1546.3.2 属性选择1546.3.3 离散化方法1556.3.4 PCA的实例1556.4 数据标准化1586.4.1 数据标准化的概念1586.4.2 数据标准化的方法1586.4.3 数据标准化的实例1596.5 本章小结1616.6 习题162第7章大数据分析算法1637.1 聚类算法1637.1.1 经典聚类算法1637.1.2 大数据聚类算法的应用1847.2 分类算法1887.2.1 经典分类算法1887.2.2 大数据分类算法的应用2157.3 本章小结2197.4 习题220第8章大数据分析的应用案例2218.1 案例背景2218.2 数据获取和预处理2228.2.1 获取来源2228.2.2 数据说明2228.2.3 数据预处理2238.3 评价指标说明2268.4 基于Python的实现2278.4.1 基于Python的逻辑回归2278.4.2 基于Python的SVM2298.4.3 基于Python的朴素贝叶斯2318.4.4 基于Python的决策树2328.4.5 基于Python的随机森林2348.5 基于Spark的实现2368.5.1 基于Spark的逻辑回归2368.5.2 基于Spark的SVM2378.6 实验结果分析2388.7 本章小结2398.8 习题239

書城介紹　 |　合作申請　|　索要書目　 |　新手入門　|　聯絡方式　 |　幫助中心　|　找書說明　 |　送貨方式　|　付款方式 香港用户　 |　台灣用户　|　海外用户

megBook.com.hk

Copyright © 2013 - 2025 （香港）大書城有限公司　 All Rights Reserved.