登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』数据分析与应用入门(Python版)

書城自編碼: 3877625
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 潘晓 吴雷 王书海
國際書號(ISBN): 9787302621829
出版社: 清华大学出版社
出版日期: 2022-12-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 71.8

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
建筑与时间:从上古城市到当代空间
《 建筑与时间:从上古城市到当代空间 》

售價:HK$ 93.6
重建:美利坚未完成的革命(1863—1877)
《 重建:美利坚未完成的革命(1863—1877) 》

售價:HK$ 202.8
复辟:查理二世和他的王国,1660—1685
《 复辟:查理二世和他的王国,1660—1685 》

售價:HK$ 165.6
向上社交:拿捏分寸 跨越社交圈层的底层逻辑 让优秀的人主动靠近你
《 向上社交:拿捏分寸 跨越社交圈层的底层逻辑 让优秀的人主动靠近你 》

售價:HK$ 70.8
九州天下:中国文化与中国人
《 九州天下:中国文化与中国人 》

售價:HK$ 69.6
Hadoop大数据集群部署及数据存储项目化教程
《 Hadoop大数据集群部署及数据存储项目化教程 》

售價:HK$ 57.6
隐藏的文脉:北京书院述微( 作家解玺璋文化随笔   溯源北京文脉,追摹文士遗风)
《 隐藏的文脉:北京书院述微( 作家解玺璋文化随笔 溯源北京文脉,追摹文士遗风) 》

售價:HK$ 57.6
哲学、历史与僭政——重审施特劳斯与科耶夫之争
《 哲学、历史与僭政——重审施特劳斯与科耶夫之争 》

售價:HK$ 114.0

 

建議一齊購買:

+

HK$ 121.2
《 自动控制原理(第七版) 》
+

HK$ 130.7
《 公司理财(精要版·原书第12版) 》
+

HK$ 83.8
《 大学生应该知道的事 一本书搞懂大学应该怎么读 丁志伟 》
+

HK$ 76.7
《 电路(第5版)(换封面加十二五标) 》
+

HK$ 56.3
《 政治经济学概论(第五版)(21世纪经济学系列教材) 》
+

HK$ 197.4
《 财务管理(原书第14版) 》
編輯推薦:
1.数据科学是一门新兴的热门科学,国内外大学纷纷设立了数据相关课程、专业。数据相关的书籍深受读者欢迎。
2.本书主要涉及数据分析方面基础内容,包括方法模型、分析步骤和数据分析报告专业等相关内容,适应于需要做数据分析的零基础人员使用。
3.本书将在现实真实的数据集,结合大量数据分析案例,贯穿全书,领域广泛。
4.本书适用于计算机科学与技术、数据科学、统计学、财务分析、大数据金融等需要进行数据分析的专业和领域。目前市场上对数据分析背景相关技能人员需求一直居高不下。
5.采用最受欢迎的编程语言Python作为分析工具,代码简洁性、易读性以及可扩展性,易上手。
內容簡介:
本书是数据分析类课程的入门教材,系统整理了数据分析的知识体系,以分析流程为主线阐述了数据分析的主要方法和基于Python的技术应用。 全书共分为9章,包括数据分析简介,数据分析的方法,NumPy和pandas基础,数据获取与导入,数据预处理,数据探索,数据挖掘概述,基本统计图形,文本、网络和地理空间可视化。从第2章开始,在阐述基础知识的同时设计了大量例题,按照“分析需求→Python代码展示→例题解析→运行结果”的模式对知识点进行剖析。全书提供习题、答案及程序源码。 本书可作为普通高等院校数据分析处理相关课程的学生的教材使用,也可供刚刚步入数据分析领域的从业人员参考。
目錄
第1章数据分析简介
1.1开篇案例
1.2认识数据
1.2.1数据
1.2.2数据类型
1.3认识数据分析
1.3.1数据管理的产生和发展
1.3.2机器学习与人工智能
1.4数据分析步骤
1.5数据分析作用
1.6常用数据分析工具
1.7数据分析思维
小结
习题
第2章数据分析的方法
2.1针对现状分析的数据分析方法
2.1.1对比分析法
2.1.2分组分析法
2.1.3结构分析法
2.1.4平均分析法
2.1.5综合评价分析法
2.2针对原因分析的数据分析方法
2.2.1交叉分析法
2.2.2漏斗分析法
2.2.3矩阵关联分析法
2.2.4聚类分析法
2.2.5帕累托分析法
2.3针对预测分析的数据分析方法
2.3.1回归分析法
2.3.2时间序列分析法
2.3.3决策树分析法
2.3.4神经网络分析法
小结
习题
第3章NumPy和pandas基础
3.1NumPy基础
3.1.1ndarray数组的创建
3.1.2ndarray的常用属性
3.1.3ndarray的数据类型
3.1.4ndarray的算术操作
3.1.5ndarray的索引和切片
3.1.6对轴的理解


3.2pandas基础
3.2.1pandas数据结构
3.2.2索引重命名与重新索引
3.2.3数据基本操作
小结
习题
第4章数据获取与导入
4.1数据获取
4.2网络爬虫
4.2.1网页结构
4.2.2爬虫的流程
4.2.3爬虫Robots协议
4.3数据导入与导出
4.3.1一般文件
4.3.2CSV文件
4.3.3Excel文件
4.3.4JSON文件
4.3.5数据库
小结
习题
第5章数据预处理
5.1数据预处理的必要性
5.2数据清洗
5.2.1重复值检测与处理
5.2.2缺失值检测与处理
5.2.3噪声检测与处理
5.3数据集成
5.3.1实体识别问题

5.3.2数据列冗余问题
5.3.3数据值冲突问题
5.4数据规约
5.4.1策略概述
5.4.2属性子集选择
5.4.3抽样
5.5数据变换
5.5.1数据合并
5.5.2数据抽取
5.5.3数据计算
小结
习题
第6章数据探索
6.1基本统计描述
6.1.1集中趋势
6.1.2离散程度
6.1.3分布形状
6.2数据分组与聚合分析
6.2.1数据分组
6.2.2数据聚合
6.3交叉分析
6.3.1数据透视表
6.3.2数据交叉表
6.4参数估计及假设检验
6.4.1参数估计
6.4.2假设检验
6.5相关分析
6.5.1简单相关分析
6.5.2偏相关分析
6.5.3非参数相关分析
小结
习题
第7章数据挖掘概述
7.1什么是数据挖掘
7.2数据挖掘问题与任务
7.3分类分析
7.3.1预备知识
7.3.2解决分类问题的一般方法
7.3.3代表性方法之一: K最近邻算法
7.3.4评估分类器性能的度量
7.4关联分析
7.4.1购物篮分析
7.4.2频繁项集和关联规则
7.4.3基于Python的Apriori算法
7.4.4关联模式的评估
7.5聚类分析
7.5.1什么是聚类分析
7.5.2基本的聚类方法
7.5.3代表性方法之一: k均值
7.5.4聚类评估
小结
习题
第8章基本统计图形
8.1Matplotlib绘图
8.1.1图形基本设置
8.1.2基本统计图形
8.2pandas绘图
8.3Seaborn绘图
8.3.1单变量数据分布
8.3.2双变量数据分布
8.3.3多变量数据分布
小结
习题
第9章文本、网络和地理空间可视化
9.1文本可视化
9.1.1分词
9.1.2词云
9.2网络图可视化
9.2.1网络与图
9.2.2NetworkX绘图
9.3地理空间可视化
9.3.1GeoPandas和Basemap
9.3.2分级统计地图
9.3.3点描法地图
9.3.4带气泡的地图
小结
习题
参考文献
內容試閱
大数据时代下,以信息技术为支撑的数据分析与研究方法正深刻地改变着传统科学探索的工作方式,成为人类科技发展与知识获取的一种新兴模式。为了使堆积如山的数据能更好地被人们利用,需要对数据进行有意义的处理。大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。因此,寻求有效的数据处理技术和方法已经成为现实的迫切需求。
本书的写作目的是使读者了解数据分析的基础理论,掌握运用Python进行科学计算、数据处理、分析和可视化的方法,具备处理和解决大量数据问题的能力。全书共分为9章,如表01所示。

表01全书知识体系

知 识 体 系章节
基础知识
第1章 数据分析简介
第2章 数据分析的方法
第3章 NumPy和pandas基础
数据分析技术
第4章 数据获取与导入
第5章 数据预处理
第6章 数据探索
第7章 数据挖掘概述
数据可视化
第8章 基本统计图形
第9章 文本、网络和地理空间可视化

1. 基础知识
第1章数据分析简介,介绍数据、数据分析等基本概念以及数据分析的作用、步骤和常用工具等;第2章介绍数据分析方法;第3章是Python中常用的NumPy和pandas数据分析包。
2. 数据分析技术
第4~7章以Python为基础介绍数据的主要分析技术。第4章主要介绍数据获取、网络爬虫以及不同种类文件的导入、导出方式;第5章介绍数据预处理的主要步骤和相关方法,包括数据清洗、数据集成、数据规约和数据变换等;第6章阐述数据探索的主要方法,包括基本描述性统计、分组与聚合分析、参数估计、假设检验和相关性分析等;第7章介绍数据挖掘的概念、问题与任务,以及从基础知识、代表性算法、评估分析等方面,重点介绍了数据挖掘常用的分析方法,包括分类分析、关联分析和聚类分析。
3. 数据可视化
第8章介绍了基于Python的三种常用绘图包,分别是Matplotlib、pandas和Seaborn,可绘制的图形类型包括线图、直方图、条形图、龙卷风图、饼图、散点图、气泡图、箱线图、雷达图和数据分布图等。第9章概要介绍了网络图、文本数据、地理数据等非数值型数据的可视化方法。
书中每章的最后都给出了配套的习题,便于教师教学和测试,学生巩固知识点并启发全面思考。
与现有以介绍Python编程语法、数据挖掘与机器学习理论的书籍不同,本书是数据分析类课程的入门教材,系统整理了数据分析的知识体系,以分析流程为主线阐述了数据分析的主要方法和基于Python的技术应用。从第2章开始,在阐述基础知识的同时设计了大量例题,按照“分析需求→Python代码展示→例题解析→运行结果”的思路对知识点进行剖析。设计的例题有助于教师授课和学生自学理解。采用较受欢迎的编程语言Python作为分析工具,代码简洁、易读性好,且易上手。全书提供习题、答案及源码。建议至少进行32学时的授课和学习。
本书可作为普通高等院校数据分析处理相关课程的学生的教材使用,也可供刚刚步入数据分析领域的从业人员参考。
本书由潘晓、吴雷、王书海编著,第1~3章、第7~9章由潘晓编写,第4~6由吴雷编写,全书由潘晓负责统稿定稿。本书在撰写过程中参考了如维基百科、知乎、CSDN等互联网上优秀的资料。此外,特别感谢实验室的博士生和硕士生们进行的资料收集与整理,其中包括董慧、姜梦、鹿东娜和杜一凡,感谢石家庄铁道大学信息管理与信息系统专业的2018级和2019级学生作为第一批读者完成的勘误工作。感谢河北省自然科学基金项目(F2021210005)、河北省重点研发项目(21340301D)、河北省省级科技计划资助项目(21550803D)、河北省教育厅青年拔尖项目(BJ2021085)项目的支持。
感谢清华大学出版社在全书的校对和编辑出版过程中付出的巨大努力。由于作者水平有限,书中如有疏漏之处敬请读者提出宝贵意见。
潘晓2022年12月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.