新書推薦:

《
病菌、观念与社会:病菌如何影响现代生活
》
售價:HK$
85.8

《
经过检视的人生 从苏格拉底到尼采
》
售價:HK$
66.0

《
阿尔喀比亚德斯 I(柏拉图全集)
》
售價:HK$
107.8

《
百家争鸣与中华文明的哲学突破
》
售價:HK$
115.5

《
孟子学术流传与秦汉价值重构
》
售價:HK$
110.0

《
中国早期城市与文明起源 一部中国早期城市发展简史,解读城市与文明交织共生的规律
》
售價:HK$
96.8

《
只要我还在创作 角谷美智子访谈录
》
售價:HK$
74.8

《
国医大师邓铁涛 治未病从孩子抓起 中医治未病 二十四节气顺时调养 常见病预防 中医健康体检 广东科技
》
售價:HK$
54.9
|
| 編輯推薦: |
|
《Python数据分析》从入门到进阶的Python数据分析全攻略!深挖Pandas、NumPy、Seaborn三大核心库的进阶用法,详解数据清洗、特征工程、可视化优化的底层逻辑。
|
| 內容簡介: |
|
全书共分为9章,主要内容包括数据分析的基础概念、操作环境以及数据预处理的基本知识和技能,数据分析中最重要的手段与方法,如描述性分析、可视化分析、分类分析、回归分析以及预测模型,几种评价方法以及过拟合与欠拟合问题,如精准度与召回率、ROC曲线与AUC值、F1分数与MSE/RMSE等,数据分析方法在各领域中的典型应用案例,为读者提供思路和参考,帮助读者更好地理解和应用数据分析方法。
|
| 目錄:
|
目录
第1章Python数据分析概述00
1.1数据分析概述00
1.1.1什么是数据分析00
1.1.2数据分析的流程00
1.1.3数据分析的应用场景00
1.2数据分析方法00
1.3数据分析工具00
1.3.1数据分析常用工具00
1.3.2Python数据分析的优势00
1.4搭建Python开发环境00
1.4.1Python简介00
1.4.2Python数据处理常用库介绍00
1.4.3搭建IDLE开发环境0
1.4.4Anaconda环境0
课程思政0
习题0
第2章数据获取0
2.1数据及其类型0
2.2数据获取渠道0
2.3网络数据采集工具——八爪鱼采集器0
2.3.1八爪鱼采集器概述0
2.3.2八爪鱼数据采集的过程0
2.4Python网络爬虫数据采集0
2.4.1网络爬虫概述0
2.4.2Python网络爬虫库0
2.4.3Requests库0
2.4.4网页解析0
2.5从文件中读取数据0
2.5.1从数据库中读取数据0
2.5.2从文本文件中读取数据0
2.5.3从Excel文件中读取数据0
2.6数据访问权限与合规性0
2.6.1数据访问权限0
2.6.2数据合规性0
课程思政0
习题0
第3章数据预处理0
3.1数据预处理的目的0
3.2数据清洗0
3.2.1缺失值处理0
3.2.2异常值处理0
3.2.3重复数据处理0
3.3数据变换0
3.3.1数据替换0
3.3.2虚拟变量处理0
3.3.3数据离散化0
3.4数据集成0
3.5数据规范化0
3.6数据降维0
3.6.1数据归约0
3.6.2主成分分析0
3.6.3线性判别分析0
3.6.4t-SNE0
3.7时间序列处理0
3.7.1日期数据0
3.7.2时期数据0
课程思政0
习题0
第4章描述性分析0
4.1单特征描述性分析0
4.1.1频数分析0
4.1.2统计分析0
4.1.3可视化分析0
4.1.4数据分布分析0
4.1.5数据分组与聚合0
4.2双特征描述性分析0
4.2.1协方差0
4.2.2相关系数0
4.2.3可视化分析0
4.3比较分析0
4.3.1对比分析0
4.3.2同比、定比和环比分析0
4.3.3贡献度分析0
4.3.4差异化分析0
4.4时间序列分析
课程思政
习题
第5章可视化分析
5.1为什么要进行数据可视化
5.2绘图基础
5.3Matplotlib可视化
5.3.1常用设置
5.3.2常用图形的绘制
5.3.3复杂图形的绘制
5.4Seaborn可视化
5.4.1基本设置
5.4.2单一特征可视化
5.4.3多特征可视化
5.5可视化分析综合案例
课程思政
习题
第6章分类分析
6.1分类概述
6.1.1分类的基本概念
6.1.2分类的基本步骤
6.1.3常用分类方法简介
6.2决策树分类
6.2.1决策树概述
6.2.2决策树特征选择
6.2.3剪枝方法
6.2.4决策树实现过程
6.3k-近邻分类
6.3.1k-近邻算法原理与流程
6.3.2k值的选择
6.3.3KNN常用的距离度量
6.3.4k-近邻实现过程
6.4贝叶斯分类
6.4.1概率基础
6.4.2贝叶斯分类原理
6.4.3朴素贝叶斯分类
6.5支持向量机
6.5.1支持向量机算法原理
6.5.2线性支持向量机
6.5.3核函数选择
6.5.4Python实现支持向量机
课程思政
习题
第7章回归分析
7.1回归分析概述
7.1.1回归分析的含义
7.1.2常用回归方法
7.2线性回归分析
7.2.1线性回归模型与基本假设
7.2.2模型估计与检验
7.2.3共线性分析
7.2.4回归预测和模型诊断
7.2.5Python实现线性回归
7.2.6岭回归分析
7.2.7套索回归分析
7.3逻辑回归分析
7.3.1逻辑回归模型原理与假设
7.3.2Logistic回归模型的估计与检验
7.3.3Python实现逻辑回归
7.4支持向量机回归分析
7.4.1支持向量机概述
7.4.2回归型支持向量机
7.4.3Python实现SVR模型
7.5KNN回归分析
7.5.1KNN回归算法原理
7.5.2距离度量与k值选择方法
7.5.3Python实现KNN回归
7.6过拟合与欠拟合问题
7.6.1过拟合
7.6.2欠拟合
7.6.3过拟合和欠拟合示例
7.7模型提升
7.7.1使用交叉验证评估模型的泛化能力
7.7.2使用网格搜索确定模型最佳参数
课程思政
习题
第8章聚类分析
8.1聚类分析概述
8.2聚类分析的算法
8.3k-means聚类分析
8.3.1k-means算法
8.3.2聚类模型的评估
8.3.3Python实现k-means算法
8.4AGNES聚类分析
8.4.1AGNES聚类方法
8.4.2Python实现AGNES
8.5DBSCAN聚类分析
8.5.1DBSCAN概述
8.5.2Python实现DBSCAN算法
8.6高斯混合模型
8.6.1高斯混合模型概述
8.6.2Python实现GMM聚类
课程思政
习题
第9章数据分析综合分析案例
9.1二手房房价分析与预测
9.1.1工作准备
9.1.2数据可视化
9.1.3二手房价格预测与评价
9.2文本分析
9.2.1文本分析概述
9.2.2jieba库
9.2.3文本可视化
9.2.4文本分类
9.3糖尿病预测
9.3.1加载数据
9.3.2相关性分析
9.3.3降维
9.3.4回归分析
课程思政
习题
参考文献
|
| 內容試閱:
|
前言
中共中央总书记习近平强调,要构建以数据为关键要素的数字经济,推动实体经济和数字经济融合发展。数据分析技术将帮助企业在合理时间内获取、整理以及管理海量数据,为企业经营决策提供积极帮助,提高企业的竞争力。本书通过系统性地介绍数据采集、描述性分析和可视化分析、分类、回归、聚类等数据分析方法,帮助读者掌握数据分析的基本知识和技能,成为具备数据分析和应用能力的人才,更好地适应市场需求,提升自身的竞争力,以满足社会对于数据分析人才的需求。
本书编写内容由浅入深,图表结合,逻辑关系清晰,内容具体明确,重点突出,具有科学性,使读者能够轻松掌握数据分析相关知识。本书包含大量的案例和实践内容,以及相应的练习题,使读者能够在实践中学习和掌握数据分析的技能,并能够将所学知识应用到实际场景中。通过练习题,读者可以进一步巩固所学知识,提高实际操作能力,培养独立思考和解决问题的能力。价值引领,润物细无声,本书在编写过程中,始终注重思政的融入,无论是案例的选取还是内容的阐述,都融入爱国主义、中华民族认同、社会主义核心价值观,达到潜移默化的教育效果。
本书由辽宁师范大学刘宏主编,负责全书内容的组织与编写。辽宁师范大学的顾吉林和电子科技大学的刘群英参与了部分章节的编写工作。在本书编写过程中,北京交通大学出版社的编辑郭东青女士给予了很大的支持,我们也参考了国内外相关教材、文献资料和一些网络资料,吸收了前人的研究成果,在此谨向相关作者表示衷心的感谢!
由于编者水平有限,书中难免存在纰漏或错误之处,欢迎专家和读者不吝赐教,批评指正。
编者
2025年11月
|
|