登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』Python预测分析与机器学习

書城自編碼: 3754782
分類:簡體書→大陸圖書→計算機/網絡程序設計
作者: 王沁晨
國際書號(ISBN): 9787302592549
出版社: 清华大学出版社
出版日期: 2022-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 111.3

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
人性的博弈:为什么做个好人这么难
《 人性的博弈:为什么做个好人这么难 》

售價:HK$ 81.6
不完美的自我:接纳与放手,让自己活得更有韧性
《 不完美的自我:接纳与放手,让自己活得更有韧性 》

售價:HK$ 70.8
苏菲的世界(漫画版):寻找自我的旅程
《 苏菲的世界(漫画版):寻找自我的旅程 》

售價:HK$ 94.8
让改变发生:学校改进视角下的办学思考与实践叙事
《 让改变发生:学校改进视角下的办学思考与实践叙事 》

售價:HK$ 55.2
麦肯锡原则:成就全球顶级公司的11条经验    (美) 达夫·麦克唐纳
《 麦肯锡原则:成就全球顶级公司的11条经验 (美) 达夫·麦克唐纳 》

售價:HK$ 106.8
今日宜偏爱(全二册)
《 今日宜偏爱(全二册) 》

售價:HK$ 95.8
氢经济
《 氢经济 》

售價:HK$ 117.6
从中国出发的全球史
《 从中国出发的全球史 》

售價:HK$ 477.6

 

建議一齊購買:

+

HK$ 107.3
《 了不起的Markdown 》
+

HK$ 491.7
《 Java核心技术第11版基础知识+高级特性套装 套装共2册 》
+

HK$ 70.7
《 玩转C语言程序设计(全彩版) 》
+

HK$ 97.5
《 PHP+MySQL动态网站开发(全案例微课版) 》
+

HK$ 115.2
《 JavaScript设计模式与开发实践 》
+

HK$ 86.7
《 Java项目开发实战入门(全彩版) 》
編輯推薦:
本书的着重点在于机器学习与预测分析的实战思路,其中加入算法或模型的理论知识介绍,让读者在学习如何进行运用的同时,更加深入的学习到为何在该实践场景下使用特定算法或模型。书中侧重讲解实操中常用、回报率高的算法。内容明了易懂,图文搭配,借鉴实际例子让学习过程更具实用感。
內容簡介:
本书从理解问题定义、了解数据内的高层信息、数据清理、视化数据,到基础建模、模型优化,分享一个数据分析师的视角与思路。在预测分析的流程中,一步步用详细的图文代码讲解使用到的库,如何正确使用各个库中的方法和函数,以及在遇到类似的问题时如何套用学过的知识。 本书共8章。第1章对预测分析的流程进行一个高层次的概述。第2章介绍本书需要安装使用的库,并讲解数据清理步骤的执行。第3章讲解基础建模需考虑的细节,结合第4章的模型选择,可以搭建一个基础的预测管道。第5章和第6章分别从模型和数据的角度讲解如何优化预测表现。第7章讲解时间序列这一特殊数据的预测方法。后,第8章总结全书学习到的内容,解决一个实战问题。 本书面向3类读者。第1类,有编程基础但毫无数据科学背景,有意入门的读者;第2类,有数据科学理论基础,有意进入实操的读者,如刚毕业没有业界经验的学生;第3类,有数据科学理论基础与实操经验,但日常工作集中在数据分析管道中的数据分析师。
關於作者:
王沁晨,多伦多大学圣乔治校区计算机专业,曾在加拿大零售企业Loblaw Companies担任机器学习数据分析师,从公司传统的大型数据库中筛选有效信息、清理数据、人工数据挖掘、视化,到基础建模、模型优化、数据再筛选,再到结合商业需求创造扩展性强的实用管线,让项目从理论性的头脑风暴变现为商业价值。
目錄
第1章预测分析与机器学习的实用价值
1.1人工智能、机器学习与数据分析的关系
1.2什么是预测分析
1.3预测分析在各行业中的应用
1.4预测分析流程概览
1.5小结
第2章数据清理
2.1建立编程环境
2.1.1Anaconda简介及安装
2.1.2Jupyter Notebook 简介及安装
2.1.3Pandas简介及安装
2.1.4scikitlearn 简介及安装
2.1.5XGBoost、LightGBM、CatBoost简介及安装
2.1.6TensorFlow简介及安装
2.2面对异构数据如何下手
2.2.1什么是异构数据
2.2.2如何处理异构数据
2.3数据误差
2.3.1各类数据误差及其影响
2.3.2如何处理数据误差
2.4数据重新格式化
第3章基础建模
3.1判断何为X和y
3.1.1X和y的定义
3.1.2X和y的选择对预测的影响
3.2训练集、验证集与测试集
3.2.1三者的定义及关系
3.2.2如何使用sklearn分离3个集
3.2.3如何使用Pandas手动分离3个集
3.3数据泄露
3.3.1不同类型的数据泄露
3.3.2发现并避免目标泄露
3.3.3避免训练集与测试集的相互污染
3.4偏差与方差
3.4.1定义偏差与方差
3.4.2过拟合与欠拟合
3.4.3实践中的过拟合与欠拟合
3.5小结


第4章模型选择
4.1朴素贝叶斯分类器
4.2关联规则算法
4.3K近邻算法
4.4K均值聚类算法
4.5回归算法
4.5.1线性回归
4.5.2罗吉斯蒂回归
4.6深度神经网络
4.7决策树
4.8森林算法
4.8.1随机森林
4.8.2随机树
4.8.3孤立森林
4.9提升方法
4.9.1Adaboost
4.9.2XGBoost和LightGBM
4.9.3CatBoost
第5章模型优化
5.1损失函数和衡量指标
5.1.1分类问题的衡量指标
5.1.2回归问题的衡量指标
5.1.3损失函数
5.2K折交叉验证
5.3超参数调试
5.3.1网格搜索法
5.3.2随机搜索法
5.3.3遗传算法
5.4函数正则化
第6章数据优化
6.1数据规范化
6.2异常值清理
6.3平滑法
6.4聚类
6.5特征工程
第7章时间序列
7.1时间序列简介
7.2时间序列数据探索
7.2.1加法模型下的可视化图
7.2.2乘法模型下的部分可视化图
7.3时间序列特征提取
7.3.1时间特征
7.3.2滞后特征
7.3.3基于移动窗口的特征
7.3.4基于展开窗口的特征
7.4时间序列模型
7.4.1自回归模型
7.4.2滑动平均模型
7.4.3整合移动平均自回归模型
7.4.4季节性整合移动平均自回归模型
第8章实战
8.1M5预测分析比赛介绍
8.1.1数据介绍
8.1.2评估标准
8.2数据清理
8.3基础建模
8.4优化
內容試閱
笔者在Loblaw Companies任职全栈数据分析师期间,深刻体会到了有时许多校内学习到的理论知识并非即刻适用。这样的传统零售业在走向数据驱动模式时,往往不需要使用庞大的深度学习模型,或其他消耗巨大算力的算法。一些可解释性高,所需数据量较小的模型足以贡献十分可观的商业价值。相比起走学术路径中理论基础的重要性,在行业实操中更重要的是掌握数据分析的全过程,以及拥有足够的经验让步骤间有节奏地配合,因此笔者决定写这本书,将预测分析中重点的步骤和其间配合以可着手的方式展现给读者。
本书的着重点在于预测分析与机器学习的实战思路,其中加入算法或模型的理论知识介绍,让读者在学习如何运用的同时,更加深入地学习为何在该实践场景下使用该特定算法或模型。书中侧重讲解实操中常用、回报率高的算法。内容简单易懂,图文搭配,借鉴实际例子让学习过程更具实用感。
本书致力于帮助3类读者在预测分析与机器学习这条路上有所成长。第1类,有Python编程基础但缺乏数据科学背景,有意入门的读者。书中不设置有关数据科学背景的阅读门槛,每个相关背景都将先介绍再进行引用。另外,因本书偏向实操而非理论,内容对于这一类读者将更加容易消化,书中的代码注释丰富,容易着手跟随。第2类,有数据科学理论基础知识,有意进入实操的读者,例如缺乏业界经验的学生。这类读者已经掌握了许多理论背景知识,只是缺少实践经历。本书有效地展示理论算法如何在实操中运行,以及各理论知识运用的搭配。第3类,有数据科学理论基础与实操经验,但日常工作集中在数据分析管道中的数据分析师。本书可以帮助这类读者了解在工作中如何与同事配合。在项目经理职位的读者也可以通过阅读本书更好地理解队内成员的工作、难点,以及定位项目突破口。
本书还包含部分理论知识,希望通过介绍算法的运作原理,帮助读者建立面对问题选择解决方案的思路。浏览目录便会发现,第4章不到100页的内容包含了大量机器学习模型及算法,每种算法的介绍从其运作原理讲起,到将其运用在一个实际例子中。笔者尽量平衡了理论深度与实践思路的讲解,希望可以在有限的篇幅中帮助本书面对的群体。
机器学习这一领域有着长达数十年的理论研究,其内容包罗万象。笔者学识有限,书中难免存在疏漏,望得到各位读者的指正。
王沁晨
2022年2月
本书源代码

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.