登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』干净的数据 数据清洗入门与实践

書城自編碼: 2801618
分類:簡體書→大陸圖書→計算機/網絡數據庫
作者: [美] 斯夸尔[Megan Squire]
國際書號(ISBN): 9787115420473
出版社: 人民邮电出版社
出版日期: 2016-05-01
版次: 1 印次: 1
頁數/字數: 188/296千字
書度/開本: 16开 釘裝: 平装

售價:HK$ 73.5

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
山河不足重,重在遇知己
《 山河不足重,重在遇知己 》

售價:HK$ 54.0
独自走过悲喜
《 独自走过悲喜 》

售價:HK$ 81.6
永不停步:玛格丽特·阿特伍德传
《 永不停步:玛格丽特·阿特伍德传 》

售價:HK$ 94.8
假努力:方向不对,一切白费
《 假努力:方向不对,一切白费 》

售價:HK$ 71.8
北京三万里
《 北京三万里 》

售價:HK$ 93.6
争吵的恋人:我们为什么相爱,又为什么争吵
《 争吵的恋人:我们为什么相爱,又为什么争吵 》

售價:HK$ 70.8
秘史:英国情报机构的崛起
《 秘史:英国情报机构的崛起 》

售價:HK$ 81.6
李鸿章及其时代:中西方世界的历史撞击
《 李鸿章及其时代:中西方世界的历史撞击 》

售價:HK$ 70.8

 

建議一齊購買:

+

HK$ 72.2
《 大数据侦查 》
+

HK$ 118.5
《 Oracle性能优化与诊断案例精选 》
+

HK$ 67.5
《 用Python写网络爬虫 》
+

HK$ 73.5
《 淘宝天猫网店运营秘笈:如何用SEO和数据化精准营销打造爆款 》
+

HK$ 171.1
《 Python网络数据采集 》
+

HK$ 148.5
《 基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 》
編輯推薦:
理解数据清洗在整个数据科学过程中的作用
掌握数据清洗的基础知识,包括文件清洗、数据类型、字符编码等
发掘电子表格和文本编辑器中与数据组织和操作相关的重要功能
学会常见数据格式的相互转换,如JSON、CSV和一些特殊用途的格式
采用三种策略来解析和清洗HTML文件中的数据
揭开PDF文档的秘密,提取需要的数据
借助一系列解决方案来清洗存放在关系型数据库里的坏数据
创建自己的干净数据集,为其打包、添加授权许可并与他人共享
使用书中的工具以及Twitter和Stack Overflow数据,完成两个真实的项目
內容簡介:
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML 文件的三种策略,提取和清洗PDF 文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter 和Stack Overflow 的数据。
關於作者:
Megan Squire 依隆大学计算科学专业教授,主要教授数据库系统、Web开发、数据挖掘和数据科学课程。有二十年的数据收集与清洗经验。她还是FLOSSmole研究项目的领导者,致力于收集与分析数据,以便研究免费软件、自由软件和开源软件的开发。
目錄
目录
第1 章 为什么需要清洗数据 1
1.1 新视角 1
1.2 数据科学过程 2
1.3 传达数据清洗工作的内容 3
1.4 数据清洗环境 4
1.5 入门示例 5
1.6 小结 9
第2 章 基础知识——格式、 类型与编码 11
2.1 文件格式 11
2.1.1 文本文件与二进制文件 11
2.1.2 常见的文本文件格式 14
2.1.3 分隔格式 14
2.2 归档与压缩 20
2.2.1 归档文件 20
2.2.2 压缩文件 21
2.3 数据类型、空值与编码 24
2.3.1 数据类型 25
2.3.2 数据类型间的相互转换 29
2.3.3 转换策略 30
2.3.4 隐藏在数据森林中的空值 37
2.3.5 字符编码 41
2.4 小结 46
第3 章 数据清洗的老黄牛——电子表格和文本编辑器 47
3.1 电子表格中的数据清洗 47
3.1.1 Excel 的文本分列功能 47
3.1.2 字符串拆分 51
3.1.3 字符串拼接 51
3.2 文本编辑器里的数据清洗 54
3.2.1 文本调整 55
3.2.2 列选模式 56
3.2.3 加强版的查找与替换功能 56
3.2.4 文本排序与去重处理 58
3.2.5 Process Lines Containing 60
3.3 示例项目 60
3.3.1 第一步:问题陈述 60
3.3.2 第二步:数据收集 60
3.3.3 第三步:数据清洗 61
3.3.4 第四步:数据分析 63
3.4 小结 63
第4 章 讲通用语言——数据转换 64
4.1 基于工具的快速转换 64
4.1.1 从电子表格到CSV 65
4.1.2 从电子表格到JSON 65
4.1.3 使用phpMyAdmin 从SQL语句中生成CSV 或JSON 67
4.2 使用PHP 实现数据转换 69
4.2.1 使用PHP 实现SQL 到JSON的数据转换 69
4.2.2 使用PHP 实现SQL 到CSV的数据转换 70
4.2.3 使用PHP 实现JSON 到CSV的数据转换 71
4.2.4 使用PHP 实现CSV 到JSON的数据转换 71
4.3 使用Python 实现数据转换 72
4.3.1 使用

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.