登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』SQL数据分析实战(第2版)

書城自編碼: 3821485
分類:簡體書→大陸圖書→計算機/網絡程序設計
作者: [美]马特·古德瓦瑟 等著 李庆良 译
國際書號(ISBN): 9787302621768
出版社: 清华大学出版社
出版日期: 2022-12-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 148.8

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
变革时代的公司契约:法律能否与时俱进?
《 变革时代的公司契约:法律能否与时俱进? 》

售價:HK$ 93.6
我国城乡融合发展基本格局及典型形态研究
《 我国城乡融合发展基本格局及典型形态研究 》

售價:HK$ 82.8
写意兰竹树石课徒稿
《 写意兰竹树石课徒稿 》

售價:HK$ 110.4
不较真的心理智慧
《 不较真的心理智慧 》

售價:HK$ 59.8
漫画算法与数据结构(大规模数据集)
《 漫画算法与数据结构(大规模数据集) 》

售價:HK$ 95.8
欧洲的扩张1415—1789:现代世界的奠基
《 欧洲的扩张1415—1789:现代世界的奠基 》

售價:HK$ 177.6
引导的秘诀:通过团队合作获得结果的SMART指南(最新修订版)(白金版)
《 引导的秘诀:通过团队合作获得结果的SMART指南(最新修订版)(白金版) 》

售價:HK$ 118.8
文史星历:秦汉史丛稿
《 文史星历:秦汉史丛稿 》

售價:HK$ 141.6

 

建議一齊購買:

+

HK$ 82.8
《 Scratch+数学与算法进阶 》
+

HK$ 267.3
《 Scratch+小学数学(共5册) 》
+

HK$ 160.0
《 Scratch实战技巧精粹:300秘技大全 》
+

HK$ 112.3
《 R语言编程:基于tidyverse 》
+

HK$ 148.8
《 对比VBA学Python:高效实现数据处理自动化 》
編輯推薦:
《SQL数据分析实战(第2版)》由一个专业数据科学家团队撰写,该团队曾经利用自己的数据分析技能为各种形式和规模的企业提供服务,因此拥有非常丰富的实践经验。本书是读者开始学习数据分析的入门宝典,它向读者展示了如何有效地筛选和处理来自原始数据的信息。即使你是一个没有任何经验的新人,也可以从本书的学习中获益良多。
內容簡介:
《SQL数据分析实战(第2版)》详细阐述了与SQL数据分析相关的基本解决方案,主要包括SQL数据分析导论、SQL和数据准备、聚合和窗口函数、导入和导出数据、使用复合数据类型进行分析、高性能SQL、科学方法和应用问题求解等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
目錄
第1章 SQL数据分析导论 1
  1.1 本章主题简介 1
  1.2 数据世界 2
  1.2.1 数据类型 2
  1.2.2 数据分析和统计 3
  1.2.3 统计类型 3
  1.2.4 作业1.01:分类新数据集 4
  1.3 描述性统计方法 5
  1.3.1 单变量分析 5
  1.3.2 数据频率分布 6
  1.3.3 练习1.01:创建直方图 6
  1.3.4 分位数 11
  1.3.5 练习1.02:计算附加销售额的四分位数 12
  1.3.6 集中趋势的度量 15
  1.3.7 练习1.03:计算附加销售额的集中趋势 16
  1.3.8 数据散布的度量 17
  1.3.9 练习1.04:附加销售额的散布程度 19
  1.3.10 双变量分析 20
  1.3.11 散点图 20
  1.3.12 皮尔逊相关系数 24
  1.3.13 练习1.05:计算两个变量的Pearson相关系数 25
  1.3.14 解释和分析相关系数 28
  1.3.15 时间序列数据 30
  1.3.16 作业1.02:探索经销商销售数据 31
  1.3.17 处理缺失数据 32
  1.4 统计显著性检验 32
  1.4.1 统计显著性检验的组成 32
  1.4.2 常见的统计显著性检验 34
  1.5 关系数据库和SQL 34
  1.5.1 关系数据库的基础概念 34
  1.5.2 SQL数据库的优缺点 35
  1.6 SQL的基本数据类型 36
  1.6.1 数值 36
  1.6.2 字符 37
  1.6.3 布尔值 37
  1.6.4 日期时间值 38
  1.6.5 数据结构:JSON和数组 38
  1.7 读取表:SELECT查询 38
  1.7.1 SELECT查询的工作原理 39
  1.7.2 SELECT查询中的基本关键字 40
  1.7.3 SELECT和FROM语句 40
  1.7.4 WHERE 子句 41
  1.7.5 AND/OR子句 41
  1.7.6 IN/NOT IN子句 42
  1.7.7 ORDER BY子句 43
  1.7.8 LIMIT子句 45
  1.7.9 IS NULL/IS NOT NULL子句 46
  1.7.10 练习1.06:在SELECT查询中使用基本关键字 47
  1.7.11 作业1.03:在SELECT查询中使用基本关键字查询客户表 49
  1.8 创建表 49
  1.8.1 创建空白表 49
  1.8.2 列约束 50
  1.8.3 练习1.07:在SQL中创建表 50
  1.8.4 使用SELECT创建表 51
  1.9 更新表 52
  1.9.1 添加和删除列 52
  1.9.2 添加新数据 53
  1.9.3 更新现有行 55
  1.9.4 练习1.08:更新表格以提高车辆的价格 56
  1.10 删除数据和表 57
  1.10.1 从行中删除值 57
  1.10.2 从表中删除行 58
  1.10.3 删除表 59
  1.10.4 练习1.09:删除不必要的表 59
  1.10.5 作业1.04:为营销活动创建和修改表 60
  1.11 SQL和分析 61
  1.12 小结 61
第2章 SQL和数据准备 63
  2.1 本章主题简介 63
  2.2 组合数据 63
  2.2.1 使用JOIN连接表 64
  2.2.2 连接类型 66
  2.2.3 内连接 67
  2.2.4 外连接 70
  2.2.5 交叉连接 75
  2.2.6 练习2.01:使用JOIN进行分析 76
  2.2.7 子查询 77
  2.2.8 UNION 78
  2.2.9 练习2.02:使用UNION生成来宾名单 80
  2.2.10 公用表表达式 82
  2.3 转换数据 83
  2.3.1 CASE WHEN函数 84
  2.3.2 练习2.03:使用CASE WHEN函数获取区域列表 85
  2.3.3 COALESCE函数 86
  2.3.4 NULLIF函数 87
  2.3.5 LEAST和GREATEST函数 89
  2.3.6 转换函数 90
  2.3.7 DISTINCT和DISTINCT ON函数 91
  2.3.8 作业2.01:使用SQL技术构建销售模型 93
  2.4 小结 94
第3章 聚合和窗口函数 95
  3.1 本章主题简介 95
  3.2 聚合函数 95
  3.2.1 常见聚合函数简介 96
  3.2.2 练习3.01:使用聚合函数分析数据 98
  3.3 使用GROUP BY聚合函数 99
  3.3.1 GROUP BY子句 100
  3.3.2 多列GROUP BY 104
  3.3.3 练习3.02:使用GROUP BY按产品类型计算成本 105
  3.3.4 分组集 106
  3.3.5 有序集合聚合 107
  3.4 HAVING子句 109
  3.4.1 HAVING子句的语法 109
  3.4.2 练习3.03:使用HAVING子句计算并显示数据 110
  3.5 使用聚合函数清洗数据和检查数据质量 111
  3.5.1 使用GROUP BY查找缺失值 111
  3.5.2 使用聚合函数衡量数据质量 113
  3.5.3 作业3.01:使用聚合函数分析销售数据 114
  3.6 窗口函数 115
  3.6.1 窗口函数基础知识 116
  3.6.2 练习3.04:分析一段时间内的客户数据填充率 121
  3.6.3 WINDOW关键字 123
  3.7 窗口函数统计 124
  3.7.1 练习3.05:雇佣日期的排名顺序 125
  3.7.2 窗口frame子句 126
  3.7.3 练习3.06:团队午餐激励 129
  3.7.4 作业3.02:使用窗口帧和窗口函数分析销售数据 130
  3.8 小结 131
第4章 导入和导出数据 133
  4.1 本章主题简介 133
  4.2 COPY命令 134
  4.2.1 使用psql复制数据 135
  4.2.2 配置COPY和 \\copy 137
  4.2.3 使用COPY和\\copy将数据批量上传到数据库 138
  4.2.4 练习4.01:将数据导出到文件以在Excel中进一步处理 139
  4.3 使用R分析数据 143
  4.3.1 使用R的原因 143
  4.3.2 开始使用R 143
  4.4 使用Python分析数据 146
  4.4.1 使用Python的原因 146
  4.4.2 开始使用Python 146
  4.4.3 使用SQLAlchemy和Pandas改进Python中的Postgres访问 149
  4.4.4 关于SQLAlchemy 150
  4.4.5 结合使用Python和Jupyter Notebook 151
  4.4.6 使用Pandas读写数据库 153
  4.4.7 练习4.02:在Python中读取和可视化数据 154
  4.4.8 使用Python将数据写入数据库 156
  4.4.9 使用COPY提高Python写入速度 157
  4.4.10 用Python读写CSV文件 158
  4.5 导入和导出数据的最佳实践 160
  4.5.1 跳过密码 160
  4.5.2 作业4.01:使用外部数据集发现销售趋势 161
  4.6 小结 162
第5章 使用复合数据类型进行分析 163
  5.1 本章主题简介 163
  5.2 用于分析的日期和时间数据类型 164
  5.2.1 关于DATE类型 164
  5.2.2 转换日期类型 167
  5.2.3 关于INTERVAL类型 169
  5.2.4 练习5.01:时间序列数据分析 170
  5.3 在PostgreSQL中执行地理空间分析 172
  5.3.1 纬度和经度 172
  5.3.2 在PostgreSQL中表示纬度和经度 172
  5.3.3 练习5.02:地理空间分析 174
  5.4 在PostgreSQL中使用数组数据类型 176
  5.4.1 关于ARRAY类型 176
  5.4.2 练习5.03:使用数组分析序列 179
  5.5 在PostgreSQL中使用JSON数据类型 181
  5.5.1 JSONB:预解析的JSON 183
  5.5.2 从JSON或JSONB字段访问数据 184
  5.5.3 使用JSON路径语言 186
  5.5.4 在JSONB字段中创建和修改数据 188
  5.5.5 练习5.04:通过JSONB搜索 189
  5.6 使用PostgreSQL的文本分析 191
  5.6.1 标记文本 191
  5.6.2 练习5.05:执行文本分析 193
  5.6.3 执行文本搜索 196
  5.6.4 优化PostgreSQL上的文本搜索 198
  5.6.5 作业5.01:销售搜索和分析 200
  5.7 小结 202
第6章 高性能SQL 203
  6.1 本章主题简介 203
  6.2 数据库扫描方法 204
  6.2.1 查询计划 205
  6.2.2 顺序扫描 205
  6.2.3 练习6.01:解释查询计划器 206
  6.2.4 作业6.01:查询计划 210
  6.2.5 索引扫描 211
  6.2.6 B树索引 212
  6.2.7 练习6.02:创建索引扫描 213
  6.2.8 作业6.02:实现索引扫描 218
  6.2.9 哈希索引 219
  6.2.10 练习6.03:生成若干个哈希索引来比较性能 220
  6.2.11 作业6.03:实现哈希索引 223
  6.2.12 有效的索引使用 224
  6.3 高性能JOIN 226
  6.3.1 练习6.04:使用INNER JOIN 227
  6.3.2 作业6.04:实现高性能连接 233
  6.4 函数和触发器 234
  6.4.1 函数定义 235
  6.4.2 练习6.05:创建没有参数的函数 236
  6.4.3 作业6.05:定义最大销售额函数 239
  6.4.4 练习6.06:创建带参数的函数 240
  6.4.5 关于\\df和\\sf命令 241
  6.4.6 作业6.06:创建带参数的函数 242
  6.4.7 触发器 243
  6.4.8 练习6.07:创建触发器来更新字段 245
  6.4.9 作业6.07:创建触发器以跟踪平均购买量 250
  6.4.10 终止查询 251
  6.4.11 练习6.08:取消长时间运行的查询 252
  6.4.12 作业6.08:终止长时间运行的查询 253
  6.5 小结 254
第7章 科学方法和应用问题求解 255
  7.1 本章主题简介 255
  7.2 案例分析 255
  7.2.1 科学方法 256
  7.2.2 练习7.01:使用SQL技术进行初步数据收集 256
  7.2.3 练习7.02:提取销售信息 259
  7.2.4 作业7.01:量化销量下降的情况 263
  7.2.5 练习7.03:启动时序分析 265
  7.2.6 作业7.02:分析销售价格假设的差异 272
  7.2.7 练习7.04:通过电子邮件打开率分析销量增长情况 274
  7.2.8 练习7.05:分析电子邮件营销活动的效果 282
  7.2.9 得出结论 286
  7.2.10 现场测试 286
  7.3 小结 287
附录 289
  
·XXX·
SQL数据分析实战(第2版)
  
·XXXI·
目 录
內容試閱
关于本书
  现代企业每天都在运营,并快速生成大量数据。隐藏在这些数据中的是关键模式和行为,它们可以帮助企业从根本上深入了解自己的客户。作为一名数据分析师,最令人兴奋的莫过于像淘金一样,从海量数据分析中获取有用的见解。
  本书由一个专业数据科学家团队撰写,该团队曾经利用自己的数据分析技能为各种形式和规模的企业提供服务,因此拥有非常丰富的实践经验。本书是读者开始学习数据分析的入门宝典,它向读者展示了如何有效地筛选和处理来自原始数据的信息。即使你是一个没有任何经验的新人,也可以从本书的学习中获益良多。
  本书首先向读者展示了如何形成假设并生成描述性统计数据,这些统计数据可以为读者现有的数据提供关键见解。跟随本书,读者将学习如何编写SQL查询来聚合、计算和组合来自当前数据集之外的SQL数据。读者还将了解如何使用不同的数据类型,如JSON。通过探索高级技术,如地理空间分析和文本分析,读者最终将能够更深入地了解自己的业务。最后,本书还能让读者了解如何使用分析和自动化等高级技术以更快、更有效地获取信息。
  通读完本书,读者将获得识别数据中的模式和提取见解所需的技能。读者将能够以专业数据分析师的眼光来查看和评估数据。
本书读者
  如果读者是一名正在寻求过渡到分析业务的数据库工程师,或者是具有SQL基础知识但不知道如何通过它来挖掘数据见解的人,那么本书正适合你。
内容介绍
  第1章“SQL数据分析导论”,介绍了有关数据分析和SQL的基础知识。读者将学习如何使用数学和图形技术,通过Excel分析数据。此外,读者还将了解到SQL在数据世界中的作用,以及如何使用基础SQL来操作关系数据库中的数据。
  第2章“SQL和数据准备”,详细展示了如何使用SQL技术清洗和准备数据以进行分析。首先读者将学习如何将多个表和查询组合成一个数据集,然后学习更高级的内容。
  第3章“聚合和窗口函数”,介绍了SQL的聚合函数和窗口函数,它们是汇总数据的强大技术。读者将能够应用这些函数来获得对数据的新见解并了解数据集的属性,如数据 质量。
  第4章“导入和导出数据”,为读者提供了利用其他软件工具(如Excel、R和Python)与数据库交互的必要技能。
  第5章“使用复合数据类型进行分析”,让读者深入了解SQL中可用的各种数据类型,并演示如何从日期时间数据、地理空间数据、数组、JSON和文本中提取见解。
  第6章“高性能SQL”,详细介绍了如何优化查询,使它们运行得更快。除如何分析查询性能之外,读者还将学习到如何使用其他SQL功能(如函数和触发器),以扩展其默认功能。
  第7章“科学方法和应用问题求解”,将强化读者已经获得的技能,以帮助读者解决除本书描述的问题外的其他实际问题。使用科学方法和批判性思维,读者将能够分析数据并将其转换为可操作的任务和信息。
本书约定
  本书中使用了许多文本约定。
  (1)有关代码块的设置如下:
 SELECT *
FROM products
WHERE production_end_date IS NULL;
  (2)要突出代码块时,相关内容将加粗显示:
(
SELECT
street_address, city, state, postal_code
FROM
customers
WHERE
street_address IS NOT NULL
)
UNION
(
SELECT
street_address, city, state, postal_code
FROM
dealerships
WHERE
street_address IS NOT NULL
)
ORDER BY
1;
  (3)术语或重要单词采用中英文对照形式,在括号内保留其英文原文。示例如下:
 异常值(outlier)也称为离群值,是与数据的其余值明显不同且很少出现的数据点。异常值通常可以使用图形技术(如散点图和箱形图)找出来,因为它与其余数据相距甚远,非常容易识别。
  (4)对于界面词汇或专有名词,将保留英文原文,在括号内添加其中文译名。示例如下:
接下来还需要在R中安装RPostgreSQL包。可以在RStudio中通过导航到Packages(包)选项卡并单击Install(安装)图标来执行此操作。
设置环境
  在进入本书的具体学习之前,需要先设置一下特定的软件和工具。请按下文介绍的详细步骤操作。
安装PostgreSQL 12
  要在Windows、Linux和MacOS上安装和设置PostgreSQL 12,请按下述步骤操作。
在Windows系统上下载和安装PostgreSQL
  在Windows上下载并安装PostgreSQL的具体操作如下。
  (1)打开Web浏览器,导航到以下网址:
  https://www.postgresql.org/download/
   从Package and Installers(包和安装程序)列表中选择Windows,如图P1所示。
图P1 PostgreSQL下载页面
  (2)单击Download the installer(下载安装程序),如图P2所示。
图P2 PostgreSQL Interactive安装程序下载
  (3)选择Version(版本)为12.x,因为这是本书使用的版本,如图P3所示。
图P3 PostgreSQL下载页面
  (4)大部分安装步骤只需要单击Next(下一步)按钮即可。期间你将被要求指定一个数据目录。建议指定一个可轻松记住的路径,如图P4所示。
图P4 PostgreSQL安装—Windows路径
  (5)为postgres超级用户指定密码,如图P5所示。
图P5 设置超级用户密码
  (6)不要更改默认指定的Port(端口)号,除非它与系统上已安装的应用程序冲突,如图P6所示。
图P6 PostgreSQL端口设置
  (7)单击Next(下一步)按钮继续执行其余步骤并等待安装完成。
  设置PATH变量
  要验证当前系统的PATH变量是否设置正确,请打开命令行,键入或粘贴以下命令,然后按Enter键执行:
psql -U postgres
  如果你收到如图P7所示的错误,则需要将PostgreSQL bin目录添加到PATH变量。
图P7 错误—未设置路径变量
  请按以下步骤操作以将PostgreSQL bin目录添加到PATH变量。
  (1)右击Windows桌面上的“此电脑”图标,在快捷菜单中选择“属性”,打开“控制面板\\系统和安全\\系统”窗口,然后单击左侧列表中的“高级系统设置”,如图P8所示。
图P8 Windows高级系统设置
  (2)在出现的“系统属性”对话框中,应该已经自动定位到“高级”选项卡,单击右下角的“环境变量”按钮,如图P9所示。
图P9 Windows系统属性
  (3)单击“系统变量”中的Path,然后单击“编辑”按钮,如图P10所示。
图P10 设置PATH变量
  (4)在出现的“编辑环境变量”对话框中,单击“新建”按钮,如图P11所示。
图P11 新建变量
  (5)单击“浏览”按钮,定位到PostgreSQL的安装路径(默认为C:\\Program Files\\ PostgreSQL\\12\\),别忘记在末尾添加bin文件夹,如图P12所示。
图P12 输入路径
  单击“确定”按钮并重新启动系统。
  (6)重启完成后,现在打开命令行,在其中键入或粘贴以下命令,按Enter键执行:
  
psql -U postgres
  
  输入你在前面“在Windows系统上下载和安装PostgreSQL”部分步骤(5)中设置的密码,然后按Enter键。此时你应该能够登录到PostgreSQL控制台,如图P13所示。
图P13 PostgreSQL Shell
  (7)输入“\\q”并按Enter键退出PostgreSQL Shell,如图P14所示。
图P14 退出PostgreSQL Shell
  在Linux上安装PostgreSQL
  以下步骤将帮助你在基于Ubuntu或Debian的Linux系统上安装PostgreSQL。
  (1)打开终端。在新行上键入或粘贴以下命令,然后按Enter键:
  
sudo apt-get install postgresql-12
  
  (2)安装后,PostgreSQL 将创建一个名为postgres的用户。你需要以该用户身份登录才能访问PostgreSQL Shell:
  
sudo su postgres
  
  此时你看到的Shell提示如图P15所示。
图P15 在Linux上访问 PostgreSQL Shell
  (3)键入以下命令将带你进入PostgreSQL Shell:
  
psql
  
  你可以键入“\\l”(这是一个反斜杠和一个小写字母l)来查看默认加载的所有数据库的列表,如图P16所示。
图P16 Linux上的数据库列表
?注意:
  在此我们仅介绍了如何在基于Ubuntu和Debian的系统上安装PostgreSQL。有关在其他发行版上安装的说明,请参阅发行版的说明文档。
  Linux的PostgreSQL下载页面如下:
  
  https://www.postgresql.org/download/linux/
  在MacOS上安装PostgreSQL
  在MacOS上安装PostgreSQL之前,请确保你的系统上安装了Homebrew包管理器。如果尚未安装,请转到https://brew.sh/并将该网页上提供的脚本粘贴到MacOS终端(Terminal应用程序)中,然后按Enter键。按照出现的提示操作并等待脚本完成安装。
?注意:
  以下说明是基于MacOS Catalina版本10.15.6编写的,这是本书撰写时的最新版本。有关使用Terminal的更多帮助,请访问以下链接:
  
  https://support.apple.com/en-in/guide/terminal/apd5265185d-f365-44cb-8b09-
71a064a42125/mac
  Homebrew包管理器安装页面如图P17所示。
图P17 安装Homebrew
  安装Homebrew后,请按照以下步骤安装PostgreSQL。
  (1)打开一个新的Terminal终端窗口。依次键入以下3个命令,然后按Enter键安装 PostgreSQL包:
  
brew doctor
brew update
brew install postgres
  等待安装完成。根据你的本地设置和连接速度,你将看到类似于如图P18所示的消息(请注意,图P18仅显示了部分安装日志)。
图P18 安装进度(部分显示)—PostgreSQL
  (2)安装完成后,可通过在终端中键入以下命令并按Enter键来启动PostgreSQL进程:
  
pg_ctl -D /usr/local/var/postgres start
  
  此时你会看到类似于如图P19所示的输出。
图P19 启动PostgreSQL进程
  (3)进程启动后,可使用名为postgres的默认超级用户登录PostgreSQL Shell,如下所示(按Enter键执行命令):
  
psql postgres
  
  (4)你可以键入“\\l”(这是一个反斜杠和一个小写字母l),然后按Enter键以查看默认加载的所有数据库的列表,如图P20所示。
图P20 默认加载的数据库列表
  输入“\\q”然后按Enter键退出PostgreSQL Shell。
?注意:
  pgAdmin将与PostgreSQL 12一起自动安装。
安装Python
  在Windows上安装Python
  (1)访问以下官方网址,找到你想要的Python版本。
  
  https://www.anaconda.com/distribution/#windows
  
  (2)确保从下载页面选择Python 3.7。
  (3)确保安装的版本匹配你的计算机系统架构(即32位或64位)。你可以在操作系统的“系统属性”窗口中找到此信息。
  (4)下载安装程序后,只需双击文件并按照屏幕上的提示进行操作即可。
  在Linux上安装Python
  要在Linux上安装Python,请按以下步骤操作。
  (1)打开命令提示符并运行:
  
python3 --version
  
  这可以验证是否已安装Python 3。
  (2)要安装Python 3,请运行以下命令:
  
sudo apt-get update
sudo apt-get install python3.7
  
  (3)也可以通过以下网址下载Anaconda Linux安装程序并按照说明安装Python:
  
  https://www.anaconda.com/distribution/#linux
  在MacOS上安装Python
  与Linux类似,你有多种在Mac上安装Python的方法。要在MacOS上安装Python,请执行以下操作。
  (1)按CMD 空格键打开Mac终端,在打开的搜索框中键入“terminal”,然后按Enter键进入命令行界面。
  (2)通过命令行运行以下命令以安装Xcode:
  
xcode-select --install
  
  (3)安装Python 3最简单的方法是使用Homebrew,通过命令行运行:
  
ruby -e ”$(curl -fsSL https://raw.githubusercontent.com/Homebrew/
install/master/install)”
  
  (4)将Homebrew添加到你的$PATH环境变量中。
  在命令行中运行以下命令以打开你的配置文件:
  
sudo nano ~/.profile
  
  在底部插入以下命令:
  
export PATH=”/usr/local/opt/python/libexec/bin:$PATH”
  
  (5)最后一步是安装Python。在命令行中,运行以下命令:
  
brew install python
  
  (6)同样,也可以通过以下网址提供的Anaconda安装程序安装Python。
  
  https://www.anaconda.com/distribution/#macos
安装Git
  在Windows或MacOS X上安装Git
  可通过访问以下网页下载和安装适用于Windows/MacOS的Git:
  
  https://git-scm.com/
  
  当然,为了改善用户体验,建议通过GitKraken等高级客户端安装Git。其网址如下:
  
  https://www.gitkraken.com/
  在Linux上安装Git
  Git可以通过以下命令行轻松安装:
  
sudo apt-get install git
  
  如果你更喜欢图形用户界面,则GitKraken也可用于Linux。其网址如下:
  
  https://www.gitkraken.com/
加载示例数据集
  在Windows系统上加载示例数据集
  本书中的大多数练习都使用示例数据库sqlda,其中包含一家名为ZoomZoom的虚构电动汽车公司伪造的数据。请执行以下步骤来设置它。
  首先,创建一个名为sqlda的数据库。打开命令行并键入或粘贴以下命令,然后按Enter键执行:
  
createdb -U postgres sqlda
  
  系统将提示你输入在安装过程中为postgres超级用户设置的密码,如图P21所示。
图P21 PostgreSQL Shell密码请求
  要检查数据库是否已成功创建,可通过键入或粘贴以下命令并按Enter键登录到Shell:
  
psql -U postgres
  
  出现提示时输入你的密码。按Enter键继续。
  输入“\\l”(这是一个反斜杠和一个小写字母l),然后按Enter键检查是否创建了数据库。此时sqlda数据库应与默认数据库列表一起出现,如图P22所示。
图P22 PostgreSQL数据库列表
  访问以下链接,从本书GitHub存储库中的Datasets文件夹下载data.dump文件:
  
  https://packt.live/30UhcfI
  
  根据文件在系统上的位置,修改以下命令行中显示的路径。在命令行中键入或粘贴命令,然后按Enter键执行:
  
psql -U postgres -d sqlda -f C:\\\\data.dump
?注意:
  或者,你也可以使用命令行导航到下载文件所在的本地文件夹(使用cd命令)。例如,如果已将data.dump文件下载到计算机的“下载”文件夹中,则可以使用以下命令导航到它:
  
cd C:\\Users\\<你的Windows用户名>\\Downloads
  
  在导航到下载文件所在的本地文件夹之后,即可删除上述步骤中显示的前缀。该命令此时如下所示:
  
psql -U postgres -d sqlda -f data.dump
  此时你可以得到类似于图P23的输出。
  现在来检查一下该数据库是否加载正确。通过键入或粘贴以下命令登录到PostgreSQL 控制台,按Enter键执行:
  
psql –U postgres
  
  在Shell中,键入以下命令以连接到sqlda数据库:
  
\\c sqlda
  
  然后键入“\\dt”。此命令可以列出数据库中的所有表,如图P24所示。
?注意:
  我们使用超级用户postgres导入数据库仅用于演示目的。在实际生产环境中,建议使用单独的账户。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.