登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』Pandas数据分析快速上手500招(微课视频版)

書城自編碼: 3842426
分類:簡體書→大陸圖書→計算機/網絡數據庫
作者: 罗帅、罗斌
國際書號(ISBN): 9787302624110
出版社: 清华大学出版社
出版日期: 2023-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 124.8

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
不胜欢喜
《 不胜欢喜 》

售價:HK$ 63.4
现代欧洲史:1500—1815
《 现代欧洲史:1500—1815 》

售價:HK$ 105.6
高颜值创意饮品:咖啡 茶饮 鸡尾酒 气泡水
《 高颜值创意饮品:咖啡 茶饮 鸡尾酒 气泡水 》

售價:HK$ 71.8
慢慢来,好戏都在烟火里
《 慢慢来,好戏都在烟火里 》

售價:HK$ 59.8
一间自己的房间
《 一间自己的房间 》

售價:HK$ 47.8
波段交易的高级技术:股票和期权交易者的资金管理、规则、策略和程序指南
《 波段交易的高级技术:股票和期权交易者的资金管理、规则、策略和程序指南 》

售價:HK$ 94.8
人,为什么需要存在感:罗洛·梅谈死亡焦虑
《 人,为什么需要存在感:罗洛·梅谈死亡焦虑 》

售價:HK$ 81.6
锁国:日本的悲剧
《 锁国:日本的悲剧 》

售價:HK$ 93.6

 

建議一齊購買:

+

HK$ 111.3
《 薛定宇教授大讲堂(卷Ⅱ):MATLAB微积分运算(第2版) 》
+

HK$ 124.8
《 从0到1 MySQL即学即用 》
+

HK$ 111.3
《 对比Excel,轻松学习Python统计分析 》
編輯推薦:
问题描述 解决方案 真实源码 效果截图 视频教学, 精选500案例,附赠36个可视化案例,提供完整源码,边看边做边学 。优化数据分析,提高工作效率 ;告别重复劳动,蜕变职场精英
內容簡介:
本书采用“问题描述 解决方案”模式,通过500个案例介绍了使用Pandas进行数据分析和数据处理的技术亮点。全书共分为8章,主要案例包括:读写CSV、Excel、JSON、HTML等格式的数据;根据行标签、列名和行列数字索引筛选和修改数据,使用各种函数根据数据大小、日期范围、正则表达式、lambda表达式、文本类型等多种条件筛选数据;统计NaN(缺失值)的数量、占比,根据规则填充和删除NaN;在DataFrame中增、删、查、改行列数据,计算各种行差、列差、极差以及直接对两个DataFrame进行加、减、乘、除运算和比较差异;将宽表和长表相互转换,创建交叉表和各种透视表;对数据分组结果进行求和、累加、求平均值、求极差、求占比、排序、筛选、重采样等多种形式的分析,将分组数据导出为Excel文件。本书还附赠36个数据可视化案例,如根据指定的条件设置行列数据的颜色和样式,根据行列数据绘制条形图、柱形图、饼图、折线图、散点图、六边形图、箱形图、面积图等。   本书适于作为数据分析师、物流分析师、金融分析师、数据产品开发人员、人工智能开发人员、市场营销人员、办公管理人员、Python程序员等各行各业人员的案头参考书,无论对于初学者还是专业人士,本书都极具参考和收藏价值。
目錄
第1章 DataFrame 1
001 使用随机数创建一个DataFrame 1
002 使用字母设置DataFrame的行标签 2
003 使用日期设置DataFrame的行标签 3
004 使用月份设置DataFrame的行标签 4
005 使用月初日期设置DataFrame的行标签 5
006 使用星期日设置DataFrame的行标签 6
007 使用日期范围设置DataFrame的行标签 7
008 使用等差日期设置DataFrame的行标签 8
009 使用时间差设置DataFrame的行标签 9
010 根据工作日移动DataFrame的行标签 10
011 使用shift()移动DataFrame的行标签 11
012 根据日期差修改DataFrame的行标签 11
013 在日期行标签中禁止使用法定节假日 12
014 在日期行标签中排除自定义的节假日 13
015 在日期行标签中增加或减少分钟数 14
016 指定DataFrame的列数据为行标签 15
017 在DataFrame中移除现有的行标签 16
018 使用列表设置DataFrame的行标签 17
019 使用字典修改DataFrame的行标签 17
020 使用lambda修改DataFrame的行标签 18
021 在多层索引的DataFrame中设置行标签 19
022 使用字典修改DataFrame的多层行索引 20
023 根据DataFrame创建笛卡儿积多层索引 20
024 使用rename()修改DataFrame的列名 22
025 使用strip()修改DataFrame的列名 22
026 使用set_axis()修改DataFrame的列名 23
027 使用字典修改DataFrame的列名 24
028 为DataFrame的列名添加前缀或后缀 24
029 根据DataFrame的列名获取列索引数字 25
第2章 读取数据 27
030 从CSV格式的字符串中读取数据 27
031 从CSV格式的文本文件中读取数据 28
032 从星号分隔的文本文件中读取数据 28
033 从制表符分隔的文本文件中读取数据 29
034 从空格分隔的文本文件中读取数据 29
035 读取文本文件的数据并自定义列名 30
036 读取文本文件的数据并重命名列名 31
037 根据列名读取文本文件的部分数据 31
038 从文本文件中读取lambda筛选的列 32
039 读取文本文件的数据并设置列名前缀 33
040 读取文本文件的数据并设置列类型 33
041 读取文本文件并使用lambda修改列 34
042 读取文本文件并使用自定义函数修改列 35
043 读取文本文件并设置True和False 36
044 读取文本文件的数据并跳过指定行 37
045 读取文本文件的数据并跳过奇数行 37
046 读取文本文件的数据并跳过倒数n行 38
047 读取文本文件并将列类型转为日期类型 39
048 读取文本文件的数据并解析日期列数据 40
049 读取文本文件的数据并合并日期列数据 41
050 从压缩格式的文本文件中读取数据 42
051 把DataFrame的数据保存为文本文件 43
052 从Excel文件中读取单个工作表的数据 44
053 从Excel文件中读取多个工作表的数据 45
054 从Excel文件中读取工作表的前n行数据 46
055 从首行跳过n行读取Excel工作表的数据 47
056 从末尾跳过n行读取Excel工作表的数据 48
057 跳过指定行读取Excel工作表的部分数据 49
058 从Excel文件中读取工作表的偶数行数据 50
059 从Excel文件中读取工作表的偶数列数据 51
060 根据列号读取Excel文件的工作表数据 52
061 读取Excel工作表的数据且取消默认列名 53
062 读取Excel工作表的数据且自定义列名 53
063 读取Excel工作表的数据并指定行标签 54
064 在读取Excel工作表数据时解析千分位符 55
065 把DataFrame的数据保存为Excel文件 56
066 在保存Excel文件时不保留默认的行标签 57
067 使用read_json()函数读取JSON数据 58
068 将DataFrame的数据保存为JSON文件 59
069 从指定的网页中读取多个表格的数据 60
070 将DataFrame的所有数据转换为网页代码 62
071 将DataFrame的部分数据转换为网页代码 63
072 根据当前剪贴板的数据创建DataFrame 64
073 将DataFrame的所有数据保存到剪贴板 65
074 将DataFrame的部分数据保存到剪贴板 66
第3章 筛选数据 67
075 根据指定的列名筛选整列数据 67
076 使用eq()在指定列中筛选数据 68
077 使用ne()在指定列中筛选数据 68
078 使用lt()在指定列中筛选数据 69
079 在指定列中根据平均值筛选数据 70
080 使用le()在指定列中筛选数据 70
081 使用gt()在指定列中筛选数据 71
082 使用ge()在指定列中筛选数据 72
083 根据行标签的大小筛选数据 73
084 根据行标签的范围筛选数据 73
085 根据行标签步长筛选偶数行数据 74
086 根据指定的日期切片筛选数据 75
087 根据指定的日期范围筛选数据 76
088 根据指定的月份范围筛选数据 76
089 在日期类型的列中按日筛选数据 77
090 根据日期列的差值筛选数据 78
091 使用loc筛选并修改单个数据 79
092 使用loc筛选并修改多个数据 79
093 使用loc筛选并修改多行单列数据 80
094 使用loc筛选并修改单行多列数据 81
095 使用loc筛选并修改多行多列数据 82
096 使用loc根据切片筛选并修改数据 83
097 使用loc筛选并修改单行数据 84
098 使用loc筛选并修改多行数据 84
099 使用loc筛选并修改单列数据 85
100 使用loc筛选并修改多列数据 86
101 使用loc筛选并修改多层数据 87
102 使用loc筛选并输出DataFrame 87
103 使用loc根据大小筛选数据 88
104 使用loc根据字符串长度筛选数据 89
105 使用loc根据数值范围筛选数据 90
106 在loc中使用all()筛选多列数据 90
107 在loc中使用any()筛选多列数据 91
108 使用loc筛选数据且指定输出列 92
109 使用loc筛选IndexSlice结果 92
110 使用loc根据最后一行筛选列 93
111 在loc中使用lambda筛选列 94
112 使用loc根据负数步长倒序筛选列 94
113 使用loc根据负数步长倒序筛选行 95
114 使用iloc筛选并修改单个数据 96
115 使用iloc筛选并修改多个数据 96
116 使用iloc筛选并修改多行单列数据 97
117 使用iloc筛选并修改单行多列数据 98
118 使用iloc筛选并修改多行多列数据 99
119 使用iloc根据列表筛选并修改数据 99
120 使用iloc筛选并修改单列数据 100
121 使用iloc筛选并修改多列数据 100
122 使用iloc筛选并修改单行数据 101
123 使用iloc筛选并修改多行数据 102
124 使用iloc筛选并输出DataFrame 103
125 使用iloc根据指定的步长筛选数据 103
126 使用iloc筛选不连续的多行数据 104
127 在iloc中使用numpy筛选多行数据 105
128 在iloc中使用numpy筛选多列数据 106
129 在iloc中使用lambda筛选偶数行数据 106
130 使用at筛选并修改单个数据 107
131 使用iat筛选并修改单个数据 108
132 使用last()筛选最后几天的数据 108
133 使用truncate()根据行标签筛选数据 109
134 使用truncate()根据日期范围筛选数据 110
135 使用between()根据日期范围筛选数据 110
136 使用between()根据数值范围筛选数据 111
137 使用between_time()根据时间筛选数据 112
138 使用contains()在指定列中筛选文本 113
139 使用contains()不区分大小写筛选文本 114
140 在contains()中使用或运算符筛选文本 115
141 在contains()中使用正则表达式筛选文本 115
142 使用endswith()根据结束字符筛选文本 116
143 使用startswith()根据开始字符筛选文本 117
144 使用match()根据多个开始字符筛选数据 118
145 使用isnumeric()筛选全部为数字的数据 119
146 使用isin()筛选在指定列表中的数据 120
147 使用isin()筛选未在指定列表中的数据 120
148 使用isin()筛选指定列最大的前n行数据 121
149 使用isin()筛选指定列最小的前n行数据 122
150 在apply()中调用自定义函数筛选数据 122
151 在链式语句中调用自定义函数筛选数据 123
152 在apply()中使用lambda筛选数据 124
153 在链式语句中调用lambda筛选数据 125
154 在applymap()中使用lambda筛选数据 126
155 使用apply()筛选指定列首次出现的数据 126
156 使用apply()根据日期范围筛选数据 127
157 使用apply()根据数值范围筛选数据 128
158 使用select_dtypes()根据类型筛选列 129
159 使用select_dtypes()根据类型反向筛选列 129
160 使用filter()根据指定的列名筛选列 130
161 使用filter()根据指定的条件筛选列 131
162 使用filter()根据正则表达式筛选列 131
163 使用filter()根据指定的行标签筛选行 132
164 使用filter()根据正则表达式筛选行 133
165 在query()中使用比较运算符筛选数据 134
166 在query()中使用多个运算符筛选数据 134
167 使用query()根据平均值筛选数据 135
168 使用query()根据两列差值筛选数据 136
169 使用query()根据多列数值大小筛选数据 136
170 使用query()筛选多列均存在的数据 137
171 使用query()根据指定列表筛选数据 138
172 使用query()根据外部变量筛选数据 139
173 使用query()根据日期范围筛选数据 139
174 使用query()筛选包含指定字符的数据 140
175 使用query()根据行标签筛选数据 141
176 使用query()组合多个条件筛选数据 142
177 使用query()以链式风格筛选数据 142
178 使用eval()组合多个条件筛选数据 143
179 使用rolling()根据样本筛选数据 144
180 使用sample()根据占比筛选随机子集 145
181 使用apply()根据指定条件筛选数据 146
182 在DataFrame中筛选所有数据 146
183 根据在列表中指定的多个列名筛选列 147
184 根据在集合中指定的多个列名筛选列 148
第4章 清洗数据 150
185 统计DataFrame每列的NaN数量 150
186 统计DataFrame每行的NaN数量 151
187 统计DataFrame每行的非NaN数量 151
188 统计DataFrame每列的NaN数量占比 152
189 统计DataFrame每行的NaN数量占比 153
190 统计DataFrame每行的非NaN数量占比 154
191 使用isna()在列中筛选包含NaN的行 155
192 使用notna()在列中筛选不包含NaN的行 155
193 使用isnull()在列中筛选包含NaN的行 156
194 使用isnull()在列中筛选不包含NaN的行 156
195 在DataFrame中筛选包含NaN的列 157
196 在DataFrame中筛选包含NaN的行 158
197 在DataFrame中筛选不包含NaN的列 158
198 在DataFrame中筛选不包含NaN的行 159
199 在DataFrame中删除包含NaN的行 160
200 在DataFrame中删除包含NaN的列 160
201 在DataFrame中删除全部是NaN的行 161
202 在DataFrame中删除全部是NaN的列 162
203 在DataFrame中根据NaN占比删除列 162
204 在指定的列中删除包含NaN的行 163
205 在指定的行中删除包含NaN的列 164
206 使用fillna()根据指定值填充NaN 164
207 使用fillna()在指定列中填充NaN 165
208 使用fillna()根据列平均值填充NaN 166
209 使用fillna()填充指定列的首个NaN 167
210 使用fillna()实现自动向下填充NaN 168
211 使用fillna()实现自动向上填充NaN 169
212 使用applymap()填充DataFrame的NaN 169
213 使用mask()填充DataFrame的NaN 170
214 根据分组已存在的数据填充分组的NaN 171
215 使用transform()根据分组平均值填充NaN 171
216 将小数点前后有空格的数据修改为NaN 172
217 在format()中使用指定字符标注NaN 173
218 使用指定的颜色高亮显示所有的NaN 174
219 自定义函数设置NaN的颜色 174
220 自定义函数设置NaN的背景颜色 175
221 自定义函数设置非NaN的颜色 176
222 自定义函数设置非NaN的背景颜色 177
223 在DataFrame中强制NaN排在首位 177
224 读取Excel文件并设置NaN的对应值 178
225 读取Excel文件并按列设置NaN的对应值 179
226 读取文本文件并设置NaN的对应值 180
227 读取文本文件并按列设置NaN的对应值 181
第5章 整理数据 183
228 使用apply()转换指定列的数据类型 183
229 使用apply()转换所有列的数据类型 184
230 使用to_numeric()转换列的数据类型 184
231 使用astype()转换指定列的数据类型 185
232 使用astype()将百分数转换为浮点数 186
233 使用astype()转换千分位符的数字 186
234 使用astype()将其他时间转为北京时间 187
235 根据日期类型列的日期解析星期 188
236 根据日期类型列的日期解析季度 188
237 使用lower()将指定列的字母变为小写 189
238 使用rjust()在指定列左端补充字符 190
239 使用ljust()在指定列右端补充字符 191
240 使用center()在指定列两端补充字符 191
241 使用lstrip()删除指定列左端字符 192
242 使用rstrip()删除指定列右端字符 193
243 使用strip()删除指定列左右两端字符 193
244 使用get()提取指定列指定位置的字符 194
245 使用slice()提取指定列的多个字符 195
246 使用count()统计指定列的字符个数 195
247 使用repeat()在指定列中重复字符 196
248 使用replace()在指定列中替换文本 197
249 使用replace()在指定列中替换字母 197
250 在replace()中使用正则表达式替换 198
251 在replace()中使用lambda替换 199
252 使用slice_replace()替换指定切片 199
253 在apply()中调用自定义函数修改数据 200
254 在apply()中调用lambda修改数据 201
255 使用apply()删除%符号并转换数据 202
256 使用mask()根据指定条件修改数据 202
257 使用where()根据指定条件修改数据 203
258 使用replace()在指定列中替换数据 204
259 使用replace()在指定行中替换数据 205
260 在map()中使用字典修改数据 205
261 在map()中使用lambda修改数据 206
262 使用map()格式化指定列的数据 207
263 使用map()将浮点数转换为百分数 207
264 使用map()根据时间差计算天数 208
265 在DataFrame的末尾增加新行 209
266 在DataFrame的中间插入新行 209
267 根据行标签在DataFrame中删除行 210
268 根据条件在DataFrame中删除行 211
269 在多层索引的DataFrame中删除行 211
270 使用duplicated()筛选重复行 212
271 使用drop_duplicates()删除重复行 213
272 在指定列中使用drop_duplicates() 214
273 根据表达式初始化DataFrame的新增列 215
274 使用map()初始化DataFrame的新增列 215
275 计算DataFrame的单列数据并新增列 216
276 计算DataFrame的多列数据并新增列 217
277 使用assign()在DataFrame中新增列 218
278 使用assign()根据lambda表达式新增列 218
279 使用列表初始化DataFrame的新增列 219
280 使用apply()根据列表成员增加新列 220
281 使用apply()计算多列数据增加新列 220
282 使用apply()把列表成员扩展成多列 221
283 使用partition()将一列拆分成两列 222
284 使用split()将一列拆分成多列 223
285 使用extract()将一列拆分成两列 224
286 使用extract()将一列拆分成多列 224
287 在extract()中根据正则表达式拆分列 225
288 使用cat()以拼接字符串方式合并列 226
289 根据字符串日期列拆分年月日列 227
290 根据日期类型的列拆分年月日列 227
291 使用加号运算符拼接年月日列 228
292 使用to_datetime()拼接年月日列 229
293 根据索引在DataFrame中插入列 230
294 根据列名在DataFrame中删除列 230
295 根据条件在DataFrame中删除列 231
296 使用concat()按行拼接DataFrame 232
297 使用append()按行拼接DataFrame 233
298 使用concat()分组拼接DataFrame 234
299 使用concat()按列拼接DataFrame 235
300 使用concat()提取两个DataFrame的交集 236
301 使用merge()根据同名列合并DataFrame 237
302 使用merge()根据指定列合并DataFrame 238
303 使用merge()以指定方式合并DataFrame 239
304 使用join()根据索引列按列合并DataFrame 240
305 使用combine_first()合并DataFrame 241
306 使用combine()根据参数合并DataFrame 242
307 使用Pandas的merge()合并DataFrame 243
308 使用merge_ordered()合并DataFrame 244
309 使用merge_asof()合并DataFrame 245
310 使用compare()比较两个DataFrame 246
311 使用align()补齐两个DataFrame的列 247
312 在DataFrame中垂直移动指定的行数 248
313 在DataFrame中水平移动指定的列数 248
314 使用round()设置DataFrame的小数位数 249
315 使用update()更新DataFrame的数据 250
316 使用clip()修剪DataFrame的数据 251
317 使用clip()根据列表按列修剪数据 251
318 使用replace()在DataFrame中替换数据 252
319 使用replace()执行多值对应替换 253
320 使用replace()替换所有行列的字母 253
321 在replace()中使用正则表达式替换 254
322 在replace()中使用多个正则表达式 255
323 使用apply()修改DataFrame的数据 256
324 使用applymap()修改DataFrame 256
325 使用transform()修改DataFrame 257
326 使用transform()按行修改DataFrame 258
327 在DataFrame中按列相加指定的列表 258
328 在DataFrame中按行相加指定的列表 259
329 在DataFrame中按列相减指定的列表 260
330 在DataFrame中按行相减指定的列表 261
331 在DataFrame中按列相乘指定的列表 261
332 在DataFrame中按行相乘指定的列表 262
333 在DataFrame中实现各行数据连乘 263
334 在DataFrame中按列除以指定的列表 263
335 在DataFrame中按行除以指定的列表 264
336 使用add()实现两个DataFrame相加 265
337 使用sub()实现两个DataFrame相减 265
338 使用mul()实现两个DataFrame相乘 266
339 使用div()实现两个DataFrame相除 267
340 使用sum()在DataFrame中按列求和 267
341 使用sum()在DataFrame中按行求和 268
342 使用apply()在DataFrame中按列求和 269
343 使用apply()在DataFrame中按行求和 270
344 使用agg()在DataFrame中按列求和 270
345 使用agg()在DataFrame中按行求和 271
346 使用select_dtypes()实现按列求和 272
347 使用select_dtypes()实现按行求和 272
348 使用expanding()累加前n个数据 273
349 使用apply()按行累加各列的数据 274
350 使用apply()按列累加各行的数据 275
351 使用apply()计算每列数据的平均值 275
352 使用apply()计算每行数据的平均值 276
353 使用apply()计算每行最大值的比值 276
354 使用apply()计算每列最大值的比值 277
355 使用apply()计算每列数据的极差 278
356 使用apply()计算每行数据的极差 278
357 使用diff()计算DataFrame的行差 279
358 使用diff()计算DataFrame的列差 280
359 使用diff()计算指定列的差值 281
360 使用diff()计算差值并筛选数据 281
361 使用shift()按行计算移动平均值 282
362 使用shift()按列计算移动平均值 283
363 使用rolling()按行计算移动平均值 284
364 使用rolling()居中计算移动平均值 284
365 使用rolling()计算移动极差 285
366 在rolling()中设置最小观测期 286
367 使用pct_change()计算增减百分比 287
368 使用apply()获取每列数据的最大值 288
369 使用apply()获取每列数据的中位数 288
370 使用describe()获取指定列的最大值 289
371 使用agg()获取所有列的最大值 290
372 使用tolist()获取DataFrame的数据 291
373 根据行标签顺序排列DataFrame 292
374 根据行标签大小排列DataFrame 292
375 倒序排列DataFrame并重置行标签 293
376 在DataFrame中根据单个列名排序 294
377 在DataFrame中根据多个列名排序 294
378 在DataFrame中根据文本长度排序 295
379 在DataFrame中降序排列所有的列 296
380 在DataFrame中倒序排列所有的列 297
381 在DataFrame中自定义所有列顺序 297
382 在DataFrame中根据列表调整列顺序 298
383 使用rank()根据大小生成排名序号 299
384 使用value_counts()统计列成员数量 300
385 使用value_counts()统计列成员占比 300
第6章 透视数据 302
386 使用melt()将宽表转换为长表 302
387 使用pivot()将长表转换为宽表 303
388 使用stack()将宽表转换为长表 304
389 使用unstack()将长表转换为宽表 304
390 使用stack()将多行数据转换成一行 305
391 使用crosstab()根据行列创建交叉表 306
392 使用crosstab()创建交叉表并计算合计 307
393 使用explode()将列表成员扩展为多行 307
394 使用explode()筛选互为好友的数据 308
395 使用explode()在组内容之前插入组名 309
396 使用pivot_table()根据指定列进行分组 310
397 使用pivot_table()获取分组平均值 311
398 使用pivot_table()获取多级分组平均值 312
399 使用pivot_table()实现多级分组并求和 313
400 使用pivot_table()对不同列执行不同函数 314
401 使用transpose()实现行列数据交换 315
第7章 分组聚合 316
402 使用groupby()根据单列数据分组求和 316
403 使用groupby()根据多列数据分组求和 317
404 使用groupby()分组并对指定列数据求和 317
405 在groupby()中设置分组键为非索引列 318
406 重命名在使用groupby()分组之后的列名 319
407 自定义在使用groupby()分组之后的列名 320
408 使用groupby()分组并统计各组的个数 321
409 使用groupby()分组并获取各组的明细 321
410 使用groupby()分组并获取多级分组明细 322
411 使用groupby()分组并遍历各组的明细 323
412 使用groupby()分组并计算各组移动平均值 324
413 使用groupby()分组并计算各组累加值 325
414 使用groupby()分组并获取各组最大值 326
415 使用groupby()分组并获取各组第二大值 327
416 使用groupby()分组并添加各组合计 328
417 使用groupby()分组并添加分组占比 329
418 使用groupby()分组求和并禁止排序 330
419 使用groupby()根据lambda进行分组 331
420 使用groupby()根据行标签进行分组 332
421 使用groupby()根据索引年份进行分组 333
422 使用groupby()根据年份月份进行分组 334
423 使用groupby()根据星期进行分组 335
424 使用groupby()根据日期进行分组 336
425 使用groupby()根据列名进行分组 336
426 使用groupby()根据字典进行分组 337
427 使用groupby()根据字典类型进行分组 338
428 使用groupby()根据自定义函数进行分组 339
429 使用groupby()根据指定字符进行分组 340
430 使用groupby()根据返回值进行分组 341
431 使用groupby()根据Grouper进行分组 341
432 在分组指定列中查找互为相反数的数据 342
433 使用resample()实现日期重采样分组 343
434 使用resample()实现先分组再重采样 344
435 使用cut()根据连续型数据进行分组 346
436 使用cut()进行分组并设置分组的标签 347
437 使用cut()进行分组并计算各组平均值 348
438 使用qcut()根据指定的个数进行分组 348
439 根据索引层对多层索引的DataFrame分组 349
440 使用agg()获取分组指定列的最大值 351
441 使用agg()获取分组某几列的最大值 351
442 使用agg()自定义分组之后的新列名 352
443 使用agg()根据字典自定义分组新列名 353
444 使用agg()转换分组之后的合计数据 354
445 使用agg()转换分组之后的列数据类型 355
446 使用agg()通过lambda计算分组极差 356
447 使用agg()通过自定义函数计算分组极差 357
448 在agg()中调用带多个参数的自定义函数 358
449 使用pipe()计算各个分组指定列的极差 359
450 使用filter()筛选分组指定列的合计 359
451 使用filter()筛选分组指定列的最大值 360
452 使用filter()筛选分组指定列的平均值 361
453 使用filter()筛选分组指定列的所有值 362
454 使用filter()筛选分组指定列的某个值 363
455 使用filter()筛选分组成员的个数 364
456 使用filter()筛选分组大于某值的数据 365
457 使用apply()获取分组某列的最大值 366
458 使用apply()获取分组数值列的最大值 366
459 在apply()中使用lambda计算分组列差 367
460 在apply()中使用lambda计算分组差值 368
461 在apply()中使用DataFrame返回分组差值 369
462 在apply()中调用自定义函数统计分组指标 370
463 使用apply()将分组数据导出为Excel文件 371
464 使用unstack()以宽表风格输出多级分组 372
465 使用quantile()计算各个分组的分位数 373
466 使用rank()获取各个成员在分组中的序号 374
467 使用transform()计算平均值并筛选分组 375
468 使用drop_duplicates()删除分组重复数据 376
第8章 可视化数据 377
469 使用format()自定义列的数据格式 377
470 使用format()将浮点数转为百分数 377
471 在format()中使用lambda重置列 378
472 使用指定的颜色设置所有列的背景颜色 379
473 使用自定义函数设置指定列的背景颜色 379
474 使用自定义函数设置指定行的背景颜色 380
475 使用自定义函数设置交错的行背景颜色 381
476 使用自定义函数设置列切片的背景颜色 382
477 使用applymap()根据条件设置背景颜色 383
478 使用指定的颜色设置所有列的数据颜色 383
479 使用自定义函数设置指定列的数据颜色 384
480 使用自定义函数设置指定行的数据颜色 385
481 使用自定义函数设置交错的行数据颜色 386
482 使用自定义函数设置列切片的数据颜色 387
483 在所有列中根据值的大小设置背景颜色 387
484 在指定列中根据值的大小设置背景颜色 388
485 在所有列中根据值的大小设置数据颜色 389
486 在指定列中根据值的大小设置数据颜色 390
487 使用指定颜色高亮显示分位包含的数据 390
488 使用指定颜色高亮显示所有列的最大值 391
489 使用指定颜色高亮显示指定列的最大值 392
490 使用指定颜色高亮显示所有列的最小值 393
491 使用指定颜色高亮显示指定列的最小值 393
492 使用自定义函数设置每列的最大值颜色 394
493 使用自定义函数设置每列的最小值颜色 395
494 使用指定颜色高亮显示所有行的最大值 396
495 使用指定颜色高亮显示指定行的最大值 396
496 使用指定颜色高亮显示所有行的最小值 397
497 使用指定颜色高亮显示指定行的最小值 398
498 根据大小使用渐变色按列设置数据颜色 398
499 根据大小使用渐变色按行设置数据颜色 399
500 根据大小使用渐变色按列设置背景颜色 400

IV

V
內容試閱
Pandas是最近比较热门的一个分析结构化数据的工具包,它提供了高性能、易使用的数据结构和数据分析方法,其所提供的各种数据处理方法、工具基于数理统计学。Pandas 的命名来源并非“熊猫”,而是衍生自计量经济学的术语“panel data(面板数据)”和“Python data analysis(Python数据分析)”。Pandas的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。
  Jupyter Notebook是一个基于 Web的交互式开发环境,用户可以在其中编写代码、运行代码、查看并保存结果,这些特性使其成为一款执行端到端数据科学工作流程的便捷工具,它常用于数据清理、统计建模、构建和训练机器学习模型、可视化数据等用途。本书所有使用Python语言编写的Pandas实战案例均在Jupyter Notebook开发环境中完成,因此建议读者在测试和学习本书实战案例时也使用Jupyter Notebook。特别需要说明的是:建议从Anaconda官网下载安装Anaconda 3,里面包含Jupyter Notebook、Python 3.8.8、Pandas 1.3.3、numpy 1.20.1、matplotlib 3.4.1等大量的工具包,也可以根据需要在线升级相关工具包的最新版本。
  全书共分为8章,简述如下。
  第1章主要列举了在DataFrame中使用各种形式的日期设置行标签、修改行标签、修改列名以及修改多层行标签、创建笛卡儿积多层索引、根据列名获取列索引数字等。
  第2章主要列举了将CSV、Excel、JSON、HTML等格式的数据读入DataFrame,以及将DataFrame的数据写入CSV、Excel、JSON、HTML等格式的文件,甚至直接访问剪贴板数据等。
  第3章主要列举了使用loc根据行标签和列名筛选和修改单行数据、单列数据、多行数据、多列数据、多行多列数据、单个数据、多个数据;使用iloc根据行列索引数字筛选和修改单行数据、单列数据、多行数据、多列数据、多行多列数据、单个数据、多个数据;使用各种函数根据数据大小、日期范围、正则表达式、lambda表达式、文本类型等多种条件筛选数据。
  第4章主要列举了在DataFrame的行列中统计NaN(缺失值)的数量、占比,以及根据向上填充、向下填充等规则填充NaN的多个案例;同时列举了根据要求删除包含NaN的行或列、自定义NaN的颜色等案例;以及在读取Excel文件时如何处理NaN等案例。
  第5章主要列举了在DataFrame中新增行、插入行、删除行、删除重复行,新增列、删除列、拆分列、合并列、合并同构或异构的DataFrame,根据指定的规则修改数据、裁剪数据,计算各种行差、列差、极差以及直接对两个DataFrame进行加、减、乘、除运算和比较差异等。
  第6章主要列举了宽表和长表的相互转换,根据DataFrame的行列数据创建交叉表以及使用pivot_table()创建各种透视表等。
  第7章主要列举了根据指定的要求在DataFrame中对数据进行分组,并对分组结果进行求和、累加、求平均值、求极差、求占比、排序、筛选、重采样等多种形式的分析,以及将分组数据导出为Excel文件等。
  第8章主要列举了在DataFrame中根据指定的条件设置行列数据的颜色和样式等。
  本书最后还附赠36个数据可视化案例,如根据行列数据绘制条形图、柱形图、饼图、折线图、散点图、六边形图、箱形图、面积图等,请读者扫描“目录”下方的二维码下载查看。
  本书案例丰富、实用性强、技术新颖、贴近实战、思路清晰、代码简洁、知识精炼、高效直观、通俗易懂、操作性强。本书配套教学视频,读者可先扫描封底的刮刮卡内二维码,获得权限,再扫描书中对应章节处的二维码,即可观看视频。本书提供所有案例的完整代码,读者可扫描“目录”下方的二维码下载查看。
  本书为黑白印刷,书中提到的彩色高亮等效果无法直接体现,请读者观看教学视频,以视频中的显示效果为准。
  全书所有内容和思想并非一人之力所能及,而是凝聚了众多热心人士的智慧并经过充分的提炼和总结而成,在此对他们表示崇高的敬意和衷心的感谢!由于时间关系和作者水平原因,少量内容可能存在认识不全面或偏颇的地方,以及一些疏漏和不当之处,敬请读者批评指正。
  
罗帅 罗斌 2022年于重庆渝北
II

23

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.