《统计反思：用R和Stan例解贝叶斯方法》 - [美]理查德·麦克尔里思[Richard，McElreath - Meg Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

2023年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

『簡體書』统计反思：用R和Stan例解贝叶斯方法

書城自編碼： 3348125
分類：簡體書→大陸圖書→計算機/網絡→程序設計
作者： [美]理查德·麦克尔里思[Richard，McElreath
國際書號(ISBN)： 9787111624912
出版社：机械工业出版社
出版日期： 2019-05-01

書度/開本： 16开釘裝：平装

售價：HK$ 187.7

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《次经导论》
售價：HK$ 177.6

《故纸留痕：抗日战争时期澳门报刊资料选辑》
售價：HK$ 345.6

《玩转Photoshop（零基础快速上手，全彩赠视频）》
售價：HK$ 57.6

《故事力：TED演讲者助力，当代青年克服表达难题（两位TED专业讲者教你掌握故事五大力）》
售價：HK$ 81.6

《中国民间神话故事绘（套装共15册）》
售價：HK$ 456.0

《无限可能的身体》
售價：HK$ 72.0

《中国人工智能系列研究报告：大型语言模型的教育应用》
售價：HK$ 69.6

《北洋大学与近代中国（第2辑）》
售價：HK$ 153.6

建議一齊購買：

HK$ 268.7
《 ROS机器人编程：原理与应用》

HK$ 67.2
《 Word/Excel/PPT 2019从入门到精通移动学习版》

HK$ 169.0
《利用Python进行数据分析（原书第2版）》

HK$ 205.4
《 Redis设计与实现（资深Redis技术专家撰写，深入了解Redis技术内幕的必读之作。从源码角度解析Redis的架构设计、实现原理和工作机制，为高效使用Redis提供原理性指导）》

編輯推薦：

本书能增加你对统计模型的理解和信心。现在，基于模型的统计对编程有基本的要求，本书能促使你一步一步地计算原本自动的过程。书中独特的计算过程可确保你了解足够的细节，以便你在建模工作中合理地选择和解释模型。
本书从贝叶斯的角度介绍了广义线性分层模型，通过贝叶斯概率和*熵的基础逻辑解释模型,涵盖从基础的回归分析到分层模型的内容。作者还讨论了测量误差、缺失数据，以及处理空间和网络自相关的高斯过程模型。
本书特色：
将代码嵌入讲解的正文，你能够在阅读的过程中实践代码并查看结果。
通过实际数据分析的例子来讲解概念。
详细地讲解代码，让你能够诊断并且纠正问题。
传授重要但是不常见的编程技巧。
展示相同的数学模型如何能有不同的实践方法。
在选读部分提供更加详细的数学解释。
在作者的网站和Github页面上提供相应的R包。

內容簡介：

本书以Stan统计软件为基础，以R代码为例，提供了一个实际的统计推断的基础。从贝叶斯统计方法的角度出发，介绍了统计反思的相关知识，以及一些常用的进行类似权衡的工具，展示了两个完整的*常用的计数变量回归，介绍了应对常见的单一模型无法很好地拟合观测数据的排序分类模型与零膨胀和零增广模型，提出了基于贝叶斯概率和*熵的广义线性分层模型以及处理空间和网络自相关的高斯过程模型。本书适合统计、数学等相关专业的高年级本科生、研究生，以及数据挖掘的从业人士阅读。

目录
译者序
前言
第1章　布拉格的泥人1
　1.1　统计机器人1
　1.2　统计反思4
1.2.1　假设检验不是模型5
1.2.2　测量很关键8
1.2.3　证伪是一种共识10
　1.3　机器人工程的3种工具10
1.3.1　贝叶斯数据分析11
1.3.2　分层模型14
1.3.3　模型比较和信息法则15
　1.4　总结16
第2章　小世界和大世界18
　2.1　路径花园19
2.1.1　计算可能性20
2.1.2　使用先验信息23
2.1.3　从计数到概率24
　2.2　建立模型26
2.2.1　数据背景26
2.2.2　贝叶斯更新27
2.2.3　评估28
　2.3　模型组成30
2.3.1　似然函数30
2.3.2　参数31
2.3.3　先验32
2.3.4　后验33
　2.4　开始建模35
2.4.1　网格逼近36
2.4.2　二项逼近37
2.4.3　马尔可夫链蒙特卡罗40
　2.5　总结41
　2.6　练习41
第3章　模拟后验样本43
　3.1　后验分布的网格逼近抽样46
　3.2　样本总结47
3.2.1　取值区间对应的置信度48
3.2.2　某个置信度下的取值区间49
3.2.3　点估计52
　3.3　抽样预测55
3.3.1　虚拟数据55
3.3.2　模型检查57
　3.4　总结61
　3.5　练习61第4章　线性模型64
　4.1　为什么人们认为正态分布是常态65
4.1.1　相加得到正态分布65
4.1.2　通过相乘得到正态分布67
4.1.3　通过相乘取对数得到正态分布67
4.1.4　使用高斯分布68
　4.2　用来描述模型的语言70
　4.3　身高的高斯模型71
4.3.1　数据72
4.3.2　模型73
4.3.3　网格逼近后验分布76
4.3.4　从后验分布中抽取样本77
4.3.5　用map拟合模型79
4.3.6　从map拟合结果中抽样82
　4.4　添加预测变量84
4.4.1　线性模型策略85
4.4.2　拟合模型88
4.4.3　解释模型拟合结果89
　4.5　多项式回归101
　4.6　总结105
　4.7　练习105
第5章　多元线性回归108
　5.1　虚假相关110
5.1.1　多元回归模型的数学表达112
5.1.2　拟合模型113
5.1.3　多元后验分布图114
　5.2　隐藏的关系122
　5.3　添加变量起反作用128
5.3.1　共线性129
5.3.2　母乳数据中的共线性132
5.3.3　后处理偏差136
　5.4　分类变量138
5.4.1　二项分类139
5.4.2　多类别141
5.4.3　加入一般预测变量144
5.4.4　另一种方法：独一无二的截距144
　5.5　一般最小二乘和lm145
5.5.1　设计公式145
5.5.2　使用lm146
5.5.3　从lm公式构建map公式147
　5.6　总结148
　5.7　练习148
第6章　过度拟合、正则化和信息法则150
　6.1　参数的问题152
6.1.1　更多的参数总是提高拟合度153
6.1.2　参数太少也成问题156
　6.2　信息理论和模型表现158
6.2.1　开除天气预报员158
6.2.2　信息和不确定性161
6.2.3　从熵到准确度163
6.2.4　从散度到偏差165
6.2.5　从偏差到袋外样本167
　6.3　正则化169
　6.4　信息法则171
6.4.1　DIC173
6.4.2　WAIC173
6.4.3　用DIC和WAIC估计偏差176
　6.5　使用信息法则178
6.5.1　模型比较178
6.5.2　比较WAIC值180
6.5.3　模型平均185
　6.6　总结187
　6.7　练习188第7章　交互效应190
　7.1　创建交互效应192
7.1.1　添加虚拟变量无效195
7.1.2　加入线性交互效应是有效的197
7.1.3　交互效应可视化199
7.1.4　解释交互效应估计200
　7.2　线性交互的对称性203
7.2.1　布里丹的交互效应203
7.2.2　国家所属大陆的影响取决于地势204
　7.3　连续交互效应205
7.3.1　数据206
7.3.2　未中心化的模型206
7.3.3　中心化且再次拟合模型209
7.3.4　绘制预测图212
　7.4　交互效应的公式表达214
　7.5　总结215
　7.6　练习215
第8章　马尔可夫链蒙特卡罗218
　8.1　英明的马尔可夫国王和他的岛屿王国219
　8.2　马尔可夫链蒙特卡罗221
8.2.1　Gibbs抽样222
8.2.2　Hamiltonian
蒙特卡罗222
　8.3　初识HMC：map2stan224
8.3.1　准备225
8.3.2　模型估计225
8.3.3　再次抽样226
8.3.4　可视化227
8.3.5　使用样本229
8.3.6　检查马尔可夫链230
　8.4　调试马尔可夫链231
8.4.1　需要抽取多少样本232
8.4.2　需要多少条马氏链233
8.4.3　调试出错的马氏链234
8.4.4　不可估参数236
　8.5　总结238
　8.6　练习239
第9章　高熵和广义线性模型241
　9.1　最大熵242
9.1.1　高斯分布246
9.1.2　二项分布248
　9.2　广义线性模型253
9.2.1　指数家族254
9.2.2　将线性模型和分布联系起来256
9.2.3　绝对和相对差别259
9.2.4　广义线性模型和信息法则259
　9.3　最大熵先验260
　9.4　总结260
第10章　计数和分类261
　10.1　二项回归262
10.1.1　逻辑回归：亲社会的大猩猩262
10.1.2　累加二项：同样的数据，用累加后的结果271
10.1.3　累加二项：研究生院录取272
10.1.4　用glm拟合二项回归模型278
　10.2　泊松回归279
10.2.1　例子：海洋工具复杂度281
10.2.2　MCMC岛屿287
10.2.3　例子：曝光和抵消项288
　10.3　其他计数回归290
10.3.1　多项分布290
10.3.2　几何分布294
10.3.3　负二项和贝塔二项分布295
　10.4　总结295
　10.5　练习295
第11章　怪物和混合模型297
　11.1　排序分类变量297
11.1.1　案例：道德直觉298
11.1.2　通过截距描绘有序分布299
11.1.3　添加预测变量303
　11.2　零膨胀结果变量307
　11.3　过度离散结果310
11.3.1　贝塔二项模型311
11.3.2　负二项或者伽马泊松分布314
11.3.3　过度分散、熵和信息理论314
　11.4　总结315
　11.5　练习315
第12章　分层模型318
　12.1　案例：蝌蚪数据分层模型320
　12.2　变化效应与过度拟合拟合不足326
12.2.1　建模327
12.2.2　对参数赋值328
12.2.3　模拟存活的蝌蚪329
12.2.4　非聚合样本估计329
12.2.5　部分聚合估计330
　12.3　多重聚类332
12.3.1　针对不同黑猩猩分层333
12.3.2　两重聚类334
12.3.3　更多的聚类337
　12.4　分层模型后验预测337
12.4.1　原类别后验预测338
12.4.2　新类别后验预测339
12.4.3　聚焦和分层模型342
　12.5　总结345
　12.6　练习345
第13章　解密协方差347
　13.1　变化斜率348
13.1.1　模拟数据349
13.1.2　模拟观测351
13.1.3　变化斜率模型352
　13.2　案例分析：录取率和性别357
13.2.1　变化截距357
13.2.2　性别对应的变化效应358
13.2.3　收缩效应360
13.2.4　模型比较360
13.2.5　更多斜率361
　13.3　案例分析：对黑猩猩数据拟合变化斜率模型361
　13.4　连续变量和高斯过程368
13.4.1　案例：岛屿社会工具使用和空间自相关368
13.4.2　其他距离375
　13.5　总结375
　13.6　练习375
第14章　缺失数据及其他378
　14.1　测量误差379
14.1.1　结果变量误差381
14.1.2　结果变量和预测变量同时存在误差383
　14.2　缺失数据385
14.2.1　填补新皮层数据385
14.2.2　改进填补模型389
14.2.3　非随机390
　14.3　总结392
　14.4　练习393
第15章　占星术与统计学394
参考文献398

內容試閱：

译　者　序这是我希望在学习贝叶斯统计的时候首先阅读的一本书。与其说贝叶斯是一种不同的统计方法，不如说它是一种不一样的统计哲学，也是一种看待生活中很多问题的不同的视角。不是所有的应用数据科学领域都需要用到贝叶斯，但即使你所处的行业用得很少，了解贝叶斯的基本概念也是很有必要的。因为这种根据证据改变自己想法的思维方式能帮助我们约束直觉，这是一种高级的思维方式。贝叶斯推断不外乎计算在某假设下事情可能发生的方式的数目。事情发生方式多的假设成立的可能性更高。一旦我们定义了假设，贝叶斯推断会强制施行一种通过已经观测到的信息进行纯逻辑的推理过程。频率法要求所有概率的定义都需要和可计数的事件以及它们在大样本中出现的频率联系起来。这使得频率学的不确定性依赖于想象的数据抽样的前提如果多次重复测量，我们将会收集到一系列呈现某种模式的取值。这也意味着参数和模型不可能有概率分布，只有测量才有概率分布。这些测量的分布称为抽样分布。这些所谓的抽样只是假设，在很多情况下，这个假设很不合理。而贝叶斯方法将随机性视为信息的特质，这更符合我们感知的世界运转模式。所以，在很多应用场景中，贝叶斯也更加合适。总体说来，本书有如下亮点：1.可重复。这点实在是太重要了。书中的数据很容易获取，书中的代码、建模过程都可以重复。读者可以在阅读的过程中实践代码，并且生成书中展示的结果。也可以自己修改代码，看看结果的变化，这对理解内容有极大的帮助。2.前3章中有我见过的对贝叶斯及哲学最清晰的讲解。对于那些只想知道贝叶斯模型是什么但不想花太多时间深入学习更加复杂的贝叶斯模型的读者，推荐仔细阅读前3章。第1章反思了流行的统计和科学哲学，指出我们不该仅使用各种自动化的工具，而应该学着在实际应用中建立、评估不同的模型。接下来的第2章和第3章介绍了贝叶斯推断和进行贝叶斯计算的基本工具。其中作者的讲解方式很绕、很慢，特别强调了概率理论的纯逻辑解释。但我希望读者能够耐心地认真阅读这3章，这对以深入理解贝叶斯为目标的人来说，一点儿也不啰嗦。3.本书提供了R包rethinking来实现模型，使用更加简单直接。更好的方法当然是直接学习使用Stan。rethinking中的一些函数（map和map2stan）对stan进行包装，隐藏了背后的stan代码，这使得一些错误信息让人难以理解。如果要在工作中应用书中介绍的模型，最好还是在之后花时间学习Stan。好在读过本书之后，学习Stan应该不难。4.rethinking包中自带的数据以及一些绘图函数可极大地帮助读者对真实数据进行建模，并且通过可视化解释结果。在这些绘图的函数中，有些能直接对后验预测进行可视化，并通过这种方式比较模型和参数。对于简单的模型，可以通过参数估计总结表来理解模型。但只要模型稍微复杂一点，尤其是含有交互效应（见第7章），解释后验分布就会变得很难。如果要在模型解释中考虑参数间的相关性，那可视化就不可或缺。5.书中的一些关于社会科学的例子不仅展示了如何建立模型，更重要的是展示了如何定义问题本身。社会学的问题往往是开放的，很复杂。所以通过数据建模解决这类问题的难点不仅仅是模型本身，还有将开放式问题转化成一个封闭式问题的过程。本书中有很多这样的例子，而且作者对数据所处的实际语境也进行了详细的解释。为了使行文更加通顺，在翻译的过程中采用了较多的意译，有的地方加上了译者注以帮助读者理解。华章公司的编辑对本书的翻译工作给予了大力的支持和帮助。在此对所有为本书中文版问世做出努力的人表示感谢！由于译者水平有限，书中难免有错误和不妥之处，恳请读者批评指正。
林　荟2018年12月
前言石匠，开始动工之前（Masons,when they start upon a building），总会小心测试鹰架（Are careful to test out the scaffolding）。
确保模板不会滑落在繁忙的街口（Make sure that planks wont slip at busy points），牢牢钉好每把梯子，拴紧所有螺丝（Secure all ladders, tighten bolted joints）。
这一切付出在完工后都得被拆除（And yet all this comes down when the jobs done），展露结实的石墙（Showing off walls of sure and solid stone）。
所以，亲爱的，就算我们之间的桥梁（So if, my dear, there sometimes seem to be），偶尔因为老旧看似即将倒塌（Old bridges breaking between you and me）。
别害怕。让那鹰架倒下吧（Never fear. We may let the scaffolds fall），相信我们建造的墙坚不可摧（Confident that we have build out wall）。
《鹰架》Scaffolding,作者Seamus Heaney, 19392013
本书意在帮助你增进统计模型的知识以及使用模型的信心。就像造墙时的鹰架，能够帮助你建造需要的石墙，虽然最终你要将鹰架拆除。因此，本书讲解的方式有些拐弯抹角，但那是为了促使你们亲自实践模型背后的每一个计算步骤，虽然真实建模的过程常常是自动的。这样小题大做是为了让你能够对方法背后的细节有足够的了解，以能够合理地选择和解释模型。虽然你最终会用一些工具自动建模，但刚开始放慢步伐、夯实基础是很重要的。耐心建立坚实的墙然后再拆去鹰架。目标读者本书主要面向自然和社会科学的研究人员，可以是新入学的博士生，也可以是有经验的专业人士。你需要有回归的基本知识，但不一定需要对统计模型驾轻就熟。如果你接受这样的事实：一些在21世纪早期广泛使用的典型统计学方法并非完全正确，其中大部分和p值以及令人迷惑的各种统计检验有关。如果你在一些杂志和书上读到过一些替代的方法，但不知道从何学习这些方法，那么本书就是为你而写的。事实上，本书并不是要直接抨击p值和相关的方法。在我看来，问题并不在于人们习惯用p值来解决科学界的各种问题，而在于人们忽略了许多其他有用的工具。因此，我假定本书的读者已经准备好不使用p值做统计推断。仅有这种心理准备还不够，最好能有一些文献资料帮助你探查与p值和传统统计检验有关的错误及误解。即使我们不用它们，也要对其有所了解。我因此查阅了一些相关的资料，但由于本书篇幅所限不能详细讨论，否则本书会太厚，也会打乱原本的教学节奏。这里要提醒一点，反对p值不仅仅是贝叶斯学派的观点。事实上，显著性检验能够（其实也已经）构建为贝叶斯过程。其实真正促使人们避免使用显著性检验的是出于认识论的考虑，关于这一点我会在第1章简单讨论。教学方法本书使用更多的是程序代码而非数学公式。直到真正对算法付诸实践，即使最出色的数学家可能也无法理解该过程。因为用代码实践的过程去除了算法中所有模棱两可的地方。因此，如果一本书同时教你如何实践算法的话，学习起来会更轻松。展示代码除了有利于教学也是必需的，因为许多统计模型现在都需要计算，纯数学的方法无论如何也不能解决问题。你在本书后面部分可以看到，同样的数理统计模型的实现方法可以有多种，而且我们有必要区分这些方法。当你在本书之外探索更高级或更有针对性的统计模型时，这里强调的编程计算知识将帮助你识别和应对各种实际困难。本书的每一部分都只揭示了冰山一角。我丝毫没有涵盖所有相关内容的打算，而是试图将其中一些东西解释清楚。在此尝试中，我在数据分析的实例中穿插了许多模型概念和内容。例如，书中没有一个单元专门讲预测变量的中心化，但我在数据分析中使用并解释了这项技术。当然，不是所有读者都喜欢这样的讲解方式。但是我的很多学生喜欢这种讲解方式。我很怀疑这样的讲解能否对大部分要学习这些内容的读者起作用。从心底来说，这反映了我们在现实中是如何在自己的研究中学会这些方法的。如何使用本书这不是参考书，而是教科书。本书不是让你在遇到问题时用来查阅相关部分的，而是一个完整连贯的教学过程。这在教学上很有优势，但可能不符合很多科学家现实中的阅读习惯。本书正文中有很多代码。这样做是因为在21世纪从事统计分析工作必须要会编程，或多或少会一些。编程不是候选技能，而是必备技能。在书中的很多地方，我宁可过多地展示代码，也不愿过少展示代码。根据我对编程新手的教学经验，当学生手上有可以运行的代码时，让他们在此基础上修改比让他们从0开始写程序效果更好。我们这代人可能是最后一代需要用命令的方式操作计算机的了，因此编程也越来越难教。我的学生非常熟悉计算机，但他们不知道计算机代码长什么样。[=1]本书要求读者具备什么基础？[=]本书的目的不是教读者关于编程的基本知识。我们假设读者已经知道R的基本安装和数据处理知识。在大多数情况下，入门级的R编程介绍便足够。据我所知，许多人觉得Emmanuel Paradis所著的《R for Beginners》很有帮助。你可以通过链接http：cran.r-project.orgother-docs.html找到该指南以及许多入门级教程。要顺利阅读本书，你得知道y

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	香港用户　 \|　台灣用户　\|　大陸用户　\|　海外用户

	megBook.com.hk
Copyright © 2013 - 2024 （香港）大書城有限公司　 All Rights Reserved.