新書推薦:

《
青少年拖延心理学:培养孩子的高效执行力
》
售價:HK$
54.8

《
股是股非之三:强势之星 全新修订全彩版
》
售價:HK$
135.3

《
摩洛哥史:沙海行舟 , 看世界 , 区域国别史(剑桥大学出版社经典版本)
》
售價:HK$
107.8

《
原来如此!人体运转的奥秘
》
售價:HK$
39.6

《
哲学的慰藉(三大狱中书简之一,波爱修斯绝笔之作,资深翻译家杨德友经典译本)
》
售價:HK$
71.5

《
亲密陷阱(PUA这个词,究竟是从哪里来的?起底伦敦骗色产业的长篇深入研究,剖析PUA产业背后的逻辑链
》
售價:HK$
75.9

《
象形文字 , 热爱的代价:社交媒体、理想职业与愿景劳动
》
售價:HK$
82.5

《
章太炎与中国的“法”(菿汉丛书)
》
售價:HK$
118.8
|
| 編輯推薦: |
|
本书既可以作为任意学科的课外读物, 也可以作为基础统计学的参考书.四 盲目地接受他人结论的人不会有创造性. 只有持怀疑的态度, 基于事实不断地对现 有理论进行质疑和挑战的人, 才能在科学探索的征途上有所作为.
|
| 內容簡介: |
|
书通过一些故事利用理性和逻辑来剖析作为传统统计核心价值的“统计显著性’’ 以及统计学家一些 ‘‘例行做法”,让读者从不同于教科书的角度认识数理统计中的逻辑及应用中的各种问题.
|
| 關於作者: |
|
吴喜之系美国北卡罗来纳大学统计系博士,博士生导师。国务院学位委员会统计学科评议组成员、概率统计学会常务理事、国家概率统计教材组成员、国家统计教材编审委员会委员、数学进展编委、中国统计方法应用标准化技术委员会标准化中统计方法应用分委员会主任委员。主要从事序贯分析,回归诊断,质量控制和模型选择等方向的教学与研究。在国际重要学术刊物上发表论文50多篇,时著有近二十部专著和教材,代表性著作有《非参数统计》,《现代贝叶斯统计》,多次主持国家自然科学基金项目。曾在国加利福尼亚大学、北卡罗来那大学、北京大学、南开大学任教。吴喜之是国内统计学界的学术带头人,国内推广R语言的先驱,曾为我国统计学学科升级为一级学科做出巨大的贡献,经常应邀到各个大学做统计学与R语言的讲座或短期培训。
|
| 目錄:
|
|
前言第 1 章 引子 / 11.1 汽车中的争论 / 11.2 传统统计的核心套路 / 21.3 辩论能解决所有问题吗 / 41.4 为什么人们喜欢非黑即白的结论 / 51.5 什么是“有用” / 71.6 顺其自然: 水到渠成而非揠苗助长 / 9第 2 章 显著性检验: 骗术还是误导 / 102.1 小厂经理的奇遇和查博士的推理 / 102.2 拿破仑滑铁卢战败原因之探讨 / 122.3 魏同学和查博士的逻辑对比 / 132.4 恶补: 显著性检验 / 152.4.1 统计推断的目的: 为何不直接考虑样本均值, 而考虑什么“总体均值” / 152.4.2 从 t 检验看显著性检验的逻辑错误 / 152.4.3 科学家反对统计显著性的划时代意义 / 172.4.4 怀疑是获取知识的最好出发点 / 18第 3 章 显著性的工具: 均值、正态性和大样本 / 193.1 数理统计专注均值的猫腻 / 19VI 统计的魔法:揭开统计的另一面3.1.1 “我们被平均了” / 193.1.2 “避实就虚”: 专注均值在数学上方便 / 203.1.3 “总体均值”代表“总体分布”吗 / 223.1.4 “击中要害”: 让数据说话 / 223.2 正态分布和大样本定理 / 233.2.1 正态分布是“最常见分布”吗 / 233.2.2 正态假定的备胎: 大样本定理 / 243.2.3 十万都不算“大样本”的反例 / 253.2.4 “通过正态性检验”的说法 / 263.3 “接受零假设”的逻辑 / 263.3.1 任何无法验证的谣言都可“证明” / 263.3.2 科学的证伪、法律的无罪推定原则和实践中的有罪推定 / 273.3.3 用正态性检验“证明”正态性 / 28第 4 章 假设检验深层次探索 / 304.1 势的计算只涉及单点备择假设 / 304.2 与备择假设无关的检验和试验结果相抵触 / 314.3 贝叶斯统计的解决方案 / 33第 5 章 得克萨斯神枪手谬误: 选择性取舍 / 355.1 疫苗的调查数据被选择性滥用 / 355.2 得克萨斯神枪手谬误 / 375.3 让“得克萨斯神枪手”现形 / 385.4 恶补: 置信区间的本质 / 395.4.1 经典统计的置信区间 / 395.4.2 置信区间和假设检验的关系 / 415.4.3 贝叶斯统计的最高密度区域 / 42第 6 章 末位淘汰的员工和 C 教授的回归课 / 446.1 蚂蚁搬运工和末位淘汰的员工 / 446.1.1 蚂蚁搬运白菜叶子 / 44目录 VII6.1.2 “末位淘汰”员工的命运 / 456.1.3 用蚂蚁搬物理解多重线性回归 / 476.1.4 解救被“末位淘汰”的员工 / 476.1.5 被“淘汰”年轻硕士的后话 / 486.2 C 教授课堂的麻烦 / 486.3 恶补: 多重共线性等概念 / 516.4 mathematistry、数据驱动还是模型驱动 / 536.4.1 线性回归系数可解释神话破灭的后果 / 536.4.2 数据驱动和模型驱动的区别 / 53第 7 章 数据异常还是模型异常 / 567.1 被剥夺奖金的优秀学生 / 567.1.1 “异常值” / 567.1.2 P 教授的“回归诊断”结果 / 567.1.3 没有异常的点, 只有异常的模型 / 597.2 恶补: 回归诊断的一些术语 / 61第 8 章 从形成菜谱谈交叉验证 / 628.1 王氏菜谱 / 628.2 从“王氏菜谱”到统计的预测精度 / 638.3 恶补: 交叉验证的概念 / 66第 9 章 坐井观天的“霸王” / 689.1 董同学课题被当成反例 / 689.2 寻找真正的“霸王” / 709.3 “猴子”和“老虎”的较量 / 729.4 恶补: 逻辑回归 / 75第 10 章 垃圾文章的产生过程 / 7710.1 每周吃 6 个及以上鸡蛋死亡率增加 30%吗 / 7710.2 答辩 / 7810.3 恶补: 模拟研究的误导机制 / 79VIII 统计的魔法:揭开统计的另一面第 11 章 永远看不透的因果关系 / 8111.1 相关关系还是因果关系 / 8111.1.1 著名学术争论: 晚上婴儿室开灯造成婴儿近视吗 / 8111.1.2 游戏: 列举伪因果的例子 / 8211.2 因果关系争夺战 / 8311.2.1 杨博士的数据分析 / 8311.2.2 哪个变量是长寿的原因 / 8511.2.3 寿命、创造性工作和 BMI 之间是什么关系 / 8611.2.4 因果关系的复杂性 / 8711.3 恶补: 因果关系漫游 / 8911.3.1 最简单的因果关系图解 / 8911.3.2 哲学家对因果关系的不同理解 / 8911.4 恶补: 生存分析的几个概念 / 91第 12 章 “成也萧何, 败也萧何” / 9212.1 只看百分比或标准化数据的猫腻 / 9212.2 药物 B 根据治愈比例及显著性检验打败了药物 A / 9312.3 药物 A 根据治愈比例及显著性检验打败了药物 B / 94第 13 章 能假装什么都不知道吗 / 9513.1 客观性是不是假装没有先验知识 / 9513.1.1 猜测的基础 / 9513.1.2 传统统计的伪客观性 / 9613.2 从无感染的手术数据计算出感染率 / 9613.2.1 无感染的手术数据: 传统统计方法 / 9613.2.2 无感染的手术数据: 贝叶斯统计方法 / 97第 14 章 概率和决策问题谜团 / 10014.1 Monty Hall 问题 / 10214.1.1 哪个门后有汽车 / 10214.1.2 根据贝叶斯定理的结论 / 103目录 IX14.2 男孩或女孩悖论 / 10414.3 两信封问题 / 10614.4 睡美人问题 / 10714.4.1 问题 / 10714.4.2 若干解决方案 / 10814.5 秘书问题 / 10914.6 圣彼得堡问题 / 11214.6.1 来自伯努利的问题 / 11214.6.2 为什么是悖论 / 11414.6.3 帕萨迪纳游戏 / 11614.6.4 诺贝尔经济学奖获得者的实话 / 117第 15 章 一石二鸟左右通吃的骗术 / 11915.1 文章产业 / 11915.2 使任博士毅然回国的两篇荟萃分析论文 / 12315.2.1 两篇论文 / 12315.2.2 只选择显著的结果 / 12515.2.3 脱离统计论文产业链 / 12715.3 恶补: 荟萃分析 / 12715.3.1 荟萃分析概要 / 12715.3.2 荟萃分析的基本数学模型 / 12815.3.3 固定效应荟萃分析模型 / 12915.3.4 随机效应荟萃分析模型 / 13015.3.5 荟萃分析存在的问题 / 131第 16 章 评价科研成果的科学: 元科学 / 13416.1 为什么很多已发表的研究结果是错误的 / 13416.2 元科学基础: 基于贝叶斯定理的模型 / 13816.2.1 不考虑论文作者偏见的模型 / 13816.2.2 考虑了论文作者偏见的模型 / 14016.3 伊奥尼迪斯的推论 / 142X 统计的魔法:揭开统计的另一面16.4 高假阳性率的驱动因素和事实 / 14416.4.1 高假阳性率的驱动因素 / 14416.4.2 高假阳性率的一些事实 / 14516.5 我们该怎么办 / 14816.5.1 文章出版产业链 / 14816.5.2 降低假阳性率必须对自己诚实 / 14916.5.3 如何识别虚假的结果呢 / 150第 17 章 本书使用的代码 / 15117.1 第 2 章代码 / 15117.2 第 3 章代码 / 15217.2.1 3.1.3 节代码 / 15217.3 第 5 章代码 / 15317.3.1 5.1 节代码 / 15317.3.2 5.3 节代码 / 15417.3.3 5.4.1 节代码 / 15417.3.4 5.4.3 节代码 / 15417.4 第 6 章代码 / 15517.4.1 6.1.2 节代码 / 15517.4.2 6.1.4 节代码 / 15517.4.3 6.2 节代码 / 15617.4.4 6.3 节代码 / 15717.5 第 7 章代码 / 15717.5.1 7.1.2 节代码 / 15717.5.2 7.1.3 节代码 / 15817.6 第 8 章代码 / 15817.7 第 9 章代码 / 16017.7.1 9.1 节代码 / 16017.7.2 9.2 节代码 / 16117.7.3 9.3 节代码 / 16317.8 第 11 章代码 / 166目录 XI17.8.1 11.1.2 节代码 / 16617.8.2 11.2 节代码 / 16617.9 第 12 章代码 / 16717.9.1 12.2 节代码 / 16717.9.2 12.3 节代码 / 16817.10 第 13 章代码 / 16817.11 第 15 章代码 / 169
|
| 內容試閱:
|
|
前言PREFACE喜欢自嘲的统计学家都喜欢引用马克·吐温 (Mark Twain) 的话: 一存在三种谎言: 谎言、该死的谎言和统计.二马克·吐温话中的“统计 (statistics)”显然是指统计数字而不是当时并未形成的统计学, 但统计学和谎言难道就不会沾上边吗? 实际上, 70 年前已经有一本名为《如何用统计撒谎》的书了 三, 此外引言中“该死的”(damned) 也可译为“该诅咒的”或“讨厌的”, 是褒义词还是贬义词?有个人声称自己是拿破仑, 人们说他撒谎. 但测谎仪说他没有撒谎, 这是因为他真的认为自己是拿破仑, 如果他否认自己是拿破仑, 才的确是撒谎. 但是, 这个人是否撒谎对自然界或者人类社会能造成什么伤害吗? 另外, 根本不用说一句谎话, 通过某些聪明的手段或散布精心选择的信息就可以达到误导的效果, 这可能比有意撒谎更“该诅咒”.谎言或误导一定会造成不良后果吗? 有没有必要去识别、认识或者揭露谎言或误导呢? 说谎的人希望他的谎言被揭穿吗? 受骗的人愿意承认自己受骗了吗?统计领域中的频率学派和贝叶斯学派互斗可能被局外人认为是“家庭纠纷”. 统计学家绝对不会主动公开砸自己饭碗, 但其他科学家可没有这个顾虑, 2019 年 3 月 20 日《自然》发表了一篇题为《科学家起来反对统计显著性: Amrhein、Greenland、McShane一 Elizabeth Knowles, ed. 2009. Oxford Dictionary of Quotations (7 ed.). Oxford University Press.二 马克·吐温在 Mark Twain Autobiography (1924) vol. 1 将“There are three kinds of lies: lies, damnedlies and statistics”归功于本杰明·迪斯雷利. 虽然马克·吐温说这是引用英国前首相本杰明的话, 但很可能这是马克·吐温杜撰的, 本杰明可能从来没有说过这句话.三 Darrel Huff. 1954. How To Lie With Statistics. W. W. Norton & Company.IV 统计的魔法:揭开统计的另一面以及 800 多人署名呼吁终止骗人的结论并消除可能至关重要的影响》的文章. 一一些人认为: 有 100 多年历史的统计学科正处在十字路口二, 毕竟 p 值代表的“统计显著性”曾经成就了无数饭碗啊! 试图对统计学科的状况和发展进行辩论有意义吗? 似乎只有在人文社会科学领域中才有辩论这一说. 辩论中关心真理的人很少见, 多数人只关心输赢. 因此, 柏拉图认为辩论是非常愚蠢和危险的事情.在自然科学中没有辩论也用不着辩论. 科学的理论都不是真理, 而仅仅是对客观规律的某种近似而已, 只有无知的人才会说某个理论是真理. 在科学中, 不讨论某个理论的是与非.在纯粹数学中, 也没有辩论的余地. 在公理和定义清楚的情况下, 只要逻辑清楚, 结论就是明摆着的.没有必要讨论什么应该或什么不应该, 哲学家黑格尔 (1770—1831) 说过:“任何存在的事物都有其存在的理由, 任何有存在理由的都会存在.”三本书通过一些故事利用理性和逻辑来剖析作为传统统计核心的“统计显著性”以及统计学家的一些“例行做法”. 必须声明: 本书涉及的没有说明出处的故事、人物、数据四和一些事件完全是虚构的, 如有雷同则纯属巧合.成都武侯祠的一副楹联中说“从古知兵非好战”. 本书当然不是教人行骗, 而是让读者从不同于教科书的角度认识数理统计中的逻辑及应用中的各种问题. 任何背景的人都能成为本书的读者, 当然, 本书既可以作为任意学科的课外读物, 也可以作为基础统计学的参考书.四盲目地接受他人结论的人不会有创造性. 只有持怀疑的态度, 基于事实不断地对现有理论进行质疑和挑战的人, 才能在科学探索的征途上有所作为.
|
|