新書推薦:

《
孤独谱系障碍评估与干预:从理论到实践 国际经典医学心理学译著
》
售價:HK$
228.8

《
大数据导论(第2版)
》
售價:HK$
75.9

《
帝国时代
》
售價:HK$
206.8

《
现象学的心灵(第三版)(中国现象学文库·现象学原典译丛·扎哈维系列)
》
售價:HK$
107.8

《
近世通儒——纪念沈曾植逝世100周年学术研讨会论文集
》
售價:HK$
184.8

《
光速声波物理学. 1、2、3
》
售價:HK$
494.9

《
天下之极:世界枢纽观念的古今之变
》
售價:HK$
96.8

《
认识现代社会之真相:杨照讲马克斯·韦伯
》
售價:HK$
94.6
|
編輯推薦: |
本书是南京大学吴建鑫教授多年深耕学术研究和教学实践的潜心力作,系统阐述了模式识别中的基础知识、主要模型及热门应用,并给出了近年来该领域一些新的成果和观点,是高等院校人工智能、计算机、自动化、电子和通信等相关专业模式识别课程的优秀教材。
|
內容簡介: |
本书是模式识别领域的入门教材,系统阐述了模式识别的基础知识、主要模型及热门应用,并给出了近年来本领域一些新的成果和观点.。本书可作为高等院校人工智能、计算机、自动化、电子和通信等相关专业研究生或本科生的教材,也可供相关领域研究人员和工程技术人员参考。全书共15章,分为五部分:第一部分(第1~4章)介绍了模式识别的基础知识;第二部分(第5~6章)介绍了与领域知识无关的特征提取;第三部分(第7~10章)介绍了分类器与其他工具;第四部分(第11~12章)介绍了如何处理变化多端的数据;第五部分(第13~15章)介绍了一些高阶课题,包括正态分布、EM算法和卷积神经网络。本书可作为高等院校人工智能、计算机、自动化、电子和通信等相关专业研究生或本科生的教材,也可供相关领域研究人员和工程技术人员参考。
|
關於作者: |
吴建鑫
南京大学人工智能学院教授、博士生导师,入选中组部青年海外高层次人才引进计划(青年千人计划),2014年获得国家自然科学基金委优秀青年科学基金项目支持。主要从事计算机视觉和机器学习等领域的研究。在重要国际期刊如 TPAMI、IJCV、AIJ、JMLR 等以及重要国际会议如 ICCV、CVPR、ICML 等发表论文 100 余篇。曾担任国际会议 CVPR、ICCV、AAAI、IJCAI
等领域主席。发表论文被 60 余个国家和地区的学者引用 22000 余次。
|
目錄:
|
目录
前言
符号表
第一部分 概述
第 1 章 绪论 2
1.1 样例: 自动驾驶 3
1.2 模式识别与机器学习 5
1.2.1 一个典型的模式识别流程 5
1.2.2 模式识别与机器学习8
1.2.3 评估、部署和细化 9
1.3 本书的结构 10
习题 12
第 2 章 数学背景知识 15
2.1 线性代数 15
2.1.1 内积、范数、距离和正交性16
2.1.2 角度与不等式 16
2.1.3 向量投影 17
2.1.4 矩阵基础 18
2.1.5 矩阵乘法 19
2.1.6 方阵的行列式与逆20
2.1.7 方阵的特征值、特征向量、秩和迹 22
2.1.8 奇异值分解 23
2.1.9 (半) 正定实对称矩阵 24
2.2 概率 25
2.2.1 基础 25
2.2.2 联合分布、条件分布与贝叶斯定理 27
VIII 模式识别
2.2.3 期望与方差/协方差矩阵 28
2.2.4 不等式 30
2.2.5 独立性与相关性 30
2.2.6 正态分布 31
2.3 优化与矩阵微积分 32
2.3.1 局部极小、必要条件和矩阵微积分 33
2.3.2 凸优化与凹优化 34
2.3.3 约束优化和拉格朗日乘子法36
2.4 算法复杂度 37
2.5 阅读材料 38
习题 39
第 3 章 模式识别系统概述 42
3.1 人脸识别 42
3.2 一个简单的最近邻分类器 43
3.2.1 训练或学习 43
3.2.2 测试或预测 44
3.2.3 最近邻分类器 44
3.2.4 k-近邻 46
3.3 丑陋的细节 46
3.4 制定假设并化简 49
3.4.1 设计工作环境与设计复杂算法 49
3.4.2 假设与简化 50
3.5 一种框架 54
3.6 阅读材料 55
习题 56
第 4 章 评估 58
4.1 简单情形中的准确率和错误率 58
4.1.1 训练与测试误差 59
4.1.2 过拟合与欠拟合 60
4.1.3 使用验证集来选择超参数62
4.1.4 交叉验证 63
4.2 最小化代价/损失 64
4.2.1 正则化 65
4.2.2 代价矩阵 66
目 录 IX
4.2.3 贝叶斯决策理论 67
4.3 不平衡问题中的评估67
4.3.1 单个类别内的比率67
4.3.2 ROC 曲线下的面积 69
4.3.3 查准率、查全率和 F 值 70
4.4 我们能达到 100%的准确率吗? 72
4.4.1 贝叶斯错误率 72
4.4.2 真实标记 73
4.4.3 偏置-方差分解 74
4.5 对评估结果的信心 77
4.5.1 为什么要取平均?77
4.5.2 为什么要报告样本标准差?78
4.5.3 比较两个分类器 79
4.6 阅读材料 84
习题 84
第二部分 与领域知识无关的特征提取
第 5 章 主成分分析 90
5.1 动机 90
5.1.1 维度与内在维度 90
5.1.2 降维 92
5.1.3 PCA 与子空间方法92
5.2 PCA 降维到零维子空间 93
5.2.1 想法-形式化-优化实践 93
5.2.2 一个简单的优化 94
5.2.3 一些注释 94
5.3 PCA 降维到一维子空间 95
5.3.1 新的形式化 95
5.3.2 最优性条件与化简96
5.3.3 与特征分解的联系97
5.3.4 解98
5.4 PCA 投影到更多维度99
5.5 完整的 PCA 算法 99
X 模式识别
5.6 方差的分析 100
5.6.1 从最大化方差出发的 PCA102
5.6.2 一种更简单的推导 103
5.6.3 我们需要多少维度呢? 103
5.7 什么时候使用或不用 PCA 呢? 104
5.7.1 高斯数据的 PCA 104
5.7.2 非高斯数据的 PCA 105
5.7.3 含异常点数据的 PCA 106
5.8 白化变换106
5.9 特征分解与 SVD 107
5.10 阅读材料 107
习题 107
第 6 章 Fisher 线性判别 111
6.1 用于二分类的 FLD 112
6.1.1 想法: 什么是隔得很远呢 112
6.1.2 翻译成数学语言 114
6.1.3 散度矩阵与协方差矩阵 115
6.1.4 两种散度矩阵以及 FLD 的目标函数 116
6.1.5 优化 117
6.1.6 等等, 我们有一条捷径! 118
6.1.7 二分类问题的 FLD118
6.1.8 陷阱: 要是 S_W 不可逆呢 119
6.2 用于多类的 FLD 120
6.2.1 稍加修改的符号和 S_W 120
6.2.2 S_B 的候选 121
6.2.3 三个散度矩阵的故事 121
6.2.4 解 122
6.2.5 找到更多投影方向 122
6.3 阅读材料123
习题 123
目 录 XI
第三部分 分类器与其他工具
第 7 章 支持向量机 128
7.1 SVM 的关键思想 128
7.1.1 简化它! 简化它! 简化它!129
7.1.2 查找最大 (或较大) 间隔的分类器 130
7.2 可视化并计算间隔 131
7.2.1 几何的可视化 131
7.2.2 将间隔作为优化来计算 132
7.3 最大化间隔 133
7.3.1 形式化 133
7.3.2 各种简化 134
7.4 优化与求解 136
7.4.1 拉格朗日函数与 KKT 条件 136
7.4.2 SVM 的对偶形式137
7.4.3 最优的 b 值与支持向量138
7.4.4 同时考虑原始形式与对偶形式 140
7.5 向线性不可分问题
|
內容試閱:
|
前言
模式识别是从输入数据中自动提取有用的模式并将其用于决策的过程, 一直以来都是计算机科学及相关领域的重要研究内容之一. 当前受到高度重视的深度学习技术, 其应用主要也是各种模式识别任务. 模式识别在社会生活的各个方面均有广泛的直接应用, 而相关的人才缺口却相当大, 也就是说, 我们为加强模式识别及相关领域的人才培养添砖加瓦是很有必要的.
本书作为模式识别领域的入门教材, 目的就是介绍模式识别中的基础知识、主要模型及热门应用, 通过理论学习和动手实践相结合的形式使初学者能有效入门, 并培养独立解决任务的能力, 为模式识别的项目开发及相关科研活动打好基础.
在模式识别领域中已经出版了若干经典的中、英文教材, 那么, 是否还需要一本新的教材 (比如你眼前的这一本) 呢?
受诸多因素 (例如深度学习的广泛普及) 影响, 目前模式识别体现出一些与 10 年前较为不同的特性,而本领域的一些经典教材大多出版于 10 年之前. 因此, 本书除了在最后一章介绍了卷积神经网络这一主要的深度学习模型之外, 还在各处给出近年来本领域一些新的成果和观点.
然而, 作为一本入门教材, 笔者的主要目的亦本书最大的特点是: 即便某些读者在数学知识和其他相关背景知识方面的基础一般, 甚至薄弱, 本书通过使用示例、图解、强调方法的来龙去脉 (意图、用途、适用条件)、不省略任何推导步骤、适时补充背景知识及鼓励动手实践等方式, 力图使这些基础有所欠缺的读者也能顺利理解书中的内容!
本书第 14 章可作为一个例子来说明上述特点. 期望最大化 (EM) 方法在模式识别与机器学习领域均非常重要. 然而, 在经典教材 [20] 中, EM 方法只占了 7 页, 而其核心的数学推导部分甚至仅用了 2 页的篇幅加以说明!笔者就曾经试图用 [20] 的内容来向一位朋友 (美国相关专业排名前 10 某学校的一位博士)解释 EM 方法, 结果很令人沮丧. 这样简练的教材或许适合一些有经验的读者抑或是天才的读者, 却未必普遍适用于大多数教程所面向的读者群体.
在本书第 14 章中, 我们首先通过一个实例 (高斯混合模型, GMM) 来引入 EM 方法, 介绍其必要性和主要的思路, 从而为 EM 方法的形式化建模铺平道路; 然后, 对这个形式上很短小精干的算法, 以该实例为例, 详尽地揭示每一步的推导步骤及其含义; 最后, 水到渠成地得到 GMM 的 EM 更新公式. 在这章的一道习题中, 我们要求读者在不借助于教材内容的前提下, 独立完成所有的推导; 在另外一道习题中, 我们分步骤给出足够的提示, 希望读者能独立推导 Baum-Welch——另一个经典算法的 EM 更新公式. 对于同样的 EM 主题, 笔者使用了 15 页的篇幅, 相信这样的安排不仅有助于读者较容易地学会 EM 方法, 还可以帮助他们深入理解其思想与优缺点, 甚至能够有所推广.
具体来说, 本书在写作时希望实现以下几点:
. 强调可读. 通过增加样例 (包括图例)、解释意图、详细推导 (不省略任何中间步骤) 等方法, 力图使得中等水平的读者可以完全理解课程内容, 包括一些相对复杂的数学推导. 本书在专用名词首次出现的时候提供其对应的英文词组, 并在书末提供了中文和英文两个索引, 以便读者建立中英文专业术语之间的对应关系. 同时, 本书的第 2 章简要总结了本科数学教学中对本书有用的一部分知识,并额外补充了一些必要的数学知识.
. 注重实践. 模式识别是一门实践性很强的学科, 笔者在教材章节, 尤其是习题中注意培养学生的动手能力, 并强调一些理论推导涉及不到但在实践中却极其重要的实现细节. 本书的习题中有若干需要读者自行安装软件、阅读文档并编程解决的问题. 本书的大部分习题由笔者设计完成, 设计习题大概花了一年的时间. 如果想完全理解课程内容, 完成每章的习题是非常重要的.
. 拓广视野. 笔者注重从学科整体而不是从单个技术或方法的角度来介绍各章内容. 尽管本书详细介绍的只是经过仔细选择的一些核心内容, 但通常会对其他相关技术的意义、要点及如何获取更多相关知识也进行简要的描述. 例如, 在习题中介绍了指数族 (exponential family)、局部线性嵌入(LLE) 等内容, 并在大多数章的最后一节提供阅读材料的指南.
. 培养能力. 通过样例、推导等潜移默化的手段, 培养学生以下两个方面的能力. 首先, 在面对一个新的问题时, 能够按照问题剖析、产生想法、形式化定义、问题简化、问题研究与解决的经典步骤, 独立解决问题; 其次, 通过拓广视野, 在遇到新的问题 (或子问题) 时, 能够主动发现和利用可用的现有资源 (如软件、文档、产品等) 快速加以解决, 避免自己重复“造轮子”.
一本教材的完成绝非易事. 本书的写作开始于 2013 年秋季, 那时我刚回到母校南京大学任教, 并计划开设一门新课程——模式识别. 本书用英文写作, 迄今已逾 5 年. 这本教材能完成, 笔者必须感谢相当多人士的帮助, 试按大致的时间先后顺序致谢如下:
. 南京大学计算机系、人工智能学院、LAMDA 研究所的领导、同事与同学们. 校系两级领导在科研环境甚至生活环境等各方面提供了一个宽松的氛围, 他们还允许我结合自己的研究兴趣开设一门新课程. 此前在新加坡任教时必须教一门自己完全不感兴趣的课程, 这一经历让我深恶痛绝, 所以我在 “模式识别” 课程上倾注了极大的热情. 机器学习与数据挖掘 (LAMDA) 研究所提供了一个极优秀的科研环境, 与所长周志华教授、其他同事以及研究生同学间的讨论、合作也让我很快安定下来, 有足够的时间可以从事科研与教学 (包括写这本书). 事实上, LAMDA 研究所聘请的科研助理也功不可没——否则, 我大概要把所有写作本书的时间都花在报销手续上了.
. 选修 “模式识别” 课程的同学们. 在本书最初的几章草稿发布后, 他们的热情反馈是支撑我继续写下去的动力, 而在教学过程中的不断交流显然有助于随时调整本书的方向、内容与细节. 这几年课上的同学还为本书指出了大量的错误和笔误. 笔者将在本书配套的主页详细致谢每位曾为本书各稿纠错的读者. 由于篇幅所限, 详细名单此处暂从略.
. 我所指导的研究生们. 正是由于我们共同的努力, 研究组的科研工作能够正常开展, 从而使得我有额外的时间来写这本教材; 同时他们也常常是本书的第一批读者和纠错者. 谢谢他们!
. 剑桥大学出版社与机械工业出版社的编辑们. 在本书初稿接近完成之时, 剑桥大学出版社的刘泳辰 (David Liu) 先生适时出现, 与笔者商讨由剑桥大学出版社出版本书的事宜, 刘先生的时时来信不断提醒我在本书投入时间, 使其完稿时间大为提前. 而在初稿完成之后不到一个星期, 机械工业出版社华章分社的姚蕾女士从天而降, 很快说服我由机械工业出版社出版中文版, 并商定了远远快于我原本规划的翻译与出版时间表. 事实证明, 她的计划比我更合理、高效, 从而使得本书可以尽早与读者诸君见面——目前英文版合同已经签署, 但书稿的编辑工作尚未最后完成, 而中文版就要面市了. 由于与一般的外文文献翻译成中文的过程颇为不同, 本书的中文版与英文版会存在一些轻微的差异.
. 本书的两位译者. 我指导的两位研究生——罗建豪 (博士研究生, 前 8 章的译者) 与张皓 (硕士研究生, 后 7 章的译者) 在仔细考虑后同意翻译本书. 感谢他们在繁忙的学业与研究工作之余提供高质量的译文!译文由笔者逐字校对、审核和修改.
. 创作TEX系列软件的志愿者们. 在最初开始写作时, 笔者没有发现能够在 Ubuntu 下运行的中文LATEX环境, 正是基于这个近乎可笑的原因, 本书是用英文写作的. 在数年后翻译工作开始时, 两位译者告诉我中文LATEX写作在 Windows 环境中已相当方便, 我仔细研究之后发现其在 Ubuntu 环境下也变得颇为方便. 书中的图和表格均由笔者自行绘制.
. 家人们. 在小儿彬彬出生之前, 这本书的大部分写作是我上班前或下班后在家完成的; 而在彬彬出生尤其是会走路之后, 就只能在办公室或者飞机、火车上抽出时间来进行写作了. 感谢家人对我的一贯支持, 尤其是在彬彬出生之后, 感谢父母、岳父母与太太在育儿方面历经辛苦, 万分感谢!
在努力提高可读性之余, 笔者也已尽力使本书严谨、准确, 但受精力和水平所限, 书中的错误在所难免. 欢迎读者 (例如使用本教材的老师与同学, 以及相关领域的研究和开发人员) 不吝指出书中技术上、文字上或是翻译中的任何错误 (请发送电子邮件至pr.book.wujx@gmail.com). 笔者将在本书配套主页一并致谢.
吴建鑫
于南京
|
|