新書推薦:

《
近三十年新中国史研究前沿问题
》
售價:HK$
107.8

《
中国社会各阶层分析
》
售價:HK$
96.8

《
纯粹·破壁与神游
》
售價:HK$
90.2

《
春秋大义:中国传统语境下的皇权与学术(新版)
》
售價:HK$
96.8

《
女人们的谈话(奥斯卡金像奖最佳影片提名、最佳改编剧本奖 原著!)
》
售價:HK$
61.6

《
忧郁的秩序:亚洲移民与边境管控的全球化(共域世界史)
》
售價:HK$
140.8

《
一周一堂经济学课:为了更好地理解这个世界
》
售價:HK$
107.8

《
慢性胃炎的中医研究 胃
》
售價:HK$
657.8
|
編輯推薦: |
全书按学科知识和认知规律合理布局,有利于系统掌握模式分析各主流方法的学术内涵与之间关系。
重论述各模式分析方法基本原理和相应核方法,上下贯通,益于深入掌握知识与方法。
以模块化结构论述各类模式分析方法,各部分虽然有关联论述,但是相对完整独立,便于快学快用。
深入论述各模式分析方法的学术思想和理论分析。
|
內容簡介: |
模式分析的主要任务是了解数据源或数据集的内在结构、关系和规律,并运用学习后的分析系统对新的数据进行预测预判,或根据已有模式知识进一步了解更深层次的知识。本书第1章宏观介绍模式分析。第2章主要论述模式分析的基本原则与策略;集中度、容量、VC维、Rademacher理论,它们是模式分析的顶层思想和泛化错误率分析的基础理论。第3章给出后面各章节共用的核函数与核映射空间知识。在前面3章的基础上,续而讨论具体的模式分析与核方法,各章节首先比较详细地论述基本原理和方法,然后利用核函数有关理论或核技巧“平滑过渡”到核映射空间中的模式分析。第4章论述数据分析与模式分析,包括: 矩阵奇异值分解与广义本征分解;Fisher判别分析;主成分分析;相关分析;回归分析等。第5章论述支持矢量机,包括: 硬间隔支持矢量机;软间隔支持矢量机;支持矢量机的泛化错误率;训练样本具有不确定性的支持矢量机;样本类内缩聚与两类样本数不均的补偿。第6章论述支持矢量数据描述,包括: 包含全部样本的最小球;包含大部分样本的最优球;样本加权的支持矢量数据描述;小球大间隔SVDD;最优椭球数据描述;基于距离学习和SVDD的判别方法。第7章论述支持矢量回归,包括: 岭回归;一范数ε不敏损失支持矢量回归;二范数ε不敏损失支持矢量回归。第8章论述核函数的优化,包括: 基于误差界的核函数参数寻优方法;核极化方法;核调准方法;根据核矩阵估计可分性与二范数SVM核调准;核映射空间的Fisher判据;基于Fisher准则的扩展数据相关核函数的优化算法;多核学习。
本书可供信息、控制、数据科学、人工智能、计算机类及其他相关专业和研究方向的研究生、本科高年级学生作为关于信息分析、检测、识别、知识发现的教材或教学参考书,也可作为有关科技人员的科研参考书。
|
目錄:
|
第1章绪论1
1.1概述1
1.2模式识别4
1.2.1模式识别系统5
1.2.2模式识别的基本方法6
1.3数据分析10
1.3.1Fisher判别分析10
1.3.2主成分分析10
1.3.3典型相关分析11
1.3.4回归分析11
1.4本书各章主要内容及其关系12
参考文献12
第2章模式分析的原则与策略13
2.1利用类域界面分类原理和多类分类策略13
2.1.1特征矢量和特征空间13
2.1.2用判别域界面方程分类的概念14
2.1.3线性判别函数14
2.1.4两类问题15
2.1.5多类问题15
2.1.6判别函数值的大小、正负的鉴别意义18
2.1.7权空间、解矢量与解空间19
2.1.8球面分类界面和椭球面分类界面21
2.2模式分析的基本原则22
2.2.1没有免费午餐定理23
2.2.2丑小鸭定理25
2.2.3最小描述长度原理26
2.2.4误差中偏差和方差的分析28〖3〗模式分析与其核方法目录〖3〗2.3集中度、容量、VC维、Rademacher理论32
2.3.1集中度、容量、Rademacher复杂度33
2.3.2VC维36
2.4经验风险最小化、结构风险最小化38
2.5错误率的实验估计41
2.5.1交叉验证法41
2.5.2从学习曲线估计错误率44
2.6Akaike信息准则与贝叶斯信息准则46
2.6.1Akaike信息准则46
2.6.2贝叶斯信息准则48
2.7预测器选择的统计方法50
2.7.1小差别错误率的分类器选择的统计检验50
2.7.2预测器可靠性度量51
参考文献52
第3章核函数与核映射空间53
3.1核函数与核映射53
3.1.1核函数、希尔伯特空间54
3.1.2Mercer定理58
3.1.3再生核理论59
3.1.4核矩阵在核方法中的作用63
3.2核函数的运算——构造新的核映射空间64
3.3核映射空间中一些量值的核函数表示67
参考文献71
第4章数据分析73
4.1矩阵奇异值分解与矩阵广义本征分解73
4.1.1矩阵奇异值分解73
4.1.2矩阵广义本征分解77
4.2Fisher判别分析79
4.2.1Fisher判别分析的原理79
4.2.2FDA的奇异问题83
4.2.3多类问题中Fisher方法的其他几种准则84
4.2.4多类问题行比准则的Fisher分析方法85
4.2.5采用型比准则的Fisher迭代算法86
4.2.6采用迹比准则的Fisher迭代算法87
4.2.7采用差迹准则的Fisher迭代算法88
4.2.8核映射空间中的Fisher方法88
4.2.9正则化核Fisher判别分析89
4.3局部均值判别分析92
4.3.1局部均值判别92
4.3.2加权LMDA 93
4.3.3核局部均值判别94
4.3.4加权KLMDA96
4.4主成分分析97
4.4.1主成分分析原理与性质98
4.4.2核映射空间中的主成分分析108
4.4.3KPCA性能稳定性分析110
4.4.4PCA的应用112
4.5两个数据集间的相关分析115
4.5.1基于协方差和双PCA的两数据集相关分析115
4.5.2典型相关分析120
4.6回归分析129
4.6.1线性回归129
4.6.2主成分回归131
4.6.3基于两数据集协方差阵奇异值分解的回归133
4.6.4偏最小二乘回归133
4.7聚类分析143
4.7.1概述143
4.7.2C均值算法145
4.7.3改进的C均值算法148
4.7.4核映射空间中C均值聚类150
4.7.5最大间隔聚类方法151
4.8基于流形学习的数据降维161
4.8.1数据降维 161
4.8.2流形与流形学习162
4.8.3拉普拉斯本征映射164
4.8.4局部保持映射算法165
4.8.5核局部保持映射算法166
参考文献168
第5章支持矢量机171
5.1概述171
5.2硬间隔支持矢量机174
5.2.1线性支持矢量机174
5.2.2非线性支持矢量机178
5.2.3硬间隔支持矢量机泛化错误率181
5.3软间隔支持矢量机182
5.3.1软间隔线性支持矢量机182
5.3.2l1软间隔支持矢量机184
5.3.3l1软间隔支持矢量机的泛化错误率190
5.3.4l2软间隔支持矢量机及其泛化界194
5.4训练样本具有不确定性的支持矢量机198
5.5样本类内缩聚与两类样本数不均的补偿200
5.5.1核映射空间中样本类内缩聚200
5.5.2两类训练样本数目不均情况下的惩罚系数补偿201
参考文献202
第6章支持矢量数据描述204
6.1概述204
6.2包含全部点集的最小球206
6.2.1包含全部样本的最小球206
6.2.2包含核映射空间中全部样本的最小球208
6.2.3基于SVDD异常检测的统计特性211
6.3包含大部分点集的最优球212
6.3.1包含大部分样本的最优球212
6.3.2包含核映射空间大部分样本的最优球215
6.3.3ν软界最优球221
6.3.4软界最优球算法的检测性能221
6.3.5软界最优球面与广义最优平面的关系222
6.4样本加权的支持矢量数据描述224
6.4.1样本加权SVDD224
6.4.2样本的权重225
6.5小球大间隔SVDD226
6.6数据域最优椭球描述229
6.6.1最优椭球数据描述229
6.6.2核映射空间中椭球数据描述与检测231
6.7基于距离学习和SVDD的判别方法234
6.7.1距离测度学习235
6.7.2新类的设定236
6.7.3最优球面作为已给类别的边界描述236
6.7.4描述球重叠情况下的样本识别238
6.7.5从新类候选样本集发现新类子集238
6.8支持矢量数据描述的研究概要239
参考文献241
第7章支持矢量回归245
7.1岭回归245
7.1.1基本岭回归方法245
7.1.2核岭回归方法247
7.2一范数ε不敏损失支持矢量回归248
7.2.1ε不敏损失函数248
7.2.2一范数ε不敏损失的SVR249
7.2.3ε不敏损失的SVR的另一种表达251
7.2.4一范数ε不敏损失的νSVR251
7.2.5一范数ε不敏损失的SVR的泛化性能252
7.3二范数ε不敏损失支持矢量回归253
参考文献255
第8章核函数的优化257
8.1核函数的基本性质258
8.1.1高斯核函数258
8.1.2多项式核函数259
8.1.3ANOVA核函数260
8.2基于误差界的核函数参数寻优方法260
8.2.1留一法错误率的上界261
8.2.2SVM中核函数参数梯度法寻优264
8.2.3SVR中核函数参数梯度法寻优265
8.3核极化方法266
8.4核调准方法269
8.5根据核矩阵估计可分性与二范数SVM核调准270
8.6核映射空间的Fisher判据272
8.7基于Fisher准则的数据相关核函数的优化方法274
8.7.1数据相关核函数274
8.7.2经验特征空间275
8.7.3基于Fisher准则的扩展数据相关核函数的优化算法276
8.8多核学习277
参考文献279
|
內容試閱:
|
人们在日常生活、社会活动、生产科研及工作学习中,很多思维和智能都可归结为预测预判,其中大多数是类型预判和数值预测。人们希望机器具有智能并能代替人类完成智能工作,知识是智能的基础,机器学习是指机器系统利用外部样例数据通过运行分析算法提高完善目标算法的性能,或获取机器能实行智能行为的知识。从样例数据提取知识的方法称为基于数据的方法或数据驱动的方法。人们的工作、学习、生活中充满了各种类型、规模和复杂性的数据,从数据中学习,了解事物,获得知识,数据就是资源,经过物理系统就能转化成能量、物质。由于其重要性并涉及众多学科专业,国内外许多大学相继设立了数据科学专业,使用科学的方法系统地从结构化或非结构化数据中提取知识并加以利用。数据科学内容非常宽泛,涉及数据获取、数据存储、数据管理、数据分析,知识挖掘、知识利用。本书只涉及其核心内容,讨论模式分析与核方法。模式分析的主要任务是应用计算机系统,运用数学原理和方法、根据领域知识分析了解数据源或数据集内在结构、关系和规律,及以模式形态表达它们,并用获得知识对未来数据预测预判。模式分析主要涵盖数据分析、模式识别。现在线性理论和方法已相当成熟和完善,但很多事物的结构、关系和规律是非线性的,将成熟的线性理论和方法与适应性强的非线性方法相结合,无疑是一个很好的途径,模式分析中的核技巧、核技术可以说是线性理论和方法与非线性处理间的桥梁,核函数可以快捷地直接将线性模型和方法转化成高维空间的线性模型和方法,但相对原来数据空间是非线性的模型和方法,其具有坚实的理论基础,又有理想的实际效果,同时还有便捷的使用方法。模式分析是机器学习、人工智能的核心理论和技术之一,属于人工智能范畴,人工智能理论、方法的完善与广泛应用将引发重大的科技和产业革命。对复杂大规模数据的模式分析通常运用机器学习的方法,这是现代模式分析的一个重要属性。
本书顶层设计的思考是: 本书更适宜沉下心来系统学习知识、提高能力、致力创新的读者,其内容涵盖模式分析的各主流理论和技术,在论述上力图让技术与理论关联,缩小它们间的距离;撰写中,优化布局,优化内容,优化表达,尽量使读者学习效率极大化、成本极小化,扩大受众面,极大化知识用场。为使读者容易进入模式分析学习和应用中,本书内容展开的起点低置;目标高企,使读者最终达到较高的专业学养;内容深化展开梯度较大。基于我们一贯秉持的原则性观点和方法,本书具有下述特点。
(1) 注重基础。打好基础是教育经验的总结,也是科技高速发展的需要,本书注重强化基本概念、基本思想、基础理论、基本方法。只有灵活掌握了基本而有用的知识,读者才能在日后的学习和科研中有“后劲”、持续前进,能以“不变”应“万变”,应对科技发展日新月异的挑战,能在浩瀚的知识海洋中畅游,始终能处于科技潮流的前沿。
〖3〗模式分析与其核方法前言〖3〗(2) 结构合理清晰。合理清晰的学科知识表述体系有益于读者对各种理论、方法的理解和记忆,有益于对知识的掌握和创新。本书内容组织呈现层次化、树状化、模块化。各章节都尽量遵循由浅入深、先易后难、先具体后抽象来安排;各章间、各方法技术既相对完整独立,又有联系,融会贯通形成整体。结构模块化便于科技工作者快捷学习、掌握和使用,可提高阅读和应用效率。
(3) 内容选材考究。模式分析是一门相当活跃的重要学科,涉及的理论广泛、方法丰富,发展迅速,新理论、新方法、新应用不断涌现。本书以具有当前或潜在的理论、学术意义或应用价值作为取材标准,并且处理好本书内容与其他学科知识的关系。在众多知识中选取那些或具基础理论性,或具思维训练性,或具有效实用性,或具思想启发性,或具前瞻代表性的重要内容。模式分析内容丰富、方法众多,其他的重要方法,如半监督学习、流形学习、深度学习、迁移学习、增强学习等将在后续出版的有关机器学习的著作中讨论。
(4) 注重讲“理”,突出学术思想。为使读者真正掌握学科知识、提高解决问题能力,培养创新思维,在阐明知识时,不仅讲其然还要讲其所以然。本书较系统地阐述了模式分析的主流知识、重要的专业思维、必要的数学手段及解决一般性问题方法,并着重论述模式分析的原理与核方法,侧重各种模式分析方法原理的讨论。
(5) 重视学习效率。基于模式分析的学科特点和一般的学习规律,为了知识系统性和完整性,书中收录了重要文献的研究成果,并用严谨易懂的语言阐述。为了学习深入便捷,有些知识复习回述,或以“注”的方式补充、解释一些知识。本书注意理论严密性与表述易懂性的统一,力求各部分在内容深浅上大致达到均衡,对一些通常认为较“简单”的内容,尽量挖掘其理论依据,使之有理论深度,对涉及较深奥理论的内容,在严谨前提下尽量用平实直白的语言论述,避免不必要的符号猜解和复杂推导而淡化更为重要的基本概念、学术思想和技术思路。
(6) 详略得当。本书涉及的知识面较广,对重要的主干理论和方法论述清楚、说深说透;而对相关的、类似的或不“稳定”的内容,或受限于知识层次的内容,则适当论述或点到为止,这样既实现了知识在面上的宽广,又达到知识点处的理论深度,通过自己创造性思维的“内插和外延”可以扩张成更大的“知识体”。
本书的主要内容如下。
第1章绪论是顶层论述,展现模式分析领域的概貌,首先概述模式识别,然后概述数据分析。第2章论述模式分析的原则与策略,用于指导研发和分析具体模式分析方法的顶层思维,包括: 类域界面分类原理和多类分类策略;模式分析的基本原则和策略;集中度、容量、VC维、Rademacher理论,它们是后续的模式分析的泛化误差的理论基础;介绍了经验风险和结构风险最小化设计思想;论述了错误率的实验估计,以及模型选择的原则方法。第3章给出后面各章节共用的核知识,主要内容是: 核函数与核映射空间基本知识;核映射空间中某些量值的核函数表示。在前面3章基础上,接下来讨论具体的模式分析与核方法,各章节首先比较详细地论述基本原理和方法,然后利用核函数有关理论或核技巧“平滑过渡”到核映射空间中的模式分析。第4章论述数据分析,包括: 矩阵奇异值分解与广义本征分解; Fisher判别分析;主成分分析;基于PCA的两个数据集间相关分析;回归分析等。第5章论述支持矢量机,解决小子样的识别问题,内容包括: 硬间隔支持矢量机;软间隔支持矢量机;支持矢量机的泛化错误率;训练样本具有不确定性的支持矢量机;改善训练样本集缺陷的一种补偿方法。第6章论述支持矢量数据描述,其是支持矢量机的变体,内容包括: 包含全部样本的最小球——硬界最优球;包含大部分样本的最优球——软界最优球;样本加权的支持矢量数据描述;小球大间隔SVDD;数据域的最优椭球描述;基于距离学习和最优球的判别和检测方法。第7章论述支持矢量回归,内容包括: 岭回归;一范数ε不敏损失支持矢量回归;二范数ε不敏损失支持矢量回归。第8章论述基本的核函数优化方法,内容包括: 基于误差界的核函数参数寻优方法;核极化方法;核调准方法;根据核矩阵估计可分性与二范数SVM核调准;核映射空间的Fisher判据;基于Fisher准则的数据相关核函数的优化方法;多核学习。
基于本书结构和论述特点,读者根据自己情况可以从本书不同处切入阅读学习,总体上讲,本书阅读学习路线图:
本书是我们将要出版的《现代模式识别》(第3版)和《机器学习》的姊妹篇,它们相对比较完整地覆盖此领域的主流知识。
本书属国家科学技术学术著作出版基金资助项目。
感谢国防科技大学电子科学学院及认知通信系对本书撰写和出版给予的大力支持和资助。
感谢清华大学出版社各位编辑认真负责、辛勤细致的工作。
孙即祥2024年于长沙
|
|