新書推薦:
《
西周基层地域组织研究
》
售價:HK$
63.8
《
中国土司制度史料集成(全十九册)
》
售價:HK$
5478.0
《
守护健康:纽约市公共卫生制度的构建(1866—1920)
》
售價:HK$
96.8
《
岩体边坡锚固结构体系安全性评价指标体系研究
》
售價:HK$
72.6
《
癌症幸存者的秘密
》
售價:HK$
50.2
《
专业主义 (美)大卫·梅斯特
》
售價:HK$
86.9
《
城市计算 郑宇
》
售價:HK$
130.9
《
赢在常识:巴菲特的投资原则
》
售價:HK$
54.8
編輯推薦:
l 深度探索了基于演化计算的分布式估计算法,并提出了多种深度改进的算法,可推广应用于数据挖掘、智能优化等领域;
l 重点探讨了演化机器学习中的分类器和特征选择问题,提出了一种基于演化的统一框架,可同时优化分类模型和特征子集,显著提升分类算法的性能和效率;
l 从提高搜索质量的角度出发,介绍了基于分布估计算法的学习分类器,可有效提升分类效果。
內容簡介:
本书针对基于演化的机器学习的一些关键问题进行深入探索。全书共20章,分为3篇。
來源:香港大書城megBookStore,http://www.megbook.com.hk 上篇为第1~6章,探索了深度改进的分布估计算法,提出了基于共轭先验分布的两层分布估计算法、带有链接学习的量子演化算法和问题规模自适应的基于分解的多目标分布估计算法。中篇为第7~13章,针对学习分类器与特征选择方法,重点研究两者的融合策略,将学习分类器的分类模型构建过程与特征选择的特征子集搜索过程统一集成在基于演化的机器学习框架下,同时改善了分类算法的预测性能与运行效率。下篇为第14~20章,从提高规则空间的搜索质量出发,立足于分类问题,介绍基于分布估计算法的学习分类器。
本书可作为演化计算、智能优化、大数据及人工智能等专业方向研究生教材,也可供相关领域研究者参考。
目錄 :
上篇深度改进的分布估计算法
第1章上篇导言31.1研究背景3
1.2主要内容4
1.3结构安排5
第2章相关研究综述7
2.1概述7
2.2组合优化问题概述7
2.3单变量分布估计算法综述9
第3章基于共轭先验分布的单模分布估计算法14
3.1概述14
3.2Beta分布与二项分布15
3.3两层分布估计算法16
3.3.1算法框架16
3.3.2模型更新过程19
3.4测试与实验20
3.4.1测试问题20
3.4.2参数研究22
3.4.3实验设置24
3.4.4实验结果24
3.5本章小结31目录 演化机器学习(第2版)〖2〗〖2〗 〖1〗 第4章基于信息熵的多模分布估计算法32
4.1概述32
4.2概念引导组合算子32
4.3基于概念引导组合算子的多模分布估计算法34
4.3.1算法框架34
4.3.2坍缩个体的生成过程36
4.4测试与实验38
4.4.1测试问题38
4.4.2实验设置41
4.4.3实验结果43
4.5本章小结45
第5章基于分解的多目标分布估计算法47
5.1概述47
5.2基于分解的多目标演化算法框架47
5.2.1分解方法47
5.2.2MOEA/D框架48
5.3规模自适应生成算子49
5.4测试与实验52
5.4.1测试问题52
5.4.2参数研究53
5.4.3实验设置与性能指标53
5.4.4实验结果55
5.5本章小结58
第6章上篇总结与展望59
6.1主要工作和结论59
6.2未来研究工作展望60
中篇内嵌特征选择的学习分类器
第7章中篇导言637.1研究背景63
7.2主要内容65
7.3结构安排66
第8章相关工作综述68
8.1概述68
8.2学习分类器研究综述68
8.2.1进化计算概述69
8.2.2基于遗传的机器学习思想概述70
8.2.3Michigan式学习分类器研究进展71
8.2.4Pittsburgh式学习分类器研究进展72
8.3特征选择方法综述74
8.3.1特征选择的问题描述75
8.3.2特征选择的搜索模型76
8.3.3特征选择的主要方法77
8.4本章小结80
第9章基于Memetic算法的WrapperFilter特征选择方法81
9.1概述81
9.2Memetic算法概述81
9.2.1Memetic算法思想起源82
9.2.2Memetic算法框架83
9.3混合式WrapperFilter特征选择方法85
9.3.1算法设计思想85
9.3.2算法整体框架86
9.3.3全局搜索的GAWrapper算法设计87
9.3.4局部搜索的ReliefF算法设计88
9.3.5计算复杂度分析90
9.4本章小结91
第10章基于合作式协同进化内嵌特征选择的学习分类器92
10.1概述92
10.2协同进化算法概述92
10.2.1协同进化思想起源93
10.2.2竞争式协同进化算法94
10.2.3合作式协同进化算法95
10.3基于合作式协同进化的学习分类器算法设计96
10.3.1算法设计思想96
10.3.2算法整体框架97
10.3.3分类器演化的Pittsburgh式学习分类器算法设计99
10.3.4计算复杂度分析100
10.4本章小结101
第11章算法评估结果与分析102
11.1概述102
11.2算法比较实验框架102
11.2.1Benchmark数据集102
11.2.2性能评估指标104
11.2.3实验方法104
11.3MFS算法实验105
11.3.1算法参数设置105
11.3.2实验结果与讨论106
11.4CoCoLCS_MFS算法实验107
11.4.1算法参数设置107
11.4.2实验结果与讨论108
11.4.3显著性检验109
11.5特征选择对学习分类器的影响分析110
11.5.1分类准确率110
11.5.2运行时间111
11.5.3特征约简率112
11.5.4显著性检验113
11.6本章小结113
第12章基于混合式GVNS算法的多处理器任务调度研究115
12.1概述115
12.2多处理器任务调度综述115
12.2.1研究背景116
12.2.2多处理器任务调度问题模型117
12.2.3多处理器任务调度算法118
12.3基于启发式的混合式GVNS调度算法的总体设计121
12.3.1混合式设计的算法思想121
12.3.2算法整体框架121
12.4任务优先级定序的启发式策略123
12.5全局搜索的遗传算法设计124
12.5.1种群个体的基因编码124
12.5.2种群初始化与个体适应度评估124
12.5.3遗传操作设计125
12.6局部搜索的变邻域搜索算法设计126
12.6.1算法流程126
12.6.2邻域结构设计127
12.6.3局部搜索128
12.7算法实验129
12.7.1性能评估指标与参数设置129
12.7.2确定图上的结果130
12.7.3随机图上的结果133
12.7.4显著性检验135
12.7.5局部搜索有效性分析136
12.8本章小结137
第13章中篇总结与展望138
13.1主要工作和结论138
13.2未来研究工作展望139
下篇分布估计的学习分类器
第14章下篇导言14314.1研究背景143
14.2主要内容145
14.3结构安排147
第15章分布估计算法和学习分类器148
15.1概述148
15.2进化计算148
15.3遗传算法149
15.4分布估计算法151
15.4.1分布估计算法的基本流程151
15.4.2分布估计算法分类152
15.5学习分类器153
15.5.1Michigan式学习分类器153
15.5.2Pittsburgh式学习分类器154
第16章基于L1正则化贝叶斯网络的分布估计算法157
16.1概述157
16.2L1正则化贝叶斯网络158
16.2.1贝叶斯网络与L1正则化158
16.2.2候选链接关系建立160
16.2.3剪枝搜索162
16.3L1正则化贝叶斯网络与分布估计算法整合164
16.4实验设置165
16.4.1测试函数165
16.4.2参数设置167
16.5优化性能比较168
16.5.1第一组实验168
16.5.2第二组实验170
16.6模型比较180
16.6.1测试函数的理想模型180
16.6.2模型复杂度比较181
16.6.3模型准确度比较183
16.7本章小结187
第17章基于分布估计算法的分类器进化算法188
17.1概述188
17.2算法框架介绍189
17.3分类器的知识表示189
17.4规则进化191
17.4.1规则评价191
17.4.2规则重组192
17.5规则集进化194
17.5.1规则集评价194
17.5.2规则集重组194
17.6规则与规则集进化整合195
17.7实验设置196
17.7.1测试数据196
17.7.2比较对象199
17.7.3评价指标200
17.7.4参数设置201
17.8实验结果202
17.8.1构造问题202
17.8.2实际问题210
17.8.3参数敏感度分析218
17.9本章小结220
第18章面向学习分类器的嵌入式特征选择算法221
18.1概述221
18.2本章相关工作222
18.3算法框架介绍223
18.4嵌入式特征选择算法223
18.4.1特征冗余度计算223
18.4.2特征关联度计算224
18.5特征选择与学习分类器整合226
18.6实验设置228
18.6.1测试数据228
18.6.2比较对象229
18.6.3评价指标229
18.6.4参数设置230
18.7实验结果230
18.7.1构造问题230
18.7.2实际问题232
18.7.3参数敏感度分析240
18.8本章小结242
第19章基于进化纠错输出编码的多分类算法243
19.1概述243
19.2纠错输出编码方法简介244
19.3编码矩阵设计245
19.3.1编码矩阵评价245
19.3.2优化方法248
19.4解码策略248
19.5实验设置250
19.5.1测试数据250
19.5.2比较对象251
19.5.3评价指标与参数设置251
19.6实验结果251
19.6.1分类准确率251
19.6.2训练开销253
19.6.3结果复杂度与特征约简率255
19.6.4纠错输出编码性能257
19.7本章小结259
第20章下篇总结与展望260
20.1主要工作和结论260
20.2未来研究工作展望261
参考文献262
附录A缩略语280
图索引284
表索引287
內容試閱 :
近年来,一种名为学习分类器系统(Learning Classifier System,LCS,以下简称学习分类器)的机器学习新范式吸引了越来越多的研究者的注意。总的来说,学习分类器基于规则归纳的思想,主要致力于解决分类问题。在学习分类器中,处于中心地位的规则学习单元通常是演化计算中的遗传算法,因此在一些文献中又将其称为基于遗传的机器学习。通过将学习性能指标定义为优化目标函数,学习分类器实质上将作为学习问题的分类任务转化为传统的优化问题进行求解,继而基于遗传算法的全局优化能力确保规则知识表示的假设空间中一定强度的随机化搜索,以期在合理的运算时间内收敛到较优性能的问题解,从而更好地平衡了算法性能与计算效率的矛盾。
遗传算法是现代启发式算法的典型代表之一。这类算法与最优算法不同,并不以求得最优解为目的,而是在一个可以接受的计算代价下得到问题的一个可行解。分布估计算法是近年来被提出并逐步发展起来的一类演化算法。与遗传算法不同,分布估计算法不再使用交叉、变异等来源于生物学的概念,而是将概率模型及其演化作为算法的核心,不同的概率模型和不同的模型演化策略塑造了不同的分布估计算法。基于先进的分布估计算法与学习分类器融合,从而打造优异的学习分类器,也是机器学习领域发展的重要趋势之一。
在实际的学习分类器中,存在以下主要问题: 首先,在基础演化优化方法层面,学习分类器所依赖的分布估计算法仍然面临着遗传漂移与多样性保持、全局搜索和局部搜索平衡、变量之间依赖关系的有效学习等问题;其次,在学习分类器的应用层面,在真实场景中采集的原始数据不可避免地包含冗余乃至噪声的属性信息,这些不相关的特征将对学习分类器算法的学习性能与计算效率造成负面影响;最后,在实际应用中的学习性能方面,学习分类器以显式规则表示目标概念,在监督学习或强化学习机制的基础上,利用演化算法对规则空间进行搜索,从而完成学习任务,规则空间的有效搜索是影响学习分类器性能的关键。针对上述问题,本书分为上、中、下三篇,分别对学习分类器中的重要内容加以介绍。上篇为第1~6章,重点介绍典型的组合优化方法——分布估计算法的最新进展,深入探索了深度改进的分布估计算法,提出了基于共轭先验分布的两层分布估计算法、带有链接学习的量子演化算法和问题规模自适应的基于分解的多目标分布估计算法。中篇为第7~13章,重点介绍学习分类器与特征选择方法,重点对两者的整合研究内容加以介绍,将学习分类器的分类模型构建过程与特征选择的特征子集搜索过程统一集成在基于遗传的机器学习框架下,同时改善了分类算法的预测性能与运行效率。下篇为第14~20章,从提高规则空间的搜索质量出发,着眼于分类问题,介绍了基于分布估计算法的学习分类器。相关成果已经在演化计算领域的权威国际会议 ACM GECCO、IEEE CEC和知名国际期刊Information Sciences、Neurocomputing、Applied Soft Computing等上发表。为了能够系统地呈现学术界和笔者团队近年来在演化学习与智能优化领域学习分类器方面的研究成果,本书梳理了相关工作内容并进行了完整论述。
第2版在第1版的基础上扩展了如下基础性的理论内容。针对在基础演化优化方法层面学习分类器所依赖的分布式估计方法仍然面临着遗传漂移与多样性保持、全局搜索和局部搜索平衡、变量之间的依赖关系的有效学习等问题,探索了深度改进的分布估计算法,提出了基于共轭先验分布的两层分布估计算法(THEDA)、带有链接学习的量子演化算法(QEALL)和问题规模自适应的基于分解的多目标分布估计算法(sMEDA/D)。
笔者的研究团队将继续梳理和归纳总结相关的最新研究成果,以演化学习与智能优化系列学术专著的形式呈献给读者。本书既可以作为演化学习、智能优化等专业方向的研究生教材,也可以作为优化调度、演化学习、智能系统等领域的系统与产品研发的理论方法参考书。本书相关资料(算法、代码、数据集等)可在开源社区下载(下载地址可查阅THUAIR官网或联系作者索取)。由于演化学习领域的学习分类器是一个快速发展的崭新研究领域,限于笔者的学识和知识,书中不足之处在所难免,笔者衷心地希望读者提出宝贵的意见和建议。
本书中介绍的相关研究工作得到国家自然科学基金项目(编号为61673235、61175110、60875073、60575057)的持续资助。在本书编写过程中,清华大学计算机科学与技术系智能技术与系统国家重点实验室陈小飞、黄嘉宇等同学做了大量书稿整理工作。本书内容中也包含了温赟、杨甲东、王勃、袁源等同学在相关研究方向上与笔者持续合作的创新工作成果。笔者感谢各位团队成员的努力。
徐华2024年10月于清华大学