新書推薦:

《
软件工程3.0:大模型驱动的研发新范式
》
售價:HK$
109.8

《
肉类料理的194种做法:猪肉、牛肉、羊肉、鸡肉、鸭肉、内脏类料理,全品类覆盖,终结“肉慌”。
》
售價:HK$
43.8

《
兵行诡道:孙子思想精义
》
售價:HK$
63.8

《
极简日本茶道史
》
售價:HK$
85.8

《
法律人AI实操指南进阶版
》
售價:HK$
68.2

《
分镜设计:脚本、镜头语言与AI技术应用从入门到精通
》
售價:HK$
108.9

《
钱穆 中国历代政治得失
》
售價:HK$
53.9

《
海外中国研究·秦帝国的诞生
》
售價:HK$
85.8
|
編輯推薦: |
本书遵循教指委相关指导文件和高等院校学生学习规律编写而成。践行四新理念,融入思政元素,注重理论与实践相结合。
|
內容簡介: |
本书分10章介绍了计算机视觉的基本概念、底层视觉信号处理技术、高级计算机视觉技术,以及计算机视觉技术应用等内容。第1章为绪论,介绍了人类视觉与计算机视觉的基本概念,回顾了计算机视觉的发展历史,介绍了经典的计算机视觉理论、主要应用场景和面临的挑战。第2~6章介绍了底层视觉信号处理技术。其中,第2章介绍了图像的表示和处理,第3章介绍了图像的点特征表示,第4章介绍了图像的线特征表示,第5章介绍了图像的区域分割技术,第6章介绍了纹理分析的相关概念和方法。第7~9章介绍了高级计算机视觉技术,包括第7章的摄像机成像模型,第8章的三维重建,第9章的运动分析。第10章介绍了计算机视觉技术在图像分类、目标检测和跟踪等方面的应用。
來源:香港大書城megBookStore,http://www.megbook.com.hk 本书适合作为普通高校人工智能、计算机、自动化等相关专业的教材,也可作为广大从事计算机视觉技术应用研发人员的参考读物。
本书配有电子课件、教学大纲、习题解答、教学案例、数据代码、教学视频等教学资源,欢迎选用本书作教材的教师登录www.cmpedu.com注册后下载,或发邮件至jinacmp@163.com索取。
|
關於作者: |
胡永利,北京工业大学信息学部教授、博士生导师,北京人工智能研究院智能交互研究中心主任,美国卡耐基梅隆大学高级访问学者,入选北京市百千万人才工程,北京市高层次创新创业领军人才。担任中国计算机学会CCF-CV 专委会执行委员、中国图学学会可视化与认知计算专委会委员,多次担任 CVPR、AAAI、IJCAI、ACM MM和ICPR等国际会议程序/技术委员会委员。主要从事计算机视觉、模式识别、机器学习和大数据挖掘等方面的研究工作,近年来关注高维数据流形表示和聚类、多模态数据融合分析、跨媒体智能和交通大数据分析等研究方向。主持国家自然科学基金重点项目、北京市科技计划项目、北京市自然科学基金重点项目等科研项目10 余项。在Science、IEEE TPAMI 等刊物和会议上发表论文150 余篇,其中包括IEEE/ACM汇刊和CCF A 类会议论文50 余篇,ESI 热点论文1篇、ESI高被引论文3 篇。取得国家发明专利授权20 余项。
|
目錄:
|
第1章 绪论 1
1.1 人类视觉 1
1.2 计算机视觉 3
1.3 计算机视觉的发展 4
1.4 经典计算机视觉理论 6
1.5 计算机视觉的应用和面临的挑战 8
本章小结 10
思考题与习题 11
参考文献 11
第2章 图像表示和处理 13
2.1 图像的表示 13
2.2 图像的基本性质 16
2.2.1 距离 16
2.2.2 连通性 17
2.2.3 边缘和边界 18
2.2.4 直方图 19
2.2.5 图像中的噪声 20
2.3 图像处理数学基础 21
2.3.1 卷积 21
2.3.2 傅里叶变换 23
2.4 常用图像处理技术 24
2.4.1 亮度变换 25
2.4.2 直方图变换 25
2.4.3 空域滤波 27
2.4.4 频域滤波 32
2.5 卷积神经网络基础 45
本章小结 47
思考题与习题 48
参考文献 48
第3章 图像的点特征表示 49
3.1 图像点特征介绍 49
3.2 图像关键点检测算法 50
3.2.1 Harris角点检测 50
3.2.2 SIFT关键点检测 52
3.2.3 HardNet点特征学习 56
3.2.4 Key.Net关键点检测网络 60
3.3 图像点特征应用 62
本章小结 64
思考题与习题 65
参考文献 65
第4章 图像的线特征表示 67
4.1 边缘检测 67
4.1.1 边缘和边缘检测 68
4.1.2 微分边缘检测 69
4.1.3 Canny边缘检测 75
4.2 活动轮廓模型(Snake模型) 78
4.3 主动形状模型(ASM) 80
4.3.1 基本原理 80
4.3.2 ASM的建立 81
4.3.3 ASM的形状搜索 82
4.4 Hough变换 84
4.4.1 直线检测 84
4.4.2 曲线检测 86
本章小结 86
思考题与习题 86
参考文献 87
第5章 区域分割 88
5.1 区域分割的概念 88
5.2 传统数字图像区域分割算法 89
5.2.1 阈值分割法 89
5.2.2 区域生长法 91
5.2.3 分裂合并法 92
5.2.4 分水岭算法 93
5.3 基于深度学习的区域分割算法 94
5.3.1 全卷积分割网络 94
5.3.2 U-net分割网络 97
5.3.3 DeepLab系列分割网络 99
5.3.4 预训练大模型分割网络(SAM) 103
本章小结 107
思考题与习题 107
参考文献 108
第6章 纹理分析 109
6.1 纹理的概念 109
6.2 经典纹理分析方法 111
6.2.1 灰度共生矩阵 111
6.2.2 Gabor小波 113
6.3 基于深度学习的纹理分析方法 115
6.3.1 纹理分类网络PCANet 116
6.3.2 基于CNN的纹理合成网络 118
本章小结 120
思考题与习题 121
参考文献 121
第7章 摄像机成像模型 122
7.1 成像原理 122
7.1.1 小孔成像 122
7.1.2 凸透镜成像 123
7.1.3 摄像机成像原理 123
7.1.4 齐次坐标 125
7.2 摄像机成像模型 126
7.3 摄像机标定 129
7.3.1 直接线性变换法(DLT) 129
7.3.2 平面标定法 131
7.3.3 基于一维标定物的标定方法 135
本章小结 136
思考题与习题 137
参考文献 137
第8章 三维重建 138
8.1 三维重建介绍 138
8.1.1 三维重建的目的与任务 138
8.1.2 三维重建的应用 140
8.2 多视几何 140
8.2.1 极几何关系 141
8.2.2 基础矩阵估计 142
8.3 基于立体视觉的三维重建 143
8.3.1 基于SFM的三维重建 143
8.3.2 基于多目立体视觉(MVS)的三维重建 146
8.3.3 基于深度学习的三维重建 152
8.4 其他三维重建技术 155
8.4.1 结构光 155
8.4.2 激光扫描 156
8.4.3 光度立体重建 157
本章小结 160
思考题与习题 160
参考文献 161
第9章 运动分析 162
9.1 运动分析简介 162
9.2 时间差分方法 164
9.3 背景减除法 167
9.3.1 单高斯模型 168
9.3.2 混合高斯模型 169
9.3.3 ViBe算法模型 171
9.3.4 CodeBook算法 172
9.4 光流法 173
本章小结 177
思考题与习题 177
参考文献 177
第10章 计算机视觉应用 179
10.1 图像分类 179
10.1.1 ResNet 180
10.1.2 Vision Transformer 183
10.1.3 图像分类数据集介绍 185
10.2 目标检测 187
10.2.1 滑动窗口法 188
10.2.2 Faster R-CNN 188
10.2.3 YOLOv3 190
10.2.4 目标检测数据集介绍 193
10.3 目标跟踪 195
10.3.1 经典目标跟踪算法—Mean Shift 195
10.3.2 深度目标跟踪算法—FCNT 199
10.3.3 目标跟踪数据集介绍 202
本章小结 204
思考题与习题 205
参考文献 205
|
內容試閱:
|
人工智能正在成为推动全球产业变革的关键力量,也是国家发展及形成新质生产力的重要引擎。而在人工智能领域,计算机视觉技术扮演着至关重要的角色,它利用摄像头感知世界,通过先进的算法和强大的计算资源,为人工智能系统装配了“眼睛”,即提供视觉智能,使其能够模拟人类视觉的功能,实现物体检测、目标追踪、场景理解和决策控制等。借助计算机视觉技术,人工智能系统不仅能够识别并解析周围环境的复杂信息,还能在许多领域替代人类执行繁重或重复的任务,极大地提高了生产效率和人们的生活质量。随着计算机视觉技术的快速发展和广泛应用,对于相关领域专业人才的需求也显著增加。
计算机视觉涵盖了信号处理、数字图像处理、人工智能和计算机科学等多个学科,具有很强的专业性和广泛的应用领域。经过几十年的发展,计算机视觉已经形成了相对完善的理论和技术体系,也出现了许多有关计算机视觉的书籍,但现有的书籍大部分是为工程技术人员和研究生以上层次教学编写的,而面向本科教育,尤其是近年来才开设的人工智能等新兴专业的计算机视觉教材则相对较少。随着人工智能和计算机视觉新技术的不断涌现,相关技术的应用场景也迅速扩展,在此情况下,计算机视觉相关知识的更新和教育资源的不断完善变得尤为重要。
本书旨在填补目前面向本科教育的计算机视觉教材资源的空白。在介绍计算机视觉基础理论和核心技术的基础上,本书结合了前沿的计算机视觉研究动态和技术更新,并广泛地涵盖了计算机视觉应用的多个技术案例。本书还特别强调实践操作,提供了丰富的编程实例和项目案例,以帮助学生和专业人员理解理论,并将知识应用于实际问题的解决。
本书按照从底层信号处理到高级视觉任务的知识体系,系统介绍了计算机视觉的基本理论、主要方法、关键技术和应用领域。
在绪论部分(第1章),本书主要介绍了计算机视觉的基本概念、发展历程、经典理论、应用场景和面临的挑战。通过这些内容的学习,读者可以更好地了解计算机视觉的总体情况,从而为进一步学习具体的计算机视觉方法和技术奠定基础。
在低级视觉部分,分为5章详细介绍了低级视觉图像处理技术,包括点、线、面(区域)以及纹理的特征表示分析技术。其中,第2章涵盖了图像量化表示的基础知识和图像处理的核心技术,如滤波、增强和变换等。第3章和第4章分别探讨了图像中的点特征和线特征的检测与表示,这是图像匹配和识别的关键环节。第5章主要介绍了图像的区域分割技术。第6章主要介绍了图像的纹理特征表示及应用。上述低级视觉的图像处理和特征表示技术为后续的三维重建和运动分析等高级视觉任务提供了基础。
在高级视觉部分,主要包括三维视觉和运动分析两部分内容。其中,三维视觉是计算机视觉最核心的内容,分为两章(第7章和第8章)详细介绍了摄像机成像模型和三维重建技术,这些技术是理解物理世界和创建三维虚拟环境的关键。第9章则重点介绍了如何从图像或视频序列中提取动态信息和特征。
在计算机视觉应用部分(第10章),结合深度学习技术重点探讨了计算机视觉在实际应用中的关键技术,包括最常见的图像分类、目标检测和目标跟踪。这些技术构成了现代计算机视觉系统的核心,使计算机能够在复杂的现实世界环境中理解视觉内容。
本书第2~10章有应用案例,包括案例的分析、实验设置、实验数据、程序及运行结果。案例的编程实现采用了MATLAB、C 和Python等编程语言,使用了OpenCV库函数、MATLAB视觉与图形工具箱、Scikit-Learn机器学习工具包,以及Pytorch等深度学习框架。通过对案例的学习和实践,读者能够掌握解决计算机视觉实际问题的基本技能,增强计算机视觉理论与实践结合的工程应用能力。
本书由北京工业大学、北京师范大学和西安电子科技大学的多位长期从事计算机视觉研究和教学,具备深厚的计算机视觉理论基础、丰富的实践经验和优秀的工程能力的教授和专家学者共同编写。大家经过多个日夜,通过一丝不苟的撰写、讨论和校对,形成了最终的版本,所有参编人员付出了辛勤的劳动。同时,对参与部分材料收集和整理、案例和代码编写、文字和格式校对的研究生致以衷心的感谢。
本书的编写得到战略性新兴领域高等教育教材体系建设项目的支持,特此致谢。
由于编者水平有限,书中若有疏漏,在此诚心致歉,敬请广大读者批评指正。
编 者
|
|