新書推薦:

《
宇宙(第二卷) 科学元典丛书
》
售價:HK$
107.8

《
了不起的创作者:保持创造力的10堂启发课
》
售價:HK$
64.9

《
爱得太多的父母:14组家庭,20年追踪的家庭教育调查实录
》
售價:HK$
65.8

《
人偶游戏(东野圭吾竟然写过这种惊悚悬疑之作)
》
售價:HK$
65.8

《
自然、权利与正义(重思古典自然法 探索人类生活的永恒根基)
》
售價:HK$
74.8

《
汗青堂丛书153·弓弩与投石机:蒙古的战争艺术
》
售價:HK$
77.0

《
汗青堂丛书155·糖与现代世界的塑造:种植园、奴隶制与全球化
》
售價:HK$
118.8

《
汗青堂丛书154·崩盘:小冰期与大明王朝的衰落
》
售價:HK$
92.0
|
編輯推薦: |
丰富实践经验:本书撰写源于地平线立项Halo 3.0项目,团队成员走访多地、与多类人群交流,获取一线反馈与诉求。同时邀请量产车型一线工程师、专家学者担任作者或审稿人,带来第一手资料,极具实践指导意义。
知识体系完整:内容覆盖汽车人机交互发展历程、概念、原理及趋势,介绍设计原则、技术类型与安全标准。采用自上而下、自内而外的方法,阐述人机交互系统架构、硬件、算法、数据基础,以及开发实践、测试方法和迭代升级方法,搭建全面知识体系。
贴合实际需求:针对大部分从业者刚入行、知识分散、缺少成体系培训的现状编写,解决实际工作中的疑惑,如“人机交互是什么,怎么实现的”“智能车为何需要AI芯片”等,让读者快速掌握相关背景知识与开发技术。
便于学习理解:每章以案例导入,正文后设置练习题并配备答案,方便读者联系客服下载。能帮助读者更好地理解章节内容,检验学习效果,实现知识融会贯通。
|
內容簡介: |
随着智能化技术在汽车领域的应用日渐广泛,智能座舱这一概念频繁出现在各大车企的新车发布会及宣传活动中,其也是赋能传统汽车智能化、网联化的关键,而人机交互是智能座舱的核心。另外,“软件定义汽车”已经成为行业的共识,除了专门的软件及科技公司外,主机厂也纷纷成立了自家的软件部门或软件公司。在学术界,与人机交互相关的环境感知、人机共驾、人机共情等研究工作越来越多,很多学术会议及期刊也不断推出与之相关的研讨会与特刊。本教材编写团队拥有多年智能座舱与人机交互研发及量产经验,本着开放赋能、共同进步的目标,特编写本书。本书系统化介绍了人机交互的内涵、核心技术、开发与测试方法,帮助学生快速掌握设计、算法、工程、测试等核心能力。为了方便入门,本书还加入了与人机交互开发相关的基础知识介绍,如相关工业设计基础、算法基础、硬件基础、数据基础及相关架构等。
來源:香港大書城megBookStore,http://www.megbook.com.hk 本书主要面向高校计算机学院、汽车学院以及车企等与智能驾驶、智能座舱、人机交互相关的学生、研究人员和开发人员等。本书既可以用于面向智能驾驶的人机交互入门级教材,也可作为智能座舱与人机交互开发的参考工具书。
|
關於作者: |
杨聪,男,副教授。博士毕业于德国锡根大学(University of Siegen),师从Marcin Grzegorzek教授,研究方向为计算机视觉与模式识别。后在法国国家信息与自动化研究所(INRIA)进行博士后研究,师从Marie-Odile Berger教授,方向集中于计算机视觉并涉及多个学科的交叉。2017年回国,担任扩博智能(Clobotics)算法团队负责人,带领团队成功研发并交付了多个智能零售相关产品,客户包括可口可乐,尼尔森,沃尔玛,宝洁等。2019年加入地平线机器人,并担任南京人工智能高等研究院高级研究员,带领团队深度参与了地平线征程2-5代芯片在智能驾驶领域的落地与量产,也使得长安UNI-T成为首款搭载国产人工智能芯片的智能汽车。在此期间,他还设计并提出了多个基于国产大算力芯片的参考算法包。杨聪博士先后在TVCG, TIP,ACM MM,TITS,TCSS,ECCV, PR等国内外知名期刊或会议发表学术论文40多篇,专著2本(中英文各一本),专利近30个(包含美国专利3个),并担任TVCG,TII,TITS等多个期刊/会议审稿人。
|
目錄:
|
前言
第1章 概述
案例导入:长安UNI-T汽车人机交互…001
1.1 汽车人机交互发展历程…005
1.1.1 技术推动下的人机交互…005
1.1.2 社会变迁下的人机交互…014
1.2 汽车人机交互安全性要求…015
1.2.1 驾驶员行为分析模型…015
1.2.2 驾驶员心理分析模型…026
1.3 汽车人机交互演变与趋势…032
练习题…040
第2章 面向智能驾驶的人机交互设计
案例导入:多模态疲劳驾驶检测与缓解…042
2.1 智能驾驶人机交互设计原则…050
2.1.1 智能驾驶人机交互场景…050
2.1.2 人机交互中的多模态传达…052
2.1.3 人机交互中的文化因素…058
2.1.4 人机交互中的感性需求…063
2.1.5 智能驾驶中的人机共情…071
2.2 智能驾驶人机交互技术类型…076
2.3 智能驾驶人机交互安全性标准…077
练习题…088
第3章 智能驾驶人机交互系统架构设计
案例导入:智能驾驶语音识别技术架构…090
3.1 智能驾驶人机交互系统架构设计…091
3.1.1 人机交互系统架构总览…092
3.1.2 人机交互车端系统架构设计…095
3.1.3 车-云结合的人机交互系统架构设计…097
3.2 智能驾驶人机交互系统功能开发…103
3.2.1 人机交互系统开发流程…103
3.2.2 人机交互系统开发工具…105
3.3 智能驾驶人机交互系统开发流程…110
3.3.1 面向量产的人机交互系统开发实践…110
3.3.2 开发团队高效协作方法…111
练习题…115
第4章 智能驾驶人机交互系统硬件基础
案例导入:基于地平线征程芯片的硬件接入设计…117
4.1 车规级芯片…123
4.1.1 芯片性能…124
4.1.2 图形处理器与片上系统…126
4.2 车载传声器…132
4.2.1 传声器类型及规格…132
4.2.2 传声器阵列参数及安装规则…134
4.3 车载摄像头…134
4.3.1 摄像头类型及规格…135
4.3.2 摄像头选型及安装规则…135
4.4 基于芯片的硬件设计…136
练习题…137
第5章 智能驾驶人机交互系统算法基础
案例导入:面向智能驾驶的VarGNet网络结构设计…139
5.1 人机交互系统中的深度学习基础…142
5.1.1 卷积神经网络…143
5.1.2 损失函数…149
5.1.3 模型训练及测试…150
5.1.4 模型压缩…151
5.2 人机交互系统中的机器视觉算法基础…156
5.2.1 分类…157
5.2.2 检测…159
5.2.3 分割…163
5.2.4 关键点…166
5.3 人机交互系统中的语音识别算法基础…170
5.3.1 声学模型…171
5.3.2 语言模型…180
5.3.3 解码器…185
5.4 人机交互系统中的大语言模型基础…188
5.4.1 从基础模型到大模型…188
5.4.2 典型大语言模型…190
5.4.3 多模态大模型…193
练习题…199
第6章 智能驾驶人机交互系统数据基础
案例导入:FatigueView疲劳驾驶数据采集与标注…201
6.1 人机交互数据采集…206
6.1.1 采集环境搭建…206
6.1.2 采集文档格式…207
6.1.3 采集数据管理…207
6.2 人机交互数据标注…209
6.2.1 数据标注方法…210
6.2.2 数据标注文档…217
6.2.3 标注体系建设…218
练习题…223
第7章 智能驾驶人机交互算法开发
案例导入:汽车驾驶中的安全带感知…225
7.1 视觉交互算法开发…229
7.1.1 视线…231
7.1.2 手势…235
7.1.3 行为…240
7.1.4 情绪…246
7.2 语音交互算法开发…251
7.2.1 语音前端…251
7.2.2 语音后端…256
7.3 多模交互算法开发…269
7.3.1 多模语音…269
7.3.2 多模态大模型…273
练习题…276
第8章 智能驾驶人机交互软件开发
案例导入:驾驶中打电话识别与主动降音…278
8.1 人机交互感知软件开发框架…285
8.1.1 通信及底层组件…285
8.1.2 模型集成框架…290
8.2 人机交互感知软件开发流程…294
8.2.1 开发环境搭建…294
8.2.2 开发流程概述…294
8.3 人机交互感知软件开发工具…295
8.3.1 AI计算单元…295
8.3.2 AI芯片工具链…297
8.3.3 地平线AI工具链举例…299
练习题…303
第9章 智能驾驶人机交互应用开发
案例导入:驾驶员抽烟识别及交互应用…305
9.1 智能驾驶人机交互应用类型…308
9.2 人机交互应用开发框架…310
9.2.1 通信…310
9.2.2 组件…314
9.2.3 工程模式…326
9.2.4 对外输出能力…331
9.3 人机交互应用开发规则…334
9.3.1 应用可视化配置…335
9.3.2 应用冲突处理…337
练习题…338
第10章 智能驾驶人机交互系统测试
案例导入:驾驶员抽烟感知及交互测试…340
10.1 人机交互系统测试流程…341
10.2 人机交互系统测试标准…342
10.2.1 智能驾驶车载视觉测试标准…342
10.2.2 智能驾驶车载语音测试标准…347
10.3 人机交互测试工具…353
10.3.1 图像测试工具…353
10.3.2 语音测试工具…357
练习题…359
第11章 智能驾驶人机交互系统迭代
案例导入:基于AirFlow的全自动模型迭代…361
11.1 人机交互系统迭代周期…364
11.2 人机交互系统长尾问题及升级机制…366
11.2.1 人机交互系统中的长尾问题…367
11.2.2 人机交互系统快速迭代与升级…368
11.3 人机交互系统迭代流程自动化…373
练习题…375
附录 术语与符号列表…377
参考文献…382
|
內容試閱:
|
自世界上第一辆汽车诞生伊始,人们便在不断改善驾驶体验:真皮座椅、电灯、顶篷、气囊式喇叭、后视镜等部件不断被加入,用于延伸人与车、人与环境以及人与人之间的交互。以转向操纵机构为例(图1),1885年德国人卡尔·本茨(Carl Benz)研制的全球首辆汽车没有转向盘,而是配备了转向曲柄,这是因为马车夫习惯拉动缰绳来指挥马匹,遵循并延续了传统的人车交互方式。直到1894年,法国工程师阿尔弗雷德·瓦赫伦(Alfred Vacheron)在他的潘哈德4HP车型(Panhard 4 HP Model)中设置了转向盘,并在巴黎到鲁昂汽车比赛(Paris-Rouen Race)中首次亮相,转向盘自此流行起来,引领了全新的人车交互方式。过去百年中,转向盘上又增加了许多功能,如电动喇叭开关、转向信号、换档拨片、巡航控制系统、安全气囊、多功能控制系统、生理信号感知等,极大提升了人车交互的便捷性与舒适度。
a)转向曲柄(1885年) b)转向盘(1894年) c)转向盘喇叭开关(1915年)
图1 人机交互设备迭代更新
随着电子电气技术的发展及封闭式厢型轿车的热卖?,汽车座舱的概念自此诞生,人们更加追寻有趣且便捷的人机交互方式:1924年,世界上第一台车载收音机(Car Radio)诞生;20世纪50年代,相继诞生了第一台车载黑胶唱片播放器(Car Record Player)以及车载电话(Car Phone);20世纪80年代,电子显示屏及触摸屏首次出现在车上。人们不自觉地将生活中的习惯与设备搬入汽车,并随着社会、文化的发展以及技术的进步,进一步推动汽车、座舱及人机交互进化。特别是进入21世纪后,随着人工智能、传感器、芯片以及云计算等技术不断发展,更多智能化与个性化功能被开发了出来,使得汽车可以主动感知人的行为、表情及操作,进而实现更安全、更有乐趣、更便捷的交互场景。作为提升舱内驾驶体验(In-vehicle Experience)的一部分,人机交互成为打造智能汽车差异化竞争的亮点之一,频繁出现在各大车企及厂商的新车发布会及宣传活动中。
从技术上说,面向智能汽车的人机交互,就是在传统人车交互的基础上增加了智能化属性,通过舱内外感知(语音、视觉、触觉等)、认知、决策、服务过程,使汽车能够主动服务于驾驶员和乘客,提升驾驶安全及体验。在学术界,中国计算机学会(China Computer Federation,CCF)推荐的人机交互类顶级期刊和会议如TOCHI(ACM Transactions on Computer-Human Interaction)及CHI(ACM Conference on Human Factors in Computing Systems)中有越来越多的论文专门探讨智能驾驶人机交互的相关场景及算法。在部分高校,越来越多的学生与研究人员选择智能驾驶及人机交互作为自己的研究方向(如舱内外感知算法、人机交互场景开发等)。智能驾驶下的人机交互是一个集硬件、软件、算法、大数据、云计算、工业设计以及生命周期管理等不同学科为一体的复杂系统,开发难度大、周期长,需要不同团队配合完成。特别是对于刚进入这个行业的“新玩家”来说,不但需要快速掌握相关背景知识与开发技术,还要不断进行场景创新来打造差异化竞争,其中难度可想而知。
本书撰写的背景是2020年6月,搭载地平线征程二代芯片及人机交互解决方案的长安UNI-T实现了量产及热卖,使得UNI-T成为历史上第一款搭载国产AI芯片的智能汽车。在此基础上,地平线于2021年内部正式立项Halo 3.0,一方面打造基于地平线征程三代芯片的人机交互解决方案及定点,另一方面就是开放赋能。为此,项目团队核心成员在年初的几个月里,先后前往十多个城市密集访问了各类主机厂(OEM)、一级供应商(Tier1)、二级供应商(Tier2)、软件服务供应商、算法公司、芯片公司、相关研究院及高校,与工程师、研发人员、设计人员、销售人员、实习生、教师及学生等面对面交流,听取一线的反馈与诉求,并出版了《智能座舱开发与实践》用于技术交流。在沟通的过程中,我们发现除少部分人拥有两年以上智能驾驶及人机交互工作经验外,大部分人员呈现出以下特点:①刚进入该领域;②对智能驾驶、智能座舱、人机交互相关背景知识了解比较分散;
③缺少成体系培训课程与教材。他们还普遍反映目前网络上关于智能驾驶与人机交互的知识比较分散,在内容深度与实操指导性方面都比较薄弱,因此在实际工作中依然是摸索着前进,会“踩很多坑”。为此,地平线联合苏州大学于2023年成立了智能驾驶生态创新中心(BeeLab),邀请UNI-T及其他量产车型一线工程师、工业设计专家、人机交互方向学者担任本书作者或审稿人。在《智能座舱开发与实践》一书的基础上,他们从领域知识与实际经验出发,为本书带来面向智能驾驶的人机交互第一手资料,确保本书的读者不但可以掌握体系化的背景知识,还能学到各个开发环节的“干货”。
本书从汽车人机交互的发展历程、安全性要求及演变出发,详述面向智能驾驶的人机交互相关概念、原理及发展趋势(第1章),并在此基础上介绍了面向智能驾驶的人机交互设计原则、技术类型及安全性标准(第2章)。这两章内容作为汽车人机交互的入门,不但适用于技术开发者,还适用于人机交互设计、安全性测试等其他方向的人才。从第3章开始,本书采用自上而下的方法,首先介绍了智能驾驶人机交互系统架构及设计方法(第3章),并依次展开,介绍实现人机交互系统的硬件基础(第4章)、算法基础(第5章)及数据基础(第6章),进而解决了调研时常被问到的诸如“人机交互是什么,怎么实现的”“什么是算法,跟深度学习模型有什么关系”“我的车算智能车吗”“为什么智能车需要AI芯片”“为什么要用图形处理器(GPU)而不用中央处理器(CPU)”等问题。在上述基础上,从第7章开始,自内而外地详细讲述智能驾驶中人机交互开发实践,包括底层的人机交互算法开发(第7章)、中层的人机交互软件开发(第8章)以及最外层的人机交互应用开发(第9章),并在第10章介绍了上述系统的测试方法及相关测试平台。最后,本书在第11章介绍了人机交互系统在量产后的迭代与升级方法。上述知识架构充分涵盖了智能驾驶人机交互的核心技术细节,搭建了自上而下及自内而外的知识组织体系,并符合量产实践中的产品研发流程,可以让读者最大程度了解全貌、深入细节并实现融会贯通。为方便读者理解,每章开始都会有相应的案例导入,并在正文之后均设置了练习题(本书配备练习题答案,可联系客服人员微信(13070116286)下载)。
感谢本书作者团队在每日忙碌的研发工作外为本书所做的贡献,具体分工如下:
第1章:赵智峰、黄耀渔、孙铭禧、何潇鸥、冯澳杰、乔欣怡、高慧乐、杨聪。
第2章:赵智峰、黄耀渔、孙铭禧、何潇鸥、冯澳杰、乔欣怡、高慧乐、杨聪。
第3章:王昱、杨聪、陈涛、徐健、冯常伟。
第4章:窦宇豪、陈涛、杨聪、徐健、冯常伟。
第5章:杨聪、陈涛、赵智峰、徐健。
第6章:祝仰坤、杨聪、陈涛、徐健、王军红。
第7章:杨聪、陈涛、赵智峰、徐健、隋伟。
第8章:陈涛、杨聪、赵智峰、徐健。
第9章:徐健、杨聪、陈涛、赵智峰、王军红。
第10章:杨聪、陈涛、赵智峰、徐健、隋伟。
第11章:杨聪、陈涛、赵智峰、徐健。
为了确保本书质量,我们还成立了审稿委员会,具体名单如下:
隋伟、王昱、杨聪、程智锋、王军红、赵智峰、苏治中(注:因部分委员也为本书作者,这里采用了交叉审稿的方式)。
在本书的编写过程中,得到了许多专家、平台及项目的支持,包括但不限于:
地平线生态拓展部对本书写作(纸质教材与数字教材)整体项目的支持;
苏州大学郭树伟对练习题资料的贡献;
苏州大学侯先豹、蔚晨垚、潘俊伟、陈世源、李浩然对在线试题系统的贡献;
苏州大学潘俊伟对课程配套幻灯片及视频课的贡献;
国家自然科学基金面上项目(62473276)、江苏省自然科学基金面上项目(BK20241918)、苏州大学-地平线横向项目(H230666)、江苏省高校“新时代教材数字化建设研究”专项课题(2024JCSZ22)、苏州大学未来科学与工程学院教育教学改革研究课题(重点,22N172)对本书调研、素材收集、多媒体资料加工及相关实验验证的支持。
本书编写过程中,我们还同步举行了在线课堂,以在线讲课与直播的方式将部分实践内容分享给我们曾访问过的各类企业。我们对这些课程进行了录像,与授课用的材料、代码一同上传到地平线开发者论坛(https://developer.horizon.auto/),并将会按计划公开这些课程与材料。
本书涉及知识点众多,错漏在所难免,还请广大读者批评指正,以便本书再版时参考。如有疑问,欢迎通过电子邮件与作者联系:yangcong955@126.com。
杨聪、陈涛
2025年2月10日
|
|