登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』智能车辆强化学习与决策控制技术

書城自編碼: 4072490
分類:簡體書→大陸圖書→工業技術汽車/交通運輸
作者: 吕超,龚建伟,龚乘 著
國際書號(ISBN): 9787576341041
出版社: 北京理工大学出版社
出版日期: 2024-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 81.4

我要買

share:

** 我創建的書架 **
未登入.


新書推薦:
销售的力量
《 销售的力量 》

售價:HK$ 97.9
我活下来了(直木奖作者西加奈子,纪实性长篇散文佳作 上市不到一年,日本畅销二十九万册)
《 我活下来了(直木奖作者西加奈子,纪实性长篇散文佳作 上市不到一年,日本畅销二十九万册) 》

售價:HK$ 63.8
数学分析原理(第二卷)(第9版)
《 数学分析原理(第二卷)(第9版) 》

售價:HK$ 86.9
陈寅恪四书
《 陈寅恪四书 》

售價:HK$ 316.8
汉密尔顿关于制造业的报告
《 汉密尔顿关于制造业的报告 》

售價:HK$ 74.8
开放科学:人工智能时代的呼唤
《 开放科学:人工智能时代的呼唤 》

售價:HK$ 108.9
武器化的知识:国联、自由秩序和软力量的使用
《 武器化的知识:国联、自由秩序和软力量的使用 》

售價:HK$ 86.9
大马士革:刀锋下的玫瑰(方尖碑)
《 大马士革:刀锋下的玫瑰(方尖碑) 》

售價:HK$ 130.9

 

建議一齊購買:

+

HK$ 434.5
《钢管混凝土桥梁》
+

HK$ 88.0
《道路交通网络结构与状态分析评估理论》
+

HK$ 88.0
《奋楫笃行,臻于至善——广州公交服务再提升探索与实践》
+

HK$ 107.8
《隧道TBM卡机地质判识与防控技术》
+

HK$ 197.5
《铁路土建工程施工安全管理》
+

HK$ 97.9
《重传承 共分享——高速公路建设品质提升臻选案例集》
內容簡介:
强化学习是人工智能领域近年来崛起的新兴技术,在机器人、图像识别、语音识别等多个领域有着重要应用,而自主行为决策则是车辆智能化的重要体现。本书将二者结合起来,从数据采集、模型构建、模型验证等角度系统性地阐述了一系列基于强化学习的行为决策方法。全书共7章,第1,2章介绍了智能车辆系统的基本构成,以及强化学习技术的基础知识;第3至6章基于不同强化学习的特点,详细阐述了经典强化学习、深度强化学习、逆强化学习和分层强化学习在智能车行为决策系统构建中的应用,以及如何测试这些系统;第7章则从更宏观的角度探讨了目前强化学习方法在迁移和泛化方面的缺陷,并介绍了一种可迁移的强化学习决策方法。
书中涉及的所有模型和数据均来自于作者团队的研究成果,每一章都有相关的引申阅读材料,可供读者参考。
本书可作为智能交通系统、智能车辆、地面无人车辆及移动机器人等相关专业高年级本科生和研究生的教学资料,也可以作为从事智能决策与控制技术领域研究的科研技术人员的参考资料。
目錄
第1章 智能车辆系统概述………………………………………………………001
1.1 智能车辆介绍…………………………………………………………003
1.1.1 智能车辆架构 …………………………………………………003
1.1.2 智能车辆发展摘记 ……………………………………………006
1.2 智能车辆的基本组成部分……………………………………………017
1.2.1 环境感知与场景理解模块…………………………………017
1.2.2 决策控制模块 …………………………………………………021
第2章 强化学习基础……………………………………………………………025
2.1 强化学习概述 …………………………………………………………027
2.1.1 强化学习的特点 ……………………………………………………028
2.1.2 强化学习的发展历史 …………………………………………028
2.2 马尔可夫决策过程 ……………………………………………………030
2.2.1 马尔可夫过程 …………………………………………………031
2.2.2 马尔可夫决策过程分析 ………………………………………033
2.2.3 贝尔曼方程 …………………………………………………………034
2.3 Q迭代与Q学习………………………………………………………038
2.3.1 Q迭代…………………………………………………………040
2.3.2 时序差分算法 …………………………………………………044
2.3.3Q学习………………………………………………………………045
2.4 函数逼近 ……………………………………………………………………049
2.4.1 函数逼近方法 …………………………………………………049
2.4.2 值函数逼近 ……………………………………………………051
2.5 深度强化学习…………………………………………………………055
2.5.1 深度强化学习原理 ……………………………………………055
2.5.2 深度Q网络……………………………………………………057
第3章 基于经典强化学习的决策控制技术 ……………………………………061
3.1 CARLA仿真平台介绍 …………………………………………………063
3.2 基于Q学习的决策控制……………………………………………064
3.2.1 纵向决策控制 …………………………………………………064
3.2.2 横向决策控制 …………………………………………………067
3.2.3 路径跟踪 …………………………………………………………069
3.2.4 学习人类驾驶员………………………………………………071
3.3 基于NQL的速度控制 …………………………………………………074
3.3.1 NQL原理 ……………………………………………………………076
3.3.2 NQL模型构建………………………………………………078
3.3.3 NQL方法测试 ……………………………………………………084
第4章 基于分层强化学习的决策控制技术 ……………………………………108
4.1 分层强化学习方法及原理……………………………………………109
4.1.1 半马尔可夫决策过程 …………………………………………109
4.1.2 分层强化学习原理概述………………………………………111
4.2 基于分层强化学习的自主超车决策方法 …………………………111
4.2.1 基于半马尔可夫决策过程和运动基元的超车决策
模块…113
4.2.2 基于马尔可夫决策过程和社会偏好的超车决策模块 …121
4.3 基于半马尔可夫决策过程和运动基元的超车决策模块仿真
实验 …………………………………………………………………………124
4.3.1 离线运动基元提取结果………………………………………124
4.3.2 超车决策模块实验结果及分析 …………………………125
4.4 基于马尔可夫决策过程和社会偏好的超车决策模块实车
实验 …………………………………………………………………………………127
4.4.1 基于智能驾驶平台的实车数据采集及预处理……………127
4.4.2 超车决策模块实验……………………………………………137
第5章 基于深度强化学习的决策控制技术 ……………………………………141
5.1 基于DQN的超车场景决策控制模型构建………………………142
5.2 基于 DQN的超车决策实验……………………………………………143
5.3 基于DDPG交叉路口的纵向决策控制模型构建 …………………145
5.3.1 DDPG算法原理…………………………………………………145
5.3.2 纵向决策问题建模 ……………………………………………148
5.3.3 基元库构建与运动基元自主学习…………………………150
5.3.4 基于基元库的最优基元选择 …………………………………154
5.4 交叉路口场景下的纵向决策控制仿真实验………………………157
5.4.1 交叉路口场景简述……………………………………………157
5.4.2 离线学习与测试……………………………………………………158
5.4.3 对比实验结果与分析 …………………………………………159
5.5 交叉路口场景下的纵向决策控制实车实验 ………………………163
5.5.1 交叉路口下实车数据采集与处理…………………………163
5.5.2 实车数据驱动的交叉路口实验场景…………………………163
5.6 对比实验结果与分析…………………………………………………166
5.6.1 子任务离线学习任务 …………………………………………166
5.6.2 测试阶段 ………………………………………………………………173
第6章 决策的迁移与泛化………………………………………………………177
6.1 迁移学习与认知地图…………………………………………………178
6.2 基于SR的决策迁移建模……………………………………………179
6.2.1 类人换道场景表征……………………………………………180
6.2.2 基于SR的分层强化学习换道决策 ………………………185
6.2.3 换道场景运动基元 ……………………………………………188
6.2.4 基于场景表征和运动基元的运动规划……………………190
6.3 类人可迁移换道模型的可迁移超车实验测试……………………191
6.3.1 面向超车类人换道场景表征的离线构建…………………191
6.3.2 自主换道超车实验与结果分析………………………………193
6.4 类人可迁移换道模型的类人实验测试 ……………………………196
6.4.1 不同风格行为的类人换道场景表征 ………………………196
6.4.2 类人换道运动规划实验结果及分析………………………198
6.4.3 类人换道决策实验结果及分析………………………………202
参考文献 ……………………………………………………………………………………206
术语表………………………………………………………………………………212
索引…………………………………………………………………………………………214

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.