登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2025年02月出版新書

2025年01月出版新書

2024年12月出版新書

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

2024年06月出版新書

2024年05月出版新書

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

『簡體書』智能车辆强化学习与决策控制技术

書城自編碼: 4072490
分類: 簡體書→大陸圖書→工業技術汽車/交通運輸
作者: 吕超,龚建伟,龚乘 著
國際書號(ISBN): 9787576341041
出版社: 北京理工大学出版社
出版日期: 2024-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 377

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
深度说服力:影响和改变一个人的超级方法
《 深度说服力:影响和改变一个人的超级方法 》

售價:NT$ 352.0
2025年 中国自助游地图 自驾游游遍中国 深度旅游规划指南 专业实用精彩 旅游攻略景点介绍线路规划
《 2025年 中国自助游地图 自驾游游遍中国 深度旅游规划指南 专业实用精彩 旅游攻略景点介绍线路规划 》

售價:NT$ 449.0
教育的抉择
《 教育的抉择 》

售價:NT$ 254.0
DK灵动盎然的飞鸟
《 DK灵动盎然的飞鸟 》

售價:NT$ 806.0
AI原生应用开发:提示工程原理与实战
《 AI原生应用开发:提示工程原理与实战 》

售價:NT$ 407.0
孤独消费论
《 孤独消费论 》

售價:NT$ 305.0
全球史的九炷香:哪吒、龙涎香与坦博拉
《 全球史的九炷香:哪吒、龙涎香与坦博拉 》

售價:NT$ 500.0
画非画:古代绘画中的图像与政治
《 画非画:古代绘画中的图像与政治 》

售價:NT$ 1010.0

內容簡介:
强化学习是人工智能领域近年来崛起的新兴技术,在机器人、图像识别、语音识别等多个领域有着重要应用,而自主行为决策则是车辆智能化的重要体现。本书将二者结合起来,从数据采集、模型构建、模型验证等角度系统性地阐述了一系列基于强化学习的行为决策方法。全书共7章,第1,2章介绍了智能车辆系统的基本构成,以及强化学习技术的基础知识;第3至6章基于不同强化学习的特点,详细阐述了经典强化学习、深度强化学习、逆强化学习和分层强化学习在智能车行为决策系统构建中的应用,以及如何测试这些系统;第7章则从更宏观的角度探讨了目前强化学习方法在迁移和泛化方面的缺陷,并介绍了一种可迁移的强化学习决策方法。
书中涉及的所有模型和数据均来自于作者团队的研究成果,每一章都有相关的引申阅读材料,可供读者参考。
本书可作为智能交通系统、智能车辆、地面无人车辆及移动机器人等相关专业高年级本科生和研究生的教学资料,也可以作为从事智能决策与控制技术领域研究的科研技术人员的参考资料。
目錄
第1章 智能车辆系统概述………………………………………………………001
1.1 智能车辆介绍…………………………………………………………003
1.1.1 智能车辆架构 …………………………………………………003
1.1.2 智能车辆发展摘记 ……………………………………………006
1.2 智能车辆的基本组成部分……………………………………………017
1.2.1 环境感知与场景理解模块…………………………………017
1.2.2 决策控制模块 …………………………………………………021
第2章 强化学习基础……………………………………………………………025
2.1 强化学习概述 …………………………………………………………027
2.1.1 强化学习的特点 ……………………………………………………028
2.1.2 强化学习的发展历史 …………………………………………028
2.2 马尔可夫决策过程 ……………………………………………………030
2.2.1 马尔可夫过程 …………………………………………………031
2.2.2 马尔可夫决策过程分析 ………………………………………033
2.2.3 贝尔曼方程 …………………………………………………………034
2.3 Q迭代与Q学习………………………………………………………038
2.3.1 Q迭代…………………………………………………………040
2.3.2 时序差分算法 …………………………………………………044
2.3.3Q学习………………………………………………………………045
2.4 函数逼近 ……………………………………………………………………049
2.4.1 函数逼近方法 …………………………………………………049
2.4.2 值函数逼近 ……………………………………………………051
2.5 深度强化学习…………………………………………………………055
2.5.1 深度强化学习原理 ……………………………………………055
2.5.2 深度Q网络……………………………………………………057
第3章 基于经典强化学习的决策控制技术 ……………………………………061
3.1 CARLA仿真平台介绍 …………………………………………………063
3.2 基于Q学习的决策控制……………………………………………064
3.2.1 纵向决策控制 …………………………………………………064
3.2.2 横向决策控制 …………………………………………………067
3.2.3 路径跟踪 …………………………………………………………069
3.2.4 学习人类驾驶员………………………………………………071
3.3 基于NQL的速度控制 …………………………………………………074
3.3.1 NQL原理 ……………………………………………………………076
3.3.2 NQL模型构建………………………………………………078
3.3.3 NQL方法测试 ……………………………………………………084
第4章 基于分层强化学习的决策控制技术 ……………………………………108
4.1 分层强化学习方法及原理……………………………………………109
4.1.1 半马尔可夫决策过程 …………………………………………109
4.1.2 分层强化学习原理概述………………………………………111
4.2 基于分层强化学习的自主超车决策方法 …………………………111
4.2.1 基于半马尔可夫决策过程和运动基元的超车决策
模块…113
4.2.2 基于马尔可夫决策过程和社会偏好的超车决策模块 …121
4.3 基于半马尔可夫决策过程和运动基元的超车决策模块仿真
实验 …………………………………………………………………………124
4.3.1 离线运动基元提取结果………………………………………124
4.3.2 超车决策模块实验结果及分析 …………………………125
4.4 基于马尔可夫决策过程和社会偏好的超车决策模块实车
实验 …………………………………………………………………………………127
4.4.1 基于智能驾驶平台的实车数据采集及预处理……………127
4.4.2 超车决策模块实验……………………………………………137
第5章 基于深度强化学习的决策控制技术 ……………………………………141
5.1 基于DQN的超车场景决策控制模型构建………………………142
5.2 基于 DQN的超车决策实验……………………………………………143
5.3 基于DDPG交叉路口的纵向决策控制模型构建 …………………145
5.3.1 DDPG算法原理…………………………………………………145
5.3.2 纵向决策问题建模 ……………………………………………148
5.3.3 基元库构建与运动基元自主学习…………………………150
5.3.4 基于基元库的最优基元选择 …………………………………154
5.4 交叉路口场景下的纵向决策控制仿真实验………………………157
5.4.1 交叉路口场景简述……………………………………………157
5.4.2 离线学习与测试……………………………………………………158
5.4.3 对比实验结果与分析 …………………………………………159
5.5 交叉路口场景下的纵向决策控制实车实验 ………………………163
5.5.1 交叉路口下实车数据采集与处理…………………………163
5.5.2 实车数据驱动的交叉路口实验场景…………………………163
5.6 对比实验结果与分析…………………………………………………166
5.6.1 子任务离线学习任务 …………………………………………166
5.6.2 测试阶段 ………………………………………………………………173
第6章 决策的迁移与泛化………………………………………………………177
6.1 迁移学习与认知地图…………………………………………………178
6.2 基于SR的决策迁移建模……………………………………………179
6.2.1 类人换道场景表征……………………………………………180
6.2.2 基于SR的分层强化学习换道决策 ………………………185
6.2.3 换道场景运动基元 ……………………………………………188
6.2.4 基于场景表征和运动基元的运动规划……………………190
6.3 类人可迁移换道模型的可迁移超车实验测试……………………191
6.3.1 面向超车类人换道场景表征的离线构建…………………191
6.3.2 自主换道超车实验与结果分析………………………………193
6.4 类人可迁移换道模型的类人实验测试 ……………………………196
6.4.1 不同风格行为的类人换道场景表征 ………………………196
6.4.2 类人换道运动规划实验结果及分析………………………198
6.4.3 类人换道决策实验结果及分析………………………………202
参考文献 ……………………………………………………………………………………206
术语表………………………………………………………………………………212
索引…………………………………………………………………………………………214

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2025 (香港)大書城有限公司 All Rights Reserved.