深度强化学习及其在自动驾驶下的实战项目
本课程是为了帮助大家快速入门强化学习和学会应用深度强化学习进行算法的开发。
鉴于网上有许多开源的强化学习理论基础的视频,而且许多项目都是基于gym游戏进行开发的简单项目,并未涉及使用前沿的carla环境等自动驾驶仿真环境进行强化学习开发与讲解,所以本课程着重从模态化的单智能体和多智能体的深度强化学习入手,以实战项目为驱动进行代码的学习,并设立有学习交流社区群,购买后即可加入,一起探讨科研问题。
目前套餐内容如下:
一、深度强化学习理论
1.1 Basic concepts
1.2 Bellman Equation and Optimality
1.3 Value Iteration and Policy Iteration
1.4 Temporal-Difference Learning
1.5 Value Function Approximation
1.6 Deep Reinforcement Learning
1.7 Reward Shaping
1.8 开源框架介绍
二、经典深度RL算法
2.1 DQN Algorihtm2.1.1 算法动机&开创性思路2.1.2 损失函数2.1.3 性能对比
2.2 Policy Gradient (PG) Algorithm
2.3 Deep Deterministic Policy Gradient (DDPG)
2.4 Actor-Critic and Soft Actor-Critic (SAC) Algorithms
2.5 PPO Algorihtm
三、多智能体强化学习
3.1 Multi-agent Reinforcement Learning
3.2 Game Theory and Nash Equilibrium
3.3 Value Decomposition
3.4 QMIX, QTRAN
3.5 Multi-agent Autonomous Driving
四、仿真平台项目实战
4.1 仿真平台介绍
4.1.1 highway-env仿真平台介绍和使用案例
4.1.2 carla仿真平台介绍
4.1.3 carla仿真平台使用案例(场景设计,模态调取,动力学模型控制)
4.2 RL在highway-env上的实战应用示例4.2.1 The DQN agent solving highway-v0.4.2.2 The DDPG agent solving parking-v0.
4.3 RL在carla上的实战应用示例4.2.1 单模态RL代码解读和实验4.2.2多模态RL代码解读和实验
4.4 RL在Multi-agent交通中的应用示例
敬请期待。