深度强化学习 | 基于SAC算法的动态避障(ROS C++仿真)
目录
0 专栏介绍
1 SAC算法回顾
2 端到端SAC算法训练(Pytorch)
3 基于SAC算法的动态避障
0 专栏介绍本专栏以贝尔曼最优方程等数学原理为根基,结合PyTorch框架逐层拆解DRL的核心算法(如DQN、PPO、SAC)逻辑。针对机器人运动规划场景,深入探讨如何将DRL与路径规划、动态避障等任务结合,包含仿真环境搭建、状态空