深度强化学习算法原理与实战：基于MATLAB_郑一编著_9787122475756

本书在详细阐述强化学习基本概念与基本理论的基础上，循序渐进地介绍了深度强化学习各常用算法的基本思想、算法伪代码、算法实现、基于实例的算法演示与程序分析等内容。具体介绍了Q-learning算法求解最优路径问题，SARSA算法求解最优安全路径问题，策略迭代算法求解两地租车最优调度问题，价值迭代算法求解最优路径问题，DQN?算法求解平衡系统的最优控制问题，PG算法求解双积分系统的最优控制问题，AC类算法求解股票交易的最优推荐策略，SAC算法求解机器人手臂控球平衡问题，PPO算法求解飞行器平稳着陆最优控制问题，DDPG算法求解四足机器人行走控制策略问题，TD3算法求解PID控制器参数整定问题，多智能体强化学习的基本概念与基本方法，MAPPO算法求解多智能体协作运送物体问题，IPPO算法与MAPPO算法求解协作竞争探索区域问题，MADDPG与DDPG算法求解车辆路径跟踪控制问题。
本书可作为高等院校深度强化学习课程的教材，亦可作为本科生毕业设计、研究生项目设计和广大科研人员的技术参考用书。

你还可能感兴趣

我要评论