书单推荐 新书推荐 |
异策略安全约束强化学习 国防工业出版社 当当图书 杨奇松,常燕等 本书聚焦强化学习应用安全性,深入探讨强化学习框架内安全风险控制与训练安全。介绍 Worst - Case Soft Actor Critic(WCSAC)算法,分析累积安全成本分布、引入条件风险值平衡奖励与安全;讲解估计安全成本分布的高斯近似法和分位数回归法及其实验效果;阐述 Constrained Entropy Maximization(CEM)算法,学习安全前提下均匀访问状态的探索策略;介绍 Safe Guide(SaGui)框架,通过正则化快速迁移安全策略、促进目标任务学习。研究为强化学习现实应用提供新视角方法,适合强化学习、人工智能安全等领域研究人员、工程师及高校师生,对关注复杂环境安全决策与优化者有参考价值 。
你还可能感兴趣
我要评论
|