书单推荐
更多
新书推荐
更多

异策略安全约束强化学习 国防工业出版社 当当图书 杨奇松,常燕等

 异策略安全约束强化学习 国防工业出版社 当当图书 杨奇松,常燕等

定  价:88 元

        

当前图书已被 3 所学校荐购过!
查看明细

  • 作者:杨奇松,常燕,武健,李邦杰,王顺宏,赵久奋 著;
  • 出版时间:2025/7/1
  • ISBN:9787118137071
  • 出 版 社:国防工业出版社
  • 中图法分类:TP181 
  • 页码:
  • 纸张:胶版纸
  • 版次:
  • 开本:16开
9
7
1
8
3
7
7
1
0
1
7
8
1

本书聚焦强化学习应用安全性,深入探讨强化学习框架内安全风险控制与训练安全。介绍 Worst - Case Soft Actor Critic(WCSAC)算法,分析累积安全成本分布、引入条件风险值平衡奖励与安全;讲解估计安全成本分布的高斯近似法和分位数回归法及其实验效果;阐述 Constrained Entropy Maximization(CEM)算法,学习安全前提下均匀访问状态的探索策略;介绍 Safe Guide(SaGui)框架,通过正则化快速迁移安全策略、促进目标任务学习。研究为强化学习现实应用提供新视角方法,适合强化学习、人工智能安全等领域研究人员、工程师及高校师生,对关注复杂环境安全决策与优化者有参考价值 。

 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容