【硬核书】深度强化学习实践手册：应用现代RL方法，包括深度Q网络、值迭代、策略梯度、TRPO、AlphaGo等，547页pdf

最近强化学习(RL)与深度学习(DL)相结合，在训练智能体以类似人类的方式解决复杂问题方面取得了前所未有的进展。谷歌使用算法来玩并击败著名的雅达利街机游戏，使该领域变得突出，研究人员正在以快速的速度产生新的想法。

Deep hands是一本关于最新深度学习工具及其局限性的全面指南。在将交叉熵和策略梯度等方法应用于现实环境之前，您将对它们进行评估。比如雅达利(Atari)的虚拟游戏和家庭最喜欢的。

本书介绍了RL的基础知识，为你提供了编写智能学习智能体的诀窍，以承担一系列艰巨的实际任务。了解如何在` grid world `环境中实现Q-，教您的智能体购买和交易股票，并了解自然语言模型如何推动聊天机器人的繁荣。

目录内容：

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www..ai，获取+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

文章版权归作者所有，未经允许请勿转载。

5个月前

0600

5个月前

0610

5个月前

0800

6个月前

0740

暂无评论

暂无评论...