动手做深度强化学习

动手做深度强化学习 pdf epub mobi txt 电子书 下载 2025

想要找书就要到 小特书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

  实作现代强化学习方法:深度Q网路、值迭代、策略梯度、TRPO、AlphaGo Zero…

  强化学习(RL)的最新发展,结合使用深度学习(DL),在训练代理人「像人类一样地」解决复杂问题这方面,取得了前所未有的进步。Google团队利用演算法来玩知名的Atari街机游戏,并击败了它们,这可以说是让RL领域发光发热的重要推手,而世界各地的研究人员正马不停蹄地研发各种新的想法。

  《动手做深度强化学习》综合性地介绍了最新的DL工具与它们的限制。读者将评估包括交叉熵和策略梯度等方法,再把它们应用于真实的环境之中。本书使用Atari虚拟游戏和一般家庭常玩的Connect4游戏作为范例。除了介绍RL的基础知识之外,作者亦详述如何制作智慧型学习代理人等专业知识,让读者在面对一系列艰鉅的真实世界挑战时,能游刃有余。本书也会说明如何在网格世界(grid world)环境中实作Q学习、如何让代理人学会买卖和交易股票,并学习聊天机器人是如何使用自然语言模型与人类对话的。

  在这本书中,你将学到:
  ・ 了解结合了RL的DL内容,并实作复杂的DL模型
  ・ 学习RL的基础:马可夫决策过程
  ・ 评估RL方法,包括交叉熵、DQN、Actor-Critic、TRPO、PPO、DDPG、D4PG…等等
  ・ 了解如何在各种环境中处理离散行动空间和连续行动空间 
  ・ 使用值迭代法来击败Atari街机游戏 
  ・ 建立属于自己的OpenAI Gym环境,来训练股票交易代理人
  ・ 使用AlphaGo Zero演算法,教你的代理人玩Connect4
  ・ 探索最新的深度RL研究主题,包括AI驱动的聊天机器人等等

  下载范例程式档案:
  本书的程式码是由 GitHub 託管,可以在如下网址找到:github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On。

  下载本书的彩色图片:
  我们还提供您一个PDF档案,其中包含本书使用的彩色萤幕截图/彩色图表,可以在此下载:static.packt-cdn.com/downloads/DeepReinforcementLearningHandsOn_ColorImages.pdf。
 

著者信息

作者简介

Maxim Lapan


  Maxim Lapan是一位深度学习的爱好者,也是一位独立研究人员。他有15 年的工作经验,身分是「软体开发人员」与「系统架构师」,参与的专案从低阶的Linux 核心驱动程式开发,到在数千台伺服器上执行的「分散式应用程式」的「设计」与「性能优化」。凭借着在大数据、机器学习以及大型平行分散式HPC 和非HPC 系统方面的丰富工作经验,他能用「简单的句子」与「生动的范例」来解释复杂事物的关键重点。目前他最感兴趣的领域是深度学习的实务应用,例如:「深度自然语言处理」和「深度强化学习」。

  Maxim 和他的家人住在莫斯科,俄罗斯联邦,他在以色列新创公司担任资深NLP 开发人员。
 

图书目录

前言
第1章:什么是强化学习?
第2章: OpenAI Gym
第3章:使用PyTorch来做深度学习
第4章:交叉熵法
第5章:表格学习与贝尔曼方程式
第6章:深度Q网路
第7章:DQN扩充
第8章:以强化学习法来做股票交易
第9章:策略梯度-另一个选项
第10章:行动-评论者方法
第11章:非同步优势行动-评论者
第12章:以强化学习法训练聊天机器人
第13章:Web导航
第14章:连续行动空间
第15章:信赖域策略-TRPO、PPO与ACKTR
第16章:强化学习中的黑箱优化
第17章:超越无模型方法-想像
第18章:AlphaGo Zero

图书序言

图书试读

None

用户评价

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版权所有