动手做深度强化学习 pdf epub mobi txt 电子书 下载 2025
图书介绍
☆☆☆☆☆
简体网页||
繁体网页
著者
出版者 出版社:博硕 订阅出版社新书快讯 新功能介绍
翻译者 译者: 刘立民
出版日期 出版日期:2019/11/11
语言 语言:繁体中文
下载链接在页面底部
点击这里下载
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
发表于2025-01-27
类似图书 点击查看全场最低价
图书描述
实作现代强化学习方法:深度Q网路、值迭代、策略梯度、TRPO、AlphaGo Zero…
强化学习(RL)的最新发展,结合使用深度学习(DL),在训练代理人「像人类一样地」解决复杂问题这方面,取得了前所未有的进步。Google团队利用演算法来玩知名的Atari街机游戏,并击败了它们,这可以说是让RL领域发光发热的重要推手,而世界各地的研究人员正马不停蹄地研发各种新的想法。
《动手做深度强化学习》综合性地介绍了最新的DL工具与它们的限制。读者将评估包括交叉熵和策略梯度等方法,再把它们应用于真实的环境之中。本书使用Atari虚拟游戏和一般家庭常玩的Connect4游戏作为范例。除了介绍RL的基础知识之外,作者亦详述如何制作智慧型学习代理人等专业知识,让读者在面对一系列艰鉅的真实世界挑战时,能游刃有余。本书也会说明如何在网格世界(grid world)环境中实作Q学习、如何让代理人学会买卖和交易股票,并学习聊天机器人是如何使用自然语言模型与人类对话的。
在这本书中,你将学到:
・ 了解结合了RL的DL内容,并实作复杂的DL模型
・ 学习RL的基础:马可夫决策过程
・ 评估RL方法,包括交叉熵、DQN、Actor-Critic、TRPO、PPO、DDPG、D4PG…等等
・ 了解如何在各种环境中处理离散行动空间和连续行动空间
・ 使用值迭代法来击败Atari街机游戏
・ 建立属于自己的OpenAI Gym环境,来训练股票交易代理人
・ 使用AlphaGo Zero演算法,教你的代理人玩Connect4
・ 探索最新的深度RL研究主题,包括AI驱动的聊天机器人等等
下载范例程式档案:
本书的程式码是由 GitHub 託管,可以在如下网址找到:github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On。
下载本书的彩色图片:
我们还提供您一个PDF档案,其中包含本书使用的彩色萤幕截图/彩色图表,可以在此下载:static.packt-cdn.com/downloads/DeepReinforcementLearningHandsOn_ColorImages.pdf。
著者信息
作者简介
Maxim Lapan
Maxim Lapan是一位深度学习的爱好者,也是一位独立研究人员。他有15 年的工作经验,身分是「软体开发人员」与「系统架构师」,参与的专案从低阶的Linux 核心驱动程式开发,到在数千台伺服器上执行的「分散式应用程式」的「设计」与「性能优化」。凭借着在大数据、机器学习以及大型平行分散式HPC 和非HPC 系统方面的丰富工作经验,他能用「简单的句子」与「生动的范例」来解释复杂事物的关键重点。目前他最感兴趣的领域是深度学习的实务应用,例如:「深度自然语言处理」和「深度强化学习」。
Maxim 和他的家人住在莫斯科,俄罗斯联邦,他在以色列新创公司担任资深NLP 开发人员。
动手做深度强化学习 pdf epub mobi txt 电子书 下载
图书目录
前言
第1章:什么是强化学习?
第2章: OpenAI Gym
第3章:使用PyTorch来做深度学习
第4章:交叉熵法
第5章:表格学习与贝尔曼方程式
第6章:深度Q网路
第7章:DQN扩充
第8章:以强化学习法来做股票交易
第9章:策略梯度-另一个选项
第10章:行动-评论者方法
第11章:非同步优势行动-评论者
第12章:以强化学习法训练聊天机器人
第13章:Web导航
第14章:连续行动空间
第15章:信赖域策略-TRPO、PPO与ACKTR
第16章:强化学习中的黑箱优化
第17章:超越无模型方法-想像
第18章:AlphaGo Zero
图书序言
图书试读
None
动手做深度强化学习 epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2025
动手做深度强化学习 epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2025
动手做深度强化学习 pdf epub mobi txt 电子书 下载 2025
用户评价
类似图书 点击查看全场最低价
动手做深度强化学习 pdf epub mobi txt 电子书 下载