会员
强化学习:原理与Python实战
肖智清更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
肖智清
主页
同类热门书
最新上架
- 会员
MindSpore大语言模型实战
随着ChatGPT等大语言模型的迅速发展,大语言模型已经成为人工智能领域发展的快车道,不同领域涌现出各种强大的新模型。开发者想要独立构建、部署符合自身需求的大语言模型,需要理解大语言模型的实现框架和基本原理。本书梳理大语言模型的发展,首先介绍Transformer模型的基本原理、结构和模块及在NLP任务中的应用;然后介绍由只编码(Encoder-Only)到只解码(Decoder-Only)的技术计算机6.6万字 - 会员
大型语言模型实战指南:应用实践与场景落地
这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AIAgent等各种强大的应用程序的著作。本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:(1)大型语言模型的基础理论,包括常见的模型架构、领计算机11.2万字 - 会员
华为MindSpore深度学习框架应用开发实战
全书从逻辑上共分3部分。第一部分由第1章和第2章组成,介绍深度学习的基础理论、MindSpore总体架构和编程基础。第二部分由第3~8章组成,介绍MindSpore框架各子系统的具体情况,包括数据处理、算子、神经网络模型开发、数据可视化组件MindInsight、推理、以及移动端AI框架MindSporeLite。第三部分由第9章和第10章组成,介绍使用MindSpore框架开发和训练的经典深度计算机13万字 - 会员
空间智能原理与应用
本书从空间信息处理角度出发,将人工智能领域的理论研究与专业实践相结合,完整介绍人工智能方法及其在空间信息处理中的应用,不仅涵盖人工智能领域的基础概念与基本方法,而且探讨知识图谱、计算智能、新兴机器学习、深度学习等前沿技术,同时介绍人工智能在地理文本大数据、遥感影像、激光点云等空间信息处理中的应用实例,具有较强的代表性和启发性。本书可以作为高等院校空间信息与数字技术、遥感科学与技术等专业高年级本科生计算机23.8万字 - 会员
自动驾驶:人工智能理论与实践
本书参照产业界自动驾驶技术研发的基本流程,充分借鉴了产业界在自动驾驶技术领域中的实际研发经验,以高性能的智能小车和高度仿真的车道沙盘为实验教具和运行环境,深入浅出地讲解自动驾驶技术的原理与实际应用,为初学者打开一扇通往人工智能世界的大门。本书以帮助初学者如何从无到有地打造出具备自动驾驶功能的智能小车为主线,内容分为看车(了解自动驾驶)、造车(设计智能小车)、开车(收集训练数据)、写车(编写自动驾驶计算机14.9万字 - 会员
破解深度学习(基础篇):模型算法与实现
本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神计算机14.8万字 - 会员
量子人工智能
量子计算与人工智能的交叉融合,促使量子人工智能的不断发展。本书旨在采用对深度学习爱好者友好的方式,构建量子人工智能应用。全书共13章,第1章和第2章系统介绍量子计算机发展脉络和量子计算编程的基础知识。第3~7章分别介绍不同的深度学习方法和在这些算法逻辑上构建量子启发算法的方式,用量子线路中的相位作为神经网络的可学习参数,重构为量子神经网络算子。这些算子可以在PyTorch环境中直接调用。第8章和第计算机7.6万字 - 会员
Python视觉分析应用案例实战
本书以Python3.10.7为平台,以实际应用为背景,通过概念、公式、经典应用相结合的形式,深入浅出地介绍了Python图形图像处理经典实现。全书共10章,主要包括绪论、迈进Python、Python图形用户界面、数据可视化分析、图像视觉增强分析、图像视觉复原分析、图像视觉几何变换与校正分析、图像视觉分割技术分析、图像视觉描述与特征提取分析、车牌识别分析等内容。通过本书的学习,读者可领略到Py计算机12.3万字 - 会员
GPT图解:大模型是怎样构建的
人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理(NLP)技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2计算机14万字