集合三大类无模型强化学习算法,BAIR开源RL代码库rlpyt
发布时间:2019-10-09 01:36:00 所属栏目:建站 来源:机器之心编译
导读:副标题#e# 近日,BAIR 开源强化学习研究代码库 rlpyt,首次包含三大类无模型强化学习算法,并提出一种新型数据结构。 2013 年有研究者提出使用深度强化学习玩游戏,之后不久深度强化学习又被应用于模拟机器人控制,自此以后大量新算法层出不穷。其中大部分
试着写入一个(可能嵌套的)数组字典,这些数组具备一些共同的维度:
将上述代码替换成下列代码:
重要的是,不管 dest 和 src 是不同的 numpy 数组还是随机结构的数组集合,语法都是相同的(dest 和 src 的结构必须匹配,或者 src 是可应用于所有字段的单个值)。rlpyt 广泛使用该数据结构:使用相同的矩阵主维组织训练数据的不同元素,使其易于与期望时间维度或批量维度交互。此外,namedarraytuples 天然支持具备多模态动作或观测结果的环境。当神经网络的不同层使用不同模式时,这非常有用,因为它允许中间基础架构代码保持不变。 相关研究 深度强化学习新手可以先阅读其他资源,了解强化学习算法,如 OpenAI Spinning Up。 OpenAI Spinning Up 代码地址:https://github.com/openai/spinningup 文档地址:https://spinningup.openai.com/en/latest/ (编辑:成都站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |