百度360必应搜狗淘宝本站头条

强化学习框架 第2页

    一个Pythonte特别有用的强化学习研究框架

    Dopamine,强化学习的快乐源泉!Dopamine,听这名字就带劲!它可不是让你上瘾的那种多巴胺,而是一个Google开源的Python强化学习框架。这玩意儿好用得不得了,专为强化学习研究人员和爱好者打造,让你快速搭建、训练和测试各种强化学习Agent(智能体)。想玩转Atari游戏、探索迷宫世...

    最大扩散强化学习:为具身智能体而构建的强化学习框架

    机器人和自动驾驶汽车等具身智能体的体验表现出空间和时间的相关性。这些相关性给学习算法带来了挑战,学习算法通常依赖于数据独立且同分布的假设。这些挑战在强化学习(RL)中尤其明显,其中智能体体验的顺序性是不可避免的。在这项工作中,我们通过利用遍历扩散过程的统计物理学来解决这些限制。我们的方法被称为“最大...