Repository navigation

#

continuous-control

Website
Wikipedia

ikostrikov / pytorch-a2c-ppo-acktr-gail

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) and Generative Adversarial Imitation Learning (GAIL).

PyTorch reinforcement-learning 深度学习 deep-reinforcement-learning actor-critic advantage-actor-critic a2c ppo proximal-policy-optimization hessian atari mujoco roboschool continuous-control ale

Python

3835

841

3 年前

opendilab / LightZero

[NeurIPS 2023 Spotlight] LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios (awesome MCTS)

alphazero atari continuous-control monte-carlo-tree-search muzero PyTorch reinforcement-learning mcts board-game gym self-play

Python

1441

172

2 天前

rl-tools / rl-tools

The Fastest Deep Reinforcement Learning Library

continuous-control C++深度学习 mujoco reinforcement-learning Robotics tinyml tinyrl

C++

862

40

5 天前

ikostrikov / jaxrl

JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

深度学习 deep-reinforcement-learning continuous-control reinforcement-learning soft-actor-critic sac deep-deterministic-policy-gradient jax flax gym offline-reinforcement-learning

Jupyter Notebook

717

72

3 年前

denisyarats / pytorch_sac

PyTorch implementation of Soft Actor-Critic (SAC)

reinforcement-learning dm-control soft-actor-critic PyTorch deep-reinforcement-learning actor-critic mujoco gym 深度学习 sac continuous-control

Jupyter Notebook

559

107

4 年前

Omegastick / pytorch-cpp-rl

PyTorch C++ Reinforcement Learning

PyTorch C++reinforcement-learning reinforcement-learning-algorithms a2c ppo pytorch-rl pytorch-cpp-frontend libtorch actor-critic advantage-actor-critic proximal-policy-optimization continuous-control

C++

524

87

5 年前

ikostrikov / pytorch-trpo

PyTorch implementation of Trust Region Policy Optimization

reinforcement-learning continuous-control 深度学习 mujoco PyTorch deep-reinforcement-learning

Python

447

91

7 年前

chingyaoc / pytorch-REINFORCE

PyTorch Implementation of REINFORCE for both discrete & continuous control

reinforcement-learning reinforce continuous-control mujoco PyTorch gym

Python

267

50

8 年前

Code for the paper "Evolved Policy Gradients"

机器学习 reinforcement-learning continuous-control meta-learning Bukkit

Python

250

55

7 年前

m5823779 / motion-planner-reinforcement-learning

End to end motion planner using Deep Deterministic Policy Gradient (DDPG) in gazebo

deep-reinforcement-learning 神经网络深度学习 deep-deterministic-policy-gradient ddpg Tensorflow continuous-control navigation gazebo

Python

234

48

3 年前

andrewliao11 / gail-tf

Tensorflow implementation of generative adversarial imitation learning

imitation-learning Tensorflow continuous-control Generative Adversarial Network inverse-reinforcement-learning reinforcement-learning

Python

199

48

7 年前

zhihanyang2022 / off-policy-continuous-control

Official PyTorch code for "Recurrent Off-policy Baselines for Memory-based Continuous Control" (DeepRL Workshop, NeurIPS 21)

PyTorch recurrent-neural-network actor-critic continuous-control reinforcement-learning

Python

89

11

2 年前

andrewliao11 / pytorch-a3c-mujoco

Implement A3C for Mujoco gym envs

PyTorch reinforcement-learning a3c mujoco continuous-control actor-critic

Python

72

19

8 年前

fshamshirdar / pytorch-rdpg

PyTorch Implementation of the RDPG (Recurrent Deterministic Policy Gradient)

PyTorch recurrent-neural-networks deep-reinforcement-learning continuous-control

Python

56

24

3 年前

Scitator / catalyst-rl-framework

Catalyst.RL: A Distributed Framework for Reproducible RL Research

深度学习 reinforcement-learning continuous-control mujoco PyTorch Python benchmark 框架

Python

39

3

7 年前

simionsoft / SimionZoo

A workbench for online model-free Reinforcement Learning on continuous control problems

reinforcement-learning cntk continuous-control distributed-systems Windows Linux

C++

37

25

2 年前

LQNew / Continuous_Control_Benchmark

Benchmark data (i.e., DeepMind Control Suite and MuJoCo) for RL.

mujoco continuous-control reinforcement-learning td3 ddpg sac ppo

Python

31

1

5 年前

alirezakazemipour / Continuous-PPO

Proximal Policy Optimization (Continuous Version) in PyTorch.

ppo continuous-control

Python

29

3

5 个月前

BY571 / Normalized-Advantage-Function-NAF-

PyTorch implementation of the Q-Learning Algorithm Normalized Advantage Function for continuous control problems + PER and N-step Method

reinforcement-learning reinforcement-learning-algorithms q-learning continuous-control dqn

Jupyter Notebook

28

13

5 年前

mknbv / neuralode-rl

Neural Ordinary Differential Equations for Reinforcement Learning

reinforcement-learning Tensorflow continuous-control mujoco roboschool

Python

25

3

2 年前