Repository navigation

d4rl

Website
Wikipedia

High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC

d4rl gym offline-reinforcement-learning reinforcement-learning

Python

1244

153

2 年前

Farama-Foundation / Gymnasium-Robotics

A collection of robotics simulation environments for reinforcement learning

d4rl mujoco reinforcement-learning Robotics Simulation

Python

738

117

1 天前

nissymori / JAX-CORL

Clean single-file implementation of offline RL algorithms in JAX

jax single-file flax cql reinforcement-learning d4rl offline-reinforcement-learning

Python

150

8 个月前

EmptyJackson / unifloral

Unified Implementations of Offline Reinforcement Learning Algorithms

d4rl jax offline-reinforcement-learning flax wandb

Python

4 个月前

Howuhh / sac-n-jax

Single-file SAC-N implementation on jax with flax and equinox. 10x faster than pytorch

d4rl offline-reinforcement-learning reinforcement-learning flax jax equinox

Python

2 年前

thu-ml / SRPO

Codes accompanying the paper "Score Regularized Policy Optimization through Diffusion Behavior" (ICLR 2024).

diffusion generative offline reinforcement-learning score-based-models rl d4rl

Python

2 年前

SaminYeasar / Offline-Reinforcement-Learning-Algorithms

PyTorch Implementation of Offline Reinforcement Learning algorithms

d4rl PyTorch

Python

3 年前

alexchen-buaa / flexrl

Non-modular implementation of common RL algorithms

deep-reinforcement-learning jax offline-reinforcement-learning PyTorch reinforcement-learning gym atari mujoco d4rl

Python

2 年前

czp16 / cde-offline-rl

Learning from Sparse Offline Datasets via Conservative Density Estimation (ICLR 2024)

d4rl offline-reinforcement-learning reinforcement-learning pytorch-implementation

Python

2 年前

Greenery-S / dql_jax

a clear and fast jax/flax version of [Diffusion-Policies-for-Offline-RL](https://github.com/Zhendong-Wang/Diffusion-Policies-for-Offline-RL)

d4rl diffusion-model flax jax q-learning reinforcement-learning

Python

6 个月前