Repository navigation

offline-reinforcement-learning

Website
Wikipedia

High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC

d4rl gym offline-reinforcement-learning reinforcement-learning

Python

1244

153

2 年前

ikostrikov / jaxrl

JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

深度学习 deep-reinforcement-learning continuous-control reinforcement-learning soft-actor-critic sac deep-deterministic-policy-gradient jax flax gym offline-reinforcement-learning

Jupyter Notebook

707

3 年前

yihaosun1124 / OfflineRL-Kit

An elegant PyTorch offline reinforcement learning library for researchers.

深度学习 deep-reinforcement-learning PyTorch reinforcement-learning offline-reinforcement-learning

Python

354

1 个月前

Allenpandas / Reinforcement-Learning-Papers

📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.

deep-reinforcement-learning reinforcement-learning dqn imitation-learning multi-agent-reinforcement-learning policy-gradient q-learning 人工智能 aaai icml neurips offline-reinforcement-learning

330

1 年前

Cryolite / kanachan

A Japanese (Riichi) Mahjong AI Framework

mahjong riichi-mahjong majsoul 机器学习 game-ai reinforcement-learning 深度学习 deep-reinforcement-learning transformers transformer imitation-learning offline-reinforcement-learning dqn

Python

319

6 个月前

nikhilbarhate99 / min-decision-transformer

Minimal implementation of Decision Transformer: Reinforcement Learning via Sequence Modeling in PyTorch for mujoco control tasks in OpenAI gym

reinforcement-learning deep-reinforcement-learning 深度学习 offline-reinforcement-learning PyTorch pytorch-transformers transformer 机器学习 openai-gym mujoco Robotics

Python

278

3 年前

polixir / OfflineRL

A collection of offline reinforcement learning algorithms.

offline-reinforcement-learning reinforcement-learning

Python

195

9 个月前

instadeepai / og-marl

Datasets with baselines for Offline MARL.

multi-agent-reinforcement-learning reinforcement-learning offline-reinforcement-learning

Python

177

2 天前

nissymori / JAX-CORL

Clean single-file implementation of offline RL algorithms in JAX

jax single-file flax cql reinforcement-learning d4rl offline-reinforcement-learning

Python

150

8 个月前

silverwingsbot / EasyCarla-RL

A simple and easy-to-use autonomous driving environment for reinforcement learning, based on the CARLA simulator.

autonomous-driving autonomous-vehicles carla carla-simulator gym offline-reinforcement-learning reinforcement-learning rl self-driving decision-making

Python

145

3 个月前

BY571 / CQL

PyTorch implementation of the Offline Reinforcement Learning algorithm CQL. Includes the versions DQN-CQL and SAC-CQL for discrete and continuous action spaces.

reinforcement-learning-algorithms offline-reinforcement-learning dqn sac pytorch-implementation PyTorch 机器学习

Python

140

1 年前

polixir / NeoRL

Python interface for accessing the near real-world offline reinforcement learning (NeoRL) benchmark datasets

offline-reinforcement-learning

Python

124

9 个月前

ZhengyaoJiang / latentplan

Code release for Efficient Planning in a Compact Latent Action Space (ICLR2023) https://arxiv.org/abs/2208.10291.

model-based-reinforcement-learning offline-reinforcement-learning reinforcement-learning generative-model transformer

Python

109

2 年前

ZhengYinan-AIR / FISOR

[ICLR 2024] The official implementation of "Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model"

diffusion-models jax offline-reinforcement-learning imitation-learning reinforcement-learning

Python

108

6 个月前

EmptyJackson / unifloral

Unified Implementations of Offline Reinforcement Learning Algorithms

d4rl jax offline-reinforcement-learning flax wandb

Python

4 个月前

snu-mllab / EDAC

Official PyTorch implementation of "Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble" (NeurIPS'21)

offline-reinforcement-learning

Python

3 年前

DHDev0 / Stochastic-muzero

Pytorch Implementation of Stochastic MuZero for gym environment. This algorithm is capable of supporting a wide range of action and observation spaces, including both discrete and continuous variations.

机器学习 offline-reinforcement-learning deep-reinforcement-learning gym-environments lstm monte-carlo-tree-search muzero PyTorch rl transformer multilayer-perceptron

Python

2 年前

ltlhuuu / PSEC

[ICLR 2025] The offical implementation of "PSEC: Skill Expansion and Composition in Parameter Space", a new framework designed to facilitate efficient and flexible skill expansion and composition, iteratively evolve the agents' capabilities and efficiently address new challenges

continual-learning decision-making fine-tuning large-language-models lora pretrained-models reinforcement-learning Robotics transfer-learning parameter-efficient-fine-tuning imitation-learning multi-objective-optimization offline-reinforcement-learning

Python

6 个月前