Repository navigation

markov-decision-processes

Website
Wikipedia

afshinea / stanford-cs-221-artificial-intelligence

VIP cheatsheets for Stanford's CS 221 Artificial Intelligence

cheatsheet 人工智能 markov-decision-processes a-star constraint-satisfaction-problem bayesian-networks 数据科学

2698

512

5 年前

sudharsan13296 / Hands-On-Reinforcement-Learning-With-Python

Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow

reinforcement-learning deep-reinforcement-learning sarsa q-learning deep-q-network 深度学习 deep-deterministic-policy-gradient double-dqn dueling-dqn ppo markov-decision-processes policy-gradient openai-gym

Jupyter Notebook

849

324

5 年前

JuliaPOMDP / POMDPs.jl

MDPs and POMDPs in Julia - An interface for defining, solving, and simulating fully and partially observable Markov decision processes on discrete and continuous spaces.

pomdps markov-decision-processes Julia 语言人工智能 control-systems reinforcement-learning reinforcement-learning-algorithms mdps Python

Julia

705

104

7 天前

Svalorzen / AI-Toolbox

A C++ framework for MDPs and POMDPs with Python bindings

C++人工智能 markov-decision-processes Python mdps pomdps reinforcement-learning planning

C++

657

100

1 个月前

joanby / curso-algebra-lineal

Curso de Álgebra Lineal

algebra linear-algebra linear-programming vectors markov-chain markov-decision-processes udemy juan-gabriel-gomila udemy-curso

HTML

489

1063

9 个月前

ds4dm / ecole

Extensible Combinatorial Optimization Learning Environments

markov-decision-processes combinatorial-optimization 机器学习 gym

C++

339

2 年前

odow / SDDP.jl

A JuMP extension for Stochastic Dual Dynamic Programming

Julia 语言 optimization stochastic-optimization optimal-control jump markov-decision-processes

Julia

324

4 天前

h2r / pomdp-py

A framework to build and solve POMDP problems. Documentation: https://h2r.github.io/pomdp-py/

pomdps markov-decision-processes Python cython easy-to-use

Python

244

6 个月前

ImanRHT / QECO

A QoE-Oriented Computation Offloading Algorithm based on Deep Reinforcement Learning (DRL) for Mobile Edge Computing (MEC) | This algorithm captures the dynamics of the MEC environment by integrating the Dueling Double Deep Q-Network (D3QN) model with Long Short-Term Memory (LSTM) networks.

deep-reinforcement-learning edge-computing deep-q-network dqn resource-management markov-decision-processes offloading

Python

213

15 天前

colinskow / move37

Coding Demos from the School of AI's Move37 Course

reinforcement-learning dynamic-programming markov-decision-processes

Python

184

118

6 年前

DES-Lab / AALpy

An Automata Learning Library Written in Python

automata markov-decision-processes finite-state-machine dfa markov-chain kv Python

Python

179

9 天前

florist-notes / CS228_PGM

🌲 Stanford CS 228 - Probabilistic Graphical Models

stanford-university markov-decision-processes bayesian

Python

129

8 个月前

Limmen / csle

A research platform to develop automated security policies using quantitative methods, e.g., optimal control, computational game theory, reinforcement learning, optimization, evolutionary methods, and causal inference.

reinforcement-learning Cybersecurity markov-decision-processes 深度学习 game-theory self-learning

Python

124

1 个月前

sachinbiradar9 / Markov-Decision-Processes

Implementation of value iteration algorithm for calculating an optimal MDP policy

markov-decision-processes

Python

7 年前

wrighteagle2d / wrighteaglebase

WrightEagle Base Code for RoboCup Soccer Simulation 2D

soccer decision-making markov-decision-processes

C++

3 年前

amflorio / dvrp-stochastic-requests

Online algorithms for solving large-scale dynamic vehicle routing problems with stochastic requests

optimization Simulation vehicle-routing-problem markov-decision-processes

Makefile

3 年前

OpenSourceEconomics / respy

Framework for the simulation and estimation of some finite-horizon discrete choice dynamic programming models.

economics markov-decision-processes

Python

20 天前

lsunsi / markovjs

Reinforcement Learning in JavaScript

reinforcement-learning JavaScript 机器学习 markov-decision-processes

JavaScript

8 年前

masouduut94 / MCTS-agent-python

Monte Carlo Tree Search (MCTS) is a method for finding optimal decisions in a given domain by taking random samples in the decision space and building a search tree accordingly. It has already had a profound impact on Artificial Intelligence (AI) approaches for domains that can be represented as trees of sequential decisions, particularly games and planning problems. In this project I used a board game called "HEX" as a platform to test different simulation strategies in MCTS field.

mcts markov-decision-processes monte-carlo-tree-search reinforcement-learning

Python

1 年前

italohdc / LearnSnake

🐍 AI that learns to play Snake using Q-Learning (Reinforcement Learning)

q-learning reinforcement-learning snake-game 人工智能 markov-decision-processes

JavaScript

6 年前