Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

67,683

Full-text search

Active filters: reinforcement-learning

Terence3927/Reinforce-CartPole-v1

Reinforcement Learning • Updated Nov 11, 2022

achimvp/q-Taxi-v3

Reinforcement Learning • Updated Jan 15, 2024

matthh/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2023 • 4

OSalem99/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 11, 2022

OSalem99/q-Taxi-v3

Reinforcement Learning • Updated Nov 11, 2022

OSalem99/q-Taxi-v3-2

Reinforcement Learning • Updated Nov 11, 2022

Terence3927/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Nov 11, 2022

alextoyment/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 12, 2022

alextoyment/q-Taxi-v3

Reinforcement Learning • Updated Nov 12, 2022

Terence3927/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Nov 12, 2022 • 2

reza-aditya/dqn-SpaceInvanderNoFrameskip-v4

Reinforcement Learning • Updated Nov 12, 2022 • 8

jmsalvi/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Dec 9, 2022 • 6

phildav/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Nov 12, 2022 • 4

Mario16180/ElPanaMario_q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 12, 2022

benderv/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 9, 2022 • 10

Mario16180/ElPanaMario_q-Taxi-v3

Reinforcement Learning • Updated Nov 12, 2022

ahmadRa/try-reinforce-cartpole-custom-1

Reinforcement Learning • Updated Nov 12, 2022

ahmadRa/try-reinforce-cartpole-custom-2

Reinforcement Learning • Updated Nov 12, 2022

OSalem99/testpyramidsrnd

Reinforcement Learning • Updated Nov 13, 2022 • 6

OSalem99/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Nov 12, 2022 • 7

reza-aditya/testpyramidsrnd

Reinforcement Learning • Updated Nov 13, 2022 • 11

tsuneji/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 13, 2022 • 2

reza-aditya/Reinforce-scratch-pole

Reinforcement Learning • Updated Nov 13, 2022

phildav/testpyramidsrnd

Reinforcement Learning • Updated Nov 13, 2022 • 9

Oleg78/dqnSpaceI

Reinforcement Learning • Updated Nov 13, 2022 • 9

reza-aditya/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Nov 15, 2022

OSalem99/Reinforce-V0

Reinforcement Learning • Updated Nov 13, 2022

reza-aditya/Reinforce-Pong-PLE-v0

Reinforcement Learning • Updated Nov 15, 2022

phildav/Reinforce-carpole

Reinforcement Learning • Updated Nov 13, 2022

phildav/Reinforce-pixelcopter

Reinforcement Learning • Updated Nov 13, 2022