Improving transformer world models for data-efficient rl

Antoine Dedieu, Joseph Ortiz, Xinghua Lou, Carter Wendelken, Wolfgang Lehrach, J · 2025 · arXiv 2502.01591

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

From Pixels to Temporal Correlations: Learning Informative Representations for Reinforcement Learning Pre-training

cs.LG · 2026-07-01 · unverdicted · novelty 5.0

MTCL learns multi-scale temporal correlations in videos via contrastive learning to produce more informative representations that improve sample efficiency and performance in downstream RL tasks.

Simulus: Combining Improvements in Sample-Efficient World Model Agents

cs.LG · 2025-02-17 · unverdicted · novelty 5.0

Simulus integrates flexible tokenization, intrinsic motivation, prioritized world model replay, and regression-as-classification to achieve state-of-the-art sample efficiency for planning-free world model agents on visual Atari 100K, DMC Proprioception 500K, and symbolic Craftax-1M benchmarks.

citing papers explorer

Showing 2 of 2 citing papers.

From Pixels to Temporal Correlations: Learning Informative Representations for Reinforcement Learning Pre-training cs.LG · 2026-07-01 · unverdicted · none · ref 4
MTCL learns multi-scale temporal correlations in videos via contrastive learning to produce more informative representations that improve sample efficiency and performance in downstream RL tasks.
Simulus: Combining Improvements in Sample-Efficient World Model Agents cs.LG · 2025-02-17 · unverdicted · none · ref 13
Simulus integrates flexible tokenization, intrinsic motivation, prioritized world model replay, and regression-as-classification to achieve state-of-the-art sample efficiency for planning-free world model agents on visual Atari 100K, DMC Proprioception 500K, and symbolic Craftax-1M benchmarks.

Improving transformer world models for data-efficient rl

fields

years

verdicts

representative citing papers

citing papers explorer