Deep recurrent q-learning for partially observable mdps.arXiv preprint arXiv:1507.06527

Matthew Hausknecht, Peter Stone · 2015 · arXiv 1507.06527

5 Pith papers cite this work. Polarity classification is still indexing.

5 Pith papers citing it

read on arXiv browse 5 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Contextual Control without Memory Growth in a Context-Switching Task

cs.AI · 2026-04-03 · unverdicted · novelty 7.0

Intervention on a fixed-size recurrent state enables contextual control in sequential decisions without memory growth or direct context input.

Anticipatory Reinforcement Learning: From Generative Path-Laws to Distributional Value Functions

cs.LG · 2026-04-06 · unverdicted · novelty 6.0

ARL lifts states into signature-augmented manifolds and employs self-consistent proxies of future path-laws to enable deterministic expected-return evaluation while preserving contraction mappings in jump-diffusion environments.

ALFWorld: Aligning Text and Embodied Environments for Interactive Learning

cs.CL · 2020-10-08 · conditional · novelty 6.0

ALFWorld aligns text-based and embodied visual environments so agents can learn abstract policies in TextWorld that transfer to better performance on ALFRED tasks than visual-only training.

Belief-State RWKV for Reinforcement Learning under Partial Observability

cs.LG · 2026-04-01 · unverdicted · novelty 5.0

Belief-state RWKV maintains an uncertainty-aware recurrent state for RL policies in partial observability and shows modest gains over standard recurrent baselines in a pilot with observation noise.

Deep Learning for Sequential Decision Making under Uncertainty: Foundations, Frameworks, and Frontiers

math.OC · 2026-04-13 · unverdicted · novelty 2.0

A tutorial framing deep learning as a complement to optimization for sequential decision-making under uncertainty, with applications in supply chains, healthcare, and energy.

citing papers explorer

Showing 5 of 5 citing papers.

Contextual Control without Memory Growth in a Context-Switching Task cs.AI · 2026-04-03 · unverdicted · none · ref 9
Intervention on a fixed-size recurrent state enables contextual control in sequential decisions without memory growth or direct context input.
Anticipatory Reinforcement Learning: From Generative Path-Laws to Distributional Value Functions cs.LG · 2026-04-06 · unverdicted · none · ref 15
ARL lifts states into signature-augmented manifolds and employs self-consistent proxies of future path-laws to enable deterministic expected-return evaluation while preserving contraction mappings in jump-diffusion environments.
ALFWorld: Aligning Text and Embodied Environments for Interactive Learning cs.CL · 2020-10-08 · conditional · none · ref 2
ALFWorld aligns text-based and embodied visual environments so agents can learn abstract policies in TextWorld that transfer to better performance on ALFRED tasks than visual-only training.
Belief-State RWKV for Reinforcement Learning under Partial Observability cs.LG · 2026-04-01 · unverdicted · none · ref 6
Belief-state RWKV maintains an uncertainty-aware recurrent state for RL policies in partial observability and shows modest gains over standard recurrent baselines in a pilot with observation noise.
Deep Learning for Sequential Decision Making under Uncertainty: Foundations, Frameworks, and Frontiers math.OC · 2026-04-13 · unverdicted · none · ref 60
A tutorial framing deep learning as a complement to optimization for sequential decision-making under uncertainty, with applications in supply chains, healthcare, and energy.

Deep recurrent q-learning for partially observable mdps.arXiv preprint arXiv:1507.06527

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer