Robust multi-objective controlled decoding of large language models

Seongho Son, William Bankes, Sangwoong Yoon, Shyam Sundhar Ramesh, Xiaohang Tang, Ilija Bogunovic · 2025 · arXiv 2503.08796

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

read on arXiv browse 2 citing papers

representative citing papers

Common-agency Games for Multi-Objective Test-Time Alignment

cs.GT · 2026-05-08 · unverdicted · novelty 6.0

CAGE uses common-agency games and an EPEC algorithm to compute equilibrium policies that balance multiple conflicting objectives for test-time LLM alignment.

One Model for All: Multi-Objective Controllable Language Models

cs.LG · 2026-04-06 · unverdicted · novelty 6.0

Multi-Objective Control trains a single LLM as a preference-conditioned policy using multi-objective optimization in RLHF to produce outputs in user-specified regions of the Pareto front.

citing papers explorer

Showing 2 of 2 citing papers.

Common-agency Games for Multi-Objective Test-Time Alignment cs.GT · 2026-05-08 · unverdicted · none · ref 228
CAGE uses common-agency games and an EPEC algorithm to compute equilibrium policies that balance multiple conflicting objectives for test-time LLM alignment.
One Model for All: Multi-Objective Controllable Language Models cs.LG · 2026-04-06 · unverdicted · none · ref 26
Multi-Objective Control trains a single LLM as a preference-conditioned policy using multi-objective optimization in RLHF to produce outputs in user-specified regions of the Pareto front.

Robust multi-objective controlled decoding of large language models

fields

years

verdicts

representative citing papers

citing papers explorer