arXiv preprint arXiv:2503.06358 (2025)

Shenfeld, I · 2025 · arXiv 2503.06358

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Personalization Meets Safety:Mechanisms,Risks,and Mitigations in Personalized LLMs

cs.AI · 2026-06-08 · unverdicted · novelty 5.0

A survey that maps safety risks in personalized LLMs, introduces a unified taxonomy, and highlights three structural inadequacies in existing research on user-invariant safety, isolated techniques, and short-term evaluations.

PAFO: Pareto Fairness Optimization for Personalized Reward Modeling

cs.AI · 2026-06-06 · unverdicted · novelty 5.0

PAFO applies Pareto fairness optimization and group-specialized distillation to produce a single personalized reward model that improves accuracy for both majority and minority preference groups without requiring group labels at inference.

citing papers explorer

Showing 2 of 2 citing papers.

Personalization Meets Safety:Mechanisms,Risks,and Mitigations in Personalized LLMs cs.AI · 2026-06-08 · unverdicted · none · ref 168
A survey that maps safety risks in personalized LLMs, introduces a unified taxonomy, and highlights three structural inadequacies in existing research on user-invariant safety, isolated techniques, and short-term evaluations.
PAFO: Pareto Fairness Optimization for Personalized Reward Modeling cs.AI · 2026-06-06 · unverdicted · none · ref 32
PAFO applies Pareto fairness optimization and group-specialized distillation to produce a single personalized reward model that improves accuracy for both majority and minority preference groups without requiring group labels at inference.

arXiv preprint arXiv:2503.06358 (2025)

fields

years

verdicts

representative citing papers

citing papers explorer