Chen, Michael Y

Chen, M · arXiv 2411.05735

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

WARP: Weight-Space Analysis for Recovering Training Data Portfolios

cs.LG · 2026-07-02 · unverdicted · novelty 7.0

WARP recovers training domain mixtures from fine-tuned model weights using weight-space interpolation via model merging to generate pseudo-checkpoints and geometric features mapped to proportions.

DUET: Optimizing Training Data Mixtures via Feedback from Unseen Evaluation Tasks

cs.LG · 2025-02-01 · unverdicted · novelty 6.0

DUET is a global-to-local method that optimizes LLM training data mixtures via Bayesian optimization guided by influence-based selection and feedback from unseen evaluation tasks, with a regret bound showing convergence to the optimal mixture.

citing papers explorer

Showing 2 of 2 citing papers after filters.

WARP: Weight-Space Analysis for Recovering Training Data Portfolios cs.LG · 2026-07-02 · unverdicted · none · ref 4
WARP recovers training domain mixtures from fine-tuned model weights using weight-space interpolation via model merging to generate pseudo-checkpoints and geometric features mapped to proportions.
DUET: Optimizing Training Data Mixtures via Feedback from Unseen Evaluation Tasks cs.LG · 2025-02-01 · unverdicted · none · ref 3
DUET is a global-to-local method that optimizes LLM training data mixtures via Bayesian optimization guided by influence-based selection and feedback from unseen evaluation tasks, with a regret bound showing convergence to the optimal mixture.

Chen, Michael Y

fields

years

verdicts

representative citing papers

citing papers explorer