Holistic evaluation for interleaved text-and-image generation.arXiv preprint arXiv:2406.14643, 2024

Minqian Liu, Zhiyang Xu, Zihao Lin, Trevor Ashby, Joy Rimchala, Jiaxin Zhang, Lifu Huang · 2024 · arXiv 2406.14643

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Pareto LoRA: Mitigating Modality Imbalance in Unified Multimodal Models via Pareto-Optimal Gradient Integration

cs.CV · 2026-06-15 · unverdicted · novelty 6.0

Pareto LoRA applies Pareto-optimal gradient integration to balance text and image objectives in LoRA-based fine-tuning of unified multimodal models, reporting up to 44.9% gains in image quality on the CoMM benchmark with Emu2 while preserving text performance.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Pareto LoRA: Mitigating Modality Imbalance in Unified Multimodal Models via Pareto-Optimal Gradient Integration cs.CV · 2026-06-15 · unverdicted · none · ref 23
Pareto LoRA applies Pareto-optimal gradient integration to balance text and image objectives in LoRA-based fine-tuning of unified multimodal models, reporting up to 44.9% gains in image quality on the CoMM benchmark with Emu2 while preserving text performance.

Holistic evaluation for interleaved text-and-image generation.arXiv preprint arXiv:2406.14643, 2024

fields

years

verdicts

representative citing papers

citing papers explorer