Smith, and Luke Zettlemoyer

Blevins, Terra, Limisiewicz, Tomasz, Gururangan, Suchin, Li, Margaret, Gonen, Hila, Smith, Noah A · 2024 · DOI 10.18653/v1/2024.emnlp-main.604

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

open at publisher browse 3 citing papers

representative citing papers

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Source-Shielded Updates

cs.CL · 2025-12-04 · conditional · novelty 6.0

SSU mitigates catastrophic forgetting in low-resource LLM target-language adaptation by scoring and column-wise freezing source-critical parameters, reducing source degradation to ~3% versus ~20% for full fine-tuning while matching target performance.

Parameter Alignment Mitigates Catastrophic Forgetting in Multilingual Expert Language Models

cs.CL · 2026-05-29 · unverdicted · novelty 5.0

Parameter alignment strategies substantially reduce forgetting in family-based continual pretraining of multilingual LLMs across 32 languages with minimal impact on language acquisition.

Modular Monolingual Adaptation using Pretrained Language Models

cs.CL · 2026-06-04 · unverdicted · novelty 4.0

Replacing tokens, freezing the corresponding embeddings, and tuning the rest of the model improves NLU performance on low-resource languages compared to full fine-tuning.

citing papers explorer

Showing 3 of 3 citing papers.

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Source-Shielded Updates cs.CL · 2025-12-04 · conditional · none · ref 8
SSU mitigates catastrophic forgetting in low-resource LLM target-language adaptation by scoring and column-wise freezing source-critical parameters, reducing source degradation to ~3% versus ~20% for full fine-tuning while matching target performance.
Parameter Alignment Mitigates Catastrophic Forgetting in Multilingual Expert Language Models cs.CL · 2026-05-29 · unverdicted · none · ref 15
Parameter alignment strategies substantially reduce forgetting in family-based continual pretraining of multilingual LLMs across 32 languages with minimal impact on language acquisition.
Modular Monolingual Adaptation using Pretrained Language Models cs.CL · 2026-06-04 · unverdicted · none · ref 77
Replacing tokens, freezing the corresponding embeddings, and tuning the rest of the model improves NLU performance on low-resource languages compared to full fine-tuning.

Smith, and Luke Zettlemoyer

fields

years

verdicts

representative citing papers

citing papers explorer