Yamshchikov, and Mark Fishel

Taido Purason, Pavel Chizhov, Ivan P · 2025 · arXiv 2512.03989

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Adapting Multilingual Embedding Models to Turkish via Cross-Lingual Tokenizer Surgery and Offline Distillation

cs.CL · 2026-05-28 · unverdicted · novelty 5.0

A 200M-parameter Turkish sentence embedding model is adapted from a multilingual teacher via tokenizer pruning, mean-composition initialization, and offline cosine distillation, achieving 77.55% Pearson correlation on STSbTR and 7th place on TR-MTEB.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Adapting Multilingual Embedding Models to Turkish via Cross-Lingual Tokenizer Surgery and Offline Distillation cs.CL · 2026-05-28 · unverdicted · none · ref 8
A 200M-parameter Turkish sentence embedding model is adapted from a multilingual teacher via tokenizer pruning, mean-composition initialization, and offline cosine distillation, achieving 77.55% Pearson correlation on STSbTR and 7th place on TR-MTEB.

Yamshchikov, and Mark Fishel

fields

years

verdicts

representative citing papers

citing papers explorer