GPT3.int8(): 8-bit matrix multiplication for transformers at scale

· 2022

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

MUXQ: Mixed-to-Uniform Precision MatriX Quantization via Low-Rank Outlier Decomposition

cs.LG · 2026-04-06 · unverdicted · novelty 5.0

MUXQ uses low-rank outlier decomposition to redistribute activation outliers, allowing mixed-to-uniform INT8 quantization of LLMs with lower perplexity than naive methods on GPT-2 models.

citing papers explorer

Showing 1 of 1 citing paper.

MUXQ: Mixed-to-Uniform Precision MatriX Quantization via Low-Rank Outlier Decomposition cs.LG · 2026-04-06 · unverdicted · none · ref 6
MUXQ uses low-rank outlier decomposition to redistribute activation outliers, allowing mixed-to-uniform INT8 quantization of LLMs with lower perplexity than naive methods on GPT-2 models.

GPT3.int8(): 8-bit matrix multiplication for transformers at scale

fields

years

verdicts

representative citing papers

citing papers explorer