Limited Generalizability in Argument Mining: State-Of-The-Art Models Learn Datasets, Not Arguments

Feger, Marc, Boland, Katarina, Dietze, Stefan · 2025 · DOI 10.18653/v1/2025.acl-long.1164

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

representative citing papers

ArgBench: Benchmarking LLMs on Computational Argumentation Tasks

cs.CL · 2026-04-19 · unverdicted · novelty 8.0

ArgBench unifies 33 existing datasets into a standardized benchmark for testing LLMs across 46 argumentation tasks and analyzes the impact of prompting techniques and model factors on performance.

citing papers explorer

Showing 1 of 1 citing paper.

ArgBench: Benchmarking LLMs on Computational Argumentation Tasks cs.CL · 2026-04-19 · unverdicted · none · ref 19
ArgBench unifies 33 existing datasets into a standardized benchmark for testing LLMs across 46 argumentation tasks and analyzes the impact of prompting techniques and model factors on performance.

Limited Generalizability in Argument Mining: State-Of-The-Art Models Learn Datasets, Not Arguments

fields

years

verdicts

representative citing papers

citing papers explorer