Zenodo, 2025

Vals AI · 2025 · DOI 10.5281/zenodo.15428639

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

representative citing papers

The Stanford EDGAR Filings Dataset: Reconstructing U.S. Corporate and Financial Disclosures into Layout-Faithful and Token-Efficient Pretraining Data

cs.AI · 2026-06-16 · unverdicted · novelty 7.0

SEFD reconstructs SEC filings into MultiMarkdown to create a 152B-token financial pretraining corpus with low overlap to existing data and introduces EDGAR-Forecast and EDGAR-OCR benchmarks.

citing papers explorer

Showing 1 of 1 citing paper.

The Stanford EDGAR Filings Dataset: Reconstructing U.S. Corporate and Financial Disclosures into Layout-Faithful and Token-Efficient Pretraining Data cs.AI · 2026-06-16 · unverdicted · none · ref 19
SEFD reconstructs SEC filings into MultiMarkdown to create a 152B-token financial pretraining corpus with low overlap to existing data and introduces EDGAR-Forecast and EDGAR-OCR benchmarks.

Zenodo, 2025

fields

years

verdicts

representative citing papers

citing papers explorer