{"record_type":"pith_number_record","schema_url":"https://pith.science/schemas/pith-number/v1.json","pith_number":"pith:2026:GBMTPDMW5TDEZKENPKYPPY3PDJ","short_pith_number":"pith:GBMTPDMW","schema_version":"1.0","canonical_sha256":"3059378d96ecc64ca88d7ab0f7e36f1a445b63f3eedd79001b46bbd23bfa661a","source":{"kind":"arxiv","id":"2606.27941","version":1},"attestation_state":"computed","paper":{"title":"VASAE: Naming SAE Dictionary Directions with Vocabulary-Aligned Anchoring","license":"http://creativecommons.org/licenses/by/4.0/","headline":"","cross_cats":["cs.AI","cs.LG"],"primary_cat":"cs.CL","authors_text":"Kairui Zhang, Martha Lewis, Zahraa S. Abdallah, Ziwen Yu","submitted_at":"2026-06-26T10:30:56Z","abstract_excerpt":"Sparse autoencoders (SAEs) provide useful decompositions of Transformer residual streams, but their learned features are usually named post hoc rather than directly connected to the Transformer's token vocabulary. We introduce Vocabulary-Aligned Sparse Autoencoder (VASAE), a method that trains SAE features under vocabulary-aligned anchoring and assigns each feature an intrinsic token name: the token string whose embedding is nearest to that feature. Without reducing reconstruction quality compared with a standard SAE, VASAE produces dictionaries with vocabulary-aligned features. Using a 0.8 cu"},"verification_status":{"content_addressed":true,"pith_receipt":true,"author_attested":false,"weak_author_claims":0,"strong_author_claims":0,"externally_anchored":false,"storage_verified":false,"citation_signatures":0,"replication_records":0,"graph_snapshot":true,"references_resolved":false,"formal_links_present":false},"canonical_record":{"source":{"id":"2606.27941","kind":"arxiv","version":1},"metadata":{"license":"http://creativecommons.org/licenses/by/4.0/","primary_cat":"cs.CL","submitted_at":"2026-06-26T10:30:56Z","cross_cats_sorted":["cs.AI","cs.LG"],"title_canon_sha256":"29c4cd44db52d91469c1abeea8d4c5b9a4d9ea717bad36b84ea001e9d7032c7a","abstract_canon_sha256":"66208e877847ab6a2809e740ecf46915030083f3dbe32e66bc144e9c4e89496b"},"schema_version":"1.0"},"receipt":{"kind":"pith_receipt","key_id":"pith-v1-2026-05","algorithm":"ed25519","signed_at":"2026-06-29T01:14:53.324975Z","signature_b64":"ThlAWb1L4g7y0qwvVaYuonoHsKDlW315NT4oOfsTpcIwgn63K5n7OmDzr7YzVKU+6zJiSi6/Ke1e60Hc8V3eBw==","signed_message":"canonical_sha256_bytes","builder_version":"pith-number-builder-2026-05-17-v1","receipt_version":"0.3","canonical_sha256":"3059378d96ecc64ca88d7ab0f7e36f1a445b63f3eedd79001b46bbd23bfa661a","last_reissued_at":"2026-06-29T01:14:53.324545Z","signature_status":"signed_v1","first_computed_at":"2026-06-29T01:14:53.324545Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54"},"graph_snapshot":{"paper":{"title":"VASAE: Naming SAE Dictionary Directions with Vocabulary-Aligned Anchoring","license":"http://creativecommons.org/licenses/by/4.0/","headline":"","cross_cats":["cs.AI","cs.LG"],"primary_cat":"cs.CL","authors_text":"Kairui Zhang, Martha Lewis, Zahraa S. Abdallah, Ziwen Yu","submitted_at":"2026-06-26T10:30:56Z","abstract_excerpt":"Sparse autoencoders (SAEs) provide useful decompositions of Transformer residual streams, but their learned features are usually named post hoc rather than directly connected to the Transformer's token vocabulary. We introduce Vocabulary-Aligned Sparse Autoencoder (VASAE), a method that trains SAE features under vocabulary-aligned anchoring and assigns each feature an intrinsic token name: the token string whose embedding is nearest to that feature. Without reducing reconstruction quality compared with a standard SAE, VASAE produces dictionaries with vocabulary-aligned features. Using a 0.8 cu"},"claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"2606.27941","kind":"arxiv","version":1},"verdict":{"id":null,"model_set":{},"created_at":null,"strongest_claim":"","one_line_summary":"","pipeline_version":null,"weakest_assumption":"","pith_extraction_headline":""},"integrity":{"clean":true,"summary":{"advisory":0,"critical":0,"by_detector":{},"informational":0},"endpoint":"/pith/2606.27941/integrity.json","findings":[],"available":true,"detectors_run":[],"snapshot_sha256":"c28c3603d3b5d939e8dc4c7e95fa8dfce3d595e45f758748cecf8e644a296938"},"references":{"count":0,"sample":[],"resolved_work":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","internal_anchors":0},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"author_claims":{"count":0,"strong_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"builder_version":"pith-number-builder-2026-05-17-v1"},"aliases":[{"alias_kind":"arxiv","alias_value":"2606.27941","created_at":"2026-06-29T01:14:53.324595+00:00"},{"alias_kind":"arxiv_version","alias_value":"2606.27941v1","created_at":"2026-06-29T01:14:53.324595+00:00"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.2606.27941","created_at":"2026-06-29T01:14:53.324595+00:00"},{"alias_kind":"pith_short_12","alias_value":"GBMTPDMW5TDE","created_at":"2026-06-29T01:14:53.324595+00:00"},{"alias_kind":"pith_short_16","alias_value":"GBMTPDMW5TDEZKEN","created_at":"2026-06-29T01:14:53.324595+00:00"},{"alias_kind":"pith_short_8","alias_value":"GBMTPDMW","created_at":"2026-06-29T01:14:53.324595+00:00"}],"events":[],"event_summary":{},"paper_claims":[],"inbound_citations":{"count":0,"internal_anchor_count":0,"sample":[]},"formal_canon":{"evidence_count":0,"sample":[],"anchors":[]},"links":{"html":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ","json":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ.json","graph_json":"https://pith.science/api/pith-number/GBMTPDMW5TDEZKENPKYPPY3PDJ/graph.json","events_json":"https://pith.science/api/pith-number/GBMTPDMW5TDEZKENPKYPPY3PDJ/events.json","paper":"https://pith.science/paper/GBMTPDMW"},"agent_actions":{"view_html":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ","download_json":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ.json","view_paper":"https://pith.science/paper/GBMTPDMW","resolve_alias":"https://pith.science/api/pith-number/resolve?arxiv=2606.27941&json=true","fetch_graph":"https://pith.science/api/pith-number/GBMTPDMW5TDEZKENPKYPPY3PDJ/graph.json","fetch_events":"https://pith.science/api/pith-number/GBMTPDMW5TDEZKENPKYPPY3PDJ/events.json","actions":{"anchor_timestamp":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ/action/timestamp_anchor","attest_storage":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ/action/storage_attestation","attest_author":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ/action/author_attestation","sign_citation":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ/action/citation_signature","submit_replication":"https://pith.science/pith/GBMTPDMW5TDEZKENPKYPPY3PDJ/action/replication_record"}},"created_at":"2026-06-29T01:14:53.324595+00:00","updated_at":"2026-06-29T01:14:53.324595+00:00"}