{"state_type":"pith_open_graph_state","state_version":"1.0","pith_number":"pith:2025:JEHTGC2WQE5RFZWBEGOB4MJKP4","merge_version":"pith-open-graph-merge-v1","event_count":2,"valid_event_count":2,"invalid_event_count":0,"equivocation_count":0,"current":{"canonical_record":{"metadata":{"abstract_canon_sha256":"09b66b2486338e2cc653cad250f5587cc76895f7bcc4d6b44b50389d530d73f7","cross_cats_sorted":["cs.AI"],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.CL","submitted_at":"2025-11-08T08:56:29Z","title_canon_sha256":"e4a0ae31c47649ffff31cfec44f9258bace2e8183b08db006c0b69c8bc90a9e2"},"schema_version":"1.0","source":{"id":"2511.05933","kind":"arxiv","version":2}},"source_aliases":[{"alias_kind":"arxiv","alias_value":"2511.05933","created_at":"2026-06-25T01:18:35Z"},{"alias_kind":"arxiv_version","alias_value":"2511.05933v2","created_at":"2026-06-25T01:18:35Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.2511.05933","created_at":"2026-06-25T01:18:35Z"},{"alias_kind":"pith_short_12","alias_value":"JEHTGC2WQE5R","created_at":"2026-06-25T01:18:35Z"},{"alias_kind":"pith_short_16","alias_value":"JEHTGC2WQE5RFZWB","created_at":"2026-06-25T01:18:35Z"},{"alias_kind":"pith_short_8","alias_value":"JEHTGC2W","created_at":"2026-06-25T01:18:35Z"}],"graph_snapshots":[{"event_id":"sha256:a5e7c3c8a726c38d850010d96c9ae4e50b73c1e8d0654e09b9ee4e7ced70c2c0","target":"graph","created_at":"2026-06-25T01:18:35Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"graph_snapshot":{"author_claims":{"count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","strong_count":0},"builder_version":"pith-number-builder-2026-05-17-v1","claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"integrity":{"available":true,"clean":true,"detectors_run":[],"endpoint":"/pith/2511.05933/integrity.json","findings":[],"snapshot_sha256":"c28c3603d3b5d939e8dc4c7e95fa8dfce3d595e45f758748cecf8e644a296938","summary":{"advisory":0,"by_detector":{},"critical":0,"informational":0}},"paper":{"abstract_excerpt":"Reinforcement learning (RL) is often credited with improving language model reasoning at the expense of knowledge. We challenge this narrative by showing that reasoning models consistently outperform their instruction-tuned versions on pure knowledge recall tasks. These gains do not reflect newly acquired information, but rather an improved procedural skill in navigating and searching existing knowledge hierarchies within the model parameters. Structured prompting, which explicitly guides models through hierarchical traversal -- recovers most of the instruct-reasoning gap across five model fam","authors_text":"Manasa Kaniselvan, Renfei Zhang, Rylan Schaeffer abd Niloofar Mireshghallah","cross_cats":["cs.AI"],"headline":"","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.CL","submitted_at":"2025-11-08T08:56:29Z","title":"Reinforcement Learning Improves Traversal of Parametric Knowledge in LLMs"},"references":{"count":0,"internal_anchors":0,"resolved_work":0,"sample":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"2511.05933","kind":"arxiv","version":2},"verdict":{"created_at":null,"id":null,"model_set":{},"one_line_summary":"","pipeline_version":null,"pith_extraction_headline":"","strongest_claim":"","weakest_assumption":""}},"verdict_id":null}}],"author_attestations":[],"timestamp_anchors":[],"storage_attestations":[],"citation_signatures":[],"replication_records":[],"corrections":[],"mirror_hints":[],"record_created":{"event_id":"sha256:3e441204fcfd035d9cc33a39274a1024784c178cb61f8b48034a25bce32ff9b0","target":"record","created_at":"2026-06-25T01:18:35Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"attestation_state":"computed","canonical_record":{"metadata":{"abstract_canon_sha256":"09b66b2486338e2cc653cad250f5587cc76895f7bcc4d6b44b50389d530d73f7","cross_cats_sorted":["cs.AI"],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.CL","submitted_at":"2025-11-08T08:56:29Z","title_canon_sha256":"e4a0ae31c47649ffff31cfec44f9258bace2e8183b08db006c0b69c8bc90a9e2"},"schema_version":"1.0","source":{"id":"2511.05933","kind":"arxiv","version":2}},"canonical_sha256":"490f330b56813b12e6c1219c1e312a7f2e01b8e9de544714cb4dba5c1f305c94","receipt":{"algorithm":"ed25519","builder_version":"pith-number-builder-2026-05-17-v1","canonical_sha256":"490f330b56813b12e6c1219c1e312a7f2e01b8e9de544714cb4dba5c1f305c94","first_computed_at":"2026-06-25T01:18:35.904755Z","key_id":"pith-v1-2026-05","kind":"pith_receipt","last_reissued_at":"2026-06-25T01:18:35.904755Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","receipt_version":"0.3","signature_b64":"avQsd+wtUVuqcpvioIbFDx1gEjiMUH3bOgAo6hmsbKwmhbDEXw2iT9/BGGyqJrKsWe1yOTjDCdcslwXoksndDw==","signature_status":"signed_v1","signed_at":"2026-06-25T01:18:35.905221Z","signed_message":"canonical_sha256_bytes"},"source_id":"2511.05933","source_kind":"arxiv","source_version":2}}},"equivocations":[],"invalid_events":[],"applied_event_ids":["sha256:3e441204fcfd035d9cc33a39274a1024784c178cb61f8b48034a25bce32ff9b0","sha256:a5e7c3c8a726c38d850010d96c9ae4e50b73c1e8d0654e09b9ee4e7ced70c2c0"],"state_sha256":"99f304c45a195525bc6f69bb25a371a78b84d980370a8d43604b62a5238961ea"}