{"state_type":"pith_open_graph_state","state_version":"1.0","pith_number":"pith:2025:VRF6NTTJAFZFM6EICMCNXGPS2M","merge_version":"pith-open-graph-merge-v1","event_count":2,"valid_event_count":2,"invalid_event_count":0,"equivocation_count":0,"current":{"canonical_record":{"metadata":{"abstract_canon_sha256":"f3a05806e5a494c81b9b3ef25060d73ac97f306473a5c26c702c406f18988bef","cross_cats_sorted":[],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.CV","submitted_at":"2025-12-01T18:45:30Z","title_canon_sha256":"60883798048299e45710514d8551936216061e381ba449c79dc0720d3739f93d"},"schema_version":"1.0","source":{"id":"2512.01988","kind":"arxiv","version":2}},"source_aliases":[{"alias_kind":"arxiv","alias_value":"2512.01988","created_at":"2026-05-28T02:04:44Z"},{"alias_kind":"arxiv_version","alias_value":"2512.01988v2","created_at":"2026-05-28T02:04:44Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.2512.01988","created_at":"2026-05-28T02:04:44Z"},{"alias_kind":"pith_short_12","alias_value":"VRF6NTTJAFZF","created_at":"2026-05-28T02:04:44Z"},{"alias_kind":"pith_short_16","alias_value":"VRF6NTTJAFZFM6EI","created_at":"2026-05-28T02:04:44Z"},{"alias_kind":"pith_short_8","alias_value":"VRF6NTTJ","created_at":"2026-05-28T02:04:44Z"}],"graph_snapshots":[{"event_id":"sha256:02ad5a3ec7455795ad72068b4950d13b4432e44443f8326f61d4f3925ddbdb78","target":"graph","created_at":"2026-05-28T02:04:44Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"graph_snapshot":{"author_claims":{"count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","strong_count":0},"builder_version":"pith-number-builder-2026-05-17-v1","claims":{"count":0,"items":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"integrity":{"available":true,"clean":true,"detectors_run":[],"endpoint":"/pith/2512.01988/integrity.json","findings":[],"snapshot_sha256":"c28c3603d3b5d939e8dc4c7e95fa8dfce3d595e45f758748cecf8e644a296938","summary":{"advisory":0,"by_detector":{},"critical":0,"informational":0}},"paper":{"abstract_excerpt":"Recent reinforcement-learning frameworks for visual perception policy usually incorporate intermediate reasoning chains expressed in natural language. Empirical observations indicate that such purely linguistic intermediate reasoning often reduces performance on perception tasks. We argue that the core issue lies not in reasoning per se but in the form of reasoning: while these chains perform semantic reasoning in an unstructured linguistic space, \\textbf{visual perception requires reasoning in a spatial and object-centric space}. In response, we introduce \\textbf{Artemis}, a perception-policy","authors_text":"Na Zhao, Piotr Koniusz, Shan Zhang, Weihao Bo, Wei Li, Wei Tang, Xiaofan Li, Yanpeng Sun, Zechao Li","cross_cats":[],"headline":"","license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.CV","submitted_at":"2025-12-01T18:45:30Z","title":"Artemis: Structured Visual Reasoning for Perception Policy Learning"},"references":{"count":0,"internal_anchors":0,"resolved_work":0,"sample":[],"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"source":{"id":"2512.01988","kind":"arxiv","version":2},"verdict":{"created_at":null,"id":null,"model_set":{},"one_line_summary":"","pipeline_version":null,"pith_extraction_headline":"","strongest_claim":"","weakest_assumption":""}},"verdict_id":null}}],"author_attestations":[],"timestamp_anchors":[],"storage_attestations":[],"citation_signatures":[],"replication_records":[],"corrections":[],"mirror_hints":[],"record_created":{"event_id":"sha256:3869a5e587e987b41925f325c1c7939f5817124c9412faefac583bcfff6d929f","target":"record","created_at":"2026-05-28T02:04:44Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"attestation_state":"computed","canonical_record":{"metadata":{"abstract_canon_sha256":"f3a05806e5a494c81b9b3ef25060d73ac97f306473a5c26c702c406f18988bef","cross_cats_sorted":[],"license":"http://arxiv.org/licenses/nonexclusive-distrib/1.0/","primary_cat":"cs.CV","submitted_at":"2025-12-01T18:45:30Z","title_canon_sha256":"60883798048299e45710514d8551936216061e381ba449c79dc0720d3739f93d"},"schema_version":"1.0","source":{"id":"2512.01988","kind":"arxiv","version":2}},"canonical_sha256":"ac4be6ce6901725678881304db99f2d32be69ba72f608feecc7d7081fade7c61","receipt":{"algorithm":"ed25519","builder_version":"pith-number-builder-2026-05-17-v1","canonical_sha256":"ac4be6ce6901725678881304db99f2d32be69ba72f608feecc7d7081fade7c61","first_computed_at":"2026-05-28T02:04:44.647221Z","key_id":"pith-v1-2026-05","kind":"pith_receipt","last_reissued_at":"2026-05-28T02:04:44.647221Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","receipt_version":"0.3","signature_b64":"/azZ30dogSrkScIH/qc7YrgO9NSoc1OfBbg+q2QtTzxGOjq+HkZ4CwS5e+upNKzmTFvN44IJ1sopNTH65e/uBQ==","signature_status":"signed_v1","signed_at":"2026-05-28T02:04:44.647761Z","signed_message":"canonical_sha256_bytes"},"source_id":"2512.01988","source_kind":"arxiv","source_version":2}}},"equivocations":[],"invalid_events":[],"applied_event_ids":["sha256:3869a5e587e987b41925f325c1c7939f5817124c9412faefac583bcfff6d929f","sha256:02ad5a3ec7455795ad72068b4950d13b4432e44443f8326f61d4f3925ddbdb78"],"state_sha256":"2f808edda6ae4283288161e4f3aa65dfef0e6f3e638bbdd7ac51783744195c57"}