{"state_type":"pith_open_graph_state","state_version":"1.0","pith_number":"pith:2026:WOO7ROXYHKUZGUAO4TMTAY3T5S","merge_version":"pith-open-graph-merge-v1","event_count":2,"valid_event_count":2,"invalid_event_count":0,"equivocation_count":0,"current":{"canonical_record":{"metadata":{"abstract_canon_sha256":"3b4f197186bdb990a03b950dcd2c0fa04d6b9d1c6b22dcefac0a1cc96e5c0229","cross_cats_sorted":["cs.LG"],"license":"http://creativecommons.org/licenses/by-nc-nd/4.0/","primary_cat":"quant-ph","submitted_at":"2026-05-13T15:04:09Z","title_canon_sha256":"6ff6a47e2ad3c715684d29bbbaa7f2de4cf3c282285c5a9b7e70805df2e82fcd"},"schema_version":"1.0","source":{"id":"2605.13638","kind":"arxiv","version":1}},"source_aliases":[{"alias_kind":"arxiv","alias_value":"2605.13638","created_at":"2026-05-18T02:44:17Z"},{"alias_kind":"arxiv_version","alias_value":"2605.13638v1","created_at":"2026-05-18T02:44:17Z"},{"alias_kind":"doi","alias_value":"10.48550/arxiv.2605.13638","created_at":"2026-05-18T02:44:17Z"},{"alias_kind":"pith_short_12","alias_value":"WOO7ROXYHKUZ","created_at":"2026-05-18T12:33:37Z"},{"alias_kind":"pith_short_16","alias_value":"WOO7ROXYHKUZGUAO","created_at":"2026-05-18T12:33:37Z"},{"alias_kind":"pith_short_8","alias_value":"WOO7ROXY","created_at":"2026-05-18T12:33:37Z"}],"graph_snapshots":[{"event_id":"sha256:adec8816d063b4a4b6f05c19fbbc9b10415055a5e092887962891f75679e576e","target":"graph","created_at":"2026-05-18T02:44:17Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"graph_snapshot":{"author_claims":{"count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57","strong_count":0},"builder_version":"pith-number-builder-2026-05-17-v1","claims":{"count":4,"items":[{"attestation":"unclaimed","claim_id":"C1","kind":"strongest_claim","source":"verdict.strongest_claim","status":"machine_extracted","text":"Our trained policy achieves a 65-85% reduction in SWAP overhead when compared to existing quantum compilers on different real world datasets like MQTBench and Queko circuits."},{"attestation":"unclaimed","claim_id":"C2","kind":"weakest_assumption","source":"verdict.weakest_assumption","status":"machine_extracted","text":"That the RL policy, trained on the reported datasets, generalizes to unseen circuits without overfitting and that the measured SWAP reductions are not artifacts of benchmark selection or baseline implementation details."},{"attestation":"unclaimed","claim_id":"C3","kind":"one_line_summary","source":"verdict.one_line_summary","status":"machine_extracted","text":"Reinforcement learning policy for qubit mapping reduces SWAP overhead by 65-85% versus standard quantum compilers on MQTBench and Queko benchmark circuits."},{"attestation":"unclaimed","claim_id":"C4","kind":"headline","source":"verdict.pith_extraction.headline","status":"machine_extracted","text":"A reinforcement learning policy trained on a combinatorial formulation cuts SWAP overhead by 65-85 percent on standard quantum circuit benchmarks."}],"snapshot_sha256":"c2f5ad3d39a4f045970e988e8e097fc1d8a356e1403d0f41eae8edd54fb1c7cb"},"formal_canon":{"evidence_count":0,"snapshot_sha256":"258153158e38e3291e3d48162225fcdb2d5a3ed65a07baac614ab91432fd4f57"},"paper":{"abstract_excerpt":"A quantum compiler is a critical piece in the quantum computing pipeline since it allows an abstract quantum circuit to be run on a physical quantum computer. One extremely important subproblem in quantum compilation is the generation of a logical to physical qubit mapping. Typically in quantum compilers this step is either implemented as a random or a heuristic based assignment that aims to minimize additional (SWAP) gate overhead in the quantum circuit.\n  In this paper, we present an alternative approach to solving the qubit mapping problem. Specifically, we formulate the qubit mapping probl","authors_text":"Ankit Kulshrestha, Xiaoyuan Liu","cross_cats":["cs.LG"],"headline":"A reinforcement learning policy trained on a combinatorial formulation cuts SWAP overhead by 65-85 percent on standard quantum circuit benchmarks.","license":"http://creativecommons.org/licenses/by-nc-nd/4.0/","primary_cat":"quant-ph","submitted_at":"2026-05-13T15:04:09Z","title":"CO-MAP: A Reinforcement Learning Approach to the Qubit Allocation Problem"},"references":{"count":42,"internal_anchors":11,"resolved_work":42,"sample":[{"cited_arxiv_id":"1607.06450","doi":"","is_internal_anchor":true,"ref_index":1,"title":"Layer Normalization","work_id":"20a2d720-0046-4c7c-bcd6-327ec8143f69","year":2016},{"cited_arxiv_id":"1611.09940","doi":"","is_internal_anchor":true,"ref_index":2,"title":"Neural Combinatorial Optimization with Reinforcement Learning","work_id":"86c3352e-7964-488c-9a6a-22803e1cd602","year":2016},{"cited_arxiv_id":"","doi":"","is_internal_anchor":false,"ref_index":3,"title":"Machine learning for combinatorial optimization: a methodological tour d’horizon.European Journal of Operational Research, 290(2):405–421","work_id":"a4e96d94-5e38-4b60-9469-d54d0d521a21","year":2021},{"cited_arxiv_id":"","doi":"","is_internal_anchor":false,"ref_index":4,"title":"RL4CO: an Extensive Reinforcement Learning for Combinatorial Optimization Benchmark","work_id":"44454735-b091-4e2a-8039-d17c7d79870d","year":2025},{"cited_arxiv_id":"1206.3348","doi":"","is_internal_anchor":true,"ref_index":5,"title":"Quantum Compiler Optimizations","work_id":"7d5ece68-b579-4402-9ff9-22dbb96464d2","year":2012}],"snapshot_sha256":"c3bf0989a439a8656b91fad3b41ec917c97f1751b0c049f4034d98b20bdfae7b"},"source":{"id":"2605.13638","kind":"arxiv","version":1},"verdict":{"created_at":"2026-05-14T17:47:24.750136Z","id":"6cadc84f-438e-4383-bc77-197674709dba","model_set":{"reader":"grok-4.3"},"one_line_summary":"Reinforcement learning policy for qubit mapping reduces SWAP overhead by 65-85% versus standard quantum compilers on MQTBench and Queko benchmark circuits.","pipeline_version":"pith-pipeline@v0.9.0","pith_extraction_headline":"A reinforcement learning policy trained on a combinatorial formulation cuts SWAP overhead by 65-85 percent on standard quantum circuit benchmarks.","strongest_claim":"Our trained policy achieves a 65-85% reduction in SWAP overhead when compared to existing quantum compilers on different real world datasets like MQTBench and Queko circuits.","weakest_assumption":"That the RL policy, trained on the reported datasets, generalizes to unseen circuits without overfitting and that the measured SWAP reductions are not artifacts of benchmark selection or baseline implementation details."}},"verdict_id":"6cadc84f-438e-4383-bc77-197674709dba"}}],"author_attestations":[],"timestamp_anchors":[],"storage_attestations":[],"citation_signatures":[],"replication_records":[],"corrections":[],"mirror_hints":[],"record_created":{"event_id":"sha256:82865c4d6cc7f226584065d9de6d81ce9371c426ba7c4b733add9492c6b6040f","target":"record","created_at":"2026-05-18T02:44:17Z","signer":{"key_id":"pith-v1-2026-05","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","signer_id":"pith.science","signer_type":"pith_registry"},"payload":{"attestation_state":"computed","canonical_record":{"metadata":{"abstract_canon_sha256":"3b4f197186bdb990a03b950dcd2c0fa04d6b9d1c6b22dcefac0a1cc96e5c0229","cross_cats_sorted":["cs.LG"],"license":"http://creativecommons.org/licenses/by-nc-nd/4.0/","primary_cat":"quant-ph","submitted_at":"2026-05-13T15:04:09Z","title_canon_sha256":"6ff6a47e2ad3c715684d29bbbaa7f2de4cf3c282285c5a9b7e70805df2e82fcd"},"schema_version":"1.0","source":{"id":"2605.13638","kind":"arxiv","version":1}},"canonical_sha256":"b39df8baf83aa993500ee4d9306373eca49ea86a5546635aabb06674a4b63f73","receipt":{"algorithm":"ed25519","builder_version":"pith-number-builder-2026-05-17-v1","canonical_sha256":"b39df8baf83aa993500ee4d9306373eca49ea86a5546635aabb06674a4b63f73","first_computed_at":"2026-05-18T02:44:17.632912Z","key_id":"pith-v1-2026-05","kind":"pith_receipt","last_reissued_at":"2026-05-18T02:44:17.632912Z","public_key_fingerprint":"8d4b5ee74e4693bcd1df2446408b0d54","receipt_version":"0.3","signature_b64":"t5WAG53C7dIuu2QdDVOU2vTF92f4WHgMlcZ0GC0JMl1gF94qJ8caqv37dqg4hCKELycd0sGGPT9yzwDItc8zDg==","signature_status":"signed_v1","signed_at":"2026-05-18T02:44:17.633421Z","signed_message":"canonical_sha256_bytes"},"source_id":"2605.13638","source_kind":"arxiv","source_version":1}}},"equivocations":[],"invalid_events":[],"applied_event_ids":["sha256:82865c4d6cc7f226584065d9de6d81ce9371c426ba7c4b733add9492c6b6040f","sha256:adec8816d063b4a4b6f05c19fbbc9b10415055a5e092887962891f75679e576e"],"state_sha256":"31ccb3b3a0af19275fbda3a93b123b430c5115a76e9632bcf1e2a0356e222804"}