Deceptprompt: Exploiting llm-driven code generation via adversarial natural language instructions

Fangzhou Wu, Xiaogeng Liu, Chaowei Xiao · 2023 · arXiv 2312.04730

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

representative citing papers

A First Look at the Security Issues in the Model Context Protocol Ecosystem

cs.CR · 2025-10-18 · conditional · novelty 8.0

Analysis of 67,057 servers across six registries reveals widespread conditions for server hijacking and metadata manipulation in MCP, with a new tool MCPInspect flagging 833 vulnerable servers and 18 with suspicious descriptions.

Fragile Thoughts: How Large Language Models Handle Chain-of-Thought Perturbations

cs.CL · 2026-02-11 · unverdicted · novelty 7.0

LLMs show heterogeneous robustness to five types of chain-of-thought perturbations, with MathError causing 50-60% accuracy loss in small models but scaling benefits, UnitConversion remaining hard across sizes, and ExtraSteps causing minimal degradation.

XOXO: Stealthy Cross-Origin Context Poisoning Attacks against AI Coding Assistants

cs.CR · 2025-03-18 · unverdicted · novelty 6.0

XOXO is a cross-origin context poisoning attack on AI coding assistants that uses a Cayley Graph search algorithm (GCGS) to find stealthy perturbations, achieving 75.72% average success rate across five tasks and eleven models.

citing papers explorer

Showing 2 of 2 citing papers after filters.

Fragile Thoughts: How Large Language Models Handle Chain-of-Thought Perturbations cs.CL · 2026-02-11 · unverdicted · none · ref 13
LLMs show heterogeneous robustness to five types of chain-of-thought perturbations, with MathError causing 50-60% accuracy loss in small models but scaling benefits, UnitConversion remaining hard across sizes, and ExtraSteps causing minimal degradation.
XOXO: Stealthy Cross-Origin Context Poisoning Attacks against AI Coding Assistants cs.CR · 2025-03-18 · unverdicted · none · ref 67
XOXO is a cross-origin context poisoning attack on AI coding assistants that uses a Cayley Graph search algorithm (GCGS) to find stealthy perturbations, achieving 75.72% average success rate across five tasks and eleven models.

Deceptprompt: Exploiting llm-driven code generation via adversarial natural language instructions

fields

years

verdicts

representative citing papers

citing papers explorer