Thread - Nostr Hypermedia

VonNaturAustreVe vonnatur@getalby.com 2 weeks ago

Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models

Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models

We present evidence that adversarial poetry functions as a universal single-turn jailbreak technique for Large Language Models (LLMs). Across 25 fr...

#llm #security

↑