Formalizing and Benchmarking Prompt Injection Attacks and Defenses

Metadane

  • Autorzy: Yupei Liu, Yuqi Jia, Runpeng Geng, Jinyuan Jia, Neil Zhenqiang Gong
  • Rok: 2024
  • Zrodlo: 33rd USENIX Security Symposium (USENIX Security 24), pages 1831-1847
  • Status: #to-read
  • Kategoria: Security

Notatki

Wyekstrahowane z: hasan-llm-phishing-detection-2025

Praca formalizuje i benchmarkuje ataki prompt injection i mechanizmy obrony. Pokazuje ze obecne LLM fundamentalnie nie rozrozniaja miedzy legalnymi instrukcjami a zlosliwym inputem. Kluczowa dla zrozumienia granic bezpieczenstwa LLM-based systemow detekcji phishingu.

Elementów w folderze: 0.