PhishDebate: Multi-Agent LLM Framework for Phishing Detection

Metadane

Streszczenie

Propozycja architektury multi-agent debate do detekcji phishingu: czterech wyspecjalizowanych agentów LLM (URL, HTML, semantic, brand) analizuje stronę niezależnie, a następnie “debatuje” i głosuje nad ostateczną klasyfikacją. Osiąga 98.2% recall na rzeczywistych stronach phishingowych.

Kluczowe Wnioski

  • 98.2% recall na real-world phishing — jeden z najwyższych wyników w literaturze
  • Modularność: każdy agent specjalizuje się w jednej modalności (URL / HTML / semantic / brand)
  • Debate mechanism: agenci wymieniają argumenty → redukuje false positives vs. single-agent
  • Interpretowalność: każdy agent podaje uzasadnienie decyzji
  • Open-source LLMs (Llama, Qwen) porównywalne do GPT-4 po fine-tuningu w tym zadaniu

Metodologia

  • 4 agenci: URL-Analyst, HTML-Parser, Semantic-Reasoner, Brand-Identifier
  • Mechanizm debate: każdy agent głosuje + uzasadnia → weighted vote
  • Ewaluacja na rzeczywistym zbiorze phishing (nie ujawniono wielkości)
  • Porównanie z PhishIntention, Phishpedia, KnowPhish

Notatki

Rola w projekcie: Architektura PhishDebate jest analogiczna do modularnego designu FinPhishGuard (M1+M2+M3+M4). Potwierdza wartość podejścia multi-moduł. Debate mechanism = potencjalny late fusion layer nad M1-M4.

Elementów w folderze: 0.