PhishDebate: Multi-Agent LLM Framework for Phishing Detection
Metadane
- Autorzy: Wenhao Li et al.
- Rok: 2025
- Źródło: arXiv:2506.15656
- Link: https://arxiv.org/abs/2506.15656
- Status: reference
- Kategoria: Security / NLP / Multi-Agent
- Tagi: reference multi-agent llm phishing-detection debate modular brand-detection #2025
Streszczenie
Propozycja architektury multi-agent debate do detekcji phishingu: czterech wyspecjalizowanych agentów LLM (URL, HTML, semantic, brand) analizuje stronę niezależnie, a następnie “debatuje” i głosuje nad ostateczną klasyfikacją. Osiąga 98.2% recall na rzeczywistych stronach phishingowych.
Kluczowe Wnioski
- 98.2% recall na real-world phishing — jeden z najwyższych wyników w literaturze
- Modularność: każdy agent specjalizuje się w jednej modalności (URL / HTML / semantic / brand)
- Debate mechanism: agenci wymieniają argumenty → redukuje false positives vs. single-agent
- Interpretowalność: każdy agent podaje uzasadnienie decyzji
- Open-source LLMs (Llama, Qwen) porównywalne do GPT-4 po fine-tuningu w tym zadaniu
Metodologia
- 4 agenci: URL-Analyst, HTML-Parser, Semantic-Reasoner, Brand-Identifier
- Mechanizm debate: każdy agent głosuje + uzasadnia → weighted vote
- Ewaluacja na rzeczywistym zbiorze phishing (nie ujawniono wielkości)
- Porównanie z PhishIntention, Phishpedia, KnowPhish
Notatki
Rola w projekcie: Architektura PhishDebate jest analogiczna do modularnego designu FinPhishGuard (M1+M2+M3+M4). Potwierdza wartość podejścia multi-moduł. Debate mechanism = potencjalny late fusion layer nad M1-M4.