PhishDebate: Multi-Agent LLM Framework for Phishing Detection

Metadane

Autorzy: Wenhao Li et al.
Rok: 2025
Źródło: arXiv:2506.15656
Link: https://arxiv.org/abs/2506.15656
Status: reference
Kategoria: Security / NLP / Multi-Agent
Tagi: reference multi-agent llm phishing-detection debate modular brand-detection #2025

Streszczenie

Propozycja architektury multi-agent debate do detekcji phishingu: czterech wyspecjalizowanych agentów LLM (URL, HTML, semantic, brand) analizuje stronę niezależnie, a następnie “debatuje” i głosuje nad ostateczną klasyfikacją. Osiąga 98.2% recall na rzeczywistych stronach phishingowych.

Kluczowe Wnioski

98.2% recall na real-world phishing — jeden z najwyższych wyników w literaturze
Modularność: każdy agent specjalizuje się w jednej modalności (URL / HTML / semantic / brand)
Debate mechanism: agenci wymieniają argumenty → redukuje false positives vs. single-agent
Interpretowalność: każdy agent podaje uzasadnienie decyzji
Open-source LLMs (Llama, Qwen) porównywalne do GPT-4 po fine-tuningu w tym zadaniu

Metodologia

4 agenci: URL-Analyst, HTML-Parser, Semantic-Reasoner, Brand-Identifier
Mechanizm debate: każdy agent głosuje + uzasadnia → weighted vote
Ewaluacja na rzeczywistym zbiorze phishing (nie ujawniono wielkości)
Porównanie z PhishIntention, Phishpedia, KnowPhish

Notatki

Rola w projekcie: Architektura PhishDebate jest analogiczna do modularnego designu FinPhishGuard (M1+M2+M3+M4). Potwierdza wartość podejścia multi-moduł. Debate mechanism = potencjalny late fusion layer nad M1-M4.

Research

Przeglądaj

PhishDebate: Multi-Agent LLM Framework for Phishing Detection

PhishDebate: Multi-Agent LLM Framework for Phishing Detection

Metadane

Streszczenie

Kluczowe Wnioski

Metodologia

Notatki