VisualPhishNet: Zero-Day Phishing Website Detection by Visual Similarity

Metadane

Streszczenie

Fundamentalna praca wprowadzająca podejście oparte na wizualnym podobieństwie do detekcji phishingu. VisualPhishNet wykorzystuje sieć CNN z uczeniem tripletowym (triplet CNN), która uczy się profili wizualnych legalnych stron i wykrywa phishing przez metrykę podobieństwa. Kluczowa innowacja: zdolność generalizacji na niespotykane wcześniej strony phishingowe (zero-day) bez re-treningu.

Autorzy wprowadzają też dataset VisualPhish — największy ówcześnie zbiór do wizualnej detekcji phishingu, zebrany w ekologicznie walidowany sposób (prawdziwe kampanie phishingowe).

Kluczowe Wnioski

  • Triplet CNN uczy się metryki podobieństwa, nie klasyfikatora — generalizes to unseen
  • Outperforms poprzednie visual similarity approaches “by a large margin”
  • Testowana odporność na część evasion attacks (ale nie na GAN/diffusion — te pojawiły się później)
  • VisualPhish dataset: największy ówcześnie zbiór visual phishing

Metodologia

  • Triplet CNN: anchor (legalna strona) + positive (inna legalna) + negative (phishing)
  • Embedding space: strony podobne wizualnie → blisko siebie
  • Screenshot-based: przechwytywanie wizualnej reprezentacji strony

Luki / Ograniczenia (gap analysis)

  • Dataset z 2019-2020 — nie zawiera AI-generated phishing
  • Nie testowano przeciwko GAN adversarial logos (Lee et al. 2023) — evasion rate 95%
  • Nie testowano przeciwko diffusion-based evasion (Hao et al. 2024)
  • Nie testowano przeciwko delayed rendering attacks (Yuan et al. 2026)
  • Brak bankowej bazy trademark → false negatives dla nieznanych banków

Notatki

Kluczowa bazowa publikacja dla projektu bank-brand-phishing-detection. VisualPhishNet to najczęściej atakowany baseline w pracach adversarial (Lee 2023, Ji 2024, Yuan 2024). Dodaj PDF z arxiv:1909.00300v4 i uruchom /summarize-paper abdelnabi-visualphishnet-2020

Rola w projekcie: Baseline visual similarity method + VisualPhish dataset jako benchmark.

Elementów w folderze: 0.