Pobierz PDF

Attacking Logo-Based Phishing Website Detectors with Adversarial Perturbations

Metadane

Streszczenie

Pierwsza praca demonstrująca skuteczne adversarial attacks na logo-based phishing detectors (Siamese networks). Atakujący generuje “adversarial logos” przy pomocy GAN-based perturbacji — loga wyglądają identycznie dla człowieka (user study: nieodróżnialne), ale oszukują detektor.

Kluczowy wynik: Evasion (fooling) rate do 95% (white-box), minimum 42% (black-box, GViT vs Siamese) przy perturbacjach niewidocznych dla użytkownika.

Kluczowe Wnioski

Fig. 6d — Fooling ratio przy FPR=10⁻³ (kluczowe liczby):

  • White-box: attacker z wiedzą o discriminatorze → >95% fooling ratio dla wszystkich modeli
  • Black-box (GViT generator): fooling ratio 42–95% przeciwko różnym discriminatorom
  • Siamese (= PhishIntention/Phishpedia’s model): ~42% fooling ratio — najlepszy defender ale wciąż 42% evasion
  • ViT discriminator: najodporniejszy na adversarial, ale gorszy TPR od Siamese na czystych danych (6-12pp niższy @ FPR=10⁻³)
  • ViT jako GENERATOR (GViT): najtęższy atakujący — 42-95% fooling ratio niezależnie od discriminatora
  • CLIP nie był testowany — to luka którą adresujemy

Table 1 — Training time for generators:

  • GSiamese: 8 minut do fooling ratio 0.9 (1 epoch!) — tanie dla atakującego
  • GViT: 744 minut do 0.9 fooling ratio (kosztowne ale najskuteczniejsze)

User study (VS N=30, HS N=287): Użytkownicy nie widzą różnicy między oryginalnymi i adversarial logos.

Dataset: 181 brands (z Phishpedia target list)

Metodologia

  • GAN-based perturbation generation: zachowanie perceptual similarity
  • Target models: Siamese network-based logo detectors
  • Evaluation: evasion rate, user study (perceptual similarity)
  • Adversarial training jako defense

Luki / Ograniczenia (gap analysis)

  • Ataki na loga (visual), nie testuje URL/HTML modalities
  • Adversarial training jako obrona: brak oceny na certifiably robust models
  • Brak testów na bankowych markach specyficznie
  • Brak kombinacji z innymi evasion strategies (multi-space)

Notatki

KRYTYCZNA praca dla projektu — definiuje zagrożenie adversarial logos przeciwko logo detectors. Nasza hipoteza: banking logos szczególnie podatne (rozpoznawalne, ale perturbowalne). Pobierz PDF z arxiv:2308.09392.

Rola w projekcie: Główna klasa ataku którą nasz system musi być odporny. Evasion rate 95% = baseline do pokonania.

Elementów w folderze: 0.