Hybrydowa detekcja impersonacji marek finansowych w phishingu

Opis projektu

Badania nad systemem wykrywającym podszywanie się pod marki instytucji finansowych w atakach phishingowych. Skupia się na hybrydowym podejściu (URL + visual + content) odpornym na klasy ataków adwersaryjnych.

Zakres marek (nie tylko banki — cały sektor financial services):

  • Banki: PKO BP, mBank, ING, Santander, BNP Paribas, Pekao, Millennium, Alior, Credit Agricole
  • Bramki płatności: PayPal, Stripe, Revolut, BLIK, Square, Wise (TransferWise)
  • Sieci płatnicze: Mastercard, Visa, American Express
  • Portfele mobilne: Google Pay, Apple Pay, Samsung Pay
  • Fintech: Klarna, N26, Monzo, Starling

Strategia: Szybka ścieżka do publikacji

Cel: pierwsza publikacja w 4-6 miesięcy, obrona doktoratu.

Fast path (priorytetowe)

  1. Nie tworzymy własnych datasetów — walidacja na istniejących, publicznych zbiorach
  2. Budujemy na SOTA (KnowPhish, PhishIntention) — rozszerzamy zamiast budować od zera
  3. Wąski, konkretny wkład — jedno z: adversarial robustness LUB financial brand coverage LUB timing defense
  4. Target venues: ACSAC (deadline ~June), RAID (~May), USENIX Security (~Feb/Oct), ACM CCS (~Jan/May)

Problem badawczy

Istniejące systemy wizualnej detekcji phishingu (VisualPhishNet, DynaPhish, KnowPhish) osiągają 87-92% F1 w warunkach laboratoryjnych (KnowPhish: F1=92.05%, Phishpedia lab: Recall=87.1%), ale:

  1. Zawodzą na real-world data (Ji et al. 2024: 451k websites — recall spada do ~40-50%)
  2. Są podatne na adversarial logos (evasion rate 95%, Lee 2023)
  3. Są podatne na delayed rendering (detection 100%→0%, Yuan 2026)
  4. Mają ograniczoną bazę marek (KnowPhish: 20k — ale financial services underrepresented)
  5. Logo detection on-device: tylko 46.6% (Petrukha 2024)

Hipoteza badawcza

System hybrydowy łączący:

  • URL module: SSL CT monitoring + URL pattern analysis (Duarte 2025)
  • Visual module: adversarially hardened logo detection (VisualPhishNet + adversarial training)
  • Content module: LLM-based brand extraction z HTML (KnowPhish 2024)

…osiągnie >90% recall przy adversarial logos i timing attacks, gdzie istniejące systemy mają <30% recall — testowane na istniejących publicznych datasetach.

Dostępne datasety do walidacji (bez tworzenia własnych)

DatasetRozmiarZawartośćDostępPublikacja
Phishpedia Labelled Logo30,649 stron z bounding box logoGłówny training set M2a — 6× większy niż LogoSENSEsites.google.com/view/phishpedia-siteLin et al. 2021
Phishpedia Phishing29,496 phishing stronScreenshoty phishing; uzupełnienie Ji & Kimsites.google.com/view/phishpedia-siteLin et al. 2021
Phishpedia Target List181 marek z logoSeed dla Financial Brand KB (rozszerzyć do 150+)sites.google.com/view/phishpedia-siteLin et al. 2021
Ji & Kim 202519,131 phishing + 243 benignGłówny benchmark end-to-end — realistyczny imbalancePubliczny (arxiv/GitHub)Ji & Kim 2025
Ji et al. 2024451,000 phishing sitesLargest real-world evalKontakt z autorami (KAIST)Ji et al. 2024
LogoSENSE3,060 train + 1,979 testLogo bounding box — jako test set (Phishpedia jako train)GitHub (Bozkir 2020)Bozkir & Aydos 2020
PhiUSIIL~235k phishing + 230k legitURL + content features; M1 trainingUCI ML RepositoryPrasad & Bhargava 2023
PhishTank~1.5M URLs (live feed)URLs + labelsphishtank.com (API)Open
OpenPhishlive feedVerified phishing URLsopenphish.comOpen

Priorytet: Ji & Kim 2025 (publiczny, 19k+ stron, realistyczny) + LogoSENSE (logo bounding boxes) + PhiUSIIL (duży, URL+content).

Kluczowe publikacje

Technologie fundamentalne (Rozdział 2.4 pracy)

Logo Detection & Localization

  • carion-detr-2020 — DETR (ECCV 2020, ~15k cyt.) — object detection bez anchors
  • zhu-deformable-detr-2021 — Deformable DETR (ICLR 2021, 7,374 cyt.) — rekomendowany dla M2a: 10× szybsza konwergencja, multi-scale, lepszy dla małych logo
  • dosovitskiy-vit-2021 — ViT (ICLR 2021, ~62k cyt.) — Transformer backbone; globalny attention odporniejszy na adversarial perturbacje

Brand Matching & Metric Learning

  • radford-clip-2021 — CLIP (ICML 2021, ~30k cyt.) — kluczowa innowacja M2: zero-shot brand matching bez retrainingu dla nowych marek fintech
  • schroff-facenet-triplet-2015 — FaceNet/triplet loss (CVPR 2015, ~25k cyt.) — fundament VisualPhishNet; baseline zastępowany przez CLIP

Adversarial Robustness

Backbone & Explainability

  • he-resnet-2016 — ResNet (CVPR 2016, ~200k cyt.) — baseline backbone (PhishIntention używa ResNet-50)
  • selvaraju-gradcam-2017 — Grad-CAM (ICCV 2017, ~25k cyt.) — heatmapy decyzji logo detectora; sekcja explainability

NLP & URL

  • liu-roberta-2019 — RoBERTa (2019, 29,503 cyt.) — backbone M3 NER (brand name extraction z HTML)
  • le-urlnet-2018 — URLNet (2018) — deep learning URL analysis; punkt porównania dla M1 LightGBM
  • suzuki-shamfinder-idn-2019 — ShamFinder (IMC 2019) — IDN homograph detection; metodologia dla M1 homoglyph feature

RBPD — state-of-art (od czego zaczynamy)

Adversarial Attacks — zagrożenia

Nowy SOTA i adversarial attacks (2024-2025) — krytyczne do przeczytania

Ewaluacja i alternatywy

Banking/Deployment

LLM / Embeddings integracja (nowe kierunki — dostępne modele lokalne)

  • phishdebate-2025PhishDebate multi-agent (arXiv:2506.15656) — 98.2% recall; 4 agentów URL/HTML/semantic/brand; analogia do M1-M4
  • phishsense-1b-2025 — Phishsense-1B LoRA fine-tune (arXiv:2503.10944) — 97.5% lab → 70% real-world; ostrzeżenie przed overfittingiem
  • malqwen-qwen-security-2025 — MalQwen Qwen-7B+LoRA security (IEEE Access 2025) — BERTscore 0.84; proof Qwen działa na security tasks
  • ma-trademark-contrastive-2025 — Trademark contrastive embeddings (IEEE Access 2025) — precedens dla embedding-based M2 brand matching
  • sahf-pd-multimodal-phishing-2026 — SAHF-PD 4-modalności hierarchical fusion (Electronics 2026) — architektura analogiczna do M1+M2+M3

Inne phishing

Datasety w bazie

Luki w literaturze (gap map)

GapStatus w literaturzeNasz wkładFast?
Adversarial robustness RBPDLee 2023 (attack), brak obronyAdversarial training na RBPD
Financial brand breadthKnowPhish: 20k (ale fintech underrepresented)Financial services brand extension
Delayed rendering defenseYuan 2026 (PoC extension only)DOM/CSS analysis + multi-timestamp
Real-world RBPD performanceJi 2024 (failure report)System odporny na real-world degradation
LLM vs RBPD hybridJi & Kim 2025 (LLM only)Hybrid LLM+RBPD ensemble

Tagi wyszukiwania

#phishing-detection #brand-impersonation #adversarial-robustness #visual-similarity #financial-services #logo-detection #hybrid-detection #payment-gateways

Kierunki badań (→ ideas.md)

  1. [#BP-1] Adversarially robust hybrid: URL + visual + content (walidacja na Ji 2024 + LogoSENSE)
  2. [#BP-2] Financial Brand Phishing Benchmark: ewaluacja na Ji & Kim 2025 + PhiUSIIL
  3. [#BP-3] Defense against delayed rendering — DOM/CSS multi-signal
  4. [#BP-4] Trademark registry integration (EUIPO + URPiE)
  5. [#BP-5] SSL CT monitoring dla PL financial services
  6. [#BP-6] User study: overconfidence in financial brand detection (PL replication)

Venue docelowe