Notatki robocze

Notatki, myśli, linki, szkice dla projektu bank-brand-phishing-detection.


Zasoby do sprawdzenia

Polskie banki — target brands (impersonowane najczęściej)

Źródło: raporty CERT Polska 2023-2025

BankLogo variantDomena referencyjna
PKO BPniebieskiepko.pl
mBankczerwonembank.pl
INGpomarańczoweing.pl
Santanderczerwonesantander.pl
BNP Paribaszielonebnpparibas.pl
Bank Pekaozielonepekao.pl
Millenniumfioletowebankmillennium.pl
Alior Bankczerwono-białealiorbank.pl

Regulacje EU istotne dla projektu

  • PSD2 (Dyrektywa o usługach płatniczych) — wymaga SCA (Strong Customer Authentication)
  • DORA (Digital Operational Resilience Act) — od 2025 r., cybersecurity banków
  • NIS2 — incydent reporting dla instytucji finansowych
  • GDPR/RODO — kwestie datasetu phishingowego (zdjęcia/screenshoty stron)

Potencjalne partnerstwa / dane

  • KNF (Komisja Nadzoru Finansowego) — raporty oszustw
  • CERT Polska — feed phishingowy
  • Związek Banków Polskich — dostęp do danych branżowych
  • PhishTank — open phishing database
  • Google Safe Browsing — benchmark comparison

Bramki płatności i fintech — target brands

Scope rozszerzony poza banki na cały financial services:

KategoriaMarkiUwagi
Bramki płatnościPayPal, Stripe, Square, Wise (TransferWise)PayPal = najczęściej impersonowany
Portfele mobilneGoogle Pay, Apple Pay, Samsung Pay, BLIKBLIK — PL-specyficzny
Neobanki / fintechRevolut, N26, Monzo, Starling, KlarnaSzybko rosnące + nowe ataki
Sieci płatniczeMastercard, Visa, AmexBrand w formularzach płatności
KryptowalutyBinance, Coinbase, LedgerHigh-value target

Istniejące datasety (bez tworzenia własnych)

DatasetDostępPriorytet
Ji & Kim 2025 (19,131 sites)arXiv/GitHub — publiczny⭐⭐⭐
LogoSENSE (Bozkir 2020)GitHub (check availability)⭐⭐⭐
PhiUSIIL (~465k sites)UCI ML Repository⭐⭐
Ji et al. 2024 (451k)Kontakt z autorami KAIST⭐⭐
PhishTank feedAPI (darmowy)
OpenPhish feedopenphish.com

Roadmap publikacyjny (szybka ścieżka)

Miesiąc 1-2:  Setup środowiska, pobranie datasetów (Ji & Kim 2025, LogoSENSE)
Miesiąc 2-3:  #BP-2 Benchmark study draft (measurement paper — bez ML)
Miesiąc 3:    Submission #BP-2 → ACSAC workshop / NDSS workshop
Miesiąc 3-4:  #BP-3 TempGuard implementation
Miesiąc 4:    Submission #BP-3 → USENIX Security / IEEE S&P
Miesiąc 4-7:  #BP-1 Full hybrid system
Miesiąc 7:    Submission #BP-1 → CCS / USENIX Security

Target venues:

  • ACSAC: Annual Computer Security Applications Conference (grudzień, deadline ~czerwiec)
  • RAID: Research in Attacks, Intrusions, and Defenses (deadline ~maj)
  • USENIX Security: 3 deadlines/rok (~luty, ~maj, ~październik)
  • IEEE S&P (Oakland): deadline ~sierpień
  • CCS: ACM Conference on Computer and Communications Security (deadline ~styczeń/maj)

Pytania otwarte

  1. Czy EUIPO API pozwala na batch download logoów dla Class 36?
  2. Jak oceniać “bank-specific” vs generic phishing — gdzie granica?
  3. CSS delayed rendering: czy 300ms próg jest odpowiedni? (Yuan 2026 nie daje threshold)
  4. User study (BP-6): czy potrzebna zgoda KNF lub banków?
  5. Ji & Kim 2025 dataset: czy screenshoty są dostępne czy tylko URL+HTML?
  6. LogoSENSE: czy GitHub link jest aktywny? Sprawdzić format adnotacji.