Notatki robocze
Notatki, myśli, linki, szkice dla projektu bank-brand-phishing-detection.
Zasoby do sprawdzenia
- EUIPO Bulk Download: https://euipo.europa.eu/eSearch/
- CERT Polska raporty phishingowe: https://cert.pl/posts/
- Certificate Transparency: certstream.calidog.io (real-time stream)
- Ji et al. 2024 dataset (451k) — napisać do autorów (email z KAIST)
- LogoMorph (Hao et al.): https://gangw.cs.illinois.edu/logomorph.pdf
Polskie banki — target brands (impersonowane najczęściej)
Źródło: raporty CERT Polska 2023-2025
| Bank | Logo variant | Domena referencyjna |
|---|---|---|
| PKO BP | niebieskie | pko.pl |
| mBank | czerwone | mbank.pl |
| ING | pomarańczowe | ing.pl |
| Santander | czerwone | santander.pl |
| BNP Paribas | zielone | bnpparibas.pl |
| Bank Pekao | zielone | pekao.pl |
| Millennium | fioletowe | bankmillennium.pl |
| Alior Bank | czerwono-białe | aliorbank.pl |
Regulacje EU istotne dla projektu
- PSD2 (Dyrektywa o usługach płatniczych) — wymaga SCA (Strong Customer Authentication)
- DORA (Digital Operational Resilience Act) — od 2025 r., cybersecurity banków
- NIS2 — incydent reporting dla instytucji finansowych
- GDPR/RODO — kwestie datasetu phishingowego (zdjęcia/screenshoty stron)
Potencjalne partnerstwa / dane
- KNF (Komisja Nadzoru Finansowego) — raporty oszustw
- CERT Polska — feed phishingowy
- Związek Banków Polskich — dostęp do danych branżowych
- PhishTank — open phishing database
- Google Safe Browsing — benchmark comparison
Bramki płatności i fintech — target brands
Scope rozszerzony poza banki na cały financial services:
| Kategoria | Marki | Uwagi |
|---|---|---|
| Bramki płatności | PayPal, Stripe, Square, Wise (TransferWise) | PayPal = najczęściej impersonowany |
| Portfele mobilne | Google Pay, Apple Pay, Samsung Pay, BLIK | BLIK — PL-specyficzny |
| Neobanki / fintech | Revolut, N26, Monzo, Starling, Klarna | Szybko rosnące + nowe ataki |
| Sieci płatnicze | Mastercard, Visa, Amex | Brand w formularzach płatności |
| Kryptowaluty | Binance, Coinbase, Ledger | High-value target |
Istniejące datasety (bez tworzenia własnych)
| Dataset | Dostęp | Priorytet |
|---|---|---|
| Ji & Kim 2025 (19,131 sites) | arXiv/GitHub — publiczny | ⭐⭐⭐ |
| LogoSENSE (Bozkir 2020) | GitHub (check availability) | ⭐⭐⭐ |
| PhiUSIIL (~465k sites) | UCI ML Repository | ⭐⭐ |
| Ji et al. 2024 (451k) | Kontakt z autorami KAIST | ⭐⭐ |
| PhishTank feed | API (darmowy) | ⭐ |
| OpenPhish feed | openphish.com | ⭐ |
Roadmap publikacyjny (szybka ścieżka)
Miesiąc 1-2: Setup środowiska, pobranie datasetów (Ji & Kim 2025, LogoSENSE)
Miesiąc 2-3: #BP-2 Benchmark study draft (measurement paper — bez ML)
Miesiąc 3: Submission #BP-2 → ACSAC workshop / NDSS workshop
Miesiąc 3-4: #BP-3 TempGuard implementation
Miesiąc 4: Submission #BP-3 → USENIX Security / IEEE S&P
Miesiąc 4-7: #BP-1 Full hybrid system
Miesiąc 7: Submission #BP-1 → CCS / USENIX Security
Target venues:
- ACSAC: Annual Computer Security Applications Conference (grudzień, deadline ~czerwiec)
- RAID: Research in Attacks, Intrusions, and Defenses (deadline ~maj)
- USENIX Security: 3 deadlines/rok (~luty, ~maj, ~październik)
- IEEE S&P (Oakland): deadline ~sierpień
- CCS: ACM Conference on Computer and Communications Security (deadline ~styczeń/maj)
Pytania otwarte
- Czy EUIPO API pozwala na batch download logoów dla Class 36?
- Jak oceniać “bank-specific” vs generic phishing — gdzie granica?
- CSS delayed rendering: czy 300ms próg jest odpowiedni? (Yuan 2026 nie daje threshold)
- User study (BP-6): czy potrzebna zgoda KNF lub banków?
- Ji & Kim 2025 dataset: czy screenshoty są dostępne czy tylko URL+HTML?
- LogoSENSE: czy GitHub link jest aktywny? Sprawdzić format adnotacji.