Notatki robocze

Notatki, myśli, linki, szkice dla projektu bank-brand-phishing-detection.

Zasoby do sprawdzenia

EUIPO Bulk Download: https://euipo.europa.eu/eSearch/
CERT Polska raporty phishingowe: https://cert.pl/posts/
Certificate Transparency: certstream.calidog.io (real-time stream)
Ji et al. 2024 dataset (451k) — napisać do autorów (email z KAIST)
LogoMorph (Hao et al.): https://gangw.cs.illinois.edu/logomorph.pdf

Polskie banki — target brands (impersonowane najczęściej)

Źródło: raporty CERT Polska 2023-2025

Bank	Logo variant	Domena referencyjna
PKO BP	niebieskie	pko.pl
mBank	czerwone	mbank.pl
ING	pomarańczowe	ing.pl
Santander	czerwone	santander.pl
BNP Paribas	zielone	bnpparibas.pl
Bank Pekao	zielone	pekao.pl
Millennium	fioletowe	bankmillennium.pl
Alior Bank	czerwono-białe	aliorbank.pl

Regulacje EU istotne dla projektu

PSD2 (Dyrektywa o usługach płatniczych) — wymaga SCA (Strong Customer Authentication)
DORA (Digital Operational Resilience Act) — od 2025 r., cybersecurity banków
NIS2 — incydent reporting dla instytucji finansowych
GDPR/RODO — kwestie datasetu phishingowego (zdjęcia/screenshoty stron)

Potencjalne partnerstwa / dane

KNF (Komisja Nadzoru Finansowego) — raporty oszustw
CERT Polska — feed phishingowy
Związek Banków Polskich — dostęp do danych branżowych
PhishTank — open phishing database
Google Safe Browsing — benchmark comparison

Bramki płatności i fintech — target brands

Scope rozszerzony poza banki na cały financial services:

Kategoria	Marki	Uwagi
Bramki płatności	PayPal, Stripe, Square, Wise (TransferWise)	PayPal = najczęściej impersonowany
Portfele mobilne	Google Pay, Apple Pay, Samsung Pay, BLIK	BLIK — PL-specyficzny
Neobanki / fintech	Revolut, N26, Monzo, Starling, Klarna	Szybko rosnące + nowe ataki
Sieci płatnicze	Mastercard, Visa, Amex	Brand w formularzach płatności
Kryptowaluty	Binance, Coinbase, Ledger	High-value target

Istniejące datasety (bez tworzenia własnych)

Dataset	Dostęp	Priorytet
Ji & Kim 2025 (19,131 sites)	arXiv/GitHub — publiczny	⭐⭐⭐
LogoSENSE (Bozkir 2020)	GitHub (check availability)	⭐⭐⭐
PhiUSIIL (~465k sites)	UCI ML Repository	⭐⭐
Ji et al. 2024 (451k)	Kontakt z autorami KAIST	⭐⭐
PhishTank feed	API (darmowy)	⭐
OpenPhish feed	openphish.com	⭐

Roadmap publikacyjny (szybka ścieżka)

Miesiąc 1-2:  Setup środowiska, pobranie datasetów (Ji & Kim 2025, LogoSENSE)
Miesiąc 2-3:  #BP-2 Benchmark study draft (measurement paper — bez ML)
Miesiąc 3:    Submission #BP-2 → ACSAC workshop / NDSS workshop
Miesiąc 3-4:  #BP-3 TempGuard implementation
Miesiąc 4:    Submission #BP-3 → USENIX Security / IEEE S&P
Miesiąc 4-7:  #BP-1 Full hybrid system
Miesiąc 7:    Submission #BP-1 → CCS / USENIX Security

Target venues:

ACSAC: Annual Computer Security Applications Conference (grudzień, deadline ~czerwiec)
RAID: Research in Attacks, Intrusions, and Defenses (deadline ~maj)
USENIX Security: 3 deadlines/rok (~luty, ~maj, ~październik)
IEEE S&P (Oakland): deadline ~sierpień
CCS: ACM Conference on Computer and Communications Security (deadline ~styczeń/maj)

Pytania otwarte

Czy EUIPO API pozwala na batch download logoów dla Class 36?
Jak oceniać “bank-specific” vs generic phishing — gdzie granica?
CSS delayed rendering: czy 300ms próg jest odpowiedni? (Yuan 2026 nie daje threshold)
User study (BP-6): czy potrzebna zgoda KNF lub banków?
Ji & Kim 2025 dataset: czy screenshoty są dostępne czy tylko URL+HTML?
LogoSENSE: czy GitHub link jest aktywny? Sprawdzić format adnotacji.

Research

Przeglądaj

Notatki robocze

Notatki robocze

Zasoby do sprawdzenia

Polskie banki — target brands (impersonowane najczęściej)

Regulacje EU istotne dla projektu

Potencjalne partnerstwa / dane

Bramki płatności i fintech — target brands

Istniejące datasety (bez tworzenia własnych)

Roadmap publikacyjny (szybka ścieżka)

Pytania otwarte

Graf

Spis treści