Pomysły badawcze

Ostatnia aktualizacja: 2026-05-12

Strategia: walidacja na istniejących publicznych datasetach, bez tworzenia własnych zbiorów. Zakres marek: banki + bramki płatności (PayPal, Revolut, BLIK, Stripe) + sieci płatnicze (Mastercard, Visa) + fintech. Cel: pierwsza publikacja w 4-6 miesięcy.

🔥 Wysokie priorytety

[#BP-1] Adversarially Robust Financial Brand Phishing Detector: Rozszerzenie KnowPhish o Adversarial Hardening

Status: new Priorytet: high Dodano: 2026-05-12 Czas realizacji: 4-5 miesięcy Target venues: ACSAC (Annual Computer Security Applications Conference), RAID, USENIX Security

Bazuje na: KnowPhish 2024, PhishIntention 2022, Lee 2023, Yuan 2026, Ji 2024

Gap w literaturze:

KnowPhish 2024 (SOTA RBPD): 96% F1 w laboratorium, ale nie testowane na adversarial perturbations
PhishIntention: 94% recall w lab → ~40-50% na real-world (Ji 2024, 451k stron)
Lee 2023: GAN logos obchodzą detektory z 95% skutecznością — brak systemu odpornego
Yuan 2026: delayed rendering → 100%→0% detection — żaden system nie broni
Wszystkie istniejące systemy testowane tylko w laboratorium, nie na realnych atakach

Architektura FinPhishGuard (4 niezależne moduły + fuzja):

M1 — URL Analyzer (LightGBM, < 5ms):

Homoglyph/punycode detection (рaypal.com), Levenshtein distance do brand list
Domain age (SSL CT logs), TLD abuse, subdomain depth
Wstępny filtr: jeśli p_url > 0.9 → block bez uruchamiania ciężkich modułów

M2 — Visual Logo Detector (dwustopniowy, core novelty):

M2a Localization: Deformable DETR lub Faster R-CNN, fine-tuned na LogoSENSE (3,060 train, bounding box)
M2b Fast matching: CLIP ViT-B/32 zero-shot → brand embeddings dla 150+ marek finansowych bez retrainingu (klucz: nowy neobank = dodaj opis tekstowy, gotowe)
M2c Adversarial verifier: fine-tuned ResNet-50/ViT-B/16 z PGD adversarial training (Madry 2018, ε=8/255, k=40) + augmentacja GAN logos (Lee 2023) + diffusion logos (Hao 2024)
M2d Timing defense: multi-timestamp t=0/500ms/2000ms + delta detection

CLIP vs ResNet baseline (eksperyment kluczowy):

H1: CLIP naturalnie odporny na GAN logos (atakuje lokalne textury, CLIP = semantic alignment)
H2: ViT globalny attention > ResNet lokalny receptive field dla adversarial robustności
Weryfikacja eksperymentalna: evasion rate GAN logos na CLIP vs ResNet-50

M3 — Content Brand Extractor (RoBERTa NER + OCR, < 100ms):

HTML parsing: <title>, <h1>, <meta>, <button> → candidate brand strings
PaddleOCR na screenshot header + formularz logowania
Fine-tuned RoBERTa-base: NER dla BANK/PAYMENT_GATEWAY/FINTECH/CARD_NETWORK
Cross-check: detected brand ↔ URL domain (Levenshtein mismatch → phishing signal)

M4 — DOM Timing Analyzer (statyczna analiza, < 10ms):

CSS: regex na opacity:0, display:none, visibility:hidden na elementach logo
JS AST: setTimeout(fn, delay>200ms) operujące na logo DOM nodes
Resource timing (Playwright): logo PNG fetch delay względem DOMContentLoaded

Fuzja decyzyjna:

s = 0.25·p_url + 0.40·p_visual + 0.25·p_content + 0.10·p_timing
Adaptive: jeśli visual timeout → redistribucja wag; kontekst płatności → β wzrasta
Override: p_timing > 0.95 → PHISHING (delayed rendering = pewna detekcja)

Financial Brand Knowledge Base (150+ marek):

Tier 1 Banki: PKO BP, mBank, ING, BNP Paribas, Pekao, HSBC, Deutsche Bank, JPMorgan, …
Tier 2 Payments: PayPal, Stripe, Square, Revolut, BLIK, Wise, Klarna, Przelewy24, iDEAL
Tier 3 Cards: Mastercard, Visa, Amex + mobilne: Apple Pay, Google Pay, Samsung Pay
Tier 4 Crypto/Fintech: Binance, Coinbase, N26, Monzo, Starling
CLIP zero-shot: nowe marki bez retrainingu, only text description required

Ewaluacja (wyłącznie istniejące datasety):

Eksperyment	Dataset	Baseline	Metryka
Logo detection clean	LogoSENSE (1,979 test)	HOG+SVM 94.3%	mAP
Adv. robustness GAN	LogoSENSE + GAN logos	ResNet-50 (evasion 95%)	Recall pod atakiem
Adv. robustness diffusion	LogoSENSE + diffusion	Hao 2024 baseline	Recall pod atakiem
CLIP vs ResNet	LogoSENSE + adversarial	ResNet-50 triplet	Δ evasion rate
Timing defense	Syntetyczny (Yuan repro)	Yuan PoC (1 screenshot)	Recall timing
End-to-end F1	Ji & Kim 2025 (19,131)	PhishIntention, KnowPhish	F1, FPR@95%TPR
Payment brand recall	Ji & Kim 2025 (subset)	PhishIntention	Recall per brand tier
Multi-attack	Syntetyczny A4 (URL+GAN)	brak baseline	Recall multi-attack

Wkład badawczy (jeden paper, 4 twierdzenia):

CLIP > triplet-ResNet dla adversarial logo robustności (A1/A2 attacks)
DOM static analysis wykrywa delayed rendering bez screenshotów (A3)
End-to-end hybryda pobija PhishIntention i KnowPhish na Ji & Kim 2025
Extended financial brand KB (150+ marek fintech/payment) wypełnia coverage gaps

Grad-CAM explainability: wizualizacja decyzji logo detectora (wymagana przez recenzentów), porównanie heatmap clean vs adversarial.

Szacowany czas: 4-5 miesięcy

[#BP-2] Financial Services Phishing Benchmark: Ewaluacja SOTA na Istniejących Danych

Status: new Priorytet: high Dodano: 2026-05-12 Czas realizacji: 2-3 miesiące (szybsza publikacja!) Target venues: IEEE S&P (workshop), ACM CCS (poster/short), NDSS workshop

Bazuje na: Ji 2024, Ji & Kim 2025, PhishIntention 2022

Gap:

Ji 2024: ewaluacja 451k stron → pokazuje dramatyczny spadek, ale tylko ogólne phishing, nie financial brands
Ji & Kim 2025: LLM vs RBPD — ale bez financial services focus, bez adversarial testing
Brak systematycznej ewaluacji istniejących RBPD pod kątem financial brand coverage
Nikt nie zmierzył ile phishing stron impersonuje fintech (Revolut, Wise, Klarna) vs tradycyjne banki

Proponowane badanie:

Systematyczna ewaluacja istniejących systemów phishingu ze skupieniem na financial brands:

Brand coverage audit: sprawdź PhishIntention, KnowPhish, DynaPhish pod kątem financial services brand list
- Banki (top 50 globalnych), payment gateways (PayPal, Stripe, Revolut, BLIK), fintech (Klarna, N26, Monzo)
- Wynik: które marki są pominięte w knowledge base? → coverage gaps
Ewaluacja na Ji & Kim 2025 dataset (19,131 stron):
- Uruchom PhishIntention + KnowPhish na tym dataset
- Taguj wyniki per brand category (banking vs payment vs fintech)
- Financial brands recall vs ogólna recall — czy financial marki są trudniejsze?
Extended brand evaluation: dodaj brakujące marki do knowledge base i zmierz improvement
- Ile stron phishingowych impersonujących Revolut/BLIK/Stripe jest missed?
Adversarial subset analysis: w Ji & Kim 2025 zidentyfikuj przypadki potencjalnego visual evasion (duże różnice między modelami)

Wkład badawczy:

Pierwszy systematyczny raport financial brand coverage gaps w RBPD
Benchmark na Ji & Kim 2025 (19k stron) z brand-level breakdown
Extended financial brand knowledge base (open source, do integracji z PhishIntention/KnowPhish)
Roadmap: które marki wymagają priorytetowego pokrycia

Dlaczego szybko: to jest benchmarking + measurement study — bez implementacji nowych modeli, łatwy do opublikowania jako short paper lub workshop.

Szacowany czas: 2-3 miesiące

[#BP-3] Defense Against Delayed Rendering: DOM/CSS/JS Analysis bez Screenshot Dependency

Status: new Priorytet: high Dodano: 2026-05-12 Czas realizacji: 3-4 miesiące Target venues: USENIX Security, IEEE S&P, CCS

Bazuje na: Yuan 2026, Song 2025, Petrukha 2024

Gap:

Yuan 2026: delayed rendering → detection 100%→0%, PoC defense = jeden dodatkowy screenshot → łatwe do ominięcia (dłuższy delay, np. 10s)
Song 2025: DOM-GNN jest naturalnie odporny, ale nie adresuje timing evasion explicitly
Petrukha 2024: on-device PoC ale nie broni timing attacks
Brak systemu nie polegającego na screenshotach do detekcji delayed rendering

Proponowane badanie:

TempGuard — wielosygnałowa detekcja timing evasion bez polegania na screenshotach:

DOM/HTML static analysis (niezależny od renderowania):
- Parser HTML (BeautifulSoup/lxml): szukaj logo URL w <img src>, <link rel="icon">, <div style="background-image">
- CSS rule analysis: identyfikacja opacity:0, display:none, visibility:hidden dla elementów logo
- JavaScript static analysis: setInterval/setTimeout z długim delay na logo-related DOM nodes
- Heurystyki: jeśli logo element jest obecny w HTML ale ukryty przez CSS → suspicious score
Network traffic analysis:
- Monitoring HTTP requests: kiedy logo resource fetch pojawia się relative to page load?
- Jeśli logo PNG pobierany >300ms po DOMContentLoaded → red flag
- Proxy-based lub browser extension approach
Multi-timestamp visual (fallback):
- t=0ms, t=500ms, t=2000ms screenshots
- Anomaly detection: “materialna zmiana” = logo pojawia się po t=0ms

Hipoteza: TempGuard osiągnie >80% recall na delayed rendering attacks (vs 0% dla single-screenshot) bez dodatkowych screenshotów.

Ewaluacja:

Syntetyczny zestaw testowy: reprodukcja Yuan 2026 metodologii (CSS curtain phishing pages)
Ji & Kim 2025 dataset: ilu stron phishingowych używa timing evasion? (measurement)
Porównanie z Yuan 2026 PoC (single extra screenshot baseline)

Wkład badawczy:

Pierwsza systematyczna DOM/CSS/JS-based obrona przed delayed rendering
Nie wymaga screenshotów → szybsza, mniej zasobochłonna
Multi-signal fusion: static DOM + network + multi-timestamp

Szacowany czas: 3-4 miesiące

📌 Średnie priorytety

[#BP-4] EUIPO/URPiE Trademark Integration: Financial Brand Zero-Day Coverage

Status: new Priorytet: medium Dodano: 2026-05-12

Gap:

KnowPhish: 20k brand knowledge base ale nie zawiera trademark registry data
Rejestry EUIPO (Class 36: financial) i URPiE: autorytarne, weryfikowane źródło marek
Brak integracji trademark registry z phishing detection

Proponowane badanie:

EUIPO Bulk Download API → trademark graph (Class 36 financial services)
Integration pipeline: EUIPO marks → PhishIntention/KnowPhish knowledge base
Zero-day coverage: ile ataków na nowe fintech marki (post-2022) jest missed?
Publiczny dataset: 50k+ EU financial trademark logos

Szacowany czas: 3-4 miesiące

[#BP-5] Proactive Financial Phishing Detection via SSL Certificate Transparency

Status: new Priorytet: medium Dodano: 2026-05-12

Gap:

Duarte 2025: SSL CT framework dla brazylijskiej instytucji bankowej, LightGBM 97.28%
Brak analogicznego systemu dla szerokiego sektora financial services (banki + fintech + payment)

Proponowane badanie:

SSL CT monitoring (certstream.calidog.io) z filtrowaniem financial brand keywords
Feature engineering: homoglyph detection (PaypaI vs Paypal), brand keyword abuse, TLD patterns
Extended brand list: banki + Revolut/Wise/N26/Klarna + Mastercard/Visa
Porównanie: Duarte framework (banking only) vs financial services extension

Szacowany czas: 3 miesiące

[#BP-6] Overconfidence in Financial Brand Phishing: Experimental Study (PL Replication)

Status: new Priorytet: medium Dodano: 2026-05-12

Gap: Yuan 2024: overconfidence finding (użytkownicy znający markę → gorsi w wykrywaniu, n=470, US). Brak replikacji PL/EU.

Proponowane badanie: Replikacja Yuan 2024 z PL kontekstem (PKO BP, mBank, BLIK, Revolut PL). n=200+.

Szacowany czas: 4 miesiące (wymaga etyki badań)

💡 Niskie priorytety

[#BP-7] Adversarial Logo Benchmark: GAN vs Diffusion vs Pixel Attack

Status: new Priorytet: low Dodano: 2026-05-12

Motywacja: Lee 2023 (GAN), Hao 2024 (diffusion) — brak systematycznego benchmark. Implementacja 3 klas ataków na LogoSENSE dataset.

Szacowany czas: 2 miesiące

[#BP-8] EVA-CLIP jako Drop-in Upgrade dla Visual Logo Matching w RBPD

Status: new Priorytet: medium Dodano: 2026-05-14 Czas realizacji: 1-2 miesiące (komponent do BP-1) Target venues: Komponent systemu FinPhishGuard (#BP-1); standalone ablation section

Bazuje na: Sun et al. 2023 EVA-CLIP, [#BP-1 FinPhishGuard]

Gap w literaturze:

Istniejące RBPD (PhishIntention, KnowPhish) uzywaja CLIP ViT-B/32 lub ViT-L/14 do dopasowania logo — modeli z 2021 roku
EVA-02-CLIP-E/14+ (2023) osiaga 82,0% zero-shot na ImageNet vs 75,5% dla OpenAI CLIP-L/14+ (+6,5%)
Nikt nie zmierzyl czy nowsze, silniejsze CLIP poprawiaja recall phishing logo detection
EVA-CLIP jest open-source, z wagami publicznymi — mozliwa bezposrednia integracja

Proponowane badanie:

Podmiana enkodera: w systemie M2b (fast matching z BP-1) zamien CLIP ViT-B/32 na EVA-02-CLIP-L/14 i EVA-02-CLIP-E/14+
Pomiar poprawy: na LogoSENSE test set (1,979 probek) porownaj:
- Recall@1 dla brand matching (czy poprawny brand jest pierwszym wynikiem?)
- Recall@5 (czy poprawny brand jest w top-5 wynikach?)
- Szczegolna uwaga na rzadkie marki (fintech, nowe banki) — czy EVA-CLIP lepiej generalizuje?
Zero-shot nowe marki: dodaj 20 marek nieobecnych w training data (np. nowe fintech 2022-2024) i zmierz zero-shot accuracy dla CLIP-B/32 vs EVA-02-CLIP-L/14+
Adversarial robustnosc: przetestuj obie wersje na GAN-perturbowanych logo (Lee 2023) — czy lepsze wstepne embeddingi poprawiaja robustnosc?

Kluczowe hipotezy:

H1: EVA-02-CLIP-L/14+ osiaga wyzszy Recall@1 niz CLIP ViT-B/32 dla brand matching na LogoSENSE
H2: Lepsza inicjalizacja (MIM + CLIP) daje lepsze embeddingi dla adversarially perturbowanych logo
H3: Zero-shot coverage dla nowych marek jest wyzsza dla EVA-CLIP (silniejsze reprezentacje semantyczne)

Dlaczego wazne dla projektu:

EVA-CLIP osiaga SOTA zero-shot przy mniejszych kosztach niz OpenCLIP-G (1/6 param, 1/6 danych)
Podejscie zero-shot (bez retrainingu na markach) jest kluczowe: nowy neobank = tylko opis tekstowy
EVA-02-CLIP-L/14+ (428M param) jest praktyczny do deploymentu, w przeciwienstwie do 5B modeli

Ewaluacja:

LogoSENSE: Recall@1, Recall@5, mAP per brand (banking/payment/fintech)
GAN logo subset: recall pod atakiem dla CLIP-B/32 vs EVA-02-CLIP-L/14+
Zero-shot new brands: 20 nowych marek, accuracy vs CLIP-B/32 baseline

Szacowany czas: 1-2 miesiace (implementacja integracji + eksperymenty porownawcze)

[#BP-9] Efficient CLIP Training Techniques dla Domain-Specific Brand Models

Status: new Priorytet: low Dodano: 2026-05-14 Czas realizacji: 3-4 miesiące

Bazuje na: Sun et al. 2023 EVA-CLIP

Gap:

Ogolne CLIP modele (OpenAI, EVA-CLIP) trenowane na LAION — brak danych finansowych brand images
Drobne fine-tuning na domain-specific data (logo images + brand descriptions) moze poprawic precyzje dla waznych marek
EVA-CLIP pokazuje, ze proper initialization (MIM pretrain) + LAMB optimizer + FLIP masking drastycznie redukuje koszt treningu

Proponowane badanie:

Fine-tuning EVA-02-CLIP-L/14+ (lub mniejszego EVA-02-CLIP-B/16+) na domain-specific zbiorze finansowych logo:

Dataset konstrukcja: zbierz pary (logo image, brand description) dla 500+ marek finansowych
- Zrodla: strony WWW bankow, Wikipedia, rejestry EUIPO (Class 36)
- Format: “Logo of [BankName], [Country] bank specializing in [products]”
- Augmentacja: rozne warianty logo (white/dark background, rozne rozmiary)
Fine-tuning z EVA-CLIP technikami:
- FLIP: 50% masking image tokenow (2x szybciej)
- LAMB optimizer (optimal dla duzych batch)
- Inicjalizacja: EVA-02-CLIP-L/14+ (nie od zera!)
- Male LR: 1e-5 dla vision enc, 1e-6 dla text enc (nie niszczyc ogolnych repr.)
Ewaluacja: LogoSENSE + nowe marki fintech vs baseline EVA-02-CLIP-L/14+ zero-shot

Dlaczego low priority: wymaga custom dataset (zbieranie logo) — wiecej wysilku bez gwarancji przewagi nad zero-shot

Szacowany czas: 3-4 miesiace

Statystyki projektu

Lacznie: 9 pomyslow
High: 3 (#BP-1, BP-2, BP-3)
Medium: 4 (#BP-4, BP-5, BP-6, BP-8)
Low: 2 (#BP-7, BP-9)

🚀 Rekomendowana kolejność dla szybkiej publikacji

Miesiąc 1-3:  #BP-2 (Benchmark study — najszybszy do publikacji, measurement paper)
              ↕ równolegle
Miesiąc 1-4:  #BP-3 (TempGuard — konkretna obrona, wyraźna novelty)

Miesiąc 3-7:  #BP-1 (Pełny hybrid system — główna publikacja doktoratu)
Miesiąc 4-7:  #BP-4/#BP-5 (Supplement paper lub rozdział doktoratu)

🗺️ Mapa wkładów badawczych

Luki w literaturze             Nasze rozwiązanie              Istniejący dataset
─────────────────────────────────────────────────────────────────────────────────
GAN logos → 95% evasion    → Adversarial training RBPD    → LogoSENSE (71 cyt.)
Delayed rendering → 0%     → DOM/CSS static analysis      → Syntetyczny (Yuan metod.)
Lab 94% vs real-world 40%  → Ewaluacja na Ji & Kim 2025   → 19,131 stron (publiczny)
Fintech brand blind spots  → Extended brand coverage       → PhiUSIIL (~465k stron)
Payment gateways missed    → Financial services KB         → PhishTank + OpenPhish

Research

Przeglądaj

Pomysły badawcze

Pomysły badawcze

🔥 Wysokie priorytety

[#BP-1] Adversarially Robust Financial Brand Phishing Detector: Rozszerzenie KnowPhish o Adversarial Hardening

[#BP-2] Financial Services Phishing Benchmark: Ewaluacja SOTA na Istniejących Danych

[#BP-3] Defense Against Delayed Rendering: DOM/CSS/JS Analysis bez Screenshot Dependency

📌 Średnie priorytety

[#BP-4] EUIPO/URPiE Trademark Integration: Financial Brand Zero-Day Coverage

[#BP-5] Proactive Financial Phishing Detection via SSL Certificate Transparency

[#BP-6] Overconfidence in Financial Brand Phishing: Experimental Study (PL Replication)

💡 Niskie priorytety

[#BP-7] Adversarial Logo Benchmark: GAN vs Diffusion vs Pixel Attack

[#BP-8] EVA-CLIP jako Drop-in Upgrade dla Visual Logo Matching w RBPD

[#BP-9] Efficient CLIP Training Techniques dla Domain-Specific Brand Models

Statystyki projektu

🚀 Rekomendowana kolejność dla szybkiej publikacji

🗺️ Mapa wkładów badawczych

Graf

Spis treści

Odnośniki zwrotne