Pomysły badawcze

Ostatnia aktualizacja: 2026-05-12


🔥 Wysokie priorytety

[#PH-1] Temporal Robustness Benchmark: Legacy (2002-2005) vs Fresh Phishing (2024-2026)

Status: new Priorytet: high Dodano: 2026-04-28 Bazuje na: Al-Subaiey

Motywacja:

  • Al-Subaiey: 99.1% dokładność ale dane z Enron (1999-2002), SpamAssassin (2002-2005)
  • Pytanie: Czy modele trenowane na starych danych działają na świeże 2024-2026 phishing?

Własne badanie:

  1. Zbiory danych: SpamAssassin (2002-2005), PhishTank 2024-2026, AI-generated (GPT-4)
  2. Modele: SVM+TF-IDF, BERT-base, regresja logistyczna
  3. Eksperyment: Trenuj na starych → testuj na świeżych → mierz degradację

Wkład badawczy:

  • Kwantyfikacja degradacji czasowej (20-letni zakres)
  • Benchmark phishingu generowanego AI (5k próbek)
  • Porównanie strategii adaptacji (statyczny vs przyrostowy)

Zbiory danych: SpamAssassin, PhishTank 2024-2026, GPT-4 API

Szacowany czas: 2-3 miesiące


[#PH-2] Phishing URL Detection: Multi-Model Benchmark na Public Datasets

Status: new Priorytet: high Dodano: 2026-04-28 Bazuje na: PhishDebate, PhishChain

Motywacja:

  • PhishDebate: 96.5% (multi-agent LLM, komercyjne API, nieodtwarzalne)
  • PhishChain: 95.45% (crowdsourcing, drogie)
  • Pytanie: Czy proste modele nadzorowane są konkurencyjne?

Własne badanie:

  1. Zbiory: PhishTank 2020, Mendeley, UCI Phishing → ~20k URL
  2. Modele: Las losowy, XGBoost, LightGBM, BERT-base, regresja logistyczna
  3. Porównanie: cost-accuracy-latency trade-off (XGBoost vs multi-agent LLM)

Wkład badawczy:

  • Uczciwy benchmark wielu modeli (te same zbiory, te same podziały)
  • Analiza kompromisu koszt-dokładność-opóźnienie
  • Badanie inżynierii cech

Szacowany czas: 2 miesiące


📌 Średnie priorytety

[#PH-3] Organizational Phishing Resilience Metric: Single vs Multi-Department Study

Status: new Priorytet: medium Dodano: 2026-04-28 Bazuje na: Anti-Phishing Training

Motywacja: OII metric testowana na N=124 w pojedynczej org. Czy różni się według działu/roli?

Własne badanie:

  1. Partnerstwo z 1-2 organizacjami
  2. Gophish (open-source), 3-4 kampanie przez 6 miesięcy
  3. Segmentacja: dział, stanowisko, rola techniczna

Szacowany czas: 6 miesięcy


[#PH-4] AI-Generated Phishing Corpus: GPT-4 vs Claude vs Llama-3

Status: new Priorytet: medium Dodano: 2026-04-28 Bazuje na: Anti-Phishing Training

Motywacja: Który LLM generuje najbardziej przekonujący phishing?

Własne badanie: 3x1000 emaili, ocena NIST Phish Scale, testowanie wykrywania

Wkład: Benchmark AI-phishingu (3k próbek, publiczny), porównanie LLM

Szacowany czas: 2-3 miesiące


💡 Niskie priorytety

[#PH-5] Browser-Based Phishing Detection PoC: TensorFlow.js Implementation

Status: new Priorytet: low Dodano: 2026-04-28

Motywacja: TensorFlow.js + rozszerzenie Chrome dla real-time phishing detection.

Szacowany czas: 1-2 miesiące


📊 Statystyki projektu

  • Łącznie: 5 pomysłów
  • High: 2 (#PH-1, PH-2)
  • Medium: 2 (#PH-3, PH-4)
  • Low: 1 (#PH-5)