Pomysły badawcze
Ostatnia aktualizacja: 2026-05-12
🔥 Wysokie priorytety
[#PH-1] Temporal Robustness Benchmark: Legacy (2002-2005) vs Fresh Phishing (2024-2026)
Status: new Priorytet: high Dodano: 2026-04-28 Bazuje na: Al-Subaiey
Motywacja:
- Al-Subaiey: 99.1% dokładność ale dane z Enron (1999-2002), SpamAssassin (2002-2005)
- Pytanie: Czy modele trenowane na starych danych działają na świeże 2024-2026 phishing?
Własne badanie:
- Zbiory danych: SpamAssassin (2002-2005), PhishTank 2024-2026, AI-generated (GPT-4)
- Modele: SVM+TF-IDF, BERT-base, regresja logistyczna
- Eksperyment: Trenuj na starych → testuj na świeżych → mierz degradację
Wkład badawczy:
- Kwantyfikacja degradacji czasowej (20-letni zakres)
- Benchmark phishingu generowanego AI (5k próbek)
- Porównanie strategii adaptacji (statyczny vs przyrostowy)
Zbiory danych: SpamAssassin, PhishTank 2024-2026, GPT-4 API
Szacowany czas: 2-3 miesiące
[#PH-2] Phishing URL Detection: Multi-Model Benchmark na Public Datasets
Status: new Priorytet: high Dodano: 2026-04-28 Bazuje na: PhishDebate, PhishChain
Motywacja:
- PhishDebate: 96.5% (multi-agent LLM, komercyjne API, nieodtwarzalne)
- PhishChain: 95.45% (crowdsourcing, drogie)
- Pytanie: Czy proste modele nadzorowane są konkurencyjne?
Własne badanie:
- Zbiory: PhishTank 2020, Mendeley, UCI Phishing → ~20k URL
- Modele: Las losowy, XGBoost, LightGBM, BERT-base, regresja logistyczna
- Porównanie: cost-accuracy-latency trade-off (XGBoost vs multi-agent LLM)
Wkład badawczy:
- Uczciwy benchmark wielu modeli (te same zbiory, te same podziały)
- Analiza kompromisu koszt-dokładność-opóźnienie
- Badanie inżynierii cech
Szacowany czas: 2 miesiące
📌 Średnie priorytety
[#PH-3] Organizational Phishing Resilience Metric: Single vs Multi-Department Study
Status: new Priorytet: medium Dodano: 2026-04-28 Bazuje na: Anti-Phishing Training
Motywacja: OII metric testowana na N=124 w pojedynczej org. Czy różni się według działu/roli?
Własne badanie:
- Partnerstwo z 1-2 organizacjami
- Gophish (open-source), 3-4 kampanie przez 6 miesięcy
- Segmentacja: dział, stanowisko, rola techniczna
Szacowany czas: 6 miesięcy
[#PH-4] AI-Generated Phishing Corpus: GPT-4 vs Claude vs Llama-3
Status: new Priorytet: medium Dodano: 2026-04-28 Bazuje na: Anti-Phishing Training
Motywacja: Który LLM generuje najbardziej przekonujący phishing?
Własne badanie: 3x1000 emaili, ocena NIST Phish Scale, testowanie wykrywania
Wkład: Benchmark AI-phishingu (3k próbek, publiczny), porównanie LLM
Szacowany czas: 2-3 miesiące
💡 Niskie priorytety
[#PH-5] Browser-Based Phishing Detection PoC: TensorFlow.js Implementation
Status: new Priorytet: low Dodano: 2026-04-28
Motywacja: TensorFlow.js + rozszerzenie Chrome dla real-time phishing detection.
Szacowany czas: 1-2 miesiące