Pomysły badawcze
Ostatnia aktualizacja: 2026-05-12
🔥 Wysokie priorytety
[#BB-1] TypeNet dla Bot Detection w E-Commerce: Transfer Keystroke Biometrics do Session Validation
Status: new Priorytet: high Dodano: 2026-04-28 Bazuje na: TypeNet Acien et al.
Gap w TypeNet (2021):
- TypeNet osiąga EER 2.2% (desktop) dla uwierzytelniania użytkowników
- Nie testowano w kontekście fraud/bot detection - tylko uwierzytelnianie
- Pytanie: Czy keystroke dynamics wykrywa boty w formularzach e-commerce? Czy 20-30 klawiszy wystarczy?
Proponowane badanie:
- Zebrać: 1000+ prawdziwych użytkowników (MTurk) + 5000+ botów (Selenium, Playwright)
- Typy botów: proste (stała prędkość) + zaawansowane (randomizowana prędkość, błędy)
- Architektura TypeNet: 2-layer LSTM z triplet loss (anchor=human, positive=human, negative=bot)
- Porównanie długości: M=20, 30, 50, 70 klawiszy
Wkład badawczy:
- Pierwszy transfer TypeNet do bot detection w e-commerce
- Dataset bot vs human keystroke (1K human + 5K bots, publiczny)
- Analiza short sequences (20-30 klawiszy vs 70+)
Zbiory danych: Własny (rekrutacja MTurk + symulacja botów)
Szacowany czas: 2-3 miesiące
[#BB-2] Privacy-Preserving Continuous Authentication: Federated Learning + Keystroke Biometrics
Status: new Priorytet: high Dodano: 2026-04-29 Bazuje na: Baig 2022, Bansal 2024
Gap:
- Baig (2022): homomorphic encryption ale brak continuous authentication
- Bansal (2024): RL continuous auth ale brak privacy-preserving (centralized)
- Pytanie: Połączyć privacy-preserving + continuous authentication dla e-commerce?
Proponowane badanie (federated learning + differential privacy + on-device):
- Client-side: feature extraction + LSTM (TensorFlow.js, <5MB, <50ms)
- Federated: gradients + differential privacy (ε=1.0) + secure aggregation
- Continuous auth: co 50 keystroków → re-authenticate
- Attack scenarios: session hijacking, credential stuffing, replay
Hipoteza: Privacy-preserving osiągnie 90-92% accuracy (vs 94.7% centralized) - akceptowalny trade-off
Wkład badawczy:
- Pierwsza kombinacja: federated + continuous auth + homomorphic encryption
- On-device inference (TF.js, <50ms, <5MB)
- Attack benchmark
Zbiory danych: Dhakal (168K users, publiczny) + własny session hijacking dataset
Szacowany czas: 3-4 miesiące
📌 Średnie priorytety
[#BB-3] BeCAPTCHA-Type: Synthetic Keystroke Data dla Improved Bot Training
Status: new Priorytet: medium Dodano: 2026-04-29 Bazuje na: BeCAPTCHA-Type DeAlcala 2022
Gap: BeCAPTCHA-Type testowane na few-shot learning. Czy synthetic data może zastąpić real data w full-scale?
Własne badanie: 3 scenariusze (few-shot jak BeCAPTCHA, full-scale synthetic only, hybrid 50/50)
Szacowany czas: 2-3 miesiące
[#BB-4] Continuous Authentication with RL: Multi-User Benchmark dla E-Commerce
Status: new Priorytet: medium Dodano: 2026-04-29 Bazuje na: Bansal 2024
Gap: Bansal testuje per-user basis (każdy user ma własnego agenta) - niepraktyczne w skali.
Własne badanie: Shared DDQN (1 agent dla wszystkich users) vs per-user DDQN. Testbed: 1000 users + 500 session hijacking.
Wkład: Rozszerzenie per-user → multi-user shared model (scalable)
Szacowany czas: 3 miesiące
[#BB-5] Web Fingerprinting Risk Assessment: Entropy-Based Metrics dla GDPR Compliance
Status: new Priorytet: medium Dodano: 2026-04-29 Bazuje na: Bacis 2024
Gap: Bacis testuje tylko desktop Chrome. Brak automated GDPR audit tool.
Własne badanie: Crawler dla 100+ e-commerce sites, 5 browsers, entropy per feature + GDPR compliance check
Wkład: Multi-browser extension, pierwszy automated GDPR fingerprinting audit tool
Szacowany czas: 2-3 miesiące
💡 Niskie priorytety
[#BB-6] Cross-Device Keystroke Biometrics dla Fraud: Desktop Training → Mobile Testing
Status: new Priorytet: low Dodano: 2026-04-28 Bazuje na: TypeNet Acien et al.
Gap: Cross-device EER 13.7% (vs 2.2% native). Brak rozwiązania.
Własne badanie: DANN, fine-tuning, multi-task learning na Dhakal + Palin datasets.
Szacowany czas: 2 miesiące