Pomysły badawcze

Ostatnia aktualizacja: 2026-05-12


🔥 Wysokie priorytety

[#BB-1] TypeNet dla Bot Detection w E-Commerce: Transfer Keystroke Biometrics do Session Validation

Status: new Priorytet: high Dodano: 2026-04-28 Bazuje na: TypeNet Acien et al.

Gap w TypeNet (2021):

  • TypeNet osiąga EER 2.2% (desktop) dla uwierzytelniania użytkowników
  • Nie testowano w kontekście fraud/bot detection - tylko uwierzytelnianie
  • Pytanie: Czy keystroke dynamics wykrywa boty w formularzach e-commerce? Czy 20-30 klawiszy wystarczy?

Proponowane badanie:

  1. Zebrać: 1000+ prawdziwych użytkowników (MTurk) + 5000+ botów (Selenium, Playwright)
  2. Typy botów: proste (stała prędkość) + zaawansowane (randomizowana prędkość, błędy)
  3. Architektura TypeNet: 2-layer LSTM z triplet loss (anchor=human, positive=human, negative=bot)
  4. Porównanie długości: M=20, 30, 50, 70 klawiszy

Wkład badawczy:

  • Pierwszy transfer TypeNet do bot detection w e-commerce
  • Dataset bot vs human keystroke (1K human + 5K bots, publiczny)
  • Analiza short sequences (20-30 klawiszy vs 70+)

Zbiory danych: Własny (rekrutacja MTurk + symulacja botów)

Szacowany czas: 2-3 miesiące


[#BB-2] Privacy-Preserving Continuous Authentication: Federated Learning + Keystroke Biometrics

Status: new Priorytet: high Dodano: 2026-04-29 Bazuje na: Baig 2022, Bansal 2024

Gap:

  • Baig (2022): homomorphic encryption ale brak continuous authentication
  • Bansal (2024): RL continuous auth ale brak privacy-preserving (centralized)
  • Pytanie: Połączyć privacy-preserving + continuous authentication dla e-commerce?

Proponowane badanie (federated learning + differential privacy + on-device):

  1. Client-side: feature extraction + LSTM (TensorFlow.js, <5MB, <50ms)
  2. Federated: gradients + differential privacy (ε=1.0) + secure aggregation
  3. Continuous auth: co 50 keystroków → re-authenticate
  4. Attack scenarios: session hijacking, credential stuffing, replay

Hipoteza: Privacy-preserving osiągnie 90-92% accuracy (vs 94.7% centralized) - akceptowalny trade-off

Wkład badawczy:

  • Pierwsza kombinacja: federated + continuous auth + homomorphic encryption
  • On-device inference (TF.js, <50ms, <5MB)
  • Attack benchmark

Zbiory danych: Dhakal (168K users, publiczny) + własny session hijacking dataset

Szacowany czas: 3-4 miesiące


📌 Średnie priorytety

[#BB-3] BeCAPTCHA-Type: Synthetic Keystroke Data dla Improved Bot Training

Status: new Priorytet: medium Dodano: 2026-04-29 Bazuje na: BeCAPTCHA-Type DeAlcala 2022

Gap: BeCAPTCHA-Type testowane na few-shot learning. Czy synthetic data może zastąpić real data w full-scale?

Własne badanie: 3 scenariusze (few-shot jak BeCAPTCHA, full-scale synthetic only, hybrid 50/50)

Szacowany czas: 2-3 miesiące


[#BB-4] Continuous Authentication with RL: Multi-User Benchmark dla E-Commerce

Status: new Priorytet: medium Dodano: 2026-04-29 Bazuje na: Bansal 2024

Gap: Bansal testuje per-user basis (każdy user ma własnego agenta) - niepraktyczne w skali.

Własne badanie: Shared DDQN (1 agent dla wszystkich users) vs per-user DDQN. Testbed: 1000 users + 500 session hijacking.

Wkład: Rozszerzenie per-user → multi-user shared model (scalable)

Szacowany czas: 3 miesiące


[#BB-5] Web Fingerprinting Risk Assessment: Entropy-Based Metrics dla GDPR Compliance

Status: new Priorytet: medium Dodano: 2026-04-29 Bazuje na: Bacis 2024

Gap: Bacis testuje tylko desktop Chrome. Brak automated GDPR audit tool.

Własne badanie: Crawler dla 100+ e-commerce sites, 5 browsers, entropy per feature + GDPR compliance check

Wkład: Multi-browser extension, pierwszy automated GDPR fingerprinting audit tool

Szacowany czas: 2-3 miesiące


💡 Niskie priorytety

[#BB-6] Cross-Device Keystroke Biometrics dla Fraud: Desktop Training → Mobile Testing

Status: new Priorytet: low Dodano: 2026-04-28 Bazuje na: TypeNet Acien et al.

Gap: Cross-device EER 13.7% (vs 2.2% native). Brak rozwiązania.

Własne badanie: DANN, fine-tuning, multi-task learning na Dhakal + Palin datasets.

Szacowany czas: 2 miesiące


📊 Statystyki projektu

  • Łącznie: 6 pomysłów
  • High: 2 (#BB-1, BB-2)
  • Medium: 3 (#BB-3, BB-4, BB-5)
  • Low: 1 (#BB-6)