Balabit Mouse Dynamics Dataset

Informacje podstawowe

  • Nazwa: Balabit
  • Alias: Balabit Mouse Dynamics Challenge
  • Dziedzina: Behavioral Biometrics, Cybersecurity, User Authentication
  • Typ: Mouse pointer timing and positioning data

Źródło

Charakterystyka

  • Rozmiar: Train set contains avg 937 actions; test set contains avg 50 actions
  • Liczba Uczestników: 10 subjects
  • Typ Zbioru: Completely free collection
  • Format: Mouse events with timing and positioning information
  • Akcje: Avg 937 training actions per user
  • Licencja: Open source/freely available

Opis

Balabit dataset jest jednym z najpopularniejszych publicznie dostępnych dataset’ów do badania dynamiki myszy. Nazwę swoją zawdzięcza firmie Balabit, która udostępniła go społeczności badawczej jako “Mouse Dynamics Challenge”. Dataset zawiera dane myszy zebrane w warunkach całkowicie swobodnych.

Dataset Balabit jest szczególnie cenny dla badaczy, ponieważ jest:

  1. Publicznie dostępny bez wymogów aprobaty
  2. Wystarczająco duży do trenowania głębokich modeli neuronowych
  3. Standardowo używany do porównań między algorytmami
  4. Zawiera zarówno dane treningowe jak i testowe z jasnym podziałem

Dane obejmują czasowe i pozycyjne informacje wskaźnika myszy, umożliwiające ekstrakcję wielu cech do autentykacji użytkownika.

Zastosowania

  • User authentication and identification
  • Algorithm benchmarking and comparative studies
  • Development of machine learning and deep learning models
  • Performance evaluation of different classifiers
  • Real-world feasibility testing

Używany w publikacjach

Benchmarki

ModelMetricPerformanceRokPublikacja
2D-CNNAUC0.962018Chong et al. [26]
2D-CNNEER0.102018Chong et al. [26]
Linear SVMEER0.18292017Tan & Roy [126]
Random ForestEER18.80%2019Antal & Egyed-Zsigmond [11]
1D CNNAUC0.982020Antal & Fejér [12]

Uwagi

  • Publicznie dostępny na GitHub
  • Mały dataset (10 użytkowników) ale doskonały do prototypowania
  • Bardzo popularne benchmark dla porównań algorytmów
  • Wyniki znacznie się różnią między metodami (od EER 0.1% do 18.8%)
  • Szczególnie popularne dla badań deep learning
  • Transfer learning możliwy z innych dataset’ów
  • Limita mocnych stron: mała liczba użytkowników

Tagi

dataset behavioral-biometrics mouse-dynamics authentication open-source benchmark deep-learning