Balabit Mouse Dynamics Dataset
Informacje podstawowe
- Nazwa: Balabit
- Alias: Balabit Mouse Dynamics Challenge
- Dziedzina: Behavioral Biometrics, Cybersecurity, User Authentication
- Typ: Mouse pointer timing and positioning data
Źródło
- URL: https://github.com/balabit/Mouse-Dynamics-Challenge
- Organizacja: Balabit
- Rok: 2016
- Licencja: Open source
Charakterystyka
- Rozmiar: Train set contains avg 937 actions; test set contains avg 50 actions
- Liczba Uczestników: 10 subjects
- Typ Zbioru: Completely free collection
- Format: Mouse events with timing and positioning information
- Akcje: Avg 937 training actions per user
- Licencja: Open source/freely available
Opis
Balabit dataset jest jednym z najpopularniejszych publicznie dostępnych dataset’ów do badania dynamiki myszy. Nazwę swoją zawdzięcza firmie Balabit, która udostępniła go społeczności badawczej jako “Mouse Dynamics Challenge”. Dataset zawiera dane myszy zebrane w warunkach całkowicie swobodnych.
Dataset Balabit jest szczególnie cenny dla badaczy, ponieważ jest:
- Publicznie dostępny bez wymogów aprobaty
- Wystarczająco duży do trenowania głębokich modeli neuronowych
- Standardowo używany do porównań między algorytmami
- Zawiera zarówno dane treningowe jak i testowe z jasnym podziałem
Dane obejmują czasowe i pozycyjne informacje wskaźnika myszy, umożliwiające ekstrakcję wielu cech do autentykacji użytkownika.
Zastosowania
- User authentication and identification
- Algorithm benchmarking and comparative studies
- Development of machine learning and deep learning models
- Performance evaluation of different classifiers
- Real-world feasibility testing
Używany w publikacjach
- Mouse Dynamics Behavioral Biometrics: A Survey - Widely cited throughout survey; used by numerous studies for performance evaluation and algorithm comparison
Benchmarki
| Model | Metric | Performance | Rok | Publikacja |
|---|---|---|---|---|
| 2D-CNN | AUC | 0.96 | 2018 | Chong et al. [26] |
| 2D-CNN | EER | 0.10 | 2018 | Chong et al. [26] |
| Linear SVM | EER | 0.1829 | 2017 | Tan & Roy [126] |
| Random Forest | EER | 18.80% | 2019 | Antal & Egyed-Zsigmond [11] |
| 1D CNN | AUC | 0.98 | 2020 | Antal & Fejér [12] |
Uwagi
- Publicznie dostępny na GitHub
- Mały dataset (10 użytkowników) ale doskonały do prototypowania
- Bardzo popularne benchmark dla porównań algorytmów
- Wyniki znacznie się różnią między metodami (od EER 0.1% do 18.8%)
- Szczególnie popularne dla badań deep learning
- Transfer learning możliwy z innych dataset’ów
- Limita mocnych stron: mała liczba użytkowników
Tagi
dataset behavioral-biometrics mouse-dynamics authentication open-source benchmark deep-learning