Chaoshen-1 Mouse Dynamics Dataset
Informacje podstawowe
- Nazwa: Chaoshen-1
- Alias: Shen et al. fixed static sequence dataset
- Dziedzina: Behavioral Biometrics, Cybersecurity
- Typ: Mouse movement tracking data (temporal and spatial coordinates)
Źródło
- Paper: Shen et al. [116] - “Performance evaluation of anomaly-detection algorithms for mouse dynamics”
- Organizacja: Shen, Zhongmin et al.
- Rok: 2014
- Dostęp: Na żądanie od autorów
Charakterystyka
- Rozmiar: 17.4k samples per user
- Liczba Uczestników: 58 subjects
- Typ Zbioru: Fixed static sequence of actions
- Format: Time series with (x, y) coordinates and timestamps
- Licencja: Na żądanie
Opis
Chaoshen-1 jest dataset’em do badania autentykacji na podstawie dynamiki myszy (mouse dynamics) w warunkach ściśle kontrolowanych. Uczestników poproszono o wykonanie stałej sekwencji akcji myszy zdefiniowanej przez badaczy. Dataset zawiera 8 kolejnych ruchów myszy izolowanych przez pojedyncze i podwójne kliknięcia, generujące kierunki co 45 stopni (360-stopniowy zakres na ekranie).
Mocną stroną tego dataset’u jest konsystencja – każdy użytkownik wykonuje dokładnie te same ruchy, co umożliwia dokładną analizę indywidualnych różnic. Autorzy wykazali, że na tym dataset’ie można osiągnąć europejski standard dla komercyjnych technologii biometrycznych (EER poniżej 5%), jeśli dopuszcza się dłuższy czas autentykacji.
Zastosowania
- Static user authentication (punkt logowania)
- Evaluation of anomaly detection algorithms
- Performance benchmarking under controlled conditions
- Comparative studies of machine learning classifiers
Używany w publikacjach
- Mouse Dynamics Behavioral Biometrics: A Survey - Comprehensive review of mouse dynamics literature spanning 1897-2023; dataset mentioned as example of fixed static sequence authentication
Benchmarki
| Model | Metric | Performance | Rok | Publikacja |
|---|---|---|---|---|
| 1-class SVM (RBF) | EER | 5.68% ± 4.12 | 2014 | Shen et al. [116] |
| KNN (Manhattan Distance) | EER | Best performance | 2014 | Shen et al. [116] |
Uwagi
- Dataset represents highly controlled laboratory conditions
- Not representative of real-world free-form user behavior
- Small participant pool (58 users) limits generalizability
- Fixed task repetition may not capture variability in natural computer usage
- Useful for algorithm development and baseline performance evaluation
- Access requires contacting authors directly
Tagi
dataset behavioral-biometrics mouse-dynamics authentication static-authentication controlled-environment