Microsoft Azure Traffic Dataset
Informacje podstawowe
- Nazwa: Microsoft Azure Traffic
- Alias: Azure Traffic, Azure Service Traffic
- Dziedzina: Cloud Computing, Systems
- Typ: Time Series, Tabular
Źródło
- URL: https://github.com/Azure/AzurePublicDataset
- Paper: Leveraging Latent Causal Relationships Among Web Services for Traffic Prediction
- Organizacja: Microsoft
- Rok: 2020s (historyczne dane)
Charakterystyka
- Rozmiar: 1000 web services, 14 days of observations
- Granulacja: Multiple time intervals (1, 5, 15, 30 minutes)
- Format: Time series data (request counts per time point)
- Klasy/Kategorie: 1000 different web services
- Licencja: Public dataset
Opis
Microsoft Azure Traffic dataset zawiera rzeczywiste dane o ruchu sieciowym z platformy Microsoft Azure. Dataset obejmuje 1000 usług sieciowych obserwowanych przez okres 14 dni. Dane są scharakteryzowane częstymi i znaczącymi wahaniami w czasie, napędzanymi heterogenicznymi zachowaniami użytkowników.
Dane reprezentują ścieżkę żądań (request count) dla każdej usługi w każdym momencie czasowym, umożliwiając analizę wzorców czasowych i relacji przyczynowych między usługami.
Zastosowania
- Prognozowanie ruchu sieciowego dla optymalizacji zasobów
- Detekcja anomalii w usługach chmurowych
- Analiza relacji przyczynowych między usługami
- Benchmarking metod prognozowania szeregów czasowych
- Testowanie algorytmów autoscalingu
- Ocena wydajności modeli deep learning na danych rzeczywistych
Używany w publikacjach
- [Leveraging Latent Causal Relationships Among Web Services for Traffic Prediction] - Główny dataset do walidacji metody CCMPlus w exp. granulacji 1, 5, 15 i 30 minut
Benchmarki
| Model | Metric | Score (30 min) | Granulacja | Rok | Publikacja |
|---|---|---|---|---|---|
| MagicScaler | MSE | 42.07 | 30 min | 2023 | [CCMPlus paper] |
| OptScaler | MSE | 33.75 | 30 min | 2024 | [CCMPlus paper] |
| TimesNet | MSE | 16.62 | 30 min | 2023 | [CCMPlus paper] |
| iTransformer | MSE | 19.56 | 30 min | 2024 | [CCMPlus paper] |
| CCM+TimesNet | MSE | 14.92 | 30 min | 2025 | [CCMPlus paper] |
| TimesNet | MSE | 2.87 | 5 min | 2023 | [CCMPlus paper] |
| CCM+TimesNet | MSE | 2.63 | 5 min | 2025 | [CCMPlus paper] |
Uwagi
- Dataset jest publicznie dostępny przez GitHub
- Wymaga preprocessing dla różnych granularności czasowych
- Dobrze nadaje się do badania relacji przyczynowych między usługami
- Dostarczony przez Microsoft Research dla celów benchmarkingu
Tagi
dataset time-series web-traffic microsoft-azure cloud-computing real-world-data prediction-benchmark