Alibaba Group Traffic Dataset

Informacje podstawowe

  • Nazwa: Alibaba Group Traffic
  • Alias: Alibaba Traffic, Alibaba Service Traffic, Alibaba Cloud Traffic
  • Dziedzina: Cloud Computing, Systems, E-commerce
  • Typ: Time Series, Tabular

Źródło

Charakterystyka

  • Rozmiar: 1000 web services, 13 days of observations
  • Granulacja: Multiple time intervals (1, 5, 15, 30 minutes)
  • Format: Time series data (request counts per time point)
  • Klasy/Kategorie: 1000 different web services
  • Licencja: Public dataset

Opis

Alibaba Group Traffic dataset zawiera rzeczywiste dane o ruchu sieciowym z infrastruktury Alibaba Group. Dataset obejmuje 1000 usług sieciowych obserwowanych przez 13 dni. Reprezentuje produkcyjne scenariusze pracy z różnymi wzorcami obciążenia.

Dane pokazują znaczące fluktuacje i częste zmiany w czasie, napędzane heterogenicznymi zachowaniami użytkowników. Każdy punkt danych reprezentuje liczbę żądań (request count) dla konkretnej usługi w danym momencie czasowym.

Dataset jest szczególnie wartościowy do badania relacji przyczynowych między usługami w środowisku produkcyjnym.

Zastosowania

  • Prognozowanie ruchu sieciowego dla skalowania zasobów
  • Analiza wzorców ruchu w systemach e-commerce
  • Detekcja anomalii w usługach webowych
  • Testowanie algorytmów autoscalingu na danych produkcyjnych
  • Benchmarking metod prognozowania szeregów czasowych
  • Badanie relacji przyczynowych w systemach rozprosonych

Używany w publikacjach

Benchmarki

ModelMetricScore (30 min)GranulacjaRokPublikacja
MagicScalerMSE3.4930 min2023[CCMPlus paper]
OptScalerMSE3.5730 min2024[CCMPlus paper]
TimesNetMSE3.1830 min2023[CCMPlus paper]
iTransformerMSE3.1230 min2024[CCMPlus paper]
CCM+TimesNetMSE3.0230 min2025[CCMPlus paper]
TimesNetMSE2.175 min2023[CCMPlus paper]
CCM+TimesNetMSE1.815 min2025[CCMPlus paper]

Uwagi

  • Dataset jest publicznie dostępny przez GitHub Alibaba
  • Zawiera dane z rzeczywistej produkcji Alibaba Cloud
  • Wymagane preprocessowanie dla różnych granularności czasowych
  • Jedna z największych dostępnych publicznych kolekcji danych o ruchu webowym
  • Pokazuje naturalne relacje przyczynowe między usługami

Tagi

dataset time-series web-traffic alibaba-cloud e-commerce cloud-computing real-world-data production-data prediction-benchmark