Alexa Top-100K Websites

Informacje podstawowe

  • Nazwa: Alexa Top-100K Websites
  • Alias: Alexa rankings, top websites
  • Dziedzina: Web Measurement
  • Typ: Website list, metadata

Źródło

  • URL: https://www.alexa.com/ (web traffic rankings)
  • Paper: Wykorzystane w wielu publikacjach do pobierania próbek populanych stron
  • Organizacja: Alexa Internet (Amazon)
  • Rok: Ciągłe aktualizacje

Charakterystyka

  • Rozmiar: Ranking top 100,000 stron internetowych
  • Podział: Hierarchiczny ranking popularności
  • Klasy/Kategorie: Ranking według ruchu internetowego
  • Format: Ranking listy (CSV, JSON)
  • Licencja: Public rankings

Opis

Alexa Top-100K to ranking 100,000 najczęściej odwiedzanych stron internetowych na świecie, oparty na pomiarach ruchu internetowego. Jest powszechnie wykorzystywany w badaniach internetowych jako reprezentatywna próbka populanych serwisów do analizy trendów bezpieczeństwa, prywatności i zachowań użytkowników.

Zastosowania

  • Selekcja próbek do badań empirycznych nad bezpieczeństwem sieci
  • Analiza rozpowszechnienia technik śledzenia i fingerprinting’u
  • Badania nad implementacją standardów internetowych
  • Pomiary evolucji API przeglądarek na rzeczywistych stronach

Używany w publikacjach

  • [bahrami-fp-radar-fingerprinting-2021] - Użyty do pobierania skryptów z top-100K stron za okres 2010-2019 poprzez Wayback Machine dla analizy longitudinalnej wykorzystania API do fingerprinting’u

Benchmarki

MetrykaWartośćŹródło
Liczba stron100,000Alexa
Obserwacyjny okres2010-2019FP-Radar
Skrypty zebrane~100KFP-Radar
Skrypty fingerprinting1,658FP-Radar (z 93,851 niefingerprinting)

Uwagi

  • Ranking zmienia się dynamicznie z czasem
  • Historyczne kopie dostępne poprzez Internet Archive Wayback Machine
  • Alexa Internet (Amazon) zaprzestała aktualizacji rankingów w 2022 roku
  • Alternatywy: Tranco, HTTP Archive
  • W badaniach długookresowych należy uwzględnić zmienność rankingu

Tagi

dataset web-measurement rankings traffic websites