Alexa Top-100K Websites
Informacje podstawowe
- Nazwa: Alexa Top-100K Websites
- Alias: Alexa rankings, top websites
- Dziedzina: Web Measurement
- Typ: Website list, metadata
Źródło
- URL: https://www.alexa.com/ (web traffic rankings)
- Paper: Wykorzystane w wielu publikacjach do pobierania próbek populanych stron
- Organizacja: Alexa Internet (Amazon)
- Rok: Ciągłe aktualizacje
Charakterystyka
- Rozmiar: Ranking top 100,000 stron internetowych
- Podział: Hierarchiczny ranking popularności
- Klasy/Kategorie: Ranking według ruchu internetowego
- Format: Ranking listy (CSV, JSON)
- Licencja: Public rankings
Opis
Alexa Top-100K to ranking 100,000 najczęściej odwiedzanych stron internetowych na świecie, oparty na pomiarach ruchu internetowego. Jest powszechnie wykorzystywany w badaniach internetowych jako reprezentatywna próbka populanych serwisów do analizy trendów bezpieczeństwa, prywatności i zachowań użytkowników.
Zastosowania
- Selekcja próbek do badań empirycznych nad bezpieczeństwem sieci
- Analiza rozpowszechnienia technik śledzenia i fingerprinting’u
- Badania nad implementacją standardów internetowych
- Pomiary evolucji API przeglądarek na rzeczywistych stronach
Używany w publikacjach
- [bahrami-fp-radar-fingerprinting-2021] - Użyty do pobierania skryptów z top-100K stron za okres 2010-2019 poprzez Wayback Machine dla analizy longitudinalnej wykorzystania API do fingerprinting’u
Benchmarki
| Metryka | Wartość | Źródło |
|---|---|---|
| Liczba stron | 100,000 | Alexa |
| Obserwacyjny okres | 2010-2019 | FP-Radar |
| Skrypty zebrane | ~100K | FP-Radar |
| Skrypty fingerprinting | 1,658 | FP-Radar (z 93,851 niefingerprinting) |
Uwagi
- Ranking zmienia się dynamicznie z czasem
- Historyczne kopie dostępne poprzez Internet Archive Wayback Machine
- Alexa Internet (Amazon) zaprzestała aktualizacji rankingów w 2022 roku
- Alternatywy: Tranco, HTTP Archive
- W badaniach długookresowych należy uwzględnić zmienność rankingu