T-Finance

Informacje podstawowe

  • Nazwa: T-Finance
  • Alias: T-Fin, Transaction Finance Dataset
  • Dziedzina: Fraud Detection, Financial Transactions, Cybersecurity
  • Typ: Graph data (transaction network)

Źródło

  • URL: Dostępny przez GADBench
  • Paper: Rethinking graph neural networks for anomaly detection (Tang et al., 2022)
  • Organizacja: Michigan State University
  • Rok: 2022

Charakterystyka

  • Rozmiar: 39,357 nodes, 21,222,543 edges
  • Podział: Określany przez użytkowników (typowo 5-fold cross-validation)
  • Klasy/Kategorie: Binary (legitimate transactions vs fraudulent transactions)
  • Format: Graph structure with node features
  • Licencja: Available through GADBench
  • Feature dimension: 10 features (user profile details such as registration days)

Opis

T-Finance to financial transaction fraud dataset reprezentujący transakcje jako graf, gdzie węzły to użytkownicy/konta a krawędzie to transaction records między nimi. Dataset zawiera user profile details takie jak registration days, transaction history i behavioral patterns.

Dataset jest częścią GADBench benchmark suite i jest szeroko używany do testowania graph-based fraud detection methods w kontekście transakcji finansowych.

Zastosowania

  • Financial transaction fraud detection
  • Money laundering detection
  • Graph anomaly detection
  • Temporal pattern analysis w transakcjach
  • Benchmarking GNN fraud detection methods

Używany w publikacjach

Benchmarki

ModelMetricScoreRokPublikacja
PMPRec@K85.99%2024Zhuo et al.
GAAPRec@K85.71%2025Duan et al. AAAI-25
XGBGraphRec@K85.02%2024Tang et al. GADBench
DGA-GNNRec@K84.33%2024Duan et al.
AMNetRec@K84.05%2022Chai et al.
RFGraphRec@K84.05%2024Tang et al.
BWGNNRec@K84.19%2022Tang et al.

Uwagi

  • Optimal ~8 bins dla Dynamic Binning Embedding (vs 20-40 dla YelpChi)
  • Lower attribute complexity (10 features) niż YelpChi (32 features)
  • Relation concept: Transaction Record (user profile details such as registration days)
  • Very dense graph: 21.2M edges dla 39k nodes (avg degree ~540)
  • Part of GADBench benchmark suite

Tagi

dataset fraud-detection financial-transactions graph-data gadbench benchmark money-laundering