T-Finance
Informacje podstawowe
- Nazwa: T-Finance
- Alias: T-Fin, Transaction Finance Dataset
- Dziedzina: Fraud Detection, Financial Transactions, Cybersecurity
- Typ: Graph data (transaction network)
Źródło
- URL: Dostępny przez GADBench
- Paper: Rethinking graph neural networks for anomaly detection (Tang et al., 2022)
- Organizacja: Michigan State University
- Rok: 2022
Charakterystyka
- Rozmiar: 39,357 nodes, 21,222,543 edges
- Podział: Określany przez użytkowników (typowo 5-fold cross-validation)
- Klasy/Kategorie: Binary (legitimate transactions vs fraudulent transactions)
- Format: Graph structure with node features
- Licencja: Available through GADBench
- Feature dimension: 10 features (user profile details such as registration days)
Opis
T-Finance to financial transaction fraud dataset reprezentujący transakcje jako graf, gdzie węzły to użytkownicy/konta a krawędzie to transaction records między nimi. Dataset zawiera user profile details takie jak registration days, transaction history i behavioral patterns.
Dataset jest częścią GADBench benchmark suite i jest szeroko używany do testowania graph-based fraud detection methods w kontekście transakcji finansowych.
Zastosowania
- Financial transaction fraud detection
- Money laundering detection
- Graph anomaly detection
- Temporal pattern analysis w transakcjach
- Benchmarking GNN fraud detection methods
Używany w publikacjach
- Global Attribute-Association Pattern Aggregation for Graph Fraud Detection - GAAP osiągnęło 85.71% Rec@K (2nd best, 0.28pp behind PMP’s 85.99%). Optimal number of bins dla tego datasetu to ~8 (lower attribute complexity niż YelpChi).
Benchmarki
| Model | Metric | Score | Rok | Publikacja |
|---|---|---|---|---|
| PMP | Rec@K | 85.99% | 2024 | Zhuo et al. |
| GAAP | Rec@K | 85.71% | 2025 | Duan et al. AAAI-25 |
| XGBGraph | Rec@K | 85.02% | 2024 | Tang et al. GADBench |
| DGA-GNN | Rec@K | 84.33% | 2024 | Duan et al. |
| AMNet | Rec@K | 84.05% | 2022 | Chai et al. |
| RFGraph | Rec@K | 84.05% | 2024 | Tang et al. |
| BWGNN | Rec@K | 84.19% | 2022 | Tang et al. |
Uwagi
- Optimal ~8 bins dla Dynamic Binning Embedding (vs 20-40 dla YelpChi)
- Lower attribute complexity (10 features) niż YelpChi (32 features)
- Relation concept: Transaction Record (user profile details such as registration days)
- Very dense graph: 21.2M edges dla 39k nodes (avg degree ~540)
- Part of GADBench benchmark suite
Tagi
dataset fraud-detection financial-transactions graph-data gadbench benchmark money-laundering