Pomysły badawcze

Ostatnia aktualizacja: 2026-05-12

🔥 Wysokie priorytety

[#FG-1] Graph-Based Fraud Detection Benchmark: Własna Implementacja GNN vs Published Results

Status: new Priorytet: high Dodano: 2026-04-28 Bazuje na: GAAP

Motywacja z GAAP (2025):

GAAP osiąga najlepsze wyniki na 7 zbiorach oszustw (YelpChi, Amazon, T-Finance, itp.)
Ale: architektura GAAP złożona (DyBEM, agregacja globalna, wzorce atrybutów)
Pytanie: Czy prostsze architektury GNN (GraphSAGE, GAT, GCN) mogą osiągnąć konkurencyjne wyniki?

Własne badanie:

Zbiory danych (wszystkie publiczne):
- YelpChi (publiczny benchmark)
- Amazon Reviews (publiczny)
- Można zapytać: T-Finance, T-Social, Elliptic (jeśli publiczne)
- Wszystkie mają opublikowane podziały (trening/walidacja/test)
Własne modele (prostsze niż GAAP, otwarte źródła):
- GraphSAGE (PyTorch Geometric)
- GAT (Graph Attention Networks)
- GCN (Graph Convolutional Networks)
- Prosty MLP bazowy (bez struktury grafowej)
Porównanie z GAAP:
- Odtwórz raportowane wyniki GAAP (waliduj benchmarki)
- Czy prosty GNN osiąga 90-95% wydajności GAAP? (kompromis prostota-dokładność)
- Ablacja: czy agregacja globalna (innowacja GAAP) naprawdę konieczna?

Wkład badawczy:

Analiza kompromisu prostota-dokładność (prosty GNN vs złożony GAAP)
Uczciwy benchmark (te same zbiory, te same podziały)
Praktyczne rekomendacje (kiedy prosty GNN wystarczy vs kiedy potrzeba złożonego GAAP)
Otwarte źródła: kod + tutorial (PyTorch Geometric)

Zbiory danych: YelpChi, Amazon (publiczne), T-Finance (zapytać jeśli dostępny)

Szacowany czas: 2-3 miesiące

[#FG-2] EDoG dla Feature Attacks: Rozszerzenie Detection Pipeline na Node Feature Perturbations

Status: new Priorytet: high Dodano: 2026-04-29 Bazuje na: EDoG Xu et al.

Gap w EDoG (2022):

EDoG wykrywa tylko structure attacks (dodawanie/usuwanie krawędzi) - nie feature attacks
Autorzy explicite zakładają: “node features są nie zmienione” (Section III-A)
Pytanie: Czy można rozszerzyć EDoG aby wykrywać combined attacks?

Proponowane badanie:

Rozszerzyć EDoG pipeline o component wykrywający feature attacks i zbadać performance przeciwko combined attacks (structure + feature simultaneously).

Implementacja:
- EDoG-Original: reprodukcja (AUC >0.8)
- Feature Anomaly Detector (FAD): Isolation Forest + Autoencoder na node features
- EDoG-Combined: LP + GGD + OD + FAD, multi-task scoring s_final = α·s_structure + β·s_feature
Zbiory danych: Cora, Citeseer, syntetyczne (ER, BA)
- Generate combined attacks: RL-S2V + gradient-based feature perturbation
Hipoteza: EDoG-Combined osiągnie >0.85 AUC na combined attacks (vs <0.7 dla EDoG-original)

Wkład badawczy:

Pierwsza extension EDoG na feature attacks
Benchmark combined attacks (nowy threat model)
Multi-modal detection framework (graph structure + node features)

Zbiory danych: Cora, Citeseer (publiczne), syntetyczne ER/BA graphs

[#FG-3] Adaptive Attack Strategies przeciwko EDoG: Systematyczny Red Team Analysis

Status: new Priorytet: high Dodano: 2026-04-29 Bazuje na: EDoG Xu et al.

Gap w EDoG (2022):

Autorzy testują jedną adaptive attack strategy
Brak systematycznego eksplorowania różnych adaptive strategies
Pytanie: Jakie są najsilniejsze adaptive attacks przeciwko EDoG?

Proponowane badanie: 6 adaptive attack strategies (A1-A6):

A1: Low-Score Targeting (baseline z artykułu)
A2: Gradual Injection (nowy)
A3: Subgraph Targeting (nowy)
A4: OutlierDetect Evasion (nowy)
A5: Ensemble Confusion (nowy)
A6: Temporal Adaptive (nowy)

Wkład badawczy:

Pierwszy systematyczny red team EDoG
6 novel adaptive attack strategies
Vulnerability analysis + countermeasures

Zbiory danych: Cora, Citeseer (publiczne)

[#FG-4] Soft Links dla E-Commerce Fraud: Podobieństwo Behawioralne zamiast Hard Links

Status: new Priorytet: high Dodano: 2026-04-28 Bazuje na: CMT Xu et al.

Gap w CMT (2024):

Proprietary dataset WeChat (6.8M węzłów) - nie da się odtworzyć
Pytanie: Czy soft links działają dla oszustw e-commerce (HTML/JS similarity)?

Własne badanie:

Zebrać 5000+ stron e-commerce (2024-2026)
Cechy: HTML structure, datalayer patterns, JavaScript behaviors
Graf: hard links (IP/ASN) + soft links (cosine similarity HTML/JS > 0.7)
Porównanie: hard vs soft vs hybrid links

Wkład badawczy:

Pierwszy transfer soft links z crowdsourcing fraud do e-commerce fraud
Publiczny zbiór danych (5000+ stron, HTML similarity graph)

Zbiory danych: Własny (5000+ stron e-commerce)

📌 Średnie priorytety

[#FG-5] Dynamic Feature Binning: Comparison Across Tabular Datasets

Status: new Priorytet: medium Dodano: 2026-04-28 Bazuje na: GAAP

Motywacja: DyBEM testowane tylko na zbiorach oszustw. Czy uogólnia się na klasyfikację tabelaryczną?

Własne badanie: DyBEM vs standardowe binowanie na 5-10 zbiorach UCI.

Wkład: Transferowalność DyBEM, implementacja open-source

Szacowany czas: 2 miesiące

[#FG-6] EDoG dla Dynamic Graphs: Temporal Extension Detection Pipeline

Status: new Priorytet: medium Dodano: 2026-04-29 Bazuje na: EDoG Xu et al.

Gap: EDoG działa na static graphs; realne grafy są dynamic (temporal).

Proponowane badanie: T-EDoG z temporal components (T-LinkPred, T-GraphGenDetect, T-OutlierDetect). Datasety: Elliptic Bitcoin (49 timesteps), DBLP, Reddit.

Wkład: Pierwsza temporal extension EDoG, temporal adversarial attack benchmark

[#FG-7] Contrastive Learning dla Fraud Detection z Ograniczonymi Etykietami

Status: new Priorytet: medium Dodano: 2026-04-28 Bazuje na: CMT Xu et al.

Gap: Brak porównania strategii contrastive learning (augmentacji) dla fraud detection.

Własne badanie: 6 strategii (reorder, substitute, edge mask, node mask, subgraph crop, no CL) na FinGraph, Elliptic, YelpChi z 0.1%-2% etykiet.

Wkład: Pierwszy systematyczny benchmark CL dla fraud detection

[#FG-8] Temporal Dynamics dla Cross-Domain Transfer: FinGraph → Elliptic → PhishTank

Status: new Priorytet: medium Dodano: 2026-04-28 Bazuje na: CMT Xu et al.

Hipoteza: Temporal patterns (ADD→PULL→TRANSFER→DISAPPEAR) mają analogie w phishingu (CREATE→DISTRIBUTE→HARVEST→VANISH).

Wkład: Pierwszy cross-domain transfer temporal dynamics, PhishTank temporal dataset

📊 Statystyki projektu

Łącznie: 8 pomysłów
High: 4 (#FG-1, FG-2, FG-3, FG-4)
Medium: 4 (#FG-5, FG-6, FG-7, FG-8)
Low: 0

Research

Przeglądaj

Pomysły badawcze

Pomysły badawcze

🔥 Wysokie priorytety

[#FG-1] Graph-Based Fraud Detection Benchmark: Własna Implementacja GNN vs Published Results

[#FG-2] EDoG dla Feature Attacks: Rozszerzenie Detection Pipeline na Node Feature Perturbations

[#FG-3] Adaptive Attack Strategies przeciwko EDoG: Systematyczny Red Team Analysis

[#FG-4] Soft Links dla E-Commerce Fraud: Podobieństwo Behawioralne zamiast Hard Links

📌 Średnie priorytety

[#FG-5] Dynamic Feature Binning: Comparison Across Tabular Datasets

[#FG-6] EDoG dla Dynamic Graphs: Temporal Extension Detection Pipeline

[#FG-7] Contrastive Learning dla Fraud Detection z Ograniczonymi Etykietami

[#FG-8] Temporal Dynamics dla Cross-Domain Transfer: FinGraph → Elliptic → PhishTank

📊 Statystyki projektu

Graf

Spis treści

Odnośniki zwrotne