SAHF-PD: Semantic-Aware Hierarchical Fusion for Phishing Detection

Metadane

Streszczenie

Framework SAHF-PD integruje cechy z 4 modalności (email body, URL, screenshot, HTML) za pomocą LLM feature extraction i hierarchicznej fuzji semantycznej. Dataset PhishMMF: 11,672 próbek z pełnymi cechami multimodalnymi. Architektura blisko analogiczna do M1+M2+M3 w FinPhishGuard.

Kluczowe Wnioski

  • 4 modalności: URL + HTML + screenshot + treść emaila → hierarchiczna fuzja
  • LLM jako ekstraktor cech (nie klasyfikator end-to-end) → lepsze embeddingi niż BoW/TF-IDF
  • Dataset PhishMMF: 11,672 próbek z pełnym zestawem cech multimodalnych — publicznie dostępny?
  • Semantyczna fuzja > naiwna konkatenacja cech (ablation study potwierdza)
  • Wyniki (szczegółowe nie dostępne w abstrakcie) — weryfikować po pełnym PDF

Metodologia

  • Feature extraction: LLM (dla tekstu), CNN/ViT (dla screenshotów)
  • Fuzja: hierarchiczna (najpierw fuzja wewnątrz modalności, potem między modalnościami)
  • Semantic-aware: ważenie modalności zgodnie z ich informacyjnością dla danego przykładu
  • Dataset: PhishMMF (własny, 11,672 próbek)

Notatki

Rola w projekcie: Architektura SAHF-PD potwierdza kierunek FinPhishGuard: multimodalna fuzja (M1 URL + M2 Visual + M3 Content) z LLM feature extraction. Dataset PhishMMF może być przydatny jako dodatkowy zbiór treningowy. Hierarchiczna fuzja = potencjalne ulepszenie nad prostą konkatenacją w M6 ensemble.

Elementów w folderze: 0.