GuardReasoner: Towards Reasoning-Based LLM Safeguards

Metadane

Notatki

Publikacja dodana automatycznie z bibliografii. Framework do fine-tuning LLMs dla security-focused reasoning tasks. Używany jako metodologia bazowa w Phishsense-1B.

Kontekst użycia w Phishsense-1B:

  • Base model training stage wykorzystuje GuardReasoner methodology
  • Adaptuje llama-3.2-1B dla improved reasoning capabilities
  • Kluczowy element two-tiered approach (reasoning + phishing-specific)

Dodaj PDF aby wygenerować pełne podsumowanie używając /summarize-paper liu-guardreasoner-2025

Elementów w folderze: 0.