Pobierz PDF

ESR: Ethics and Society Review of Artificial Intelligence Research

Metadane

Autorzy: Michael S. Bernstein, Margaret Levi, David Magnus, Betsy Rajala, Debra Satz, Charla Waeiss
Rok: 2021
Zrodlo: arXiv:2106.11521 [cs.CY]; CHI 2022 (Stanford University)
DOI: arxiv:2106.11521
Status: #read
Kategoria: Security
Tagi: #ai-ethics #institutional-review #research-ethics #irb #societal-impact #dual-use #fairness #responsible-ai #project/phishing-simulation-ethics

Streszczenie

Paper opisuje Ethics and Society Review Board (ESR) - instytucjonalny proces przegladem etycznym badan AI na Stanfordzie, dzialajacy przez rok i obejmujacy 41 propozycji grantow. ESR rozni sie od IRB (Institutional Review Board): IRB skupia sie na ryzykach dla uczestnikow badan (human subjects), podczas gdy ESR adresuje ryzyka dla spoleczenstwa, grup w spoleczenstwie i swiata.

Kluczowy mechanizm: ESR jest wymogiem do otrzymania finansowania - granty nie sa wyplacane dopoki badacze nie ukoncza procesu ESR. Interdyscyplinarny panel (Antropologia, CS, Historia, Medycyna, Filozofia, Politologia, Socjologia) przegladaja propozycje i dostarcza iteracyjna informacje zwrotna.

Po roku: 100% duzych grantow i 29% seed grantow wymagalo iteracji. 58% badaczy stwierdzilo, ze ESR wplynelo na projekt badawczy. Najczesciej identyfikowane problemy: szkody dla grup mniejszosciowych, wlaczenie zroznicicowanych interesariuszy, dual-use, reprezentatywnosc danych.

Kluczowe Wnioski

IRB nie obejmuje ryzyk dla spoleczenstwa - AI research czesto wypada poza zakres IRB, gdy nie dotyczy bezposrednio uczestnikow ludzkich
ESR jako requirement do finansowania jest kluczowym mechanizmem instytucjonalnym - bez tego jest tylko opcjonalne
58% badaczy stwierdzilo zmiane projektu pod wplywem ESR; 100% chce kontynuowac
Najczesciej pomijane przez badaczy problemy: szkody dla podgrup (harms to subgroups) - to panelisci ESR najczesciej je identyfikowali
Badacze chca wiecej “scaffolding” - konkretnych pytan, przykladow, listy typowych problemow
Risk: ESR moze stac sie “ethics washing” jesli jest zbyt lagodne lub biurokratyczne
Najczesciej zidentyfikowane przez panele: representativeness (18x), IRB-scope issues (14x), diverse design (13x), dual-use (10x)

Metodologia

Deployment: 41 grantow na Stanfordzie przez 1 rok (6 duzych + 35 seed grants) Ewaluacja: Survey (N=23 projektow, 66% response rate) + semi-structured interviews (N=16 grantobiorcow, ~30-60 min) Analiza ESR statements: Induktywne kodowanie (grounded theory), 14 kategorii tematycznych, Cohen’s kappa = 0.96

Proces ESR:

Badacze skladaja ESR statement wraz z propozycja grantu
Program finansowania prowadzi merit review
Panel ESR przegladal propozycje rekomendowane do finansowania
Iteracyjna informacja zwrotna
Rekomendacja do programu finansowania → wyplacenie grantu

ESR statement: 2-czesciowy formularz: (1) opis etycznych wyzwan i ryzyk spolecznych, (2) zasady mitygacji i ich implementacja w projekcie

Glowne Koncepcje

ESR vs IRB: IRB = ryzyka dla uczestnikow badan; ESR = ryzyka dla spoleczenstwa, grup, swiata. ESR wypelnia luke, gdy badania AI nie obejmuja bezposrednio “human subjects” w sensie IRB
Ethics by Design: Etyczny przeglad na poczatku cyklu zycia projektu, przed ossyfikacja decyzji
Ethics Washing: Ryzyko, ze ESR staje sie biurokratycznym “oknem” a nie prawdziwym procesem refleksji etycznej
Dual Use: Ryzyka uzywania technologii do celow niechcianych (np. autoritarny nadzor)
Harms to Subgroups: Nierownomierne ryzyka dla grup marginalnych - najczesciej pomijane przez badaczy, najczesciej identyfikowane przez panel

Wyniki

Analiza 35 seed grants (14 kodow tematycznych, inter-rater kappa=0.96):

Badacze najczesciej zglaszali: representativeness (18), IRB purview (14), diverse design (13), dual-use (10), harms to society (10)
Panelisci najczesciej identyfikowali: harms to subgroups (11), diverse design (8), dual-use (8), representativeness (6)
Panelisci zglosili nowe ryzyka (nieobecne w statements) dla 26 z 35 projektow

Survey badaczy (N=23):

100% chce ponownie uczestniczyc w ESR
58% - ESR wplynelo na projekt (67% wsrod tych, ktorzy iterowali)
73% - ESR zmniejszylo ryzyko krytyki publicznej projektu

Przydatne Cytaty

“AI research often falls outside the purview of existing feedback mechanisms such as the Institutional Review Board (IRB), which are designed to evaluate harms to human subjects rather than harms to human society.” (Abstract)

“The ESR’s main insight is to serve as a requirement for funding: researchers cannot receive grant funding from a major AI funding program at our university until the researchers complete the ESR process.” (Abstract)

“The goal of the ESR process is to find a lever that can inject social and ethical reflection early, and to do so with the right amount of friction for researchers.” (str. 2)

“Unencumbered by regulatory requirements, the ESR can focus on adapting its approach as we learn how to improve.” (str. 4)

Datasety

Brak publicznych datasetow; dane z 41 grantow Stanforda (anonimizowane), wyniki survey i interview.

Powiazane Tematy

Institutional ethics review dla badan AI
Menlo Report i etyka badan sieciowych
GDPR i etyczne implikacje dla badan europejskich
Dual use w badaniach bezpieczenstwa
Fairness i reprezentatywnosc w AI
Research ethics vs compliance ethics

Notatki

Kluczowy paper dla PSE-3 (ethical framework dla kampanii symulacyjnych): model ESR moze stanowic wzorzec dla IRB-equivalent review w kontekscie phishing simulation studies. Szczegolnie uzyteczne sa: lista 14 kategorii ryzyk, rozroznienie ESR vs IRB, i mechanizm “requirement to funding” jako wzorzec instytucjonalny.

Research

Przeglądaj

ESR: Ethics and Society Review of Artificial Intelligence Research

ESR: Ethics and Society Review of Artificial Intelligence Research

Metadane

Streszczenie

Kluczowe Wnioski

Metodologia

Glowne Koncepcje

Wyniki

Przydatne Cytaty

Datasety

Powiazane Tematy

Notatki