Algoritme-aversjon F

Magma
03.12.2019

HALLGEIR SJÅSTAD er psykolog og forsker i FAIR Insight Team ved SNF (Senter for samfunns- og næringslivsforskning ved NHH). Sjåstad jobber i skjæringspunktet mellom psykologi og atferdsøkonomi innen tema som langsiktighet og beslutningstaking, selvkontroll og motivasjon, moral og samarbeid.

SAMMENDRAG
Nyere utvikling innen kunstig intelligens og maskinlæring tilbyr enorme muligheter, men også betydelige utfordringer. Om bare halvparten av forhåpningene slår til, vil selvlærende algoritmer snart kunne tilby datadrevet beslutningsstøtte på et nivå som verden aldri før har sett. Samtidig er det noe som holder oss tilbake. Psykologisk forskning viser at motstanden mot algoritmer er langt fra ny: Helt siden 1950-tallet har vi latt være å ta i bruk svært enkle modeller for statistisk prediksjon, til tross for en treffsikkerhet som er påviselig bedre enn menneskelige eksperter på en rekke områder. Derfor stoler vi fortsatt på fastlegens magefølelse i helsevesenet og på intervjuerens magefølelse i ansettelsesprosesser, selv i tilfeller hvor en enkel modell kan gjøre en bedre jobb. I denne artikkelen gir jeg en kortfattet oversikt over hvordan folk flest
INNLEDNING
I dette spesialnummeret av Magma ser vi et stort mangfold av ulike perspektiver på hvordan kunstig intelligens og maskinlæring kan brukes innen finansiell økonomi og strategiske beslutninger - såkalt fintech. I denne artikkelen tar jeg en annen tilnærming og vil se nærmere på den menneskelige komponenten. Spesifikt vil jeg påpeke hvilke psykologiske barrierer som kan hindre systematisk utprøving av ny teknologi, selv når
forholder seg til automatiserte beslutningsprosesser, og fire psykologiske faktorer som kan forklare fenomenet algoritme-aversjon: tendensen til å foretrekke en menneskelig vurdering selv når vi vet at en datadrevet algoritme har høyere treffsikkerhet. Disse faktorene omfatter 1) overdreven tillit til menneskelige eksperter, 2) ulik vekting av maskinelle feil over menneskelige feil, 3) sosiale behov, og 4) frykten for tapt individualitet. For å utvikle gode beslutningssystemer som er til mer hjelp enn skade, trengs det nøye tilpasning til disse psykologiske faktorene gjennom systematisk utprøving i kontrollerte eksperimenter. I denne utviklingen er det avgjørende at vi tar hensyn til at brukeren i den andre enden fortsatt er et menneske av kjøtt og blod - med fornuft og følelser, åpenhet og fordommer, og svært stor variasjon i teknologisk kompetanse.

denne teknologien har bedre treffsikkerhet enn menneskelige eksperter.
Innen alt fra helsevesen og utdanning til bank og forsikring vil vi stadig oftere møte på digitaliserte hjelpere i form av chatteroboter og avatarer. Men vil egentlig folk flest ha denne teknologien? Og dersom svaret er nei', er det bare enda bedre teknologi og enda bedre treffsikkerhet som skal til før folk vil ønske å ta dem i bruk? Som leseren raskt vil se, er dette egentlig en gammel problemstilling, men som nå har fått fornyet relevans. Siden det i psykologifaget har blitt forsket mest på hvordan folk forholder seg til statistiske modeller og ekspertvurderinger i en helsekontekst, kommer jeg til å bruke flest eksempler fra dette området. Likevel vil det komme klart frem at denne forskningen har bred relevans også for andre områder hvor ny beslutningsteknologi banker på døren, både i organisasjoner og i enkeltindividets hverdag.

KUNSTIG INTELLIGENS: DEN NYE BESLUTNINGSTEKNOLOGIEN
Hvordan bør man sette en medisinsk diagnose med størst mulig presisjon? Og gitt pasientens diagnose og øvrige sykdomshistorikk, hvordan bør man vurdere sannsynligheten for ulike behandlingsutfall slik at man velger den behandlingen som har best sjanser til å lykkes? Mange av oss har stor tiltro til at en erfaren lege vil være riktig person til jobben, men hva hvis intelligente maskiner treffer bedre og gjør færre feil?
Denne problemstillingen er langt fra science fiction. Bare i løpet av de siste fem årene har det kommet en serie forskningsartikler som viser at såkalt medisinsk kunstig intelligens (AI: artificial intelligence) presterer like bra og bedre enn menneskelige eksperter (for oversikt, se Longoni, Bonezzi, & Morewedge, 2019). Både når det gjelder identifisering av hjertesykdom (Hutson, 2017), hudkreft (Haenssle mfl., 2018) og øyesykdommer (Gulshan, Peng, & Coram, 2016), har det vist seg at en lett tilgjengelig AI-algoritme har like høy treffsikkerhet som menneskelige ekspertvurderinger. En studie som sammenlignet IBM Watson-maskinen med medisinske eksperter på tvers av 1000 kreftdiagnoser, fant at Watson-maskinen avdekket behandlingsalternativer som legene gikk glipp av i hele 30 prosent av tilfellene (Lohr, 2016). I vurderinger av prioritert behandling (hvordan rangere akuttmedisinske tilfeller av ulik alvorlighetsgrad) utførte en AI-algoritme korrekt vurdering i 90,2 prosent av tilfellene, selv om legene kun gjorde en korrekt vurdering i 77,5 prosent av tilfellene (Donnelly, 2017).
Foreløpig er dette bare enkeltstudier, så det trengs fortsatt mer forskning for å kunne si noe med større sikkerhet. Samtidig er det allerede godt dokumentert at selv dyktige leger og andre eksperter har kognitive begrensninger som leder til systematiske feil (Kahneman, 2011; Hastie & Dawes, 2010). Det er derfor mye som tyder på at AI-algoritmer som beslutningsstøtte kan bidra til bedre vurderinger og lavere feilmarginer allerede med dagens teknologi, som i beste fall kan gi bedre behandling til en lavere kostnad.
Denne problemstillingen er på ingen måte begrenset til medisinfaget. I årene som kommer, vil dette også bli en diskusjon blant psykologer som gjør livsviktige vurderinger innen psykisk helsevern, ledere som tar beslutninger om hvem som skal ansettes i hvilken stilling, og privatpersoner som lurer på hva de bør gjøre med sparepengene sine. Det er viktig å diskutere dette nå fordi det er langt fra sikkert at mer og bedre teknologi
alltid vil lede til bedre tjenester og bedre resultater for folk flest. Vil vi egentlig dette? Til syvende og sist må det være en reell etterspørsel fra både konsumenter, bedrifter og politiske beslutningstakere før nye systemer blir satt i verk.
Derfor trenger vi forskningsbasert kunnskap om når, hvordan og hvor mye vi bør prøve ut av den nye beslutningsteknologien. Per i dag er vi langt unna den systematiske utprøvingen som trengs for å kunne avgjøre i hvilken grad AI-teknologi bør skaleres opp og anvendes på nye områder, og i neste steg, hvorvidt folk flest faktisk ønsker seg disse tjenestene. Problemstillingen handler dermed like mye om psykologi som den handler om teknologi.

STATISTISKE ALGORITMER: EN GAMMEL BESLUTNINGSTEKNOLOGI
AI-algoritmer og ny teknologiutvikling til tross; selve motstanden mot automatiserte analyser er langt fra ny. Helt siden 1950-tallet, lenge før fremveksten av avanserte former for kunstig intelligens, har vi visst fra psykologisk forskning at selv enkle statistiske algoritmer er mer treffsikre enn menneskelige eksperter på en rekke områder. De første studiene sammenlignet statistisk prediksjon med såkalt klinisk prediksjon (Meehl, 1954; Sawyer, 1966; Einhorn, 1972; Dawes, 1979; Dawes, Faust, & Meehl, 1989). Her ba man menneskelige eksperter som leger og psykologer om å predikere fremtidige behandlingsutfall på basis av all tilgjengelig informasjon. Hvor lenge vil denne pasienten ha igjen å leve? Hvor god effekt vil behandling A ha i sammenligning med behandling B eller ingen behandling? Så sammenlignet man den faktiske treffsikkerheten av de menneskelige ekspertvurderingene med prediksjonene fra en enkel regresjonsmodell basert på samme informasjonsgrunnlag (f.eks. den s

Gå til mediet

Fagpressenytt

menu

search