AddToAny

Algoritme-aversjon F

HALLGEIR SJÅSTAD er psykolog og forsker i FAIR Insight Team ved SNF (Senter for samfunns- og næringslivsforskning ved NHH). Sjåstad jobber i skjæringspunktet mellom psykologi og atferdsøkonomi innen tema som langsiktighet og beslutningstaking, selvkontroll og motivasjon, moral og samarbeid.
SAMMENDRAG
Nyere utvikling innen kunstig intelligens og maskinlæring tilbyr enorme muligheter, men også betydelige utfordringer. Om bare halvparten av forhåpningene slår til, vil selvlærende algoritmer snart kunne tilby datadrevet beslutningsstøtte på et nivå som verden aldri før har sett. Samtidig er det noe som holder oss tilbake. Psykologisk forskning viser at motstanden mot algoritmer er langt fra ny: Helt siden 1950-tallet har vi latt være å ta i bruk svært enkle modeller for statistisk prediksjon, til tross for en treffsikkerhet som er påviselig bedre enn menneskelige eksperter på en rekke områder. Derfor stoler vi fortsatt på fastlegens magefølelse i helsevesenet og på intervjuerens magefølelse i ansettelsesprosesser, selv i tilfeller hvor en enkel modell kan gjøre en bedre jobb. I denne artikkelen gir jeg en kortfattet oversikt over hvordan folk flest
INNLEDNING
I dette spesialnummeret av Magma ser vi et stort mangfold av ulike perspektiver på hvordan kunstig intelligens og maskinlæring kan brukes innen finansiell økonomi og strategiske beslutninger - såkalt fintech. I denne artikkelen tar jeg en annen tilnærming og vil se nærmere på den menneskelige komponenten. Spesifikt vil jeg påpeke hvilke psykologiske barrierer som kan hindre systematisk utprøving av ny teknologi, selv når
forholder seg til automatiserte beslutningsprosesser, og fire psykologiske faktorer som kan forklare fenomenet algoritme-aversjon: tendensen til å foretrekke en menneskelig vurdering selv når vi vet at en datadrevet algoritme har høyere treffsikkerhet. Disse faktorene omfatter 1) overdreven tillit til menneskelige eksperter, 2) ulik vekting av maskinelle feil over menneskelige feil, 3) sosiale behov, og 4) frykten for tapt individualitet. For å utvikle gode beslutningssystemer som er til mer hjelp enn skade, trengs det nøye tilpasning til disse psykologiske faktorene gjennom systematisk utprøving i kontrollerte eksperimenter. I denne utviklingen er det avgjørende at vi tar hensyn til at brukeren i den andre enden fortsatt er et menneske av kjøtt og blod - med fornuft og følelser, åpenhet og fordommer, og svært stor variasjon i teknologisk kompetanse.

denne teknologien har bedre treffsikkerhet enn menneskelige eksperter.
Innen alt fra helsevesen og utdanning til bank og forsikring vil vi stadig oftere møte på digitaliserte hjelpere i form av chatteroboter og avatarer. Men vil egentlig folk flest ha denne teknologien? Og dersom svaret er ‘nei', er det bare enda bedre teknologi og enda bedre treffsikkerhet som skal til før folk vil ønske å ta dem i bruk? Som leseren raskt vil se, er dette egentlig en gammel problemstilling, men som nå har fått fornyet relevans. Siden det i psykologifaget har blitt forsket mest på hvordan folk forholder seg til statistiske modeller og ekspertvurderinger i en helsekontekst, kommer jeg til å bruke flest eksempler fra dette området. Likevel vil det komme klart frem at denne forskningen har bred relevans også for andre områder hvor ny beslutningsteknologi banker på døren, både i organisasjoner og i enkeltindividets hverdag.

KUNSTIG INTELLIGENS: DEN NYE BESLUTNINGSTEKNOLOGIEN
Hvordan bør man sette en medisinsk diagnose med størst mulig presisjon? Og gitt pasientens diagnose og øvrige sykdomshistorikk, hvordan bør man vurdere sannsynligheten for ulike behandlingsutfall slik at man velger den behandlingen som har best sjanser til å lykkes? Mange av oss har stor tiltro til at en erfaren lege vil være riktig person til jobben, men hva hvis intelligente maskiner treffer bedre og gjør færre feil?
Denne problemstillingen er langt fra science fiction. Bare i løpet av de siste fem årene har det kommet en serie forskningsartikler som viser at såkalt medisinsk kunstig intelligens (AI: artificial intelligence) presterer like bra og bedre enn menneskelige eksperter (for oversikt, se Longoni, Bonezzi, & Morewedge, 2019). Både når det gjelder identifisering av hjertesykdom (Hutson, 2017), hudkreft (Haenssle mfl., 2018) og øyesykdommer (Gulshan, Peng, & Coram, 2016), har det vist seg at en lett tilgjengelig AI-algoritme har like høy treffsikkerhet som menneskelige ekspertvurderinger. En studie som sammenlignet IBM Watson-maskinen med medisinske eksperter på tvers av 1000 kreftdiagnoser, fant at Watson-maskinen avdekket behandlingsalternativer som legene gikk glipp av i hele 30 prosent av tilfellene (Lohr, 2016). I vurderinger av prioritert behandling (hvordan rangere akuttmedisinske tilfeller av ulik alvorlighetsgrad) utførte en AI-algoritme korrekt vurdering i 90,2 prosent av tilfellene, selv om legene kun gjorde en korrekt vurdering i 77,5 prosent av tilfellene (Donnelly, 2017).
Foreløpig er dette bare enkeltstudier, så det trengs fortsatt mer forskning for å kunne si noe med større sikkerhet. Samtidig er det allerede godt dokumentert at selv dyktige leger og andre eksperter har kognitive begrensninger som leder til systematiske feil (Kahneman, 2011; Hastie & Dawes, 2010). Det er derfor mye som tyder på at AI-algoritmer som beslutningsstøtte kan bidra til bedre vurderinger og lavere feilmarginer allerede med dagens teknologi, som i beste fall kan gi bedre behandling til en lavere kostnad.
Denne problemstillingen er på ingen måte begrenset til medisinfaget. I årene som kommer, vil dette også bli en diskusjon blant psykologer som gjør livsviktige vurderinger innen psykisk helsevern, ledere som tar beslutninger om hvem som skal ansettes i hvilken stilling, og privatpersoner som lurer på hva de bør gjøre med sparepengene sine. Det er viktig å diskutere dette nå fordi det er langt fra sikkert at mer og bedre teknologi
alltid vil lede til bedre tjenester og bedre resultater for folk flest. Vil vi egentlig dette? Til syvende og sist må det være en reell etterspørsel fra både konsumenter, bedrifter og politiske beslutningstakere før nye systemer blir satt i verk.
Derfor trenger vi forskningsbasert kunnskap om når, hvordan og hvor mye vi bør prøve ut av den nye beslutningsteknologien. Per i dag er vi langt unna den systematiske utprøvingen som trengs for å kunne avgjøre i hvilken grad AI-teknologi bør skaleres opp og anvendes på nye områder, og i neste steg, hvorvidt folk flest faktisk ønsker seg disse tjenestene. Problemstillingen handler dermed like mye om psykologi som den handler om teknologi.

STATISTISKE ALGORITMER: EN GAMMEL BESLUTNINGSTEKNOLOGI
AI-algoritmer og ny teknologiutvikling til tross; selve motstanden mot automatiserte analyser er langt fra ny. Helt siden 1950-tallet, lenge før fremveksten av avanserte former for kunstig intelligens, har vi visst fra psykologisk forskning at selv enkle statistiske algoritmer er mer treffsikre enn menneskelige eksperter på en rekke områder. De første studiene sammenlignet statistisk prediksjon med såkalt klinisk prediksjon (Meehl, 1954; Sawyer, 1966; Einhorn, 1972; Dawes, 1979; Dawes, Faust, & Meehl, 1989). Her ba man menneskelige eksperter som leger og psykologer om å predikere fremtidige behandlingsutfall på basis av all tilgjengelig informasjon. Hvor lenge vil denne pasienten ha igjen å leve? Hvor god effekt vil behandling A ha i sammenligning med behandling B eller ingen behandling? Så sammenlignet man den faktiske treffsikkerheten av de menneskelige ekspertvurderingene med prediksjonene fra en enkel regresjonsmodell basert på samme informasjonsgrunnlag (f.eks. den s
Gå til mediet

Flere saker fra Magma

Magma 28.02.2024
Det er det store spørsmålet etter rapporten fra Klimautvalget 2050. Utvalget anbefaler full stans i leting etter olje og gass i nye områder. Men det blir ikke dagens regjering som vedtar en solnedgangsmelding for norsk petroleumssektor.
Magma 28.02.2024
Vinylplatene har for lengst gjenvunnet hylleplass i stua hos musikkelskerne. Nå er også CD-platene på vei tilbake inn i varmen, takket være Christer Falck og hans folkefinansiering.
Magma 28.02.2024
Digitaliseringen i offentlig sektor fører ofte med seg store IT-systemer som utvikles og driftes av mange team, ofte ved å benytte smidige utviklingsmetoder. I slike storskala settinger er god koordinering avgjørende på grunn av avhengigheter mellom teamene som kan senke farten og kvaliteten på leveransene.
Magma 28.02.2024
I dag gjennomføres stadig mer av IT-utviklingen i offentlig sektor ved hjelp av smidige (agile) metoder.
Magma 28.02.2024

Nyhetsbrev

Lag ditt eget nyhetsbrev:

magazines-image

Mer om mediene i Fagpressen

advokatbladet agenda-316 allergi-i-praksis appell arbeidsmanden arkitektnytt arkitektur-n astmaallergi automatisering baker-og-konditor barnehageno batmagasinet bedre-skole bioingenioren bistandsaktuelt blikkenslageren bobilverden bok-og-bibliotek bondebladet buskap byggfakta dagligvarehandelen demens-alderspsykiatri den-norske-tannlegeforenings-tidende diabetes diabetesforum din-horsel energiteknikk fagbladet farmasiliv finansfokus fjell-og-vidde fontene fontene-forskning forskerforum forskningno forskningsetikk forste-steg fotterapeuten fri-tanke frifagbevegelse fysioterapeuten gravplassen handikapnytt helsefagarbeideren hk-nytt hold-pusten HRRnett hus-bolig i-skolen jakt-fiske journalisten juristkontakt khrono kilden-kjonnsforskningno kjokkenskriveren kjottbransjen kommunal-rapport Kontekst lo-aktuelt lo-finans lo-ingenior magasinet-for-fagorganiserte magma medier24 museumsnytt natur-miljo nbs-nytt nettverk nff-magasinet njf-magasinet nnn-arbeideren norsk-landbruk norsk-skogbruk ntl-magasinet optikeren parat parat-stat politiforum posthornet psykisk-helse religionerno ren-mat samferdsel seilmagasinet seniorpolitikkno sikkerhet skog skolelederen sykepleien synkron tannhelsesekreteren Tidsskrift for Norsk psykologforening traktor transit-magasin transportarbeideren uniforum universitetsavisa utdanning vare-veger vvs-aktuelt