Denne tegningen viser triks som de kunstig intelligente spillerne brukte. (Bilde: DeepMind)
Denne tegningen viser triks som de kunstig intelligente spillerne brukte. (Bilde: DeepMind)

Kunstig intelligens ble god til å samarbeide i dataspill

Og som oftest vant de kunstige intelligente spillerne over menneskespillerne.

Publisert

Vi mennesker har lært dataprogrammer til å begynne å lære seg ting selv.

Det betyr at dataprogrammer kan bli flinkere og flinkere. Og når de først har lært seg å lære, kan de lære nye ting uten at mennesker hjelper dem.

Et firma som lager slike dataprogrammer, heter Deepmind.

De lagde for eksempel et sjakkprogram som heter Alphazero. Og Alphazero brukte bare fire timer på å bli så god i sjakk at det greide å slå det beste sjakkprogrammet i 2017 som heter Stockfish. Det kan du lese mer om på nettsiden Chess.com.

Alphazero trengte bare litt starthjelp fra mennesker.

Forskere i Deepmind-firmaet lærte Alphazero hva reglene i sjakk var. Og så satte programmet i gang selv.

Og så begynte programmet å spille seg gjennom millioner av sjakk-runder.

Det tok ikke lang tid før Alphazero ble ekstremt god.

Lærte seg å samarbeide

Når dataprogrammer lærer seg ting selv, kalles det maskinlæring.

Og dataprogrammene lærer ting selv om de ikke har noen ekte hjerne.

For mennesker har laget intelligensen deres. Og da kalles det kunstig intelligens.

Og nå har Deepmind-forskerne gjort noe nytt.

Forskerne klarte å lage kunstig intelligente spillere til et dataspill. Forskerne kalte spillerne for agenter. Og agentene klarte å samarbeide og spille mot hverandre i dataspillet.

Spilte Quake III

Quake III er egentlig et voldelig spill, og det har høy aldersgrense.

Spillet kom ut for nesten 20 år siden. Likevel er det mange som spiller det fremdeles.

Men i det nye eksperimentet brukte forskerne en versjon av spillet som ikke er vold i.

De kunstige agentene skulle ta på hverandre i stedet for å skyte hverandre. Og de skulle prøve om å ta flagg fra motstanderen.

Og det klarte de kunstig intelligente spillerne.

Her kan du se hvordan spillet så ut:

De ble faktisk veldig gode også.

De fleste gangene vant laget med dataprogram-spillere over et lag med ekte mennesker.

Men hvordan klarte de det?

Øvde seg og lærte fort

Først fikk dataprogrammene vite hva som var målet med spillet.

Og så skulle programmene spille mot hverandre i mange tusen omganger.

Mens de spilte, fikk de også vite om hvor mange poeng de hadde fått.

De kunstig intelligente spillerne lærte seg fort lure triks, mye fortere enn menneske-spillere.

Lærte å samarbeide med ukjente

Og de var raskere enn mennesker også. For mennesker bruker litt lengre tid på å tenke på hva de bør gjøre når de spiller.

Derfor prøvde forskerne å gjøre det litt vanskeligere for de kunstig intelligente spillerne. De gjorde spillerne litt tregere, slik at de tenkte og handlet omtrent i samme fart som ekte mennesker. Men de kunstige agentene var bedre enn mennesker likevel.

Eksperimentet til spill-forskerne viste også noe annet:

Når de kunstig intelligente spillerne kom på samme lag som menneske-spillere, klarte de det fint.

Og det betyr at de kunne lære seg å samarbeide med spillere de ikke kjenner også, mener forskerne.

Dette er en UNG-versjon av en artikkel fra forskning.no.