Home / Featured  / Oppstartslandskapet i Norge: Naviger gjennom den Blomstrende Tech-scenen i Norden

Oppstartslandskapet i Norge: Naviger gjennom den Blomstrende Tech-scenen i Norden

Oppstartsbedrifter og teknologigiganter prøver å gå fra chatboter som tilbyr hjelp via tekst, til AI-agenter som kan få ting gjort. Nylige demoer inkluderer en AI-koder kalt Devin og agenter som spiller videospill.

Denne uken vakte oppstartsbedriften Cognition AI oppsikt da de lanserte en demo som viste et kunstig intelligensprogram kalt Devin som utførte arbeid som vanligvis utføres av godt betalte programvareingeniører. Chatboter som ChatGPT og Gemini kan generere kode, men Devin gikk lenger og planla hvordan et problem skulle løses, skrev koden og testet og implementerte den.

 

Skaperne av Devin kaller den en “AI-programvareutvikler”. Da Devin ble bedt om å teste hvordan Metas open source-språkmodell Llama 2 fungerte når den ble åpnet via ulike selskaper som var vertskap for den, utarbeidet Devin en trinnvis plan for prosjektet, genererte koden som trengtes for å få tilgang til API-ene og kjøre benchmarking-tester, og opprettet et nettsted som oppsummerte resultatene.

 

Det er alltid vanskelig å bedømme iscenesatte demoer, men Cognition har vist at Devin håndterer et bredt spekter av imponerende oppgaver. Devin har imponert investorer og ingeniører på X, fått mange anbefalinger og til og med inspirert til noen memes – blant annet noen som spår at Devin snart vil være ansvarlig for en bølge av oppsigelser i teknologibransjen.

Devin er bare det nyeste og mest velutviklede eksemplet på en trend jeg har fulgt en stund – fremveksten av AI-agenter som i stedet for bare å gi svar eller råd om et problem som presenteres av et menneske, kan iverksette tiltak for å løse det. For noen måneder siden prøvekjørte jeg Auto-GPT, et program med åpen kildekode som forsøker å gjøre nyttige oppgaver ved å utføre handlinger på en persons datamaskin og på nettet. Nylig testet jeg et annet program kalt vimGPT for å se hvordan de visuelle ferdighetene til nye AI-modeller kan hjelpe disse agentene med å surfe mer effektivt på nettet.

 

Jeg ble imponert over eksperimentene med disse agentene. Men akkurat som språkmodellene som driver dem, gjør de foreløpig en del feil. Og når en programvare utfører handlinger, ikke bare genererer tekst, kan én feil bety total fiasko – og potensielt kostbare eller farlige konsekvenser. Det kan virke som en smart måte å redusere feilprosenten på ved å begrense oppgavene en agent kan utføre, for eksempel til et spesifikt sett med programvaretekniske oppgaver, men det er fortsatt mange potensielle måter å feile på.

 

Det er ikke bare oppstartsbedrifter som bygger AI-agenter. Tidligere denne uken skrev jeg om en agent kalt SIMA, utviklet av Google DeepMind, som spiller videospill, blant annet det helt vanvittige Goat Simulator 3. SIMA har lært av å observere menneskelige spillere hvordan man utfører mer enn 600 ganske kompliserte oppgaver, for eksempel å hugge ned et tre eller skyte en asteroide. Det mest bemerkelsesverdige er at den kan utføre mange av disse handlingene med suksess, selv i et ukjent spill. Google DeepMind kaller den en “generalist”.

 

Jeg mistenker at Google har forhåpninger om at disse agentene etter hvert vil jobbe utenfor videospill, kanskje med å bruke nettet på brukerens vegne eller betjene programvare for dem. Men dataspill er en god sandkasse for utvikling og testing av agenter, fordi de tilbyr komplekse miljøer der de kan testes og forbedres. “Vi jobber aktivt med å gjøre dem mer presise”, forteller Tim Harley, forsker ved Google DeepMind. “Vi har forskjellige ideer.”

 

Du kan forvente mange flere nyheter om AI-agenter i månedene som kommer. Demis Hassabis, administrerende direktør i Google DeepMind, fortalte meg nylig at han planlegger å kombinere store språkmodeller med arbeidet selskapet tidligere har gjort med å trene AI-programmer til å spille videospill for å utvikle mer kompetente og pålitelige agenter. “Dette er definitivt et stort område. Vi investerer mye i den retningen, og jeg kan tenke meg at andre også gjør det.” sier Hassabis. “Det kommer til å bli et stort steg i utviklingen av denne typen systemer – når de begynner å bli mer agentlignende.”