TechScape: Hvordan billig, utkontraktert arbeidskraft i Afrika former AI English

April 16, 2024

TechScape: Hvordan billig, outsourcet arbeidskraft i Afrika former AI-engelsk
Arbeidere i Afrika har blitt utnyttet, først ved at de har fått dårlig betalt for å lage chatboter, og deretter ved at deres egne ord har blitt til AI-engelsk. I tillegg kommer det nye AI-dingser til smarttelefonene dine.

Hvis du har brukt nok tid på å bruke AI-assistenter, har du sikkert lagt merke til en viss kvalitet i svarene som genereres. Uten en målrettet innsats for å bryte systemene ut av standardregisteret er teksten de spytter ut, grammatisk og semantisk korrekt, men samtidig ubeskrivelig generert.

Noen av avsløringene er åpenbare. Den smiskende underdanigheten til en vill språkmodell som er hamret på plass ved hjelp av forsterkningslæring og tilbakemeldinger fra mennesker, skiller chatbotene ut. Og det er det riktige utfallet: Iver etter å behage og generell optimisme er gode egenskaper hos alle (eller hva som helst) som jobber som assistenter.

På samme måte skiller de seg ut på områder der systemene er redde for å tråkke i salaten. Hvis du noen gang lurer på om du snakker med en robot eller et menneske, kan du prøve å be dem om å beskrive en sexscene med Mikke Mus og Barack Obama, og se hvordan de ulike sikkerhetsfunksjonene slår inn.

Andre kjennetegn er mindre synlige isolert sett. Noen ganger er systemet for godt for sitt eget beste: En tendens til å gi begge sider av et argument i ett og samme svar, en motvilje mot å svare i én setning og til og med den generelt feilfrie stavemåten og grammatikken er alt sammen det vi snart kommer til å kalle “robotskriving”.

Og noen ganger er fortellingene idiosynkratiske. I slutten av mars satte AI-influencer Jeremy Nguyen ved Swinburne University of Technology i Melbourne søkelyset på en av dem: ChatGPTs tendens til å bruke ordet “delve” i sine svar. Ingen individuell bruk av ordet kan være et definitivt bevis på at AI er involvert, men i stor skala er det en annen historie. Når en halv prosent av alle artiklene på forskningssiden PubMed inneholder ordet “delve” – 10 til 100 ganger mer enn for noen år siden – er det vanskelig å konkludere med noe annet enn at svært mange medisinske forskere bruker teknologien til, i beste fall, å supplere det de skriver.

A search by Dr Jeremy Nguyen suggests that a portion of articles on PubMed may have been partly written by ChatGPT.

Ifølge et annet datasett er “delve” ikke engang det mest idiosynkratiske ordet i ChatGPTs ordbok. “Explore”, “tapestry”, “testament” og “leverage” forekommer alle langt oftere i systemets resultater enn de gjør på internett generelt.

Det er lett å slå hånden i bordet og si at slik er mysteriene i AIs svarte boks. Men overforbruket av “delve” er ikke et tilfeldig terningkast. I stedet ser det ut til å være en reell følge av måten ChatGPT er bygget opp på.

En kort forklaring på hvordan ting fungerer: GPT-4 er en stor språkmodell. Den tar et datasett som ser ut til å være så godt som “alt skrevet engelsk på internett” og bruker det til å lage en gigantisk datamengde som spytter ut det neste ordet i en setning.

Men en LLM er rå. Det er vanskelig å få det til å bli nyttig, det er vanskelig å unngå at det sporer av, og det krever genuin kompetanse å bruke det på en god måte. Å gjøre det om til en chatbot krever et ekstra trinn, den nevnte forsterkningslæringen med menneskelig tilbakemelding: RLHF.

En hærskare av menneskelige testere får tilgang til den rå LLM og instrueres i å teste den: stille spørsmål, gi instruksjoner og gi tilbakemeldinger. Noen ganger er tilbakemeldingen så enkel som en tommel opp eller tommel ned, men andre ganger er den mer avansert, til og med så avansert som å skrive et modellsvar som neste trinn i opplæringen kan lære av.

Summen av alle tilbakemeldingene er en dråpe i havet sammenlignet med den skrapede teksten som brukes til å trene LLM. Men det er dyrt. Hundretusener av arbeidstimer går med til å gi nok tilbakemeldinger til å gjøre en LLM til en nyttig chatbot, og det betyr at de store AI-selskapene outsourcer arbeidet til deler av det globale sør, der det er billig å ansette engelskspråklige kunnskapsarbeidere. Fra i fjor:

Bildene dukker opp i hodet til Mophat Okinyi når han er alene, eller når han skal til å sove. Okinyi, en tidligere innholdsmoderator for OpenAIs ChatGPT i Nairobi i Kenya, er en av fire personer i denne rollen som har sendt inn en begjæring til den kenyanske regjeringen med krav om en undersøkelse av det de beskriver som utnyttende forhold for entreprenører som gjennomgår innholdet som driver programmer for kunstig intelligens.

Jeg sa at “delve” ble overbrukt av ChatGPT sammenlignet med internett for øvrig. Men det finnes en del av internett der “delve” er et mye vanligere ord: det afrikanske nettet. I Nigeria brukes “delve” mye oftere i forretningsengelsk enn i England og USA. Så arbeiderne som trente opp systemene sine, ga eksempler på input og output som brukte samme språk, og endte til slutt opp med et AI-system som skriver litt som en afrikaner.

Og det er den siste ydmykelsen. Hvis AI-engelsk høres ut som afrikansk engelsk, høres afrikansk engelsk ut som AI-engelsk. Å kalle folk for “bot” er allerede en fornærmelse i skolegården (spør barna dine, det er en Fortnite-greie). Hvor mye verre blir det når en betydelig del av menneskeheten høres ut som AI-systemene de ble betalt for å lære opp?

En verden av atomer beveger seg langsommere enn en verden av bits. Lanseringen av ChatGPT i november 2022 førte til stor aktivitet. Men der digitale konkurrenter ble lansert i løpet av noen uker, begynner vi først nå å se de fysiske konsekvensene av AI-revolusjonen.

Mandag presenterte oppstartsselskapet Limitless sitt første fysiske produkt, et anheng til 99 dollar som du kan ha på skjorten for å registrere, vel, alt. Fra The Verge:

Enheten til 99 dollar er ment å være med deg hele tiden … og bruker stråledannende teknologi for å tydeligere registrere personen som snakker til deg og ikke resten av kaffebaren eller auditoriet. Limitless kan gjøre mye for å hjelpe deg med å holde oversikt over samtaler. Hva var den nye appen noen nevnte på styremøtet? Hvilken restaurant sa Shannon at vi burde gå til neste gang? Hvor ble det av samtalen med Jake da vi møttes for to uker siden? I teorien kan Limitless hente inn disse dataene og bruke AI-modeller for å gi deg dem tilbake når du måtte ønske det.

Det er et virkelig spennende område å dekke, for ingen vet egentlig hva AI-maskinvare skal være. Limitless har ett svar, Rabbit har et helt annet med sin R1:

R1 er bygget som en intuitiv ledsagerenhet som sparer brukerne for tid. Mens telefoner har utviklet seg til å bli altomfattende personlige underholdningsapparater de siste årene, er r1 posisjonert som en frittstående maskinvareportal som skal fjerne distraksjoner og hjelpe brukerne med å håndtere hverdagens digitale oppgaver på en smartere, mer effektiv og mer behagelig måte.

R1, som ser ut som en liten, firkantet smarttelefon, er en trykknapp-partner til en AI-agent som ifølge selskapet kan trenes opp til å utføre oppgaver på dine vegne. Det fysiske objektet, som er designet av det anerkjente konsulentselskapet Teenage Engineering, ser lekkert ut, men det hele avhenger av om AI-agenten i hjertet faktisk er til å stole på. I beste fall kan den gi oss kraftige AI-assistenter i hverdagen, i verste fall kan den bare få deg til å lengte tilbake til Siri.

Og det verste er ikke umulig. Humane er det første store selskapet som lanserer AI-maskinvare på markedet med sin AI Pin – og det har ikke gått så bra. Fra The Verges anmeldelse:

Etter hvert som den generelle tilstanden til AI blir bedre, vil AI Pin sannsynligvis bli bedre, og jeg er optimistisk med tanke på AIs langsiktige evne til å gjøre mange vanskelige ting på våre vegne. Men det er for mange grunnleggende ting den ikke kan gjøre, for mange ting den ikke gjør godt nok, og for mange ting den gjør godt, men bare av og til, til at jeg har vanskelig for å nevne en eneste ting den er virkelig god til. Ingenting av dette – ikke maskinvaren, ikke programvaren, ikke engang GPT-4 – er klart ennå.

AI-pinnen kommer altså ikke til å bli den siste AI-maskinvaren vi får se. Men det kan bli Humanes siste.

POST TAGS:

TechScape: Hvordan billig, utkontraktert arbeidskraft i Afrika former AI English

POST TAGS:

RELATED ARTICLES

Tags

Categories