Anthropic advarer om risici ved selvforbedrende AI

Anthropic advarer om risici ved selvforbedrende AI
Anthropic advarede om truslen fra AI

Den amerikanske AI-virksomhed Anthropic har advaret om, at udviklingen af kunstig intelligens accelererer så hurtigt, at AI-agenter i den nærmeste fremtid selvstændigt vil kunne skabe, træne og forbedre nye systemer uden menneskelig indblanding. På denne baggrund har virksomheden opfordret til en opbremsning i udviklingen af neurale netværk.

Denne artikel er oversat fra originalen. Læs den oprindelige version af vores korrespondent her.

I et blogindlæg udtaler Marina Favaro, leder af Anthropic Institute, og Anthropic-medstifter Jack Clark, at AI-agenter allerede er i stand til at køre kode på egen hånd, uddelegere timers arbejde til andre agenter og gradvist nærme sig det punkt, hvor de kan overtage hele udviklingscyklussen.

“I det meste af AI's historie har mennesker kontrolleret alle faser af dens udvikling. Men hos Anthropic uddelegerer vi en stigende del af AI-udviklingen til AI-systemerne selv, hvilket accelererer vores arbejde,” sagde de.

Ifølge Favaro og Clark kan der, hvis denne tendens fortsætter, og systemerne modtager nok computerkraft, i sidste ende opstå AI, der er i stand til fuldt autonomt at designe og udvikle sin egen efterfølger.

Fokus på sikkerhed

Væksten i sådanne evner vækker bekymring for et scenarie, hvor AI kan blive klogere på egen hånd. I december udtalte OpenAI, at de undersøgte sikre måder at udvikle og implementere stadig mere avancerede AI-systemer på, herunder modeller, der er i stand til rekursiv selvforbedring.

OpenAI sagde, at de ønsker, at sådanne systemer konsekvent følger menneskelig hensigt i komplekse scenarier fra den virkelige verden og under modstridende forhold, undgår katastrofal adfærd, forbliver kontrollerbare og reviderbare og forbliver på linje med menneskelige værdier.

De tilføjede, at når kvaliteten af menneskeskrevet og AI-skrevet kode når samme niveau, vil folk måske helt holde op med at skrive kode og kun gå over til at gennemse den. Men hvis de ikke kan gennemse kode lige så hurtigt, som Claude genererer den, vil menneskelig gennemgang blive den største flaskehals i AI-udviklingen.

Hvorfor AI-udviklingen bør bremses

Favaro og Clark sagde også, at det ideelle scenarie ville være at bremse udviklingen, så samfundet får mere tid til at forstå de “enorme” konsekvenser af denne teknologi.

I april nægtede Anthropic at frigive sin AI-model Claude Mythos til offentligheden på grund af bekymringer relateret til globale cybersikkerhedstrusler. Modellen kunne nemt skabe software-exploits, så virksomheden besluttede ikke at gøre den offentlig for nu.

Samme dag offentliggjorde en gruppe teknologiledere, herunder repræsentanter fra Anthropic og OpenAI, et åbent brev, der opfordrede lovgivere til at indføre strengere grænser for AI. Forfatterne advarede om, at teknologien kunne hjælpe ondsindede aktører med at overvinde de “videnbarrierer”, der tidligere havde forhindret dem i at skabe biologiske våben.

Samtidig understregede de, at blot det at sætte farten ned kunne skabe nye risici, hvis det tillod mindre forsigtige aktører at indhente branchelederne teknologisk. Uden en global koordineringsmekanisme vil virksomheder og regeringer blive tvunget til at træffe svære sikkerhedsbeslutninger under konkurrencemæssigt og geopolitisk pres.

Hvad gør Claude værdifuld

Anthropics flagskibsprodukt er AI-assistenten Claude. Det er en familie af sprogmodeller designet til at arbejde med tekst, kode, data og komplekse opgaver, hvor ikke kun svarhastighed betyder noget, men også sikkerhed, kontrollerbarhed og pålidelighed. Claude bruges som en universel assistent: den kan skrive og redigere tekster, analysere dokumenter, forklare komplekse emner, hjælpe med programmering, finde fejl i kode og udarbejde resuméer, e-mails, rapporter og andet arbejdsmateriale.

For virksomheder er Claude værdifuld, fordi den kan overtage en del af det rutinemæssige intellektuelle arbejde. Den bruges i kundesupport, analyse, softwareudvikling, juridiske og finansielle processer, marketing og interne virksomhedsværktøjer. Virksomheder bruger Claude som en chat-assistent, et API til integration i deres produkter og et værktøj til automatisering af opgaver, der kræver hurtig behandling af store mængder information og klare svar på naturligt sprog.

Som en påmindelse hjalp Claude med at genoprette adgangskoden til en wallet indeholdende 5 Bitcoin.

Dette materiale kan indeholde tredjepartsmeninger, ingen af dataene og oplysningerne på denne webside udgør investeringsrådgivning i henhold til vores Ansvarsfraskrivelse. Selvom vi overholder strenge Redaktionelle Retningslinjer, kan dette indlæg indeholde referencer til produkter fra vores partnere.