Anthropic varnar för riskerna med självförbättrande AI

Anthropic varnar för riskerna med självförbättrande AI
Anthropic varnade för hotet från AI

Det USA-baserade AI-företaget Anthropic har varnat för att utvecklingen av artificiell intelligens accelererar så snabbt att AI-agenter inom en snar framtid självständigt kan skapa, träna och förbättra nya system utan mänsklig inblandning. Mot denna bakgrund har företaget efterlyst en inbromsning i utvecklingen av neurala nätverk.

Denna artikel har översatts från originalet. Läs originalversionen av vår korrespondent här.

I ett blogginlägg skriver Marina Favaro, chef för Anthropic Institute, och Anthropics medgrundare Jack Clark att AI-agenter redan kan köra kod på egen hand, delegera timmar av arbete till andra agenter och gradvis närma sig den punkt där de kan ta över hela utvecklingscykeln.

”Under större delen av AI:s historia har människor kontrollerat varje steg i dess utveckling. Men på Anthropic delegerar vi en allt större del av AI-utvecklingen till AI-systemen själva, vilket påskyndar vårt arbete”, sa de.

Enligt Favaro och Clark kan det, om denna trend fortsätter och systemen får tillräckligt med datorkraft, så småningom uppstå AI som är kapabel att helt autonomt designa och utveckla sin egen efterföljare.

Fokus på säkerhet

Tillväxten av sådana förmågor väcker oro för ett scenario där AI kan bli smartare på egen hand. I december meddelade OpenAI att de studerar säkra sätt att utveckla och distribuera alltmer avancerade AI-system, inklusive modeller som kan utföra rekursiv självförbättring.

OpenAI sa att de vill att sådana system konsekvent ska följa mänskliga avsikter i komplexa verkliga scenarier och under fientliga förhållanden, undvika katastrofala beteenden, förbli kontrollerbara och granskningsbara samt ligga i linje med mänskliga värderingar.

De tillade att när kvaliteten på mänskligt skriven och AI-skriven kod når paritet, kan människor sluta skriva kod helt och hållet och endast gå över till att granska den. Men om de inte kan granska kod lika snabbt som Claude genererar den, kommer mänsklig granskning att bli den främsta flaskhalsen i AI-utvecklingen.

Varför AI-utvecklingen bör bromsas in

Favaro och Clark sa också att det ideala scenariot vore att sakta ner utvecklingen så att samhället får mer tid att förstå de ”enorma” konsekvenserna av denna teknik.

I april vägrade Anthropic att släppa sin AI-modell Claude Mythos till allmänheten på grund av oro relaterad till globala cybersäkerhetshot. Modellen kunde enkelt skapa programvaruexploateringar, så företaget beslutade att inte göra den offentlig för tillfället.

Samma dag publicerade en grupp teknikledare, inklusive representanter från Anthropic och OpenAI, ett öppet brev där de uppmanade lagstiftare att införa striktare begränsningar för AI. Författarna varnade för att tekniken skulle kunna hjälpa illasinnade aktörer att övervinna de ”kunskapsbarriärer” som tidigare hindrat dem från att skapa biologiska vapen.

Samtidigt betonade de att enbart en inbromsning kan skapa nya risker om det tillåter mindre försiktiga aktörer att komma ikapp branschledarna tekniskt. Utan en global samordningsmekanism kommer företag och regeringar att tvingas fatta svåra säkerhetsbeslut under konkurrensmässigt och geopolitiskt tryck.

Vad som gör Claude värdefull

Anthropics flaggskeppsprodukt är AI-assistenten Claude. Det är en familj av språkmodeller utformade för att arbeta med text, kod, data och komplexa uppgifter där inte bara svarshastighet spelar roll, utan även säkerhet, kontrollerbarhet och tillförlitlighet. Claude används som en universell assistent: den kan skriva och redigera texter, analysera dokument, förklara komplexa ämnen, hjälpa till med programmering, hitta fel i kod och förbereda sammanfattningar, e-postmeddelanden, rapporter och annat arbetsmaterial.

För företag är Claude värdefull eftersom den kan ta över en del av det rutinmässiga intellektuella arbetet. Den används inom kundsupport, analys, programvaruutveckling, juridiska och finansiella processer, marknadsföring och interna företagsverktyg. Företag använder Claude som en chattassistent, ett API för integrering i sina produkter och ett verktyg för att automatisera uppgifter som kräver snabb bearbetning av stora mängder information och tydliga svar på naturligt språk.

Som en påminnelse: Claude hjälpte till att återställa lösenordet till en plånbok som innehöll 5 Bitcoin.

Detta material kan innehålla åsikter från tredje part, ingen av uppgifterna och informationen på denna webbsida utgör investeringsrådgivning enligt vår Ansvarsfriskrivning. Även om vi följer strikt Redaktionell Integritet, kan detta inlägg innehålla referenser till produkter från våra partners.