Anthropic varoittaa itsestään kehittyvän tekoälyn riskeistä

Anthropic varoittaa itsestään kehittyvän tekoälyn riskeistä
Anthropic varoitti tekoälyn aiheuttamasta uhasta

Yhdysvaltalainen tekoälyyhtiö Anthropic on varoittanut, että tekoälyn kehitys kiihtyy niin nopeasti, että lähitulevaisuudessa tekoälyagentit voisivat itsenäisesti luoda, kouluttaa ja parantaa uusia järjestelmiä ilman ihmisen osallistumista. Tätä taustaa vasten yhtiö on kehottanut hidastamaan neuroverkkojen kehitystä.

Tämä artikkeli on käännetty alkuperäisestä tekstistä. Lue kirjeenvaihtajamme alkuperäinen versio täältä.

Blogikirjoituksessa Anthropic Instituten johtaja Marina Favaro ja Anthropicin perustajajäsen Jack Clark sanoivat, että tekoälyagentit pystyvät jo nyt ajamaan koodia itsenäisesti, delegoimaan tuntikausia työtä muille agenteille ja lähestyvät vähitellen pistettä, jossa ne voisivat ottaa haltuunsa koko kehityssyklin.

”Suurimman osan tekoälyn historiasta ihmiset hallitsivat sen kehityksen jokaista vaihetta. Mutta Anthropicilla delegoimme yhä suuremman osan tekoälyn kehityksestä tekoälyjärjestelmille itselleen, mikä nopeuttaa työtämme”, he sanoivat.

Favaron ja Clarkin mukaan, jos tämä suuntaus jatkuu ja järjestelmät saavat riittävästi laskentatehoa, voi lopulta syntyä tekoäly, joka kykenee täysin autonomisesti suunnittelemaan ja kehittämään oman seuraajansa.

Keskittyminen turvallisuuteen

Tällaisten kykyjen kasvu herättää huolta skenaariosta, jossa tekoälystä voisi tulla älykkäämpi omatoimisesti. Joulukuussa OpenAI ilmoitti tutkivansa turvallisia tapoja kehittää ja ottaa käyttöön yhä edistyneempiä tekoälyjärjestelmiä, mukaan lukien malleja, jotka kykenevät rekursiiviseen itsensä kehittämiseen.

OpenAI totesi haluavansa, että tällaiset järjestelmät noudattavat johdonmukaisesti ihmisen tarkoitusta monimutkaisissa reaalimaailman skenaarioissa ja vastakkainasettelutilanteissa, välttävät katastrofaalista käyttäytymistä, pysyvät hallittavissa ja auditoitavissa sekä säilyvät linjassa inhimillisten arvojen kanssa.

He lisäsivät, että kun ihmisen kirjoittaman ja tekoälyn kirjoittaman koodin laatu saavuttaa pariteetin, ihmiset saattavat lopettaa koodin kirjoittamisen kokonaan ja siirtyä vain tarkistamaan sitä. Jos he eivät kuitenkaan pysty tarkistamaan koodia yhtä nopeasti kuin Claude sitä tuottaa, ihmisen suorittamasta tarkistuksesta tulee tekoälyn kehityksen suurin pullonkaula.

Miksi tekoälyn kehitystä pitäisi hidastaa

Favaro ja Clark sanoivat myös, että ihanteellinen skenaario olisi hidastaa kehitystä, jotta yhteiskunnalla olisi enemmän aikaa ymmärtää tämän teknologian ”valtavia” seurauksia.

Huhtikuussa Anthropic kieltäytyi julkaisemasta Claude Mythos -tekoälymalliaan yleisölle maailmanlaajuisiin kyberturvallisuusuhkiin liittyvien huolien vuoksi. Malli voisi helposti luoda ohjelmistojen haavoittuvuuksia hyödyntäviä exploit-koodeja, joten yhtiö päätti olla julkaisematta sitä toistaiseksi.

Samana päivänä ryhmä teknologiajohtajia, mukaan lukien Anthropicin ja OpenAI:n edustajat, julkaisi avoimen kirjeen, jossa kehotettiin lainsäätäjiä asettamaan tiukempia rajoituksia tekoälylle. Kirjoittajat varoittivat, että teknologia voisi auttaa pahantahtoisia toimijoita ylittämään ”tietobarriäärit”, jotka ovat aiemmin estäneet heitä luomasta biologisia aseita.

Samalla he korostivat, että pelkkä hidastaminen voisi luoda uusia riskejä, jos se antaisi vähemmän varovaisille toimijoille mahdollisuuden kuroa teknologisesti kiinni alan johtajat. Ilman maailmanlaajuista koordinointimekanismia yritykset ja hallitukset joutuvat tekemään vaikeita turvallisuuspäätöksiä kilpailullisen ja geopoliittisen paineen alla.

Mikä tekee Claudesta arvokkaan

Anthropicin lippulaivatuote on tekoälyavustaja Claude. Se on kielimalliperhe, joka on suunniteltu työskentelemään tekstin, koodin, datan ja monimutkaisten tehtävien parissa, joissa vastausnopeuden lisäksi tärkeitä ovat turvallisuus, hallittavuus ja luotettavuus. Claudea käytetään yleisavustajana: se voi kirjoittaa ja muokata tekstejä, analysoida asiakirjoja, selittää monimutkaisia aiheita, auttaa ohjelmoinnissa, etsiä virheitä koodista sekä valmistella tiivistelmiä, sähköposteja, raportteja ja muita työmateriaaleja.

Yrityksille Claude on arvokas, koska se voi ottaa hoitaakseen osan rutiininomaisesta älyllisestä työstä. Sitä käytetään asiakaspalvelussa, analytiikassa, ohjelmistokehityksessä, oikeudellisissa ja taloudellisissa prosesseissa, markkinoinnissa ja sisäisissä yritystyökaluissa. Yritykset käyttävät Claudea chat-avustajana, integraatio-API:na tuotteissaan ja työkaluna sellaisten tehtävien automatisointiin, jotka vaativat suurten tietomäärien nopeaa käsittelyä ja selkeiden vastausten saamista luonnollisella kielellä.

Muistutuksena, Claude auttoi palauttamaan salasanan lompakkoon, joka sisälsi 5 Bitcoinia.

Tämä materiaali saattaa sisältää kolmansien osapuolten mielipiteitä, eikä mikään tällä verkkosivulla oleva tieto tai data muodosta sijoitusneuvontaa Vastuuvapauslausekkeemme mukaisesti. Vaikka noudatamme tiukkaa Toimituksellista Integriteettiä, tämä julkaisu saattaa sisältää viittauksia kumppaneidemme tuotteisiin.