Anthropic warnt vor den Risiken sich selbst verbessernder KI
Das US-amerikanische KI-Unternehmen Anthropic hat davor gewarnt, dass sich die Entwicklung künstlicher Intelligenz so schnell beschleunigt, dass KI-Agenten in naher Zukunft unabhängig neue Systeme ohne menschliche Beteiligung erstellen, trainieren und verbessern könnten. Vor diesem Hintergrund hat das Unternehmen zu einer Verlangsamung der Entwicklung neuronaler Netze aufgerufen.
Dieser Artikel wurde aus dem Original übersetzt. Lesen Sie die Originalversion unseres Korrespondenten hier.
In einem Blog-Beitrag erklärten Marina Favaro, Leiterin des Anthropic Institute, und Anthropic-Mitbegründer Jack Clark, dass KI-Agenten bereits in der Lage sind, Code eigenständig auszuführen, stundenlange Arbeit an andere Agenten zu delegieren und sich allmählich dem Punkt nähern, an dem sie den gesamten Entwicklungszyklus übernehmen könnten.
„Während des größten Teils der Geschichte der KI kontrollierten Menschen jede Phase ihrer Entwicklung. Aber bei Anthropic delegieren wir einen zunehmenden Anteil der KI-Entwicklung an die KI-Systeme selbst, was unsere Arbeit beschleunigt“, sagten sie.
Laut Favaro und Clark könnte, wenn sich dieser Trend fortsetzt und die Systeme genügend Rechenleistung erhalten, schließlich eine KI entstehen, die in der Lage ist, ihren eigenen Nachfolger völlig autonom zu entwerfen und zu entwickeln.
Fokus auf Sicherheit
Das Wachstum solcher Fähigkeiten schürt Bedenken über ein Szenario, in dem die KI von sich aus intelligenter werden könnte. Im Dezember erklärte OpenAI, dass man sichere Wege zur Entwicklung und Bereitstellung zunehmend fortschrittlicher KI-Systeme untersuche, einschließlich Modellen, die zur rekursiven Selbstverbesserung fähig sind.
OpenAI gab an, dass solche Systeme in komplexen realen Szenarien und unter widrigen Bedingungen konsequent der menschlichen Absicht folgen, katastrophales Verhalten vermeiden, kontrollierbar und prüfbar bleiben und an menschlichen Werten ausgerichtet sein sollen.
Sie fügten hinzu, dass Menschen möglicherweise ganz aufhören werden, Code zu schreiben, und nur noch dazu übergehen, ihn zu überprüfen, sobald die Qualität von menschlichem und KI-geschriebenem Code gleichauf liegt. Wenn sie den Code jedoch nicht so schnell überprüfen können, wie Claude ihn generiert, wird die menschliche Überprüfung zum Hauptengpass in der KI-Entwicklung.
Warum die KI-Entwicklung verlangsamt werden sollte
Favaro und Clark sagten auch, dass das ideale Szenario darin bestünde, die Entwicklung zu verlangsamen, damit die Gesellschaft mehr Zeit hat, die „immensen“ Folgen dieser Technologie zu verstehen.
Im April weigerte sich Anthropic, sein KI-Modell Claude Mythos für die Öffentlichkeit freizugeben, da Bedenken hinsichtlich globaler Cybersicherheitsbedrohungen bestanden. Das Modell könnte leicht Software-Exploits erstellen, weshalb das Unternehmen beschloss, es vorerst nicht öffentlich zugänglich zu machen.
Am selben Tag veröffentlichte eine Gruppe von Technologieführern, darunter Vertreter von Anthropic und OpenAI, einen offenen Brief, in dem sie den Gesetzgeber aufforderten, strengere Grenzwerte für KI einzuführen. Die Autoren warnten davor, dass die Technologie böswilligen Akteuren helfen könnte, die „Wissensbarrieren“ zu überwinden, die sie zuvor an der Entwicklung biologischer Waffen gehindert hatten.
Gleichzeitig betonten sie, dass eine bloße Verlangsamung neue Risiken schaffen könnte, wenn sie es weniger vorsichtigen Akteuren ermöglichte, technologisch zu den Branchenführern aufzuschließen. Ohne einen globalen Koordinationsmechanismus werden Unternehmen und Regierungen gezwungen sein, schwierige Sicherheitsentscheidungen unter wettbewerbsbedingtem und geopolitischem Druck zu treffen.
Was Claude wertvoll macht
Das Flaggschiffprodukt von Anthropic ist der KI-Assistent Claude. Es handelt sich um eine Familie von Sprachmodellen, die für die Arbeit mit Text, Code, Daten und komplexen Aufgaben konzipiert sind, bei denen nicht nur die Antwortgeschwindigkeit zählt, sondern auch Sicherheit, Kontrollierbarkeit und Zuverlässigkeit. Claude wird als universeller Assistent eingesetzt: Er kann Texte schreiben und bearbeiten, Dokumente analysieren, komplexe Themen erklären, beim Programmieren helfen, Fehler im Code finden und Zusammenfassungen, E-Mails, Berichte und andere Arbeitsmaterialien erstellen.
Für Unternehmen ist Claude wertvoll, weil er einen Teil der routinemäßigen intellektuellen Arbeit übernehmen kann. Er wird im Kundensupport, in der Analytik, in der Softwareentwicklung, in rechtlichen und finanziellen Prozessen, im Marketing und in internen Unternehmenstools eingesetzt. Unternehmen nutzen Claude als Chat-Assistenten, als API zur Integration in ihre Produkte und als Werkzeug zur Automatisierung von Aufgaben, die eine schnelle Verarbeitung großer Informationsmengen und klare Antworten in natürlicher Sprache erfordern.
Zur Erinnerung: Claude half dabei, das Passwort für eine Wallet mit 5 Bitcoin wiederherzustellen.
Neueste Anthropic Nachrichten
- Forex
- Crypto