Badania pokazują, że agenci AI zawodzą w 97% rzeczywistych zadań

Wszystkie wiadomości

Najważniejsze wydarzenia

Wybór redakcji

Kryptowaluty

Wiadomości finansowe

Waluty

Głosy rynku

Regulatorzy

Banki centralne

Yaroslav Dmytrenko

06.11.2025

Badania pokazują, że agenci AI zawodzą w 97% rzeczywistych zadań — Badania pokazują, że ludzie nadal przewyższają sztuczną inteligencję w rzeczywistych przepływach pracy.

Kilka ostatnich badań ujawnia, że agenci AI wciąż nie są w stanie konkurować z ludźmi, jeśli chodzi o wykonywanie zadań w świecie rzeczywistym.

Ten artykuł został przetłumaczony z oryginału. Przeczytaj oryginalną wersję przygotowaną przez naszego korespondenta tutaj.

Według badań przeprowadzonych przez Scale AI i AI Research Center, agenci sztucznej inteligencji nie byli w stanie wykonać 97% zadań Upwork nawet na podstawowym poziomie. W badaniu przetestowano sześć różnych modeli sztucznej inteligencji w 240 projektach Upwork w kategoriach takich jak pisanie, projektowanie i analiza danych, porównując wyniki z wynikami prawdziwych freelancerów.

Najlepiej radzący sobie model sztucznej inteligencji, Manus, pomyślnie ukończył tylko 2,5% zadań, zarabiając około 1 810 USD z 143 991 USD dostępnej pracy. Inne modele, takie jak Claude Sonnet i Grok 4, poradziły sobie z zaledwie 2,1%. Naukowcy doszli do wniosku, że agenci AI zmagają się z wieloetapowymi przepływami pracy, inicjatywą i podejmowaniem decyzji, co sugeruje, że sztuczna inteligencja nie zastąpi ludzkich miejsc pracy w najbliższym czasie.

Odrębne badanie przeprowadzone przez Europejską Unię Nadawców i BBC wykazało, że modele AI - w tym ChatGPT, Copilot i Perplexity - są nieskuteczne w raportowaniu wiadomości. Nie spełniają one kluczowych kryteriów dziennikarskich, takich jak weryfikacja źródła, dokładność, generowanie tekstu i odróżnianie faktów od opinii.

W 45% odpowiedzi wygenerowanych przez sztuczną inteligencję badacze znaleźli co najmniej jeden znaczący błąd; tylko 31% odpowiedzi zostało ocenionych jako poprawne, a 20% zawierało nieaktualne, wprowadzające w błąd lub fałszywe informacje.

Tymczasem Freelance.com donosi, że listy motywacyjne generowane przez sztuczną inteligencję podważają proces ubiegania się o pracę - prowadząc do mniejszej liczby zatrudnień lub niedopasowanych dopasowań. Firma odkryła również, że specjaliści o najwyższych kwalifikacjach (górny kwintyl) mają o 19% mniejsze szanse na zatrudnienie niż wcześniej, podczas gdy kandydaci o niższych kwalifikacjach (dolny kwintyl) mają o 14% większe szanse na zatrudnienie.

Bez ludzi świat staje się pusty

Wyniki te są zgodne z sierpniowym badaniem MIT, w którym stwierdzono, że 95% organizacji nie widziało zwrotu z inwestycji w sztuczną inteligencję o wartości 30 miliardów dolarów.

Według WorldTest, badania przeprowadzonego przez MIT i Basis Research, agenci AI mogą dopasowywać wzorce i przewidywać słowa - ale mają trudności z budowaniem wewnętrznych modeli świata.

Badanie MIT obejmowało 129 zadań w 43 interaktywnych środowiskach, wymagających od sztucznej inteligencji przewidywania ukrytych aspektów świata, planowania sekwencji działań w celu osiągnięcia celów i wykrywania zmian reguł. Dla porównania, 517 ludzkich uczestników radziło sobie niemal optymalnie, podczas gdy modele AI często zawodziły.

Naukowcy sugerują, że ludzie wyróżniają się, ponieważ intuicyjnie rozumieją środowisko, dostosowują perspektywy, eksperymentują, resetują i strategicznie eksplorują. Zwiększenie mocy obliczeniowej nie pomogło istniejącym modelom - poprawiło wydajność tylko w 25 z 43 środowisk.

David Sacks, doradca polityczny ds. kryptowalut i sztucznej inteligencji w administracji Trumpa, ostrzegł również, że media społecznościowe i cenzura wyszukiwarek mogą stać się głęboko dystopijne dzięki generatywnej sztucznej inteligencji.

Argumentował, że termin "obudzona sztuczna inteligencja" bagatelizuje tę kwestię, opisując zamiast tego "orwellowską sztuczną inteligencję", która zniekształca odpowiedzi, kłamie i przepisuje historię w czasie rzeczywistym, aby dostosować się do dominującej narracji politycznej.

Jak pisaliśmy, Goldman Sachs: Modele AI przyspieszają możliwości autonomicznych agentów

Ten materiał może zawierać opinie osób trzecich, żadne dane ani informacje na tej stronie nie stanowią porady inwestycyjnej zgodnie z naszym Zastrzeżeniem. Chociaż przestrzegamy surowych Zasad Redakcyjnych, ten post może zawierać odniesienia do produktów naszych partnerów.

Czy spodobał Ci się ten artykuł?