Οι πράκτορες τεχνητής νοημοσύνης αποτυγχάνουν στο 97% των εργασιών του πραγματικού κόσμου, σύμφωνα με μελέτες

Οι πράκτορες τεχνητής νοημοσύνης αποτυγχάνουν στο 97% των εργασιών του πραγματικού κόσμου, σύμφωνα με μελέτες
Η έρευνα δείχνει ότι οι άνθρωποι εξακολουθούν να υπερτερούν έναντι της ΤΝ σε πραγματικές ροές εργασίας

Αρκετές πρόσφατες μελέτες αποκαλύπτουν ότι οι πράκτορες τεχνητής νοημοσύνης εξακολουθούν να μην μπορούν να ανταγωνιστούν τους ανθρώπους όταν πρόκειται για την εκτέλεση καθηκόντων στον πραγματικό κόσμο.

Αυτό το άρθρο μεταφράστηκε από το πρωτότυπο. Διαβάστε την αρχική έκδοση από τον ανταποκριτή μας εδώ.

Σύμφωνα με έρευνα της Scale AI και του AI Research Center, οι πράκτορες τεχνητής νοημοσύνης δεν μπόρεσαν να ολοκληρώσουν το 97% των εργασιών του Upwork ούτε καν σε βασικό επίπεδο. Η μελέτη εξέτασε έξι διαφορετικά μοντέλα τεχνητής νοημοσύνης σε 240 έργα Upwork σε κατηγορίες όπως η συγγραφή, ο σχεδιασμός και η ανάλυση δεδομένων, συγκρίνοντας τα αποτελέσματα με εκείνα των πραγματικών ελεύθερων επαγγελματιών.

Το μοντέλο τεχνητής νοημοσύνης με τις καλύτερες επιδόσεις, το Manus, ολοκλήρωσε με επιτυχία μόνο το 2,5% των εργασιών, κερδίζοντας περίπου 1.810 δολάρια από 143.991 δολάρια σε διαθέσιμες εργασίες. Άλλα μοντέλα, όπως το Claude Sonnet και το Grok 4, κατάφεραν μόνο το 2,1%. Οι ερευνητές κατέληξαν στο συμπέρασμα ότι οι πράκτορες AI δυσκολεύονται με τις ροές εργασίας πολλαπλών βημάτων, την πρωτοβουλία και τη λήψη αποφάσεων, γεγονός που υποδηλώνει ότι η AI δεν θα αντικαταστήσει τις ανθρώπινες θέσεις εργασίας σύντομα.

Μια ξεχωριστή μελέτη από την Ευρωπαϊκή Ραδιοτηλεοπτική Ένωση και το BBC διαπίστωσε ότι τα μοντέλα AI - συμπεριλαμβανομένων των ChatGPT, Copilot και Perplexity - είναι αναποτελεσματικά στο ρεπορτάζ ειδήσεων. Αποτυγχάνουν να ανταποκριθούν σε βασικά δημοσιογραφικά κριτήρια, όπως η επαλήθευση των πηγών, η ακρίβεια, η δημιουργία κειμένου και η διάκριση των γεγονότων από τη γνώμη.

Στο 45% των απαντήσεων που παρήγαγε η Τεχνητή Νοημοσύνη, οι ερευνητές διαπίστωσαν τουλάχιστον ένα σημαντικό σφάλμα- μόνο το 31% των απαντήσεων αξιολογήθηκαν ως σωστές, ενώ το 20% περιείχε ξεπερασμένες, παραπλανητικές ή ψευδείς πληροφορίες.

Εν τω μεταξύ, το Freelance.com ανέφερε ότι οι συνοδευτικές επιστολές που δημιουργούνται από τεχνητή νοημοσύνη υπονομεύουν τη διαδικασία υποβολής αιτήσεων εργασίας - οδηγώντας σε λιγότερες προσλήψεις ή σε λανθασμένες αντιστοιχίες. Η εταιρεία διαπίστωσε επίσης ότι οι επαγγελματίες με τα υψηλότερα προσόντα (ανώτερο πεμπτημόριο) έχουν 19% λιγότερες πιθανότητες να προσληφθούν σε σχέση με πριν, ενώ οι υποψήφιοι με χαμηλότερα προσόντα (κατώτερο πεμπτημόριο) έχουν 14% περισσότερες πιθανότητες να προσληφθούν.

Χωρίς ανθρώπους, ο κόσμος αδειάζει

Τα ευρήματα αυτά συνάδουν με μια μελέτη του ΜΙΤ από τον Αύγουστο, η οποία κατέληξε στο συμπέρασμα ότι το 95% των οργανισμών δεν είδαν καμία απόδοση από τις επενδύσεις τους σε τεχνητή νοημοσύνη ύψους 30 δισεκατομμυρίων δολαρίων.

Σύμφωνα με το WorldTest, μια μελέτη που διεξήχθη από το MIT και την Basis Research, οι πράκτορες AI μπορούν να ταιριάξουν μοτίβα και να προβλέψουν λέξεις - αλλά δυσκολεύονται να δημιουργήσουν εσωτερικά μοντέλα του κόσμου.

Η έρευνα του MIT περιελάμβανε 129 εργασίες σε 43 διαδραστικά περιβάλλοντα, απαιτώντας από την AI να προβλέπει κρυφές πτυχές του κόσμου, να σχεδιάζει ακολουθίες ενεργειών για την επίτευξη στόχων και να ανιχνεύει αλλαγές κανόνων. Συγκριτικά, 517 ανθρώπινοι συμμετέχοντες απέδωσαν σχεδόν βέλτιστα, ενώ τα μοντέλα ΤΝ συχνά απέτυχαν.

Οι ερευνητές προτείνουν ότι οι άνθρωποι υπερέχουν επειδή κατανοούν διαισθητικά τα περιβάλλοντα, προσαρμόζουν τις προοπτικές, πειραματίζονται, επαναφέρουν και εξερευνούν στρατηγικά. Η αύξηση της υπολογιστικής ισχύος δεν βοήθησε τα υπάρχοντα μοντέλα - βελτίωσε την απόδοση μόνο σε 25 από τα 43 περιβάλλοντα.

Ο Ντέιβιντ Σακς, σύμβουλος πολιτικής για την κρυπτογράφηση και την τεχνητή νοημοσύνη υπό την κυβέρνηση Τραμπ, προειδοποίησε επίσης ότι η λογοκρισία στα κοινωνικά μέσα και στις μηχανές αναζήτησης θα μπορούσε να γίνει βαθιά δυστοπική με τη γεννητική τεχνητή νοημοσύνη.

Υποστήριξε ότι ο όρος "woke AI" υποτιμά το ζήτημα, περιγράφοντας αντίθετα μια "οργουελική AI" που διαστρεβλώνει τις απαντήσεις, ψεύδεται και ξαναγράφει την ιστορία σε πραγματικό χρόνο για να ευθυγραμμιστεί με την επικρατούσα πολιτική αφήγηση.

Όπως γράψαμε, η Goldman Sachs: AI models accelerate autonomous agent capabilities (Μοντέλα τεχνητής νοημοσύνης επιταχύνουν τις δυνατότητες αυτόνομων πρακτόρων)

Αυτό το υλικό μπορεί να περιέχει απόψεις τρίτων, κανένα από τα δεδομένα και τις πληροφορίες σε αυτήν την ιστοσελίδα δεν αποτελεί επενδυτική συμβουλή σύμφωνα με την Αποποίηση Ευθυνών μας. Ενώ τηρούμε αυστηρή Συντακτική Ακεραιότητα, αυτή η ανάρτηση μπορεί να περιέχει αναφορές σε προϊόντα από τους συνεργάτες μας.
Εβδομαδιαία Κορυφαία Μπόνους
έως $2.500
μπόνους κατάθεσης για όλους τους πελάτες