研究显示，人工智能代理未能完成 97% 的实际任务

Traders Union
所有新闻
财经新闻
人工智能代理失败

头条新闻

编辑精选

加密货币

财经新闻

货币

市场之声

中央银行

Yaroslav Dmytrenko

06.11.2025

研究显示，人工智能代理未能完成 97% 的实际任务 — 研究表明，在实际工作流程中，人类的表现仍优于人工智能

最近的几项研究表明，人工智能代理在执行现实世界的任务时仍然无法与人类竞争。

本文翻译自原文。点击此处阅读由我们的通讯员撰写的原文.

根据 Scale AI 和人工智能研究中心的研究，人工智能代理无法完成 97% 的 Upwork 任务，即使是最基本的任务。这项研究在240个Upwork项目中测试了六种不同的人工智能模型，包括写作、设计和数据分析等类别，并将结果与真正的自由职业者进行了比较。

表现最好的人工智能模型 Manus 仅成功完成了 2.5% 的任务，在 143991 美元的可用工作中赚取了约 1810 美元。其他模型，如 Claude Sonnet 和 Grok 4，只完成了 2.1%。研究人员的结论是，人工智能代理在多步骤工作流程、主动性和决策方面存在困难，这表明人工智能不会很快取代人类的工作。

欧洲广播联盟和英国广播公司的另一项研究发现，包括 ChatGPT、Copilot 和 Perplexity 在内的人工智能模型在新闻报道方面效果不佳。它们无法满足关键的新闻标准，如来源验证、准确性、文本生成以及区分事实与观点。

在 45% 的人工智能生成的答案中，研究人员发现至少有一个重大错误；只有 31% 的答案被评为正确，20% 的答案包含过时、误导或虚假信息。

与此同时，Freelance.com 报道称，人工智能生成的求职信正在破坏求职申请流程--导致招聘人数减少或匹配错误。该公司还发现，顶级技能专业人士（前五分之一）被录用的可能性比以前降低了19%，而低技能求职者（后五分之一）被录用的可能性则提高了14%。

没有人类，世界变得空洞

这些发现与麻省理工学院 8 月份的一项研究相吻合，该研究认为，95% 的企业在 300 亿美元的人工智能投资上看不到回报。

根据麻省理工学院和 Basis Research 开展的一项研究 WorldTest，人工智能代理可以匹配模式并预测单词，但在建立世界内部模型方面却举步维艰。

麻省理工学院的研究涉及 43 个互动环境中的 129 项任务，要求人工智能预测世界的隐藏方面、规划行动序列以实现目标，以及检测规则变化。相比之下，517 名人类参与者的表现几乎达到最佳，而人工智能模型却经常失败。

研究人员认为，人类之所以表现出色，是因为他们能凭直觉理解环境、调整视角、进行实验、重新设定并进行战略性探索。提高计算能力对现有模型没有帮助--它只提高了 43 种环境中 25 种环境的性能。

特朗普政府的加密货币和人工智能政策顾问大卫-萨克斯（David Sacks）也警告说，社交媒体和搜索引擎审查可能会因为生成式人工智能而变得极度乌托邦化。

他认为，"觉醒的人工智能 "一词低估了这个问题，它描述的是一种 "奥威尔式的人工智能"，这种人工智能会实时歪曲答案、撒谎和改写历史，以便与主流政治叙事保持一致。

正如我们所写，高盛：人工智能模型加速自主代理能力

此材料可能包含第三方意见，根据我们的免责声明，本网页上的数据和信息均不构成投资建议。尽管我们坚持严格的编辑完整性，但此帖子可能包含对我们合作伙伴产品的引用。

你喜欢这篇文章吗？

编辑精选

区块链上的FIFA世界杯：足球与加密货币的交汇之处

由 Oleg Tkachenko
1小时前

区块链上的FIFA世界杯：足球与加密货币的交汇之处

编辑精选

外星人、中本聪与比特币：外星人理论是如何产生的始末

由 Pavlo Kot
昨天

外星人、中本聪与比特币：外星人理论是如何产生的始末

编辑精选

危机中的区块链国家：权力斗争如何分裂 Liberland

由 Pavlo Kot
20.06.2026

危机中的区块链国家：权力斗争如何分裂 Liberland

编辑精选

所有编辑精选

最新 business 新闻

西方资产因交易控制失误面临SEC制裁

由 Ciaran Ryan
05.06.2026

西方资产因交易控制失误面临SEC制裁

监管机构

#business #SEC #USA

法院裁定：马斯克的推文导致推特投资者损失26亿美元

由 Yaroslav Dmytrenko
22.03.2026

法院裁定：马斯克的推文导致推特投资者损失26亿美元

财经新闻

#埃隆·马斯克 #finance #business

派拉蒙就Seedance 2.0人工智能模型向字节跳动发起诉讼

由 Yaroslav Dmytrenko
15.02.2026

派拉蒙就Seedance 2.0人工智能模型向字节跳动发起诉讼

财经新闻

所有 business 新闻

Oleg Tkachenko
1小时前

区块链上的FIFA世界杯：足球与加密货币的交汇之处

Pavlo Kot
昨天

外星人、中本聪与比特币：外星人理论是如何产生的始末

Pavlo Kot
20.06.2026

危机中的区块链国家：权力斗争如何分裂 Liberland

Eugene Komchuk
19.06.2026

优先事项的转变：企业转向 AI，政府支持挖矿

Mikhail Vnuchkov
18.06.2026

Intel 的回归：苹果、特朗普与 AI 押注

Jose Antonio Gastelum
4小时前

陈格蕾西：Onchain 访问方式改变了购买英伟达股票的体验

Oleg Tkachenko
10小时前

安东尼·庞普利亚诺：关于市场动荡后将出现高通胀的预测是错误的

Jose Antonio Gastelum
13小时前

彼得·希夫：房地产与比特币的结合无法解决根本问题

Artem Shendetskii
21小时前

查理·比莱洛指出，股市创下历史新高，通胀持续不退

Jose Antonio Gastelum
昨天

赵长鹏：为孩子们留些加密货币

头条新闻

Hanna Syniavska
41分前

伊朗风险拖累市场，美股期货下跌

伊朗风险拖累市场，美股期货下跌

Andrey Mastykin
1小时前

HBM 需求激增，SK 海力士超越三星

HBM 需求激增，SK 海力士超越三星

Igor Krasulya
2小时前

美伊谈判取得进展后，油价跌破80美元

美伊谈判取得进展后，油价跌破80美元

Eugene Komchuk
3小时前

日本养老基金将首次投资加密货币

日本养老基金将首次投资加密货币

Pavlo Kot
昨天

外星人、中本聪与比特币：外星人理论是如何产生的始末

外星人、中本聪与比特币：外星人理论是如何产生的始末

适合您的5个最佳券商

美国

实时新闻

Anton Kharitonov
现在

WTI在支撑区附近维持下行趋势

Anton Kharitonov
现在

看涨动能重燃，天然气测试关键阻力位

Anton Kharitonov
现在

美元需求回升，EUR/USD 扩大跌幅

Anton Kharitonov
现在

微软面临压力，技术面依然疲软

Anton Kharitonov
现在

Apple 在 AI 反弹后进入盘整，投资者等待新增长催化剂

© IAFT Ltd., 2010-2026 网站版权归 IAFT Ltd., 所有
注册号码 - HE 336186

风险披露：

TradersUnion.com网站上的信息仅供参考，不构成对访问者投资的任何动机或建议。此外，我们在此警告您，交易Forex和CFD市场始终具有高风险。根据统计，75-89%的客户会损失投资资金，只有11-25%的交易者获得利润。期货和期权交易具有重大损失风险，并不适合所有投资者。

因此，您应该只投资您准备好或能够承受损失的资金，在如此高的风险下。Tradersunion.com不提供任何金融服务，包括投资或财务咨询服务。此外，Traders Union不是经纪商，也不从Forex或CFD市场的交易中获取资金。我们的网站仅提供有关经纪商和市场的信息，并帮助用户根据详细信息和客观分析选择最佳经纪公司。
免责声明：

TradersUnion.com 网站上的信息仅为出于提供信息之目的，不构成任何访问者投资资金的动机或建议。此外，我们在此提示您，外汇与差价合约市场交易存在高风险。根据统计数据，75-89% 的交易者所投资的资金出现亏损，只有11-25%的交易者盈利。

这就是您为什么只应投资您准备好的——或您能够承受的了的以此高风险投资的金额。Tradersunion.com 不提供任何金融服务，包括投资服务或金融顾问服务。Traders Union 也不是经纪商，不会从外汇市场或差价合约市场交易中获利。我们的网站仅提供经纪商和市场的信息，根据具体信息和对经纪商客观的分析帮助用户选择最佳的经纪商。
广告商披露：

Tradersunion.com 网站上的所有服务对您免费使用。我们的团队每年花费数千小时研究经纪商并收集有关他们的信息，以帮助全球投资者选择可靠的公司并避免欺诈。

该研究与信息收集过程的策划、获取，与组织需要 Tradersunion.com 的大量资金投入，而此投入由网站广告收入获得。网站有两种广告服务类型 — 直接广告或合作伙伴 (经纪商) 参与项目。但是，合作伙伴购买的服务不会对网站的推荐，我们的观点或排名造成任何影响。我们根据客观评级标准与方法进行评级；评级结果对每家经纪商公平公正。我们的内容创作者与研究组的工作不涉及与任何广告方的互动，广告方无论购买多少广告，都没有我们数据的访问权。10多年来，我们的宗旨始终是独立，绝对开放透明与客观公正。可通过链接查看经纪商网站。这可以帮助 Tradersunion.com 持续为您免费提供服务。