Anthropic 警告自我改进 AI 的风险

Anthropic 警告自我改进 AI 的风险
Anthropic 警告 AI 威胁

总部位于美国的 AI 公司 Anthropic 警告称,人工智能的发展速度正在如此之快地加速,在不久的将来,AI 智能体可能会在没有人类参与的情况下,独立创建、训练和改进新系统。在此背景下,该公司呼吁放慢神经网络的开发速度。

本文翻译自原文。点击此处阅读由我们的通讯员撰写的原文.

Anthropic 研究所负责人 Marina Favaro 和 Anthropic 联合创始人 Jack Clark 在一篇博客文章中表示,AI 智能体已经能够自行运行代码,将数小时的工作委托给其他智能体,并逐渐接近可以接管整个开发周期的临界点。

“在 AI 历史的大部分时间里,人类控制着其开发的每一个阶段。但在 Anthropic,我们正将越来越多的 AI 开发份额委托给 AI 系统本身,这正在加速我们的工作,”他们表示。

Favaro 和 Clark 认为,如果这一趋势继续下去,并且系统获得足够的算力,最终可能会出现能够完全自主设计和开发其后继者的 AI。

专注于安全

这种能力的增长引发了人们对 AI 可能自行变得更聪明的担忧。去年 12 月,OpenAI 表示正在研究安全开发和部署日益先进的 AI 系统的方法,包括能够进行递归自我改进的模型。

OpenAI 表示,它希望此类系统在复杂的现实场景和对抗性条件下始终遵循人类意图,避免灾难性行为,保持可控和可审计,并与人类价值观保持一致。

他们补充说,一旦人类编写的代码和 AI 编写的代码质量达到同等水平,人们可能会完全停止编写代码,转而只进行审查。然而,如果他们审查代码的速度赶不上 Claude 生成代码的速度,人类审查将成为 AI 开发的主要瓶颈。

为什么要放慢 AI 开发速度

Favaro 和 Clark 还表示,理想的情况是放慢开发速度,让社会有更多时间来了解这项技术带来的“巨大”后果。

今年 4 月,由于担心全球网络安全威胁,Anthropic 拒绝向公众发布其 AI 模型 Claude Mythos。该模型可以轻易创建软件漏洞,因此该公司决定暂时不公开。

同一天,包括 Anthropic 和 OpenAI 代表在内的一群技术领袖发表了一封公开信,敦促立法者对 AI 引入更严格的限制。作者警告说,这项技术可能会帮助恶意行为者克服此前阻止他们制造生物武器的“知识壁垒”。

与此同时,他们强调,如果放慢速度让不够谨慎的参与者在技术上追上行业领先者,单纯的减速可能会带来新风险。在缺乏全球协调机制的情况下,企业和政府将被迫在竞争和地缘政治压力下做出艰难的安全决策。

Claude 的价值所在

Anthropic 的旗舰产品是 AI 助手 Claude。它是一个语言模型系列,旨在处理文本、代码、数据和复杂任务,在这些任务中,不仅响应速度至关重要,安全性、可控性和可靠性也同样重要。Claude 被用作通用助手:它可以编写和编辑文本、分析文档、解释复杂主题、辅助编程、查找代码错误,以及准备摘要、电子邮件、报告和其他工作材料。

对于企业而言,Claude 的价值在于它可以接管部分常规的智力工作。它被应用于客户支持、分析、软件开发、法律和财务流程、营销以及内部企业工具。公司将 Claude 用作聊天助手、集成到其产品中的 API,以及用于自动化处理大量信息并以自然语言获得清晰答案的任务工具。

提醒一下,Claude 曾帮助找回了一个存有 5 枚比特币钱包的密码。

此材料可能包含第三方意见,根据我们的免责声明,本网页上的数据和信息均不构成投资建议。尽管我们坚持严格的编辑完整性,但此帖子可能包含对我们合作伙伴产品的引用。