Anthropic, 자가 개선 AI의 위험성 경고

Anthropic, 자가 개선 AI의 위험성 경고
Anthropic, AI의 위협에 대해 경고

미국 기반 AI 기업 Anthropic은 인공지능 개발 속도가 매우 빨라져 가까운 미래에 AI 에이전트가 인간의 개입 없이 독립적으로 새로운 시스템을 생성, 학습 및 개선할 수 있게 될 것이라고 경고했습니다. 이러한 배경 속에서 이 회사는 신경망 개발 속도를 늦출 것을 요구했습니다.

이 기사는 원문을 번역한 것입니다. 당사 특파원이 작성한 원문은 여기에서 확인하실 수 있습니다.

Anthropic 연구소 소장인 Marina Favaro와 Anthropic 공동 창립자 Jack Clark은 블로그 게시물을 통해 AI 에이전트가 이미 스스로 코드를 실행하고 다른 에이전트에게 수 시간의 작업을 위임할 수 있는 능력을 갖추었으며, 전체 개발 주기를 장악할 수 있는 시점에 점차 가까워지고 있다고 밝혔습니다.

“AI 역사의 대부분 동안 인간은 개발의 모든 단계를 통제해 왔습니다. 하지만 Anthropic에서는 AI 개발의 점점 더 많은 부분을 AI 시스템 자체에 위임하고 있으며, 이는 우리의 작업을 가속화하고 있습니다.”라고 그들은 말했습니다.

Favaro와 Clark에 따르면, 이러한 추세가 지속되고 시스템이 충분한 컴퓨팅 파워를 확보하게 된다면, 결국 자신의 후계자를 완전히 자율적으로 설계하고 개발할 수 있는 AI가 등장할 수 있습니다.

안전에 집중

이러한 능력의 성장은 AI가 스스로 더 똑똑해질 수 있는 시나리오에 대한 우려를 낳고 있습니다. 지난 12월, OpenAI는 재귀적 자가 개선이 가능한 모델을 포함하여 점점 더 발전하는 AI 시스템을 안전하게 개발하고 배포하는 방법을 연구하고 있다고 밝혔습니다.

OpenAI는 이러한 시스템이 복잡한 실제 시나리오와 적대적 조건에서도 인간의 의도를 일관되게 따르고, 파괴적인 행동을 피하며, 통제 및 감사 가능성을 유지하고, 인간의 가치와 일치하기를 원한다고 말했습니다.

그들은 또한 인간이 작성한 코드와 AI가 작성한 코드의 품질이 동등해지면 사람들이 코드 작성을 완전히 중단하고 검토 작업만 하게 될 수도 있다고 덧붙였습니다. 그러나 인간이 Claude가 생성하는 속도만큼 빠르게 코드를 검토할 수 없다면, 인간의 검토가 AI 개발의 주요 병목 현상이 될 것입니다.

AI 개발을 늦춰야 하는 이유

Favaro와 Clark은 또한 사회가 이 기술의 “막대한” 결과에 대해 이해할 수 있는 더 많은 시간을 가질 수 있도록 개발 속도를 늦추는 것이 이상적인 시나리오라고 말했습니다.

지난 4월, Anthropic은 글로벌 사이버 보안 위협과 관련된 우려로 인해 자사의 AI 모델인 Claude Mythos를 대중에게 공개하는 것을 거부했습니다. 이 모델은 소프트웨어 취약점을 쉽게 생성할 수 있어, 회사는 당분간 이를 공개하지 않기로 결정했습니다.

같은 날, Anthropic과 OpenAI의 대표를 포함한 기술 리더 그룹은 입법자들에게 AI에 대한 더 엄격한 제한을 도입할 것을 촉구하는 공개 서한을 발표했습니다. 저자들은 이 기술이 악의적인 행위자들이 이전에 생물 무기를 만드는 것을 막았던 “지식 장벽”을 극복하는 데 도움을 줄 수 있다고 경고했습니다.

동시에 그들은 단순히 속도를 늦추는 것이 덜 신중한 플레이어들이 업계 리더들을 기술적으로 추격하게 만든다면 새로운 위험을 초래할 수 있다고 강조했습니다. 글로벌 조정 메커니즘이 없다면 기업과 정부는 경쟁적 및 지정학적 압박 속에서 어려운 안전 결정을 내려야 할 것입니다.

Claude의 가치

Anthropic의 주력 제품은 AI 비서 Claude입니다. 이는 텍스트, 코드, 데이터 및 응답 속도뿐만 아니라 안전성, 통제성 및 신뢰성이 중요한 복잡한 작업을 처리하도록 설계된 언어 모델 제품군입니다. Claude는 범용 비서로 사용됩니다. 텍스트 작성 및 편집, 문서 분석, 복잡한 주제 설명, 프로그래밍 지원, 코드 오류 찾기, 요약, 이메일, 보고서 및 기타 작업 자료 준비 등을 수행할 수 있습니다.

기업 입장에서 Claude는 일상적인 지적 업무의 일부를 대신할 수 있기 때문에 가치가 있습니다. 고객 지원, 분석, 소프트웨어 개발, 법률 및 재무 프로세스, 마케팅 및 내부 기업 도구에 사용됩니다. 기업들은 Claude를 채팅 비서, 자사 제품 통합을 위한 API, 대량의 정보를 신속하게 처리하고 자연어로 명확한 답변을 받아야 하는 작업의 자동화 도구로 활용합니다.

참고로, Claude는 5 비트코인이 들어 있는 지갑의 비밀번호를 복구하는 데 도움을 준 적이 있습니다.

이 자료는 제3자의 의견을 포함할 수 있으며, 이 웹페이지의 데이터 및 정보는 우리의 면책 조항에 따라 투자 조언을 구성하지 않습니다. 우리는 엄격한 편집 무결성을 준수하지만, 이 게시물에는 파트너의 제품에 대한 언급이 포함될 수 있습니다.