Subscribe to Our Newsletter

Success! Now Check Your Email

To complete Subscribe, click the confirmation link in your inbox. If it doesn’t arrive within 3 minutes, check your spam folder.

Ok, Thanks
'멀티 에이전트 AI 시대' 도래?... 오픈 AI 이어 앤트로픽도 가세
Photo by Google DeepMind / Unsplash. /SNS 타임즈

'멀티 에이전트 AI 시대' 도래?... 오픈 AI 이어 앤트로픽도 가세

OpenAI 추격전 본격화...AI 코딩 에이전트 시장 주도권 경쟁 심화

Jason Jung profile image
by Jason Jung

'멀티 에이전트' 기능 탑재한 Claude Opus 4.6 공개

[SNS 타임즈- LA] 앤트로픽(Anthropic)이 지난 목요일 자사 AI 모델 제품군의 최신 버전인 Claude Opus 4.6을 출시했다.

이번 출시는 OpenAI가 이번 주 초 멀티 에이전트 기능을 탑재한 Codex를 선보이며 잠시 선점했던 기술적 우위를 따라잡기 위한 조치로 풀이된다.

AI 전문 조사기업 'The Deep View'에 따르면, 앤트로픽은 새 모델이 코딩 및 코드 리뷰 능력 향상과 작업 계획 수립 기능 개선, 또 이전 버전보다 에이전트 작업을 더 오래 지속할 수 있다고 밝혔다. 여기서 '에이전트 작업'이란 AI가 사용자의 지시를 받아 자율적으로 여러 단계의 업무를 수행하는 것을 의미한다.

이번 출시와 함께 앤트로픽은 '에이전트 팀(agent teams)'이라는 새로운 기능을 공개했다. 이 기능을 통해 사용자는 여러 AI 에이전트를 생성할 수 있으며, 이들 에이전트가 자율적으로 작업을 분담하고 병렬로 처리할 수 있다. 이는 OpenAI가 이번 주 초 선보인 Codex의 멀티 에이전트 기능과 유사한 능력을 제공한다.

앤트로픽의 코딩 도구인 Claude Code는 지난 몇 달간 입소문을 타며 큰 인기를 끌었다. 심지어 일각에서는 개인과 조직이 이제 AI를 활용해 맞춤형 소프트웨어를 직접 제작할 수 있게 되면서 기존 소프트웨어 기업들의 미래가 불투명해질 것이라는 우려 때문에 소프트웨어 기업들의 주가 하락 원인으로 지목되기도 했다.

하지만 OpenAI의 Codex는 기준을 한 단계 끌어올렸다. 단순히 코딩을 위한 AI 에이전트를 제공하는 것을 넘어, 여러 에이전트가 팀을 이뤄 협업할 수 있는 능력을 구현했기 때문이다. Opus 4.6은 이제 동일한 기능을 제공할 수 있게 됐다.

향상된 성능과 새로운 기능

앤트로픽은 Opus 4.6이 여러 측면에서 개선되었다고 강조했다.

주요 개선 사항으로는:

  • 재무 분석, 리서치, 문서 작성, 에이전트 검색 등 업무 작업에서의 향상된 능력
  • 대규모 코드베이스(프로그램 전체 소스 코드 집합)에서 더 안정적인 작업 수행
  • Claude Cowork에서 활용 시 자율적 멀티태스킹 기능

특히 이번 모델은 Opus 라인 중 처음으로 100만 토큰 컨텍스트 윈도우를 제공한다. 여기서 '토큰'은 AI가 처리하는 텍스트의 기본 단위이며, '컨텍스트 윈도우'는 AI가 한 번에 이해하고 처리할 수 있는 정보의 양을 의미한다. 100만 토큰은 대략 책 여러 권 분량에 해당하는 방대한 양이다.

Opus 4.6은 여러 평가 지표에서 최고 수준(state-of-the-art)의 성능을 기록했다. 에이전트 코딩 평가인 Terminal-Bench 2.0, 최첨단 모델 평가인 Humanity's Last Exam, 그리고 금융 및 법률 평가인 GDPval-AA에서 업계 최고 성적을 달성했다.

다만 회사는 블로그 게시물을 통해 한 가지 단점도 인정했다.

Opus 4.6은 어려운 문제에 대해 더 나은 결과를 제공하기 위해 출력 결과를 더욱 신중하고 주의 깊게 고려하지만, 이러한 특성이 "간단한 문제에서는 비용과 지연 시간을 증가시킬 수 있다"는 것이다.

업계 전문가 평가

앤트로픽의 클로드 관계 책임자인 알렉스 알버트(Alex Albert)는 X(구 트위터)에 게시한 글에서 이번 출시가 "스프레드시트, 슬라이드, 긴 문서 작업에 하루를 보내는 사람들에게 AI가 진정한 업무 파트너가 되는 분수령"이라고 평가했다.

The Deep View는 출시 전 모델에 대한 사전 접근 권한을 받았으나, 출력 품질의 눈에 띄는 향상은 관찰되지 않았다고 전했다. 다만 이전 모델도 이미 충분히 뛰어난 성능을 보였으며, 이번 릴리스가 그러한 경험을 전혀 저해하지 않았다고 덧붙였다. The Deep View는 매우 복잡한 코딩 및 추론 작업에서 모델을 부하 테스트할 때만 차이를 느낄 수 있을 것이며, 팀이 최신 세부 사항을 찾기 위해 계속 테스트할 것이라고 밝혔다.

주요 AI 모델 제공업체들은 경쟁사를 앞지르고, 일시적이나마 '최첨단' 타이틀을 유지하며, 요구가 많은 고객들을 만족시키기 위해 더 크고, 더 좋고, 더 강력한 모델을 출시해야 한다는 끊임없는 압박에 직면해 있다.

이번 출시로 앤트로픽도 이러한 압박을 느끼고 있는 것으로 보인다.

특히 사용자들이 Claude Sonnet 5를 간절히 기다리고 있고, OpenAI가 기업용 서비스와 멀티 에이전트 코딩 도구를 강화하는 상황에서 더욱 그렇다.

다만 새 모델이 에이전트 및 복잡한 심층 연구 작업에서 성능 향상을 제공하지만, 일상적이고 단순한 사용 사례에서 Claude를 사용하는 사용자들에게는 이번 업데이트가 큰 성능 도약을 의미하지 않을 수 있다는 점도 염두에 둘 필요가 있다고 전문가들은 지적하고 있다.

- Copyright, SNS 타임즈 www.snstimes.kr

Jason Jung profile image
by Jason Jung

Subscribe to New Posts

Lorem ultrices malesuada sapien amet pulvinar quis. Feugiat etiam ullamcorper pharetra vitae nibh enim vel.

Success! Now Check Your Email

To complete Subscribe, click the confirmation link in your inbox. If it doesn’t arrive within 3 minutes, check your spam folder.

Ok, Thanks

Latest posts