엔비디아, 로봇 AI '마지막 벽' 넘는다
20조 개 데이터로 훈련한 차세대 로봇 두뇌… 오픈소스로 전면 공개. 언어 모델 넘어 선 세계 최대 물리 AI 기반모델 'Cosmos 3' 공개
[SNS 타임즈- LA] AI 전문 연구 조사 기관 '더 딥뷰(The Deep View)'는 최근 엔비디아(Nvidia)가 대만 컴퓨텍스 행사에서 차세대 물리 AI 기반 모델 'Cosmos 3'를 공개했다고 보도했다 .
AI 업계의 관심이 언어 모델을 넘어 현실 세계와 상호작용하는 '물리 AI'로 빠르게 이동하는 가운데, 엔비디아는 이 흐름의 핵심 기술로 '월드 모델'에 대한 대규모 투자를 단행하고 있는 것으로 알려지고 있다.
월월드 모델이란 AI가 물체의 움직임, 중력, 충돌 같은 물리 법칙을 학습해 현실 세계를 가상으로 재현하고 미리 예측할 수 있도록 하는 AI 모델을 말한다. 로봇이나 자율주행 차량이 가상 환경에서 수많은 시나리오를 미리 경험하도록 돕는 일종의 '디지털 물리 세계'다.
엔비디아는 Cosmos 3을 "완전히 개방된 옴니모델(fully open omnimodel)"이라고 소개했다 . '옴니'란 '모든'을 뜻하는 접두사로, 이 모델이 텍스트·영상·이미지·소리·행동 신호처럼 서로 다른 형태의 정보를 하나의 AI가 동시에 받아들이고 만들어낼 수 있다는 의미다.
엔비디아 Cosmos 연구소 부사장 밍위 리우(Ming-Yu Liu)는 더 딥뷰와의 인터뷰에서 "물리 AI 개발자들이 더 범용적인 물리 AI 모델을 구축할 수 있도록 Cosmos 3을 만들었다"고 밝혔다.
이번 모델의 기술적 핵심은 크게 세 가지다. 첫째, '혼합 트랜스포머(mixture-of-transformers)'라는 새로운 구조를 채택했다 .
트랜스포머는 현재 대부분의 AI 모델이 채택한 핵심 연산 구조로, Cosmos 3은 '추론용 트랜스포머'와 '생성용 트랜스포머'를 결합해 물체 간 상호작용, 움직임, 시공간적 관계를 먼저 이해한 뒤 영상이나 행동 경로를 만들어낸다 . 이는 마치 사람이 '공을 던지면 어떻게 날아갈까'를 머릿속으로 그려보고 실제로 던지는 것처럼, AI도 행동하기 전에 결과를 먼저 예측하는 방식이다.
둘째, 이전 모델들이 특정 데이터 유형을 우선시했던 것과 달리, Cosmos 3은 이미지·영상·소리·행동 정보를 텍스트와 함께 동등하게 처리한다고 리우 부사장은 강조했다.
셋째, 20조 개의 토큰(AI가 처리하는 데이터의 최소 단위), 10억 장의 이미지, 4억 개의 실제 및 합성 영상으로 구성된 물리 AI 분야 최대 규모의, 글·영상·소리를 망라한 복합 데이터로 학습됐다.
모델은 용도에 따라 세 가지 크기로 제공된다.
높은 물리 정확도가 요구되는 작업을 위한 '슈퍼'와 빠른 생성이 필요한 경량 버전 '나노'는 현재 이용 가능하며, 엣지 컴퓨팅(클라우드가 아닌 현장 기기에서 직접 실행하는 방식)용 실시간 추론 모델 '엣지'는 곧 출시될 예정이다.
엣지 컴퓨팅 버전은 공장 로봇이나 자율주행 차량처럼 인터넷 연결 없이도 현장에서 즉각 판단이 필요한 환경에 특히 중요하다.
모든 모델은 오픈소스로 공개된다.
리우 부사장은 "API(응용프로그램 인터페이스)만으로는 물리 AI 개발이 쉽지 않다"며, 오픈소스 제공이 개발자들에게 더 많은 제어권과 활용성을 부여한다고 설명했다. 기업들은 이 모델을 자체 환경에서 직접 실행하고, 자신들의 요구에 맞게 커스터마이징하며, 데이터 보안도 강화할 수 있다.
그러나 엔비디아 스스로도 Cosmos 3이 물리 AI의 모든 문제를 해결하지는 못한다는 점을 인정한다. "물리 AI에서 해결해야 할 핵심 과제는 AI 에이전트의 범용화 능력이라고 본다. 분명히 말하지만, 아직 그 문제를 풀지는 못했다. 하지만 이 구조는 로봇공학의 '성배'라고 생각하는 것을 해결할 훌륭한 토대를 제공한다"고 리우 부사장은 강조했다.
여기서 '범용화 능력'이란 AI 로봇이 특정 환경이나 작업만 수행하는 것을 넘어, 새로운 상황에서도 스스로 적응하는 능력을 뜻한다.
더 딥뷰는 이번 공개가 엔비디아의 비즈니스 전략과도 맞닿아 있다고 분석했다.
개방형 모델 생태계를 육성함으로써 엔비디아는 생태계 전체의 혁신을 촉진하는 동시에, 물리 AI 확산이 결국 더 많은 컴퓨팅 수요로 이어져 자사 반도체 매출 증대로 귀결된다는 구조다.
한 척의 배가 물에 뜨면 주변의 모든 배도 함께 떠오른다는 영어 속담처럼, 엔비디아의 기술 공개는 업계 전반의 성장을 이끌 촉매제로 기대를 모으고 있다.
- Copyright, SNS 타임즈 www.snstimes.kr