AI의 다음 진화= '공간 지능'... "말하기 넘어, 보고 이해하기로"
스탠퍼드 AI 석학 "공간지능이 차세대 인공지능의 핵심"
[SNS 타임즈- LA] AI 전문 조사기관 'The Deep View'는 최근 연구 조사한 발표에서, 인공지능 기술의 다음 혁신은 대규모 언어모델(LLM)이 아닌 '공간지능(Spatial Intelligence)'에서 나올 것으로 전망했다.
스탠퍼드대학교 컴퓨터공학과 교수이자 스탠퍼드 인간중심 AI 연구소(Human-Centered AI Institute) 공동 창립이사인 페이페이 리(Fei-Fei Li) 박사는 지난 10일 발표한 에세이에서 공간지능을 '인지능력이 구축되는 토대'라고 정의했다.
공간지능, 인간 수준엔 아직 멀어
공간지능이란 AI가 시각적으로 세상을 이해하는 능력을 의미한다.
리 박사는 인간의 지능 진화를 이끈 핵심 요소가 '인식과 행동의 순환'이라며, 기계는 아직 순간적인 판단이나 몸짓을 통한 의사소통 같은 공간지능의 '유창함'을 달성하지 못했다고 지적했다.
대규모 이미지 학습 벤치마킹 도구인 이미지넷(ImageNet)을 창립한 리 박사는 멀티모달 언어모델이나 영상 생성 도구 등 이 분야에서 상당한 진전이 있었지만, "공간 능력은 여전히 인간 수준과는 거리가 멀다"고 평가했다.
차세대 AI의 목표: 세계모델 구축
리 박사가 제시한 다음 단계의 과제는 '세계모델(World Model)' 구축이다. 이는 현실과 가상의 역동적이고 복잡한 세계를 이해할 수 있는 AI 모델을 말한다.
우수한 세계모델은 세 가지 특성을 갖춰야 한다.
첫째, 물리법칙에 일관된 결과물 생성, 둘째, 다양한 형태의 입력 정보 이해, 셋째, '다음 상태'를 예측하는 능력이다.
이러한 과제의 범위는 광범위하지만, 실현될 경우 얻을 수 있는 성과는 막대하다. 단기적으로는 창의성 향상, 중기적으로는 로봇공학 발전, 장기적으로는 교육과 과학적 발견의 혁신을 가져올 수 있다는 것이다.
리 박사는 "진정으로 지능적인 기계를 향한 우리의 꿈은 공간지능 없이는 완성될 수 없다"고 강조했다.
언어모델 확장만으론 한계
이번 에세이는 AI의 진정한 가치 실현이 단순히 언어모델을 더 크고 우수하게 만드는 것을 넘어서야 한다는 점을 시사한다.
현재 주요 AI 개발사들이 서로의 대규모 언어모델을 능가하는 데 집중하고 있지만, 스타트업과 빅테크 기업들 모두 공간지능 강화에 자원을 투입하기 시작했다.
리 박사만이 이러한 주장을 펼치는 것은 아니다.
메타 AI의 수석 과학자인 얀 르쿤(Yann LeCun)도 지난 5월 저널리스트 알렉스 칸트로위츠와의 인터뷰에서 "대규모 언어모델의 규모를 키우는 것만으로는 인간 수준의 AI에 도달할 수 없다"고 유사한 견해를 밝힌 바 있다.
- Copyright, SNS 타임즈 www.snstimes.kr