
27일 'AI 프론티어 국제 심포지엄'
기조연설에서 '월드모델' 훈련 설명얀르 쿤 교수는 27일 "기존의 거대언어모델(LLM)은 5년 이내에 구식이 될 것"이라며 "텍스트 기반 학습만으론 인간 수준의 인공지능(AI)에 도달할 수 없으며, 감각 입력을 통한 세계 이해가 필수적"이라고 밝혔다.
얀르 쿤 교수가 27일 서울 용산에서 열린 'AI 프론티어 국제 심포지엄'에서 기조연설을 하고 있다. 김보경 기자
그는 이날 서울 용산 드래곤시티에서 열린 'AI 프론티어 국제 심포지엄' 기조연설에서 이같이 말했다. 얀르 쿤 교수는 'AI 4대 석학' 중 한명이자 미국 뉴욕에 위치한 '글로벌 AI 프론티어랩' 공동 소장이다.
그는 "진정한 지능형 기계를 만들려면 앞으로 몇번의 혁명이 더 필요하다"고 운을 떼며 그동안 주창해온 '월드 모델(World Model)' 개념에 대해 설명했다.
월드 모델은 태어난 지 몇 달 안 된 아기가 세상을 관찰하면서 형성하는 개념과 비슷하다. 아기처럼 시각, 청각, 촉각 등 다양한 감각으로 물리 세계를 이해하는 능력을 갖춰야 인간 수준의 지능에 도달할 수 있다는 게 얀 르쿤 교수의 견해다.
월드 모델은 현재시점(t)을 기반으로 다음 상태(t+1)를 예측하는 개념이기도 하다. t+1 예측은 AI가 물리 법칙, 인과관계, 환경 변화를 학습하고 시뮬레이션할 수 있게 해준다. 단순히 데이터를 기억하는 게 아니라 세상의 작동 원리를 이해하고 예측하는 AI를 만드는 데 목적을 두고 있다.
그는 "현재 AI 아키텍처는 매우 형편없다. 지금의 AI 시스템들은 인간이나 동물의 지능과 비교도 되지 않는다"면서 "물리적 세계를 이해하는 측면에서 집고양이만큼 똑똑하지 않다"고 평가했다.
또한 그는 인간의 지능은 일반적이지 않고, 전문화돼있기 때문에 '일반인공지능(AGI)'이라는 표현을 좋아하지 않는다고 했다. 그러면서 "우리가 목표로 해야 할 것은 세계에 대한 이해와 물리적 추론이 가능한 고도 지능"이라고 강조했다.
그는 JEPA(Joint Embedding Predictive Architecture, 공동 임베딩 예측 아키텍처) 개념을 제안하며 픽셀 단위로 미래를 정확히 예측하는 건 불가능하고, 추상적 표현 공간에서 예측하는 게 적합하다고 밝혔다.
그는 "JEPA는 입력과 예측 대상을 각각 인코더로 변환해 그 표현 공간에서 예측을 수행한다. 추상화를 통해 예측 가능한 수준에서 모델을 만든다"며 "이것이 지능의 본질"이라고 했다.
그는 인간과 동물처럼 사고하려면 AI 구조가 ▲현재 상태를 관찰하고 ▲단기 기억과 결합해 세계 모델을 통해 여러 행동 시퀀스를 시뮬레이션하고 ▲목표를 만족시키는 행동을 선택해야 한다고 말했다.
얀르 쿤 교수는 "물리적 세계 이해, 추론, 플래닝 등 기존 LLM이 해결하지 못하는 영역에 집중할 것"이라며 "JEPA 스타일 아키텍처가 대세가 될 것"이라고 내다봤다.
기조연설에서 '월드모델' 훈련 설명얀르 쿤 교수는 27일 "기존의 거대언어모델(LLM)은 5년 이내에 구식이 될 것"이라며 "텍스트 기반 학습만으론 인간 수준의 인공지능(AI)에 도달할 수 없으며, 감각 입력을 통한 세계 이해가 필수적"이라고 밝혔다.
그는 이날 서울 용산 드래곤시티에서 열린 'AI 프론티어 국제 심포지엄' 기조연설에서 이같이 말했다. 얀르 쿤 교수는 'AI 4대 석학' 중 한명이자 미국 뉴욕에 위치한 '글로벌 AI 프론티어랩' 공동 소장이다.
그는 "진정한 지능형 기계를 만들려면 앞으로 몇번의 혁명이 더 필요하다"고 운을 떼며 그동안 주창해온 '월드 모델(World Model)' 개념에 대해 설명했다.
월드 모델은 태어난 지 몇 달 안 된 아기가 세상을 관찰하면서 형성하는 개념과 비슷하다. 아기처럼 시각, 청각, 촉각 등 다양한 감각으로 물리 세계를 이해하는 능력을 갖춰야 인간 수준의 지능에 도달할 수 있다는 게 얀 르쿤 교수의 견해다.
월드 모델은 현재시점(t)을 기반으로 다음 상태(t+1)를 예측하는 개념이기도 하다. t+1 예측은 AI가 물리 법칙, 인과관계, 환경 변화를 학습하고 시뮬레이션할 수 있게 해준다. 단순히 데이터를 기억하는 게 아니라 세상의 작동 원리를 이해하고 예측하는 AI를 만드는 데 목적을 두고 있다.
그는 "현재 AI 아키텍처는 매우 형편없다. 지금의 AI 시스템들은 인간이나 동물의 지능과 비교도 되지 않는다"면서 "물리적 세계를 이해하는 측면에서 집고양이만큼 똑똑하지 않다"고 평가했다.
또한 그는 인간의 지능은 일반적이지 않고, 전문화돼있기 때문에 '일반인공지능(AGI)'이라는 표현을 좋아하지 않는다고 했다. 그러면서 "우리가 목표로 해야 할 것은 세계에 대한 이해와 물리적 추론이 가능한 고도 지능"이라고 강조했다.
그는 JEPA(Joint Embedding Predictive Architecture, 공동 임베딩 예측 아키텍처) 개념을 제안하며 픽셀 단위로 미래를 정확히 예측하는 건 불가능하고, 추상적 표현 공간에서 예측하는 게 적합하다고 밝혔다.
그는 "JEPA는 입력과 예측 대상을 각각 인코더로 변환해 그 표현 공간에서 예측을 수행한다. 추상화를 통해 예측 가능한 수준에서 모델을 만든다"며 "이것이 지능의 본질"이라고 했다.
그는 인간과 동물처럼 사고하려면 AI 구조가 ▲현재 상태를 관찰하고 ▲단기 기억과 결합해 세계 모델을 통해 여러 행동 시퀀스를 시뮬레이션하고 ▲목표를 만족시키는 행동을 선택해야 한다고 말했다.
얀르 쿤 교수는 "물리적 세계 이해, 추론, 플래닝 등 기존 LLM이 해결하지 못하는 영역에 집중할 것"이라며 "JEPA 스타일 아키텍처가 대세가 될 것"이라고 내다봤다.
댓글목록
등록된 댓글이 없습니다.