0002209077_001_20251108124108911.jpg?type=w800

[인더AI] AI의 새로운 통화
엔비디아(NVIDIA)가 미국 애리조나에서 차세대 인공지능(AI) 칩 ‘블랙웰(Blackwell)’의 양산을 공식적으로 시작했다. [사진=엔비디아]


[디지털데일리 김문기 기자] GPU 중심의 엔비디아 제국은 여전히 강력하지만, 독점의 무게가 균열을 만들기 시작했다. AMD와 인텔, AWS와 구글, 국내 신생 반도체 기업들까지 각자의 방식으로 그 균열을 넓히고 있다.

엔비디아의 생태계는 CUDA라는 언어를 중심으로 완벽하게 통제돼 있다. 그러나 최근 몇 년간 이 독점 구조를 깨려는 움직임이 전 세계에서 본격화됐다.

가장 먼저 반격에 나선 건 AMD다. MI300X를 앞세운 AMD는 하드웨어보다 생태계를 먼저 건드렸다. 폐쇄형 CUDA에 맞서 오픈소스 병렬연산 프레임워크 ROCm을 개방했고, 오픈AI와 메타, 마이크로소프트 등 주요 AI 기업들이 테스트에 나서며 ‘탈 CUDA’라는 흐름이 현실화됐다.

인텔은 CPU 시대의 유산을 바탕으로 가우디(Gaudi) 시리즈를 내세웠다. GPU 대신 신경망 처리장치(NPU) 구조를 선택했고, 그 위에 올린 oneAPI는 하드웨어 종류에 구애받지 않는 통합 프로그래밍 언어로 평가받고 있다.

반도체 기업들의 도전이 기술적 전환이라면, 클라우드 기업들의 움직임은 산업 질서의 재편이다. AWS는 자체 칩 트레이니엄(Trainium) 2와 인퍼런시아(Inferentia) 3를 투입해 내부 AI 워크로드의 70% 이상을 GPU 없이 처리하기 시작했다. 구글은 TPU v5를 통해 초거대 언어모델의 학습을 전면 자사 인프라에서 수행한다. 메타 역시 MTIA(Meta Training and Inference Accelerator)를 기반으로 라마(Llama) 학습 효율을 끌어올렸다.

이들 기업은 GPU의 납기와 가격, 공급망의 리듬에서 벗어나겠다는 목표 아래 클라우드가 스스로 칩을 설계하고 있다.

이 변화는 연산의 표준을 다원화시키고 있다. 트리톤(Triton), ROCm, oneAPI, XLA 같은 오픈소스 프레임워크가 CUDA의 자리를 노리고 있다.

엔비디아기 서울서 ‘지포스 게이머 페스티벌’을 개최했다. 사진은 무대에 오른 젠슨 황 엔비디아 창립자 겸 CEO [사진=엔비디아]


이 균열의 파장은 국내에서도 발현됐다. 리벨리온, 퓨리오사AI 등이 ‘포스트 엔비디아’ 시대를 가장 가까이서 실험하고 있다. 리벨리온은 범용 GPU 대신 전력 효율을 극단적으로 끌어올린 ‘아톰(ATOM)’과 ‘아이온(ION)’을 내세워, 대형 데이터센터보다 경량형 AI 학습 환경에 집중했다. 삼성전자와 협력해 4나노 공정 기반 차세대 칩을 개발 중이며, SK텔레콤이 주요 투자자로 참여했다.

퓨리오사AI는 학습보다 추론에 특화된 칩 ‘워리어(Warrior)’를 공개했다. 네이버의 하이퍼클로바X 일부 모듈에 적용하며 실시간 추론 속도에서 엔비디아 대비 효율을 증명했다. 사피온(SAPEON)은 SK그룹 내 자원을 묶어 그룹형 AI 반도체 생태계를 구축하고 있다. SK하이닉스의 메모리, SK브로드밴드의 네트워크, SK C&C의 클라우드가 유기적으로 맞물리며, 독립적인 AI 서버 칩 ‘X330’, ‘X340’이 상용화 단계에 들어섰다.

이들은 공통적으로 작고 효율적인 분산형 구조에 맞춰져 있다. 초대형 데이터센터를 전제로 하지 않고, 전력과 인프라가 제한된 환경에서도 충분히 돌아가는 시스템이다. 엔비디아의 거대한 팩토리에 맞서는 한국의 길은 ‘소형·고효율·자립형’이다. 국산 칩의 성능이 H100을 당장 따라잡지는 못하지만, 한정된 자원으로도 의미 있는 AI 서비스를 지속할 수 있다는 사실 자체가 경쟁력이 될 수 있다.

정부 역시 AI 반도체 자립을 국가 전략으로 전환했다. 과기정통부는 ‘AI 반도체 고도화 2단계’ 사업을 통해 학습·추론용 국산 칩 실증을 추진하고 있으며, 국가 AI 팩토리 프로젝트 내에서도 국산 가속기 테스트베드를 포함시키는 방안을 검토 중이다.

다만 하드웨어만으로는 부족하다. CUDA에 맞춰진 개발 환경을 벗어나지 못하면, 국산 칩은 여전히 외부 표준 위에 서게 된다. 따라서 하드웨어 자립과 함께 소프트웨어 스택의 개방이 병행돼야 한다. 오픈소스 기반의 ‘K-컴퓨트 스택’, 즉 한국형 연산 프레임워크가 필요한 이유다.

엔비디아가 만든 중앙집중형 구조는 여전히 견고하지만, 그 아래에서는 이미 새로운 질서가 태동하고 있다. AMD와 인텔, 클라우드 3대 기업은 각자의 화폐를 발행하고 있고, 국내 신생 기업들은 자국형 연산 질서를 세우기 위해 노력하고 있다.