https://www.youtube.com/watch?v=Jf8EPSBZU7Y
최근 일론 머스크의 AI 연구소 xAI가 엔비디아 H100 GPU 10만 장을 투입한 초대형 슈퍼컴퓨터 '콜로서스'의 내부를 최초 공개했습니다. 이는 미국 멤피스에 위치하며, AI 모델 훈련에 최적화된 슈퍼컴퓨팅 클러스터로서 큰 주목을 받고 있습니다. 콜로서스는 AI의 속도와 성능을 극대화하는 동시에, 미래 AI 연구를 위한 필수적인 인프라로 자리 잡을 계획입니다.
콜로서스의 강력한 구성과 기술적 성취
콜로서스는 엔비디아의 고성능 GPU 서버 시스템인 HGX H100을 기반으로 구성되어 있으며, 이 시스템은 각 서버에 8개의 H100 GPU를 탑재해 고성능을 발휘합니다. 액체 냉각 시스템이 적용된 4U 유니버설 GPU 시스템은, 효율적인 열 관리와 더불어 안정적인 운영을 보장합니다. 이 구성은 8개 서버가 모여 64개의 GPU를 이루는 하나의 랙을 형성하며, 랙은 다시 8개씩 그룹화되어 512개의 GPU 배열을 구성하게 됩니다. 이렇게 만들어진 GPU 배열이 약 200개에 달해 총 10만 개의 GPU가 동시에 작동하도록 설계되었습니다.
이번 프로젝트는 엔비디아와의 협력으로 더욱 강화된 성능을 보여주고 있습니다. 엔비디아의 CEO 젠슨 황은 10만 GPU 클러스터 설치가 19일 만에 이루어진 것에 대해 극찬했으며, 이는 AI 클러스터 구성의 속도와 효율성을 증명하는 사례로 평가받고 있습니다.
추가 확장과 네트워킹 기술 도입으로 향상될 성능
콜로서스는 아직 첫 번째 단계만 완성된 상태로, 향후 5만 개의 H100과 5만 개의 차세대 H200 GPU가 추가될 예정입니다. 이를 통해 총 20만 장의 GPU로 AI 모델의 훈련 속도와 효율성을 대폭 향상시킬 계획입니다. 특히 엔비디아의 이더넷 기반 네트워킹 기술이 적용되어 클러스터 간 빠른 데이터 전송과 효율적인 통신을 실현하였습니다. 이 기술은 AI 훈련 시 필요한 방대한 데이터 양을 효율적으로 처리하게 만들어, GPU 클러스터의 성능을 최대한 발휘할 수 있도록 지원합니다.
xAI의 AI 모델 '그록-3' 훈련 목표와 AI 산업에 미칠 영향
xAI는 콜로서스를 활용해 고도화된 AI 모델 '그록-3'을 훈련하고 있으며, 내년 초 공개를 목표로 하고 있습니다. 그록-3는 AI 연구소에서 의욕적으로 준비한 모델로, 실시간 대화와 자연어 처리 능력이 향상된 것이 특징입니다. 이 모델의 성공적인 훈련과 출시가 이루어진다면, AI 산업에 상당한 파급력을 미칠 것으로 예상됩니다. 특히 초대형 클러스터를 통해 훈련된 AI 모델은 다양한 분야에서 혁신적인 솔루션을 제공할 잠재력을 지니고 있습니다.
xAI의 콜로서스는 AI 슈퍼컴퓨터 분야의 새로운 기준을 제시하고 있습니다. AI의 성능 한계를 극복하려는 이번 시도는 일론 머스크가 말하는 ‘AI의 미래’를 실현하는 첫걸음으로 평가됩니다. AI 연구에 있어 독보적인 인프라를 갖춘 xAI는 앞으로도 지속적인 확장과 업그레이드를 통해 AI 기술의 선두주자로 자리매김할 것입니다.
"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."
'AI Insight News' 카테고리의 다른 글
메타, 소형 온디바이스 AI 모델 ‘모바일LLM’ 정식 출시: 모바일 AI의 새 시대 열다 (2) | 2024.11.02 |
---|---|
AI 검색 경쟁, 본격적으로 불붙다 – 오픈AI와 구글의 검색 기능 출시 (4) | 2024.11.01 |
오픈AI, 자체 AI 칩 개발 위해 브로드컴, TSMC와 협력…엔비디아 의존도 줄이기 전략 (1) | 2024.10.31 |
딥마인드가 제시하는 AI의 미래 – 시스템 2 사고로 더 똑똑해진 토커-리즈너 (1) | 2024.10.30 |
애플 인텔리전스: 애플의 새 AI 혁신, 주요 기능과 사용 가능 기기 알아보기 (3) | 2024.10.30 |