엔비디아, 오픈AI와 앤트로픽을 능가하는 대형 언어 모델(LMM) 출시 - AI 생태계의 새로운 패러다임
본문 바로가기
AI Insight News

엔비디아, 오픈AI와 앤트로픽을 능가하는 대형 언어 모델(LMM) 출시 - AI 생태계의 새로운 패러다임

by AI.PixelMind 2024. 10. 19.
반응형

엔비디아가 AI 모델 시장에서 다시 한 번 주목받고 있습니다. 이달 초, 대형 멀티모달 모델(LMM)을 선보이며 오픈AI와 같은 주요 경쟁자들과의 모델 경쟁을 선언했던 엔비디아가 이번에는 대형 언어 모델(LLM)도 공개했습니다. 이 모델은 벤치마크 테스트에서 오픈AI의 'GPT-4o'와 앤트로픽의 '클로드 3.5 소네트'를 뛰어넘는 성능을 기록해 큰 화제가 되었습니다.

 

(사진=엔비디아) 출처 : AI타임스(https://www.aitimes.com)

 

엔비디아의 새로운 LLM, '라마 3.1-네모트론-70B-인스트럭트' 공개


벤처비트에 따르면, 엔비디아는 별다른 홍보 없이 허깅페이스 플랫폼을 통해 '라마 3.1-네모트론-70B-인스트럭트'를 출시했습니다. 이 모델은 엔비디아 전용 플랫폼에서 무료로 사용해볼 수 있어 많은 사용자들이 쉽게 접근할 수 있습니다.

 

무엇이 특별한가?


이번 모델의 가장 큰 특징은 '강화 학습(RLHF)'과 고품질 데이터셋을 활용해 개발되었다는 점입니다. 엔비디아는 인간 피드백을 통해 모델을 미세 조정하여 더욱 정확한 응답을 할 수 있도록 했으며, 추가적인 프롬프트나 특수 토큰 없이 복잡한 질문도 빠르게 처리할 수 있도록 설계했습니다. 예를 들어, '딸기에는 r이 몇 개 있나요?'라는 질문에 대해 정확하게 답변하는 능력을 보여주었습니다.

 

벤치마크에서 압도적인 성능


이번 모델은 여러 주요 평가에서 인상적인 성능을 보였습니다. '아레나 하드벤치'에서는 85.0이라는 높은 점수를 기록했고, '알파카이벨 2 LC'에서는 57.6, 'GPT-4-터보 MT-벤치'에서는 8.98을 기록했습니다. 이는 오픈AI의 GPT-4o와 앤트로픽의 클로드 3.5 소네트를 능가하는 결과입니다. 이러한 성능은 현존하는 LLM 중 최강의 모델이라는 평가를 받고 있습니다.

이미지를 누르면 확대됩니다.

LMM을 통한 경쟁력 강화와 생태계 구축


이번 LLM 발표에 앞서 엔비디아는 'NVLM-D-72B'라는 오픈 소스 LMM도 공개한 바 있습니다. 이 모델 또한 여러 벤치마크에서 GPT-4o, 클로드 3.5 소네트, 제미나이 1.5 프로, 라마 3-V 405B와 비슷하거나 더 나은 성능을 보여주었습니다. 이를 통해 엔비디아가 AI 모델 경쟁에서 본격적으로 발을 들여놓은 것이 아니냐는 분석이 나오고 있습니다.

엔비디아는 이번 LLM 출시가 단순히 모델 성능에서의 경쟁이 아니라, CUDA와 같은 생태계를 구축하려는 전략의 일환으로 보고 있습니다. 자사의 인프라에 최적화된 AI 모델을 무료로 제공하면서, 사용자들이 더 많은 비용 효율적인 옵션을 선택하도록 유도하고 있는 것입니다.

 

결론: AI 생태계의 주도권을 노리는 엔비디아


엔비디아의 이러한 움직임은 AI 시장의 생태계를 바꾸려는 전략으로 풀이됩니다. 강력한 인프라와 모델 성능을 바탕으로 비용 효율성을 높이고, 사용자들에게 더 나은 AI 경험을 제공함으로써 AI 기술의 주도권을 잡겠다는 것입니다. 오픈AI와 앤트로픽을 능가하는 성능을 자랑하는 새로운 LLM 모델과 더불어, 엔비디아의 AI 생태계 구축이 앞으로 어떻게 전개될지 주목할 필요가 있습니다.

 

 

 

 

 

 

 

 

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

반응형