허깅페이스3 허깅페이스, sLM용 테스트-타임 스케일링 기술 공개 최근 허깅페이스(Hugging Face)는 소형 언어 모델(sLM)의 추론 성능을 획기적으로 향상시킬 수 있는 기술인 '테스트-타임 스케일링(Test-Time Scaling)'을 오픈 소스로 공개했습니다. 이 기술은 대형 언어 모델(LLM)의 성능을 소형 모델에서도 활용할 수 있게 해 주며, 특히 메모리가 제한적인 환경에서 뛰어난 효과를 발휘할 수 있습니다. 테스트-타임 스케일링: 소형 모델의 한계를 넘다테스트-타임 스케일링은 추론 시 추가적인 컴퓨팅 자원과 시간을 투입해 모델의 응답 품질을 높이는 방법입니다. 이는 오픈AI의 '테스트-타임 컴퓨트(Test-Time Compute)' 방식과 유사하며, 다음과 같은 주요 특징을 포함합니다:응답 정확도 향상: 추가 컴퓨팅을 통해 복잡한 질문에 대해 더 정확한.. 2024. 12. 23. 메타, 소형 온디바이스 AI 모델 ‘모바일LLM’ 정식 출시: 모바일 AI의 새 시대 열다 메타(Meta)가 모바일과 소형 장치를 위한 효율적인 온디바이스 AI 모델 ‘모바일LLM(MobileLLM)’ 제품군을 정식 출시했다. 이는 인공지능의 현장 적용성을 높이는 중요한 진전으로, 모바일 환경에서도 고성능 AI 기술을 사용할 수 있는 길을 열었다.모바일에 최적화된 AI: 모바일LLM이란?메타의 모바일LLM은 휴대폰과 기타 소형 기기에서 실행할 수 있도록 설계된 소형 언어 모델(sLM)이다. 이번에 공개된 모델은 모바일LLM-125M, 모바일LLM-350M, 모바일LLM-600M, 모바일LLM-1B 등 네 가지 버전으로, 매개변수(parameter) 수는 각각 1억2500만 개에서 최대 10억 개에 달한다. 이 모델들은 메모리와 전력 소모가 제한된 환경에서도 원활하게 작동하도록 최적화되어 있다... 2024. 11. 2. 엔비디아, 오픈AI와 앤트로픽을 능가하는 대형 언어 모델(LMM) 출시 - AI 생태계의 새로운 패러다임 엔비디아가 AI 모델 시장에서 다시 한 번 주목받고 있습니다. 이달 초, 대형 멀티모달 모델(LMM)을 선보이며 오픈AI와 같은 주요 경쟁자들과의 모델 경쟁을 선언했던 엔비디아가 이번에는 대형 언어 모델(LLM)도 공개했습니다. 이 모델은 벤치마크 테스트에서 오픈AI의 'GPT-4o'와 앤트로픽의 '클로드 3.5 소네트'를 뛰어넘는 성능을 기록해 큰 화제가 되었습니다. 엔비디아의 새로운 LLM, '라마 3.1-네모트론-70B-인스트럭트' 공개벤처비트에 따르면, 엔비디아는 별다른 홍보 없이 허깅페이스 플랫폼을 통해 '라마 3.1-네모트론-70B-인스트럭트'를 출시했습니다. 이 모델은 엔비디아 전용 플랫폼에서 무료로 사용해볼 수 있어 많은 사용자들이 쉽게 접근할 수 있습니다. 무엇이 특별한가?이번 모델의 .. 2024. 10. 19. 이전 1 다음