최근 허깅페이스(Hugging Face)는 소형 언어 모델(sLM)의 추론 성능을 획기적으로 향상시킬 수 있는 기술인 '테스트-타임 스케일링(Test-Time Scaling)'을 오픈 소스로 공개했습니다. 이 기술은 대형 언어 모델(LLM)의 성능을 소형 모델에서도 활용할 수 있게 해 주며, 특히 메모리가 제한적인 환경에서 뛰어난 효과를 발휘할 수 있습니다.
테스트-타임 스케일링: 소형 모델의 한계를 넘다
테스트-타임 스케일링은 추론 시 추가적인 컴퓨팅 자원과 시간을 투입해 모델의 응답 품질을 높이는 방법입니다. 이는 오픈AI의 '테스트-타임 컴퓨트(Test-Time Compute)' 방식과 유사하며, 다음과 같은 주요 특징을 포함합니다:
- 응답 정확도 향상: 추가 컴퓨팅을 통해 복잡한 질문에 대해 더 정확한 답변을 생성합니다.
- LLM 수준의 성능 구현: 소형 모델(sLM)도 대형 모델(LLM)에 준하는 성능을 발휘할 수 있도록 돕습니다.
- 메모리 최적화: 대형 모델을 실행할 수 없는 환경에서도 고성능 AI 추론을 가능하게 합니다.
주요 구성 요소
테스트-타임 스케일링은 다음과 같은 기법과 알고리즘으로 구성됩니다:
- 다수결 투표 (Majority Voting)
동일한 질문을 여러 번 추론하여 가장 자주 등장하는 답을 선택하는 방식으로 간단한 문제에서 효과적입니다. - 베스트 오브 N (Best-of-N)
여러 답변을 생성한 뒤, 보상 모델(reward model)을 활용해 최적의 답을 선택합니다. - 가중 베스트 오브 N (Weighted Best-of-N)
베스트 오브 N 방식을 개선한 것으로, 답변의 일관성과 자신감을 평가해 최적의 결과를 도출합니다. - 프로세스 보상 모델 (PRM)
최종 답변뿐만 아니라 답변 생성 과정을 평가하여 최적의 경로를 찾아냅니다. - 빔 탐색 (Beam Search)
단계별로 답변을 생성하고 탐색 알고리즘을 적용해 최적의 답변을 찾아내는 방식으로, 복잡한 문제에서 효과적입니다. - DVTS (Diverse Verifier Tree Search)
빔 탐색의 변형으로, 다양한 경로를 탐색하여 잘못된 추론을 줄이고 최적의 답을 도출합니다. - 연산 최적화 확장 전략 (Compute-Optimal Scaling Strategy)
문제의 난이도에 따라 동적으로 최적의 추론 방식을 선택합니다.
실험 결과: 소형 모델로 대형 모델을 능가하다
테스트-타임 스케일링과 함께 PRM 및 DVTS를 적용한 '라마-3.2 1B' 모델은, 난이도가 높은 MATH-500 벤치마크에서 더 큰 크기의 8B 모델에 근접한 성능을 기록했습니다. 심지어, 3B 모델은 특정 과제에서 70B 모델을 능가하는 결과를 보였습니다.
기술의 한계와 미래 가능성
허깅페이스는 테스트-타임 스케일링이 코딩, 수학 문제 등 명확한 평가가 가능한 분야에서만 높은 성능을 발휘한다고 설명했습니다. 또한 이 기술은 병렬로 실행되는 두 개 이상의 모델을 필요로 하므로, 추가적인 리소스가 요구될 수 있습니다.
그럼에도 불구하고, 허깅페이스의 오픈 소스화는 기업들이 환각 문제나 비용 부담 없이 고성능 AI 모델을 활용할 수 있도록 돕는 중요한 발걸음으로 평가됩니다.
결론
테스트-타임 스케일링은 소형 모델에서도 대형 모델에 가까운 성능을 발휘할 수 있는 새로운 가능성을 열어주었습니다. 허깅페이스의 이 기술은 특히 리소스가 제한적인 환경에서 고성능 AI 활용을 고민하는 기업들에게 유용하며, AI의 상용화를 더욱 가속화할 전망입니다.
링크타고 아무거나 구입하기:
https://link.coupang.com/a/cytAXf
로켓배송으로 빠르게, 로켓와우 멤버십으로 할인과 무료 반품까지 | 쿠팡
쿠팡 로켓배송, 로켓프레시, 로켓직구, 로켓럭셔리까지 쿠팡 멤버십으로 모든 헤택을 한 번에 누려보세요. 쿠팡 와우회원은 무료배송도 가능합니다
www.coupang.com
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.
원문 출처
'AI Insight News' 카테고리의 다른 글
오픈AI와 구글, 휴머노이드 로봇 개발로 AI와 하드웨어 융합 가속화(유료광고 포함) (1) | 2024.12.25 |
---|---|
"국방 AI가 대세"…팔란티어-안두릴, 오픈AI·스페이스X 등과 국방부 입찰 컨소시엄 구성(유료광고 포함) (2) | 2024.12.24 |
오픈AI, 챗GPT의 새로운 에이전트 기능 공개: "복붙 없이 앱과 직접 작업"(유료광고 포함) (4) | 2024.12.22 |
인스타그램, AI 동영상 생성 도구 '무비젠' 공개 티저: 개인화된 영상의 새로운 가능성(유료광고 포함) (2) | 2024.12.21 |
오픈AI, AGI에 근접한 혁신적 모델 'o3' 공개: AI의 새로운 시대 열다(유료광고 포함) (3) | 2024.12.21 |