Test time compute와 Chain-of-thought의 모델 성능 향상
Why We Think
Test time compute(Graves et al. 2016, Ling et al. 2017, Cobbe et al. 2021)와 Chain-of-thought(CoT)(Wei et al. 2022, Nye et al. 2021)의 사용이 모델 성능에 상당한 개선을 가져왔으며, 이와 관련된 많은 연구 질문이 제기되고 있다. 이 글은 테스트 시간 계산을 효과적으로 사용하는 방법과 그 이유를 검토하는 것을 목표로 한다.
한국 개발자는 모델 성능 향상을 위해 Test time compute와 Chain-of-thought 기법을 적용할 수 있다.
원문 출처
Lil'Log (Lilian Weng)