잘난 척을 위한 한 줄 요약테스트 타임 스케일링 법칙은 “모델을 더 크게 다시 학습시키지 않아도, 답을 내기 전에 더 오래 생각하게 하거나 여러 번 시도하게 하면 성능이 꽤 규칙적으로 좋아질 수 있다”는 경험 법칙이다. 테스트 타임 스케일링 법칙, AI는 왜 더 오래 생각하게 하면 더 똑똑해 보일까먼저, 이 말이 뭘 뜻하는지부터테스트 타임 스케일링(test-time scaling) 또는 인퍼런스 타임 스케일링(inference-time scaling)은 모델을 사용할 때 더 많은 계산 자원을 투입해서 성능을 높이는 흐름을 말한다. 쉽게 말해, 학습을 다시 시키는 대신 답변 전에 더 오래 생각하게 하거나, 여러 후보 답을 만들어 비교하게 하거나, 더 긴 추론 과정을 허용하는 방식이다. OpenAI는 o1을..