AI 모델의 지능을 측정하는 새로운 방식인 캐글 게임 아레나와 기존 벤치마크의 한계를 쉬운 비유로 설명합니다.
현재의 AI 성능 측정 방식이 왜 한계에 부딪혔는지, 그리고 학계와 산업계가 제안하는 새로운 '진짜 지능' 측정법은 무엇인지 쉽게 설명해 드립니다.