Tag: 브릿지벤치

Claude가 갑자기 멍청해졌다고? 83%에서 68%로 떨어진 성적표의 진실

최고의 AI 모델 중 하나인 클로드(Claude) 4.6의 성능 하락 논란과 브릿지벤치(BridgeBench) 환각 테스트 결과를 알기 쉽게 풀이합니다.