Tag: 기술연구

작은 AI 모델은 왜 멍청할까? '임베딩 응축' 현상의 해결책

소형 언어 모델의 성능을 향상시키는 새로운 훈련 방법인 '분산 손실(Dispersion Loss)'과 임베딩 응축 현상에 대해 설명합니다.