Tag: 小型言語モデル

小さなAIモデルはなぜ頭が悪いのか?「埋め込み凝縮」現象への解決策

小型言語モデルの性能を向上させる新しい訓練手法である「分散損失(Dispersion Loss)」と、埋め込み凝縮現象について解説します。