Tag: 技術研究

為什麼小型 AI 模型這麼笨?解決「嵌入濃縮」現象的方案

介紹一種能提升小型語言模型性能的新型訓練方法「分散損失(Dispersion Loss)」,以及所謂的嵌入濃縮現象。

小さなAIモデルはなぜ頭が悪いのか?「埋め込み凝縮」現象への解決策

小型言語モデルの性能を向上させる新しい訓練手法である「分散損失(Dispersion Loss)」と、埋め込み凝縮現象について解説します。