Tag: 深度学习

小型AI模型为何表现欠佳?“嵌入压缩”现象的解决方案

介绍了一种名为“分散损失(Dispersion Loss)”的新型训练方法,该方法通过解决嵌入压缩现象,提升了小型语言模型的性能。

每秒5.6万个单词?以老旧时钟速度完成的AI魔法'GateGPT'

在比智能手机还慢的80MHz芯片上,每秒生成5.6万个Token的GateGPT的秘密。以普通人的视角,通俗易懂地解释Transformer、KV缓存和FPGA的原理。

因为AI太危险而隐藏起来了?揭秘2019年震惊世界的‘GPT-2’事件始末

OpenAI曾因GPT-2模型‘太危险’而拒绝向公众开放。在担忧人工智能制造虚假新闻与指责其‘博眼球’的争论中,究竟发生了什么?为您深度解读。

连开发者都不知道 AI 是如何运作的?“深度学习理论”的惊人演进

从智能手机语音助手到癌症诊断,深度学习 AI 改变了我们的生活。但你是否知道,直到最近,科学家们也并不完全清楚 AI 为何如此聪明的数学原理?本文将带你深入浅出地了解揭开人工智能奥秘的“深度学习理论”世界。

[GPT-5.5 的屈辱] “背诵大王” AI,在陌生的游戏面前仅得 0.43 分?追问真正的智能

深入浅出地解释为什么最新的 AI 模型 GPT-5.5 虽然征服了现有的基准测试,却在新的推理测试 ARC-AGI-3 中惨败。

AI 重新开始“学习”了?谷歌全新智能助手 T5Gemma 的故事

介绍谷歌最新发布的 AI 模型 T5Gemma。我们将从专家的视角,深入浅出地解析比现有模型更聪明、更高效的“编码器-解码器”结构秘密,以及它在图像阅读、长文本摘要方面的能力。

与海豚对话的时代即将到来?谷歌全新 AI 'DolphinGemma' 的故事

了解谷歌发布的海豚语言翻译 AI 'DolphinGemma'。学习了 40 年数据的这款 AI 将如何帮助人类与动物进行沟通?