利用微调技术,将轻巧的适配器附加到大型语言模型(LLM)上,即使在个人笔记本电脑上,也能将 AI 完美地转变为您所需的领域专家。
想象一下。某天早晨,您对智能手机上的人工智能助手说:“帮我写一份我刚开发的应用的使用说明书。”通常情况下,它会立刻用流畅、现代的文体给出答案。但是,如果这个 AI 像坐了时光机一样,用 20 世纪 90 年代 Windows 95 时期那种生硬、笨拙的文体输出文字,会怎样呢?比如像“请将软盘插入驱动器后点击运行”这样充满复古情怀的话语。
令人惊讶的是,有人把这个有趣而又异想天开的想象变成了现实。最近,一位开发者成功地进行了一项实验,他训练最新的以人工智能像 20 世纪 80~90 年代的软件技术文档编写者(Technical writer)一样进行写作 [Fine-tuning an LLM to write docs like it’s 1995 - vuink.com]。这个故事不仅仅是一段复苏了昔日情怀的有趣插曲。这也是一个决定性的场景,向我们展示了人工智能技术已经脱离了巨头企业的掌控,深深地渗透到了我们平凡的日常和掌控之中。
在我们想象中,人工智能的开发总是宏大无比。我们认为那是在科技巨头的秘密实验室里,或是在散发着巨大热量的成千上万台计算机服务器的房间里才能实现的事情。然而,打造这个令人惊叹的“1995年情怀 AI 助手”的魔法,却是在您平时坐在咖啡馆里喝着咖啡、放在膝盖上使用的普通个人笔记本电脑上发生的。这一切究竟是如何成为可能的呢?
为什么这很重要? (Why It Matters)
我们通常认为像 ChatGPT 这样庞大的人工智能是“无所不知的万事通”。但是,企业或个人在实际生活和工作中真正需要的,并不是那种对所有领域都只懂个七八十分的“圆滑 AI”。我们真正渴望的是能够完美理解我们业务特性、像我们一样思考,并按我们的风格工作的“专属定制专家 AI”。这就好比即使在成衣店买的衣服再好,也比不上为您量身定做的衣服那样舒适。
将所有人都能免费获取的开源大型语言模型(LLM,一种通过阅读海量文本并学习,从而像人类一样理解语言的 AI)根据我们的目标进行训练,这一过程为我们极度个性化人工智能开启了巨大的潜能 [Fine Tune an open-source LLM - ashutosh.dev]。
举个例子?为需要查阅海量判例的律师配备的只使用生僻法律术语的助手、完全模仿我编程习惯的开发者专属帮手、甚至能将冗长乏味的会议记录按我口味精准提炼要点的秘书。所有这些顶级专家,现在我们都能亲手打造 [Fine Tune an open-source LLM - ashutosh.dev]。
这项技术的最大意义在于,它赋予了我们对人工智能的“绝对控制权”、“一致性”以及深度的“专业性” [Fine Tune an open-source LLM - ashutosh.dev]。过去,只有拥有数百亿韩元资本和天才研究员才能打造的“专用 AI”,现在即使是普通的个人开发者或街边的小企业也能轻松构建。可以说,一场人工智能权力的巨大转移已经拉开帷幕。
浅显易懂的讲解 (The Explainer)
所有这些魔法的核心,是一项被称为“微调(Fine-tuning)”的关键技术。虽然听起来有些技术性、让人感到陌生,但它的原理却惊人地贴近我们的日常生活。简单来说,微调就是一个特殊的训练过程,它让已经学习了海量通用知识的聪明的人工智能基础模型(Foundation LLM)再次适应特定的任务 [LLMs:Fine-tuning, distillation, and prompt engineering]。有趣的是,经过这种训练后,AI 在特定任务上的性能会飞跃式提升,但其整体体积却不会变得臃肿,而是保持原来的苗条状态 [LLMs:Fine-tuning, distillation, and prompt engineering]。
打个比方。刚下载的基础 AI 就像是一位以第一名成绩从名牌大学毕业的“极其聪明的职场新人”。这位新人通晓互联网上的世间万物,知识渊博。但是,由于他是第一次进入职场,对贵公司独特的审批文件格式或前辈们之间使用的黑话一窍不通。
这时,让这位聪明的新人坐在办公桌前,给他看 1000 份公司过去的文件,并教导他:“你的基础知识很棒,保持原样就好,但以后写文件时,必须完全模仿这些文件的风格。”这个在岗培训的过程,就是微调。在前面提到的 1995 年风格的文档编写实验中,相当于让这位新人阅读了大量 20 世纪 80 和 90 年代陈旧古板的技术文档,并让他进行高强度的表演训练,以模仿那个时代的人说话。
然而,这种特训过程并非总是顺风顺水。利用计算机训练模型本身可能成本较低,但决定这种训练成败的最大障碍在于必须收集足够多的“高质量训练数据” [Fine-tuninganLLMtowritedocslikeit’s1995– Fabrizio Ferri…]。为了训练出能让 AI 像 20 世纪 90 年代的人一样自然写作的个性化模型,就必须要有那个时代实际使用过的海量文本(数据) [Fine-tuning an LLM to write docs like it’s 1995 - vuink.com]。制作高质量的教材绝非易事,而且即使获得了完美的教材,也必须谨慎挑选能精准理解这些内容的聪明的基础模型 [Fine-tuninganLLMtowritedocslikeit’s1995– Fabrizio Ferri…]。
| 这里还要撒上改变了计算机历史的另一种神奇魔法粉末。那就是LoRA(Low-Rank Adaptation)技术。在对语言模型进行微调时,如果对作为人工智能脑细胞的数十亿个参数(可调节的数值)进行全部重构,不仅成本高昂,而且会给计算机带来极其沉重的负担 [[DoppelBot:Fine-tuneanLLMtoreplace your CEO | ModalDocs](https://modal.com/docs/examples/llm-finetuning)]。取而代之的是,LoRA 技术不会触碰原本的脑细胞,而是只制造出在需要时可以轻轻插入的极其微小轻便的“适配器” [[DoppelBot:Fine-tuneanLLMtoreplace your CEO | ModalDocs](https://modal.com/docs/examples/llm-finetuning)]。 |
让我们想象得更直观一些?假设我们想把一本数万页厚的百科全书中的一部分内容,修改成适合我们工作的内容。把整本书从头开始重新排版印刷是一件极其低效的事情。相反,LoRA 技术就像是在透明的玻璃纸或薄薄的“便利贴”上写下我们想要的笔记,然后轻轻贴在需要的页面上。只需撕下和贴上这张轻巧的便利贴,我们就能在任何时候变回原本聪明的 AI,也能瞬间化身为带有 90 年代打字机情怀的员工,获得了惊人的灵活性。
现状 (Where We Stand)
| 那么,这种像电影一样的技术,现在在我们的现实生活中究竟走到了哪一步呢?让我们再次审视前面提到的那个 20 世纪 90 年代情怀技术文档编写实验。进行这项奇妙实验的开发者,为了达成目标,选择了“Llama 3.1 8B Instruct”和“Qwen 2.5 7B Instruct”这两种开源人工智能模型作为训练模型 [[Fine-tuninganLLMtowritedocslikeit’s1995 | Hacker News](https://news.ycombinator.com/item?id=48408442)]。 |
在这里,我们需要注意模型名称后面所附的“8B”或“7B”这样的数字。这意味着人工智能内部的脑细胞(参数)数量约为 80 亿个(8 Billion)和 70 亿个。您可以把它想象成,大约相当于全球人口数量的庞大数值在相互复杂交织中,理解语境并寻找最佳的词汇。
| 就在几年前,要运行拥有全球人口数量脑细胞的人工智能,还需要带有轰鸣冷却系统的巨大数据中心和如房子般庞大的服务器计算机。但是技术的进步速度令人眼花缭乱。这些重达约 80 亿(8B)参数的模型,现在令人惊讶地,在我们通常在咖啡馆或图书馆使用的轻薄笔记本电脑,即“MacBook Air”上就能非常舒适、流畅地运行 [[Fine-tuninganLLMtowritedocslikeit’s1995 | Hacker News](https://news.ycombinator.com/item?id=48408442)]。 |
这是人类计算机史上的一项巨大成就。无需支付昂贵的云服务费用或购买价值过亿的设备,任何人都可以将免费 AI 下载到自己的个人笔记本电脑上,并贴上前面提到的神奇便利贴(LoRA)。这意味着能够打造您专属的天才 AI 助手的完美工厂,已经建立在您的书桌上了。现在剩下的课题只有一个。那就是取决于人类能够多么用心收集,并喂给聪明 AI 富有营养和美味的“数据教材”(例如 20 世纪 90 年代的使用说明书合集、贵公司独有的秘方等)。
接下来会怎样? (What’s Next)
未来,人工智能产业将分为两股巨大的浪潮并呈爆发式增长:一是广泛造福世人的“面向所有人的通用 AI”,二是能装进您房间的“专为您打造的定制 AI”。其中,微调为我们提供了一把最强大的武器,让我们在完美保持人工智能输出一致性的同时,掌握绝对的控制权 [Fine Tune an open-source LLM - ashutosh.dev]。
在不久的将来,即使在断网的飞机上或深山老林里,我们也能在自己的智能手机和轻薄的笔记本电脑中召唤出专属于自己的助手。我们将身边带好几个身材娇小却忠诚的 AI 助手,它们能运用只有您才懂的独特语气,完美掌握您职务上的一级机密知识。就像这次让 1995 年陈旧文档编写者复活的实验一样,设计师可以打造一个拥有和自己一样苛刻审美观的设计评估 AI,小说家可以在笔记本电脑中亲手“教育”出能完美复制自己文体的助理作家 AI。这个令人愉悦的魔法时代,已经悄然融入到我们的日常生活之中。
MindTickleBytes AI 的视角 (AI’s Take)
所有伟大技术的最终归宿,永远都是“个性化”。就像曾经占据一整座城市的庞大计算机,最终变成了您手腕上的智能手表。拥有数百亿个大脑的人工智能走进了轻薄的笔记本电脑,“微调”这条强大的教育鞭子交到了平凡的个人手中,这一事实令人惊叹。
现在,人工智能的真正价值不再是科技巨头单方面下发的“标准化答案”。它取决于您能多么精密、充满爱意地将其驯化成符合您生活目标和品味的模样。在您书桌上的笔记本电脑里,您想培养出怎样的专家作为您专属的可靠同伴呢?
参考资料
- Fine-tuninganLLMtowritedocslikeit’s1995– Fabrizio Ferri…
-
[Fine-tuninganLLMtowritedocslikeit’s1995 Hacker News](https://news.ycombinator.com/item?id=48408442) -
[DoppelBot:Fine-tuneanLLMtoreplace your CEO ModalDocs](https://modal.com/docs/examples/llm-finetuning) - LLMs:Fine-tuning, distillation, and prompt engineering
- Fine-tuning an LLM to write docs like it’s 1995 - vuink.com
- Fine Tune an open-source LLM - ashutosh.dev
- ChatGPT
- LoRA
- Llama 3.1
- 庞大如屋的超级计算机
- 海量高质量书面资料(训练数据)
- 数十亿韩元的预算
- 亚马逊数据中心
- 个人笔记本电脑(MacBook Air)
- 大型主机服务器