透過將輕巧的適配器附加到大型語言模型 (LLM) 上的微調技術,即使在個人筆電上,也能將 AI 完美改造為你所期望的領域專家。
想像一下。某天早晨,你對智慧型手機的人工智慧助理說:「請幫我寫一份我新開發的應用程式的使用說明書。」通常,它會用流暢、俐落且現代的文句迅速給出答案。但是,如果這個 AI 就像是搭乘時光機來的一樣,用 1990 年代 Windows 95 時期那種生硬且粗糙的文體寫出一大篇文章呢?就像是「請將軟碟片插入磁碟機後點擊執行」這種復古情懷。
令人驚訝的是,有人將這個有趣且天馬行空的想像變成了現實。最近,一位開發者成功進行了一項實驗,訓練最新的人工智慧以 1980~90 年代軟體技術文件撰寫人員 (Technical writer) 的風格來寫作 [微調 LLM 使其像 1995 年那樣撰寫文件 - vuink.com]。這個故事不僅僅是一個重溫復古情懷的有趣插曲。它更是一個決定性的場景,展示了人工智慧技術如何離開科技巨頭的掌控,深入到我們平凡的日常與控制範圍之中。
我們想像中的人工智慧開發總是宏偉壯觀的。我們以為這只能在富麗堂皇的 IT 企業秘密實驗室,或是散發著巨大熱量的數千台電腦伺服器機房中才能實現。然而,創造這個令人驚嘆的「1995 年情懷 AI 助理」的魔法,卻發生在你在咖啡廳喝咖啡時、放在膝蓋上使用的那台平凡無奇的個人筆記型電腦上。這到底是如何辦到的呢?
為什麼這很重要?(Why It Matters)
我們通常認為像 ChatGPT 這樣龐大的人工智慧是「無所不知的萬事通」。但是,企業或個人在真實的日常與工作中真正想要的,並不是在所有領域都能拿到 70 分及格邊緣的「圓滑 AI」。我們真正渴望的是能夠完美理解我們的工作特性,像我們一樣思考,並按照我們的風格工作的「專屬客製化專家 AI」。這就像是成衣店買的衣服再好,也無法比擬為自己量身訂做的西裝那般舒適。
將任何人都可以免費取得的開源大型語言模型(LLM,一種閱讀並學習大量文本以像人類一樣理解語言的 AI)訓練成符合我們目的的過程,為極度個人化的人工智慧開啟了巨大的潛力 [微調開源 LLM - ashutosh.dev]。
舉個例子吧。專門為需要翻閱龐大判例的律師而設計、只使用艱澀法律用語的助理;能夠完美模仿我寫程式習慣的開發者專用幫手;甚至能將冗長乏味的會議記錄,依照我的喜好精準濃縮出重點的秘書。所有這些頂級專家,現在都可以由我們親手打造 [微調開源 LLM - ashutosh.dev]。
這項技術最大的意義在於,它為我們提供了對人工智慧的「完美控制權」、「一致性」以及深度的「專業性」 [微調開源 LLM - ashutosh.dev]。過去需要數億韓元的資本與天才研究員才能打造的「專用 AI」,現在連普通的個人開發者或地方上的小企業也能輕易創建。一場所謂的「人工智慧權力大遷徙」已經悄然展開。
輕鬆理解(The Explainer)
所有這些魔法的核心,正是名為「微調(Fine-tuning)」的關鍵技術。雖然這是一個技術名詞聽起來有些陌生,但它的原理卻與我們的日常生活驚人地相似。簡單來說,微調就是將已經學習了龐大一般知識、聰明的人工智慧基礎模型(Foundation LLM),再次針對特定任務進行適應的特殊訓練過程 [LLM:微調、知識蒸餾與提示工程]。有趣的是,經過這項訓練後,AI 執行特定任務的性能會突飛猛進,但人工智慧的整體大小卻不會變得臃腫,依然保持原來的輕巧 [LLM:微調、知識蒸餾與提示工程]。
打個比方。剛下載的基礎 AI 就像是一位以第一名從名校畢業的「極其聰明的新進員工」。這位新進員工博覽了網路上世間的各種知識,懂得非常多。然而,因為是第一次踏入職場,所以對你們公司獨特的公文格式或是前輩們之間使用的行話一無所知。
這時,你讓這位聰明的新進員工坐在辦公桌前,給他看公司過去的 1,000 份文件,並教導他:「你的基礎知識很棒,就保持原樣,但以後寫文章時,必須完全依照這些文件的風格來寫。」這個職前訓練過程,就是微調。在前面提到的 1995 年情懷文件撰寫實驗中,就等同於讓這位新進員工閱讀了大量 1980 和 90 年代老舊生硬的技術文件,並對他進行了高強度的表演課程,要他模仿那個年代的人說話。
不過,這個特訓過程並不總是那麼順利。利用電腦訓練模型本身的成本可能相對較低,但決定訓練成敗的最大障礙在於,必須收集足夠多「高品質的訓練數據」 [微調 LLM 使其像 1995 年那樣撰寫文件 – Fabrizio Ferri…]。為了訓練出能像 1990 年代的人一樣自然寫作的個人化模型,就必須取得那個年代實際使用的龐大文章(數據) [微調 LLM 使其像 1995 年那樣撰寫文件 - vuink.com]。製作出優良的教材絕非易事,而且就算取得了完美的教材,也必須謹慎挑選出能完全理解這些內容的聰明基礎模型 [微調 LLM 使其像 1995 年那樣撰寫文件 – Fabrizio Ferri…]。
| 在此,又撒下了另一種改變電腦歷史的驚人魔法粉末。那就是名為 LoRA (Low-Rank Adaptation) 的技術。在微調語言模型時,如果把扮演人工智慧腦細胞角色的數十億個參數(Parameter,可調整的數值)全部拆解重做,不僅成本高昂,對電腦來說更是難以承受的重擔 [[DoppelBot:微調 LLM 來取代你的 CEO | ModalDocs](https://modal.com/docs/examples/llm-finetuning)]。取而代之的是,LoRA 技術不觸動原有的腦細胞,而是只建立在需要時能輕輕插入的極小且輕量化的「適配器」 [[DoppelBot:微調 LLM 來取代你的 CEO | ModalDocs](https://modal.com/docs/examples/llm-finetuning)]。 |
讓我們用更貼切的方式想像一下吧?假設你想將一部上萬頁的厚重百科全書中部分內容,修改成符合自己工作需求的版本。如果從頭開始重新排版印刷整本書,那將是極度缺乏效率的做法。相對的,LoRA 技術就像是在透明的玻璃紙或薄薄的「便利貼」上寫下自己想要的筆記,然後輕輕貼在需要的頁面上。只要撕下或貼上這張輕盈的便利貼,隨時都可以恢復成原本聰明的 AI,也能瞬間變身為充滿 90 年代打字機情懷的員工,獲得了驚人的靈活性。
現況(Where We Stand)
| 那麼,像這種電影般的技術,目前在我們的現實生活中到底發展到什麼程度了呢?讓我們再次回顧前面提到的 1990 年代情懷技術文件撰寫實驗。進行這項奇特實驗的開發者,為了達成目標,選擇了「Llama 3.1 8B Instruct」和「Qwen 2.5 7B Instruct」這兩種開源人工智慧模型作為訓練模型 [[微調 LLM 使其像 1995 年那樣撰寫文件 | Hacker News](https://news.ycombinator.com/item?id=48408442)]。 |
在這裡,我們需要注意到模型名稱後面的「8B」或「7B」這些數字。這代表著人工智慧內部的腦細胞(參數)數量大約為 80 億(8 Billion)個和 70 億個。你可以把它想像成大約等同於全球總人口數的龐大數值,彼此錯綜複雜地交織在一起,藉此理解上下文並找出最適合的詞彙。
| 就在幾年前,要運行一個擁有等同於全球總人口數腦細胞的人工智慧,還需要配備吵雜冷卻系統的巨大資料中心和如房子般龐大的伺服器電腦。然而,技術發展的速度令人目眩。這些參數高達約 80 億(8B)等級的龐大模型,現在竟然能令人驚訝地,在我們於咖啡廳或圖書館常使用的輕薄筆記型電腦,也就是「MacBook Air」上,非常輕鬆流暢地執行 [[微調 LLM 使其像 1995 年那樣撰寫文件 | Hacker News](https://news.ycombinator.com/item?id=48408442)]。 |
這是一項將被載入人類電腦歷史的巨大成就。我們不再需要支付昂貴的雲端使用費或購買價值上億的設備,任何人都可以在自己的個人筆記型電腦上下載免費 AI,並貼上前述那神奇的便利貼(LoRA)。這意味著,能打造專屬天才 AI 助理的完美工廠,已經設置在我們的辦公桌上了。現在剩下的課題只有一個:那就取決於人類能多麼用心地收集營養豐富且美味的「數據教材」(例如:1990 年代的使用手冊合集、我們公司專屬的獨門秘方等)來餵養聰明的 AI 了。
未來會如何發展?(What’s Next)
未來,人工智慧產業的發展將分為兩大巨浪並呈爆發性成長:一種是造福大眾的「全民通用 AI」,另一種則是專門安放於我房間內的「專屬客製化 AI」。其中,微調將會是最強大的武器,它讓我們能完美保持人工智慧輸出結果的一致性,同時賦予我們絕對的控制權 [微調開源 LLM - ashutosh.dev]。
在不久的將來,即使在網路斷線的飛機上或深山中,我們也能從自己的智慧型手機和輕便的筆記型電腦中召喚出專屬的助理。我們將擁有多名會使用專屬於我獨特語氣、並且完美掌握我工作核心機密的微型忠誠 AI 助理。就像這次讓 1995 年老舊文件撰寫人員復活的實驗一樣,設計師可以在筆記型電腦裡,直接「教育」出具備與自己一樣挑剔美感的設計評估 AI;小說家也能打造出完美複製自身文體的助理作家 AI。那個令人愉悅的魔法時代,已經悄然滲入我們的日常生活。
MindTickleBytes AI 的觀點(AI’s Take)
所有偉大技術最終抵達的終點,總是「個人化」。就像曾經塞滿一整個城市、如房子般巨大的電腦,如今變成了戴在我手腕上的智慧手錶一樣。擁有了數百億個大腦的人工智慧走進了輕薄的筆記型電腦中,而「微調」這條強大的教育鞭子如今交到了平凡個人的手中,這事實令人無比驚嘆。
現在,人工智慧的真正價值已不再是科技巨頭單方面提供的「標準化答案」。而在於你能多麼精準且充滿愛意地,將 AI 馴服成符合你生活目的與喜好的模樣。你現在想在辦公桌上的筆記型電腦裡,培養出什麼樣的專家,成為你最堅強的夥伴呢?
參考資料
- 微調 LLM 使其像 1995 年那樣撰寫文件 – Fabrizio Ferri…
-
[微調 LLM 使其像 1995 年那樣撰寫文件 Hacker News](https://news.ycombinator.com/item?id=48408442) -
[DoppelBot:微調 LLM 來取代你的 CEO ModalDocs](https://modal.com/docs/examples/llm-finetuning) - LLM:微調、知識蒸餾與提示工程
- 微調 LLM 使其像 1995 年那樣撰寫文件 - vuink.com
- 微調開源 LLM - ashutosh.dev
- ChatGPT
- LoRA
- Llama 3.1
- 如房子般巨大的超級電腦
- 大量的高品質書面資料(訓練數據)
- 數十億韓元的預算
- 亞馬遜資料中心
- 個人筆記型電腦(MacBook Air)
- 大型主機伺服器