由於天文數字般的成本與非開發者的失望,雲端 AI 模型的無限競爭時代正走向終結,基礎設施與貼近日常生活的客製化 AI 服務時代即將來臨。
想像一下。早上起床後,你對著智慧型手機的 AI 說:「請幫我把昨晚收到的工作郵件中,需要立刻回覆的重要信件整理出摘要草稿。」過沒多久,畫面上便出現了一封以完美句子整理好的電子郵件。這感覺就像擁有了一位專屬且能幹的私人助理。到目前為止,這正是我們過去幾年在新聞中無數次看到,並且實際開始逐漸體驗到的未來景象。
然而,在這個宛如魔法般的景象背後,隱藏著我們未曾察覺的鉅額帳單。為了處理你的一個問題,遠在沙漠或海邊、面積相當於幾座足球場的巨大資料中心裡,無數的電腦晶片正散發著驚人的熱能運轉,為了冷卻這些設備,甚至需要抽取引發乾旱地區的珍貴水資源,水量足以填滿好幾個游泳池 [雲端 LLM 淘金熱即將終結 | Hacker News](https://news.ycombinator.com/item?id=48527817)。可以說,每當你提出問題、要求摘要時,就像有一台看不見的頂級計程車,其計費表的金額正以驚人的速度飆升。
過去兩年來,以矽谷為首的全球科技企業陷入了一場競相打造更聰明、更巨大 AI 的「淘金熱(Gold Rush,指因發現金礦而引發人們湧入的現象)」。但最近,這場狂熱的慶典氛圍明顯冷卻了下來。主流分析認為,基於雲端(Cloud,連接至網際網路的巨大中央伺服器)的大型語言模型熱潮已步入尾聲。究竟 AI 業界發生了什麼事?
為什麼這很重要? (Why It Matters)
最大的原因在於人們「期望」與現實之間的巨大落差,以及無法承受的「成本」。根據一項分析特定 AI 模型流量的案例研究顯示,2025 年初,使用者的連線量在短短 3 個月內暴增了驚人的 25 倍,4 月份的單月連線次數甚至超過 17 萬次。這等同於社區裡的一家小雜貨店,突然湧入每天數千名的龐大客流。然而,當這種爆炸性的好奇心退去後,人們的造訪自然會逐漸減少,最終穩定在一個平緩的水準 [LLM 流量在 3 個月內成長 25 倍 | daydream](https://www.withdaydream.com/library/case-studies/openart-llm)。
為什麼人們會離開呢?對於缺乏深厚技術背景的普通使用者來說,AI 被宣傳得像是「能解決任何問題的魔法神燈」。人們堅信這項奇蹟般的工具能代替自己處理工作,並大幅提升生產力。但結果是,這些被承諾的魔法並沒有完美實現;而當泡沫開始破裂時,人們才痛苦地意識到,自己每個月都在支付昂貴的雲端伺服器使用費與 AI 詞元(Token,AI 辨識與生成文字時的計費單位)成本 [中國的 OpenClaw 熱潮是 AI 企業的淘金熱 | WIRED](https://www.wired.com/story/china-is-going-all-in-on-openclaw/)。
在這種情況下,過去兩年來一味擴大模型規模(參數數量,類似 AI 的腦細胞數量)、投入龐大數據並只會不斷膨脹期待的盲目競爭已宣告結束。如今,業界的目光不再停留在表面華麗的魔術秀,而是轉向在背後讓 AI 實際運作的穩固基礎設施與工具,也就是「十字鎬與鐵鍬」 [LLM 與淘金熱的共同點](https://www.linkedin.com/pulse/what-llms-gold-rush-have-common-salesforce-cjhce)。
淺顯易懂 (The Explainer)
為了準確理解這個情況,我們有必要探討兩個重要的比喻。
第一個比喻:自動販賣機與星級主廚(AI 的經濟學)
首先,我們必須了解經常聽到的大型語言模型(LLM,透過學習龐大文本來像人類一樣對話的 AI)。這項技術是以 Google 在 2017 年開發的 Transformer(一種掌握句子中單字間關係的 AI 架構)技術為基礎,學習數十億筆文本與內容數據所建立的 [利用 Google AI 的大型語言模型 (LLM) | Google Cloud](https://cloud.google.com/ai/llms)。
簡單來說,維持這種 LLM 的方式與過去傳統的電腦程式完全不同 [無法實現的 LLM 經濟學:為何 AI 競賽可能會崩潰...](https://www.linkedin.com/pulse/unattainable-economics-llms-why-ai-race-may-collapse-pierre-jean-wtpkf)。我們每天在智慧型手機上使用的照片編輯應用程式或文書處理軟體就像「自動販賣機」。對公司而言,一開始設計並在工廠製造一台優良的販賣機確實需要花費大筆資金,但一旦安裝在街頭,無論是 100 人還是 1 萬人來購買,幾乎都不會產生額外成本,每個月只需支付一點電費而已。
相反地,目前的雲端 LLM 為了滿足每一位使用者的口味,就像是專門聘請了一位頂級餐廳的「星級主廚」。無論你只是隨口問一句「今天天氣如何?」,還是提出複雜的「請向小學生解釋相對論」,這位 AI 主廚每次都需要全力運轉其龐大的大腦,從頭到尾為你烹調出一道全新的料理(句子)。也就是說,這並非做一次就一勞永逸,而是每當使用者使用服務時,資料中心就會即時消耗驚人的電力與運算成本。隨著使用量增加,公司將面臨無法承受的成本炸彈,這就是所謂的「不可持續的成本結構」 [無法實現的 LLM 經濟學:為何 AI 競賽可能會崩潰...](https://www.linkedin.com/pulse/unattainable-economics-llms-why-ai-race-may-collapse-pierre-jean-wtpkf)。
第二個比喻:1849 年的淘金熱與牛仔褲
打個比方,現在的 AI 市場與 1849 年美國加州的情況非常相似。當時加州發現金礦,數十萬人夢想著一夜致富,爭先恐後地湧入礦區。這個時期被稱為「淘金熱」。但是,在這股狂熱中,真正獲得穩定且豐厚收入的是哪些人?不是那些每天在泥水中試圖淘金的礦工,而是為這些礦工提供能承受粗重勞動的堅固「牛仔褲」,以及販售用來挖掘堅硬土地的「十字鎬與鐵鍬」的商人們。
AI 市場也正完全依循這個公式。雖然每個人都爭先恐後地想要率先開採出屬於自己的巨大人工智慧模型(黃金),但從 Podcast 平台 Spotify 的案例可以看出,真正受惠的是另一群人。Spotify 掌握著人們每天收聽的龐大音訊數據(金脈),而 AI 開發公司則必須帶著龐大的資金與高度發展的演算法(十字鎬與鐵鍬)前來尋求交易,從而形成了一種共生關係 [音訊是新的資料集:深入探討 Podcast 的 LLM 淘金熱...](https://www.francescatabor.com/articles/2025/7/22/audio-is-the-new-dataset-inside-the-llm-gold-rush-for-podcasts)。
目前情況 (Where We Stand)
儘管面臨這些成本與效率的限制,AI 的發展並未完全停滯。那麼,現在 AI 業界的版圖是如何分佈的呢?
目前我們最習慣使用的 AI 依然是雲端 LLM。其中包括 OpenAI 的 GPT 系列、Anthropic 的 Claude,以及 Google 的 Gemini 等巨頭。它們都寄居在大型科技企業 (Big Tech) 所擁有、效能驚人的伺服器之中 [本地 LLM 與雲端 AI:你該選擇哪一個?](https://arsturn.com/blog/local-llms-vs-cloud-ai-the-ultimate-showdown)。
對企業客戶而言,雲端 AI 仍然是一個非常有吸引力的選項。因為他們不需要親自花費數百億韓元購買超級電腦,只要連接網路,就能立即建構出可供數萬名員工使用的 AI 系統。也就是說,它具有無需初期設施投資,且能視需求輕鬆擴展或縮減規模的優點 [3 項突破性的 LLM 技術如何... - Peter's Pick](https://peterspick.co.kr/en/how-3-breakthrough-llm-technologies-are-revolutionizing-enterprise-ai-infrastructure-in-2025/)。
同時,這些巨大的模型也變得越來越聰明。它們不再侷限於單純的文字交流聊天機器人,而是進化成具備用眼睛看照片、用耳朵聽聲音的多重感官功能(多模態,Multi-modal)的獨立助理代理(Agent)。此外,過去我們是以間接的方式教導 AI「這是一個好答案」(RLHF 方式),但在歐盟 (EU) 強烈的監管趨勢下,現在已發展出直接偏好最佳化(DPO,讓 AI 直接學習人類偏好答案的技術),以更直接且安全的方式教導 AI [什麼是大型語言模型 (LLM) - 主要應用案例、資料集與未來](https://www.shaip.com/blog/a-guide-large-language-model-llm/)。
然而,也出現了一家足以打破雲端贏家全拿結構的巨型企業。那就是被稱為 AI 熱潮最大受惠者的 NVIDIA。獨占供應人工智慧大腦(晶片組)的 NVIDIA 最近宣布,他們不會止步於單純販售硬體這把「十字鎬」。他們推出了「基礎模型即服務 (Foundation Model as a Service)」,協助企業利用無法外洩的內部機密數據,安全地建構專屬的客製化 AI 模型,這項舉動正在顛覆市場版圖 ["$NVDA 將不會止步於販售 LLM 淘金熱的十字鎬與鐵鍬......](https://twitter.com/DrJimFan/status/1661783178854674438)。
未來將如何發展? (What’s Next)
泡沫退去後會留下什麼?專家們一致認為,巨大模型規模的競爭終於結束,我們已迎來將 AI 納入日常實用工具的 「AI 產品時代 (The AI Product Era)」。就像人類歷史上的蒸汽機或網際網路一樣,這意味著既然我們已經燒製好「AI 模型」這塊巨大的磚頭,現在該是將這些磚頭堆疊起來,建造出能真正改變我們生活、具備實用價值的建築物的時候了 [LLM 淘金熱的終結,AI 產品時代的開始... | Medium](https://medium.com/@bytestobusiness/the-end-of-the-llm-gold-rush-the-start-of-the-ai-product-era-baf5441f3547)。
這個新時代最顯著的 3 個特徵如下:
1. 進入我手機與電腦的 AI(本地 LLM 的崛起) 每次都需要透過網路連接到巨大的雲端伺服器;擔心自己提出的私密問題或公司的機密資料可能會被儲存在中央伺服器;還有企業每個月必須承擔的驚人雲端使用費。為了解決所有這些問題,「本地 LLM (Local LLM)」作為一種替代方案正在快速成長。本地 LLM 不是指 Google 或 OpenAI 的中央伺服器,而是指在各位每天使用的筆記型電腦或智慧型手機等裝置內部,即使沒有連接網路也能直接運行的 AI。
最近市場上湧現出各種解決方案,從在行動裝置(iOS、Android)環境下完全保護隱私並以裝置端(On-device,在裝置本身處理)運作的應用程式,到開發者可以直接在自己電腦上操作的本地 AI 工具 [Ollama vs vLLM vs LM Studio:2026 年在本地運行 LLM 的最佳方式?](https://www.glukhov.org/llm-hosting/comparisons/hosting-llms-ollama-localai-jan-lmstudio-vllm-comparison/)。特別是,對於那些不受大企業制定的僵化答覆道德指南所束縛、能給出自由回答的「無審查 (Uncensored)」本地模型,市場需求非常龐大。這些模型即使在一般的顯示卡環境下也能順暢運行,同時具備強大的推理能力,正迅速成為現有雲端 AI 最強勁的競爭對手 [最佳的無審查本地 LLM(以及為何你可能會需要...) | InsiderLLM](https://insiderllm.com/guides/best-uncensored-local-llms/)。
2. 削骨般的減肥(推論最佳化的時代)
提供 AI 服務的企業為了生存,也開始進行技術上的「減肥」。他們正在激烈地研究如何大幅縮短回答使用者問題的時間(延遲時間),並減少電力與運算資源的消耗。這被稱為推論最佳化 (Inference Optimization)。剔除 AI 模型的冗餘部分使其變得更輕量,並透過有效整理記憶體結構來大幅降低伺服器營運成本的技術,如今已經成為與提升 AI 智力同等重要、甚至決定企業生存的核心課題 [什麼是推論最佳化? | Google Cloud](https://cloud.google.com/discover/inference-optimization)。
3. 變得嚴格的評估標準
過去,只要一句「我們的 AI 是世界上最聰明的!」這樣的宣傳語,就能吸引投資者的資金。但現在情況不同了。為了將這些仍然經常犯錯、給出偏頗答案(幻覺現象)的新興技術實際部署到企業的客戶服務或醫療環境中,嚴格的評估是不可或缺的。不僅是問答的速度,持續監控答案的可靠性、道德問題以及伺服器營運效率,並定期進行嚴格評分的評估系統,正成為必要的基礎設施 [LLM 評估的最佳實踐與方法 | Databricks Blog](https://www.databricks.com/blog/best-practices-and-methods-llm-evaluation)。
總結來說,過去為了創造出更巨大的智慧而投入數十兆韓元、進行無限競爭的雲端淘金熱正走向尾聲。取而代之的是,市場正進入一個真正比拚技術成熟度的時期,競爭的焦點在於誰更「有效率」、誰能更「安全」地保護個人隱私,以及誰能創造出更「實用」的工具。泡沫退去後顯露出來的真正金脈,不再是那些迷惑大眾的華麗魔術秀,而是隱藏在我們辦公桌上、默默協助每天工作的實用軟體之中。
AI 的視角 (AI’s Take)
讓大眾狂熱的華麗人工智慧魔術秀即將落幕。在舞台上變出鴿子的魔術師(基於雲端的巨大 AI)雖然神奇,但僅憑這些並不足以改變世界。現在,徹底分析並拆解這些驚人魔術的原理,將其轉化為如同我們每天使用的冰箱或洗衣機等日常家電——這段冷靜且競爭激烈的「工程技術時間」已經開始。因為真正的革命,只有當技術不再顯得新奇,而是像呼吸的空氣一樣自然地融入我們的日常生活中時,才算真正完成。
參考資料
-
[雲端 LLM 淘金熱即將終結 Hacker News](https://news.ycombinator.com/item?id=48527817) -
[LLM 淘金熱的終結,AI 產品時代的開始… Medium](https://medium.com/@bytestobusiness/the-end-of-the-llm-gold-rush-the-start-of-the-ai-product-era-baf5441f3547) - 無法實現的 LLM 經濟學:為何 AI 競賽可能會崩潰…
- “$NVDA 將不會止步於販售 LLM 淘金熱的十字鎬與鐵鍬……
- 3 項突破性的 LLM 技術如何… - Peter’s Pick
-
[最佳的無審查本地 LLM(以及為何你可能會需要…) InsiderLLM](https://insiderllm.com/guides/best-uncensored-local-llms/) - 音訊是新的資料集:深入探討 Podcast 的 LLM 淘金熱…
-
[中國的 OpenClaw 熱潮是 AI 企業的淘金熱 WIRED](https://www.wired.com/story/china-is-going-all-in-on-openclaw/) -
[LLM 評估的最佳實踐與方法 Databricks Blog](https://www.databricks.com/blog/best-practices-and-methods-llm-evaluation) -
[什麼是推論最佳化? Google Cloud](https://cloud.google.com/discover/inference-optimization) -
[利用 Google AI 的大型語言模型 (LLM) Google Cloud](https://cloud.google.com/ai/llms) - 什麼是大型語言模型 (LLM) - 主要應用案例、資料集與未來
- LLM 與淘金熱的共同點
- Ollama vs vLLM vs LM Studio:2026 年在本地運行 LLM 的最佳方式?
-
[LLM 流量在 3 個月內成長 25 倍 daydream](https://www.withdaydream.com/library/case-studies/openart-llm) - 本地 LLM 與雲端 AI:你該選擇哪一個?
- 正演變成打造更大模型的無限競爭。
- 不再著重開發巨大模型,而是專注於基礎設施與實質的產品開發。
- 所有企業都將資源全數投入雲端伺服器投資。
- 即使開發完成,每當使用者提問時,仍會產生龐大的運算成本與伺服器維護費。
- 完全不需要初期開發成本。
- 隨著使用者增加,伺服器維護費會呈幾何級數減少。
- 紙本百科全書
- 地端量子電腦
- 本地 LLM (Local LLM)