AI 親自設計的晶片「Jalapeño」?會有什麼不同?

OpenAI 與博通共同開發的首款客製化 AI 晶片 Jalapeño 的概念圖
AI Summary

OpenAI 公開了專為 LLM 推論優化的自家晶片「Jalapeño」,預計將比傳統 GPU 提高 50% 的成本效益,加速 AI 服務的普及。

試著想像一下。我們每天使用的 ChatGPT,若能比現在更快、更便宜,而且回答得更聰明,那會是什麼樣的世界呢?至今為止,AI 為了處理海量數據,一直依賴於通用圖形處理器(GPU,處理電腦圖形與資料的核心零件)。這就像是用同一個大鍋子在煮全世界所有的菜色一樣。但現在,OpenAI 決定改變這種烹飪方式,那就是透過自行開發的 AI 晶片——「Jalapeño(墨西哥辣椒)」。OpenAI unveils its first custom chip, built by Broadcom

OpenAI 與半導體設計企業博通(Broadcom)於 24 日公開了共同設計的首款客製化 AI 處理器「Jalapeño」。OpenAI unveils its first custom chip, built by Broadcom 這不僅僅意味著製造出更快的晶片,更是試圖從根本上重塑 AI 服務運作方式的嘗試。OpenAI and Broadcom unveil LLM-optimized inference chip

這為什麼很重要?

對一般使用者而言,最能體會到的變化就是「AI 服務的性價比」。目前運作 AI 所需的成本高得驚人。業界推估,建立一個 1GW(十億瓦)規模的大型資料中心(為運作 AI 而設的巨大電腦倉庫)約需 500 億美元(約合 70 兆韓元),其中約有 350 億美元被分配用於採購晶片。OpenAI and Broadcom announce first custom AI chip, in strike at nvidia

如果運作我們所使用的 AI 應用程式成本降低,企業就能以更便宜的價格提供服務,AI 也將更深入地滲透到我們日常生活的各個角落。Jalapeño 具備了相較於傳統通用 GPU 節省 50% 成本的能力。OpenAI Unveils Jalapeño — Its First AI Chip, Built With Broadcom 當成本降低後,現在僅存在於想像中的複雜 AI 代理服務,也能更容易地來到我們身邊。OpenAI Unveils Jalapeño, Its First Custom AI Chip Built With Broadcom

簡單的比喻,如果通用 GPU 是能駕駛汽車、摩托車、卡車甚至輪船的全能駕駛,那麼 Jalapeño 就是只負責最高效率運輸「數據貨物」的專用高速列車。得益於此,AI 的運作將變得更加經濟實惠。

更容易理解:為什麼是「專用晶片」?

要理解 Jalapeño,首先必須了解「通用晶片」與「客製化晶片」的區別。

通用 GPU 就像必須在「數學、科學、語言、美術」樣樣精通的「模範生」。雖然所有科目都有一定水準,但很難針對特定作業進行完全優化。相反地,Jalapeño 則是專門在「LLM 推論(Large Language Model Inference,已學習的 AI 給出回答的過程)」這門學科取得滿分的「專家」。OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom — and its development was sped-up with OpenAI’s own models

特別是 OpenAI 是從「一張白紙」開始設計這款晶片的。OpenAI Unveils Jalapeño, Its First Custom AI Chip Built With Broadcom 有趣的是,OpenAI 在設計這款晶片時,利用了自家的 AI 模型,大幅縮短了開發時間。OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom — and its development was sped-up with OpenAI’s own models 可以說,AI 開始設計讓自己變得更聰明的晶片,這種令人驚奇的良性循環已經啟動了。

現況

目前的 Jalapeño 不僅僅是製作出晶片本身。博通與 Celestica 正進行合作,將這款晶片整合到實際資料中心的伺服器機櫃(Rack)與網路系統中。OpenAI, Broadcom unveil first AI inference chip

該晶片預計將成為運作 ChatGPT、Codex(寫程式 AI)、OpenAI API 以及未來即將出現的未來型 AI 代理的核心引擎。OpenAI Unveils Jalapeño, Its First Custom AI Chip Built With Broadcom OpenAI 與博通早在約 18 個月前就開始了這款晶片的合作,預計從明年年底開始正式部署。OpenAI and Broadcom announce first custom AI chip, in strike at nvidia

未來將如何發展?

Jalapeño 的出現顯示,大型 AI 企業正致力於降低對通用硬體的依賴,並強化「垂直整合(直接管理從半導體設計到服務供應的流程)」。

讀者朋友們可以關注的重點在於「這款晶片應用於大型資料中心的速度」。隨著 Jalapeño 從明年開始正式部署,AI 服務的回應速度將變得更快,且我們在使用 AI 時感受到的成本負擔,很有可能比現在大幅降低。AI 技術超越少數高級技術,以更低廉的成本成為我們日常生活必需工具的過程,那正是 Jalapeño 即將帶來的未來。

參考資料

  1. OpenAI and Broadcom unveil LLM-optimized inference chip
  2. OpenAI unveils its first custom chip, built by Broadcom
  3. OpenAI unveils first chip as part of Broadcom deal in effort
  4. OpenAI just announced its first custom chip to help ChatGPT
  5. OpenAI Unveils Jalapeño, Its First Custom AI Chip Built With
  6. OpenAI Unveils Jalapeño — Its First AI Chip, Built With
  7. [OpenAI, Broadcom unveil first AI inference chip Constellation Research](https://www.constellationr.com/insights/news/openai-broadcom-unveil-first-ai-inference-chip)
  8. OpenAI Reveals Its First AI Chip: Jalapeño - Gadget Review
  9. [OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom — and its development was sped-up with OpenAI’s own models VentureBeat](https://venturebeat.com/infrastructure/openai-unveils-first-custom-ai-inference-chip-jalapeno-with-broadcom-and-its-development-was-sped-up-with-openais-own-models)
  10. OpenAI unveils its first custom chip, built by Broadcom
  11. OpenAI and Broadcom announce first custom AI chip, in strike at nvidia
  12. [OpenAI, Broadcom join forces on AI chips Cybernews](https://cybernews.com/ai-news/openai-broadcom-build-first-ai-processor-chip-deal/)
  13. OpenAI partners with Broadcom custom AI chips alongside
測試你的理解
Q1. 此次公開的 OpenAI 客製化晶片「Jalapeño」的主要目的為何?
  • 加速一般個人電腦運算
  • LLM(大型語言模型)推論
  • 遊戲圖形處理
Jalapeño 是專為優化 ChatGPT 等 LLM 的推論(Inference)工作而設計的晶片。
Q2. OpenAI 透過自行設計晶片可獲得的主要經濟效益為何?
  • 電力消耗降低 90%
  • 相較傳統 GPU 節省 50% 的成本
  • 縮短開發週期 10 年
據悉,Jalapeño 相較於通用 GPU,能夠節省 50% 的運營成本。
Q3. Jalapeño 開發過程中的特殊點為何?
  • OpenAI 直接經營工廠
  • 利用 OpenAI 既有的 AI 模型加速開發速度
  • 重複使用博通的現有晶片
OpenAI 直接利用其內部的 AI 模型來加速晶片的開發過程。