OpenAIがLLM推論に特化した独自チップ「ハラペーニョ」を発表。従来のGPU比でコスト効率を50%向上させ、AIサービスの普及を加速させる見通しです。
想像してみてください。私たちが毎日使うChatGPTが、今よりもはるかに高速かつ安価に、そしてさらに賢い回答を出す世界を。これまでAIは、膨大なデータを処理するために汎用グラフィックプロセッシングユニット(GPU、コンピュータのグラフィックスとデータを処理する中核部品)に依存してきました。世界中のあらゆる料理を大きな鍋ひとつで作るようなものでした。しかし、OpenAIはこの料理方法を変えることにしました。自社開発したAIチップ、「ハラペーニョ(Jalapeño)」を通じてです。OpenAI unveils its first custom chip, built by Broadcom
OpenAIと半導体設計企業であるBroadcomは24日、共同設計した初のカスタムAIプロセッサ「ハラペーニョ」を発表しました。OpenAI unveils its first custom chip, built by Broadcom これは単に速いチップを作るというだけでなく、AIサービスの運営方式を根本から再編しようとする試みです。OpenAI and Broadcom unveil LLM-optimized inference chip
なぜ重要なのか?
日常のユーザーにとって最も体感できる変化は、「AIサービスのコスパ」です。現在、AIを駆動するのにかかる費用は天文学的です。業界では、1ギガワット規模の大規模データセンター(AI運用のための巨大なコンピュータ倉庫)の構築には約500億ドル(約7兆円)がかかり、そのうち約350億ドルがチップ購入に割り当てられると推計されています。OpenAI and Broadcom announce first custom AI chip, in strike at nvidia
もし私たちが使うAIアプリの運営コストが下がれば、企業はより安価にサービスを提供でき、AIは日常のあらゆるところに深く浸透するでしょう。ハラペーニョは、既存の汎用GPUと比較してコストを50%も削減できる能力を備えています。OpenAI Unveils Jalapeño — Its First AI Chip, Built With Broadcom コストが下がれば、今は想像するだけの複雑なAIエージェントサービスも、より簡単に私たちのそばにやってくるはずです。OpenAI Unveils Jalapeño, Its First Custom AI Chip Built With Broadcom
例えるなら、汎用GPUが乗用車からオートバイ、トラック、船まで運転できる万能ドライバーだとすれば、ハラペーニョは「データという貨物」だけを最も効率的に運ぶ専用の高速列車と言えます。おかげでAIは、はるかに経済的に作動するようになります。
分かりやすく解説:なぜ「専用チップ」なのか?
ハラペーニョを理解するには、まず「汎用チップ」と「カスタムチップ」の違いを知る必要があります。
汎用GPUは、数学、科学、言語、美術すべてが得意でなければならない「優等生」のようなものです。すべてをそれなりにこなせますが、特定の作業だけに完全に最適化するのは困難です。一方、ハラペーニョは「LLM推論(Large Language Model Inference、学習済みAIが質問に回答を出すプロセス)」という特定の科目だけで100点を取る「専門家」です。OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom — and its development was sped-up with OpenAI’s own models
特にOpenAIは、このチップをゼロからの「白紙」状態で設計しました。OpenAI Unveils Jalapeño, Its First Custom AI Chip Built With Broadcom 興味深いのは、OpenAIがこのチップを設計する際に自社のAIモデルを活用して、開発速度を劇的に短縮したという事実です。OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom — and its development was sped-up with OpenAI’s own models AIが自らをより賢くするためのチップを設計するという、驚くべき好循環が始まったと言えるでしょう。
現在の状況
現在ハラペーニョは、単にチップがひとつ作られたという段階ではありません。BroadcomとCelesticaが協力し、このチップを実際のデータセンターのサーバーラックやネットワークシステムに統合する作業まで進めています。OpenAI, Broadcom unveil first AI inference chip
このチップは今後、ChatGPT、Codex(コード生成AI)、OpenAI API、そして今後登場する未来型AIエージェントを駆動する核となるエンジンになる予定です。OpenAI Unveils Jalapeño, Its First Custom AI Chip Built With Broadcom すでにOpenAIとBroadcomは約18ヶ月前からこのチップのための協力を開始しており、来年末から本格的な配備が始まるものと見られます。OpenAI and Broadcom announce first custom AI chip, in strike at nvidia
今後はどうなるのか?
ハラペーニョの登場は、巨大AI企業が汎用ハードウェアへの依存度を下げ、「垂直統合(半導体設計からサービスまで直接管理)」を強化していることを示しています。
読者の皆さんが注目すべきは、「このチップがどれだけ早く大規模データセンターに適用されるか」という点です。来年からハラペーニョが本格的に配置されれば、AIサービスの応答速度はさらに速まり、私たちがAIを利用する際のコスト負担は今よりも大幅に減る可能性が高いでしょう。AI技術が一部の高度な技術を超え、私たちの日常の必須ツールとしてより安価に定着していくプロセス、それこそがハラペーニョがもたらす未来です。
参考資料
- OpenAI and Broadcom unveil LLM-optimized inference chip
- OpenAI unveils its first custom chip, built by Broadcom
- OpenAI unveils first chip as part of Broadcom deal in effort
- OpenAI just announced its first custom chip to help ChatGPT
- OpenAI Unveils Jalapeño, Its First Custom AI Chip Built With
- OpenAI Unveils Jalapeño — Its First AI Chip, Built With
-
[OpenAI, Broadcom unveil first AI inference chip Constellation Research](https://www.constellationr.com/insights/news/openai-broadcom-unveil-first-ai-inference-chip) - OpenAI Reveals Its First AI Chip: Jalapeño - Gadget Review
-
[OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom — and its development was sped-up with OpenAI’s own models VentureBeat](https://venturebeat.com/infrastructure/openai-unveils-first-custom-ai-inference-chip-jalapeno-with-broadcom-and-its-development-was-sped-up-with-openais-own-models) - OpenAI unveils its first custom chip, built by Broadcom
- OpenAI and Broadcom announce first custom AI chip, in strike at nvidia
-
[OpenAI, Broadcom join forces on AI chips Cybernews](https://cybernews.com/ai-news/openai-broadcom-build-first-ai-processor-chip-deal/) - OpenAI partners with Broadcom custom AI chips alongside
- 汎用個人PCの高速化
- LLM(大規模言語モデル)推論
- ゲーム用グラフィック処理
- 電力消費90%削減
- 既存GPU比50%のコスト削減
- 開発期間10年短縮
- OpenAIが自ら工場を運営している
- OpenAIの既存モデルを活用して開発速度を高めた
- Broadcomの既存チップを再利用した