只需一個指令就能搞定網頁應用?Google Gemini 2.5 Pro 的驚人進化

使用者在電腦螢幕前與 AI 對話,瞬間打造出複雜網頁應用程式的景象
AI Summary

Google 提前發布了大幅提升編碼能力的 Gemini 2.5 Pro 更新,加速了人人都能打造複雜網頁服務時代的到來。

想像一下,您正在觀看喜歡的料理 YouTube 影片,突然冒出一個念頭:「如果能把影片中的食譜收集起來,做成一個可以邊看邊打勾的專屬測驗 App 就好了。」以前您可能需要學習編碼或聘請開發人員,但現在您只需要對 AI 說一句話:「請根據這段影片內容,幫我做一個料理測驗 App。」

幾秒鐘後,出現在眼前的不再只是文字說明,而是一個實際可以點擊按鈕、計分並儲存結果的精美網站。這聽起來像是遙遠未來的預言嗎?Google 最近驚喜發布的新 AI 技術正在讓這個驚人的想像變為現實。

Google 原本計畫在 2025 年 5 月的開發者大會「Google I/O 2025」上公開,現在卻出人意料地提前發布了 Gemini 2.5 Pro 更新版本 Source 7, Source 17。這次更新特別側重於編碼與製作「互動式(Interactive,與使用者即時互動)」網頁應用的能力,引起了全球科技界的熱烈關注。

為什麼這很重要?

過去讓 AI 寫程式,通常只會給出「複製這段程式碼貼到那裡」之類的零碎片段。對於不懂編碼的一般大眾來說,根本不知道該如何使用這些片段。但這次更新的 Gemini 2.5 Pro 完全不同。

  1. 想法立即變為工具:即使完全不懂複雜的程式語言也沒關係。只需一個簡短的命令,即「提示詞(Prompt,給 AI 的指令)」,描述您想要的網頁功能,它就能從無到有打造出一個實際運作的網頁應用 Source 5
  2. 擁有「眼睛」的編碼天才:它超越了單純閱讀文字的水平。它具備觀察影片、影像或流程圖,掌握其脈絡並將其轉化為實際服務的能力 Source 8, Source 9
  3. 經驗證的專家實力:它的智慧程度大幅提升,在最新的編碼基準測試(Benchmark,客觀衡量 AI 性能的測驗)中獲得了世界頂尖級(State-of-the-Art, SoTA)的成績 Source 10

簡單來說,現在 AI 不僅僅是一個「知識搜尋器」,而是成為了能親自設計並將您的想法蓋成完整房屋的「首席建築師」。

簡單理解:Gemini 2.5 Pro 的「魔法」

為了更貼近生活地了解這項技術將為我們帶來什麼變化,我們透過兩個比喻來看看。

1. 讀食譜 vs 直接端出料理

如果說以前的 AI 扮演的是親切閱讀「做辣炒年糕需要準備辣椒醬和年糕…」食譜的角色,那麼更新後的 Gemini 2.5 Pro 就如同聽到一句「我想吃辣炒年糕」就衝進廚房,親自端出一盤熱氣騰騰的辣炒年糕的廚師。因為它不只是顯示程式碼,而是提供一個使用者可以立即點擊按鈕、輸入數據的「完整程式」 Source 2, Source 12

2. 反應敏捷的「思考型秘書」

Gemini 2.5 Pro 不僅是擅長計算的電腦,更是一個「思考模型(Thinking model)」 Source 10。它就像一位反應敏捷的高級秘書,只要看一眼您提供的地圖或複雜的工作流程圖,就會主動判斷:「啊,這裡需要這樣的功能,我馬上做出來。」

例如,看看 Google 演示的 「Video to Learning App」 案例。只需輸入一段 YouTube 學習影片,AI 就會觀看並理解影片的所有內容,然後迅速製作出一個配有測驗和整潔介面的「專屬學習 App」 Source 8。這展現了將影片這種視覺資訊轉化為編碼這種複雜技術成果的高超智慧。

現狀:有哪些改變?

這次公開的模型正式名稱為 「Gemini 2.5 Pro Preview I/O edition」 Source 2。主要變化摘要如下:

  • 互動式網頁應用特化:使用者在瀏覽器中直接點擊並獲得反應的應用製作能力大幅提升 Source 3
  • 高完成度的設計:不只是功能能跑,還能一致地繪製出美觀且在智慧型手機或電腦上都能良好顯示的「響應式設計」前端(Frontend,網頁的外觀) Source 12
  • 多模態推理(Multimodal Reasoning):能同時處理文字、影片、影像等多種形式的資訊,並解決複雜問題 Source 9

科技專家 Francis de Souza 對這次更新讚不絕口,表示:「非常期待使用者只需一個指令就能創造出多麼令人驚嘆的成果。」 Source 5

未來將會如何?

現在,製作網頁應用的過程正變得像「寫日記」一樣簡單。過去想要將想法做成 App,需要學習數個月的編碼或花費巨資,但現在只需向 Gemini 2.5 Pro 這樣的 AI 詳細描述您的想法即可。

在不久的將來,我們每個人都能親自製作專屬的客製化工具。例如對 AI 說:「幫我做一個專屬的健康帳本,只要拍下我今天吃的食物照片,就能自動計算卡路里並以圖表顯示」,隨即專屬於您的減重 App 就誕生了。

目前 Google 已透過 Vertex AI 和 Google AI Studio 向開發者公開此模型,並計畫在不久後擴大服務,讓更多人可以使用 Source 14


AI 的視角:MindTickleBytes AI 記者觀點

這次更新象徵著 AI 已從單純回答問題的「回答機」進化為解決實際問題的「解決方案提供者」。技術性的編碼障礙將會急劇降低。最終留給我們的課題是:「要讓 AI 幫我們做什麼?」這個具備創造力的問題。在想像力比技術更有價值的時代,您想和 AI 一起打造什麼樣的酷炫工具呢?


參考資料

  1. Gemini 2.5 Pro 更新:編碼、網頁應用與 Gemini
  2. 使用更新後的 Gemini 2.5 Pro 構建豐富的互動式網頁應用…
  3. 使用更新後的 Gemini 2.5 Pro 構建豐富的互動式網頁應用
  4. 使用更新後的 Gemini 構建豐富的互動式網頁應用…
  5. 今天 Google 發布了最新版本的 Gemini 2.5 Pro,我們最…
  6. Gemini - Google DeepMind
  7. 數據點:更新後的 Gemini Pro 模型可根據提示詞構建互動式網站
  8. Gemini 2.5 Pro 預覽:更出色的編碼性能
  9. Vertex AI 上的 Gemini 2.5:Pro、Flash 和模型優化器上線…
  10. Gemini 2.5:利用先進推理推向新領域…
  11. Gemini 2.5 Pro:開發者基準測試與集成指南
  12. Gemini 2.5 Pro:2025 年每位開發者都需要的 AI 升級
  13. [擴展 Gemini 2.5 Flash 和 Pro 的能力 Google…](https://cloud.google.com/blog/products/ai-machine-learning/expanding-gemini-2-5-flash-and-pro-capabilities)
  14. Google 宣布推出具備編碼能力的 Gemini 2.5 Pro (I/O Edition)…

FACT-CHECK SUMMARY

  • Claims checked: 16
  • Claims verified: 16
  • Verdict: PASS
測試你的理解
Q1. 這次驚喜更新的 Gemini 2.5 Pro 別稱是什麼?
  • I/O Edition
  • Vertex Edition
  • Flash Edition
Google 提前發布了原定在 Google I/O 2025 發表的模型,並將其命名為「I/O Edition」。
Q2. Gemini 2.5 Pro 的新功能之一,觀看 YouTube 影片並製作學習應用程式的例子是什麼?
  • Video to Learning App
  • YouTube to Web
  • Flash Learner
在 Google AI Studio 中展示的「Video to Learning App」是結合影片理解能力與編碼能力的代表性案例。
Q3. 這次更新中最重點強化的能力是什麼?
  • 影像生成
  • 外語翻譯
  • 編碼及互動式網頁應用製作
這次更新的核心是編碼能力的飛躍提升,以及藉此製作複雜網頁應用程式的能力。