如果腦中的想像在 8 秒內變成電影?Google 'Veo 2' 開啟的魔法世界

視覺化呈現 Google Gemini 介面中透過文字提示詞生成華麗且寫實影片過程的圖像
AI Summary

Google 的高效能影片 AI 'Veo 2' 已整合至 Gemini Advanced,現在任何人都能僅憑幾行文字或一張照片,親自創作長達 8 秒且具備電影質感的高畫質影片。

請想像一下。 昨晚夢中見到的「穿著太空衣在火星跳嘻哈舞的貓」,或是只在小說中讀過的「金黃色浪花拍打的神祕紫色海洋」景致,如果能在短短幾秒內,像真實電影場景般生動地呈現在眼前會是如何?就在不久前,這還需要專業影片剪輯師使用高效能設備耗時數日才能完成的工作,現在只要在您的智慧型手機或電腦上輸入幾行文字即可實現。

據悉,Google 已將其最強大的影片生成人工智慧模型 「Veo 2」 正式引入大眾常用的對話型 AI Gemini 以及創意實驗空間 Whisk [Source 11], [Source 16]。這標誌著人工智慧已跨越寫作與繪圖階段,進而邁入創造「動態世界」的新紀元。

為什麼這很重要?

我們正處於「影片的時代」。事實上,目前影片內容已佔據網路流量的 65% 以上 [Source 3]。然而,親自製作影片依然是一項艱鉅且複雜的任務,因為必須學習複雜的剪輯工具、配備拍攝器材,有時甚至需要投入巨額費用尋求專家協助。

Veo 2 的出現是從根本上改變創作工具的事件。簡單來說,這意味著即使沒有「技術」,只要有「創意」,任何人都能成為創作者。無論是沒有專業設備的學生、想要宣傳自家店鋪的小商業者,還是創意滿滿的普通人,都能立即將自己的想法轉化為高畫質影片。這在製作教育資料、規劃廣告行銷或預覽電影構思等各個領域,都具備徹底改變視覺溝通方式的潛力。

深入淺出:Veo 2 如何施展魔法?

如果用一句話定義 Veo 2,可以說它是 「能精準聽懂我說話的數位電影導演」。當您輸入文字提示詞(Prompt,給 AI 的指令)或提供一張圖片時,AI 就會以此為基礎生成約 8 秒長 的高畫質影片 [Source 2], [Source 14]

1. 學習現實世界規則的 AI(理解物理學)

Veo 2 優於現有模型之處在於,它能非常深入地理解現實世界的 物理定律與人物動作 [Source 1], [Source 7]

比喻來說,這就像畫家徹底學習了解剖學,從而能更寫實地描繪人體肌肉與骨骼的運動。AI 透過龐大的數據學習了人在行走或奔跑時關節如何彎曲才自然,以及水流動時光線如何反射。得益於此,人物不會呈現不自然的晃動,而是能製作出具有「電影級寫實感(Cinematic Realism)」的流暢影片 [Source 5]

2. 畫轉文,文轉影(提示詞轉換技術)

Veo 2 內含一項名為 「提示詞轉換技術(Prompt Transmutation)」 的有趣技術 [Source 9]

當您上傳一張照片時,AI 首先會將該照片轉換為非常詳細的「文字描述」,接著再根據該文字描述製作影片。

  • 比喻來說: 就像目擊者看到嫌犯的畫像後,透過電話向刑警詳細描述其長相特徵,刑警聽完描述後在腦中想像嫌犯的動作。透過這個過程,AI 能在影片中精準捕捉使用者想要的風格與場景中的微小細節。

3. 為照片注入靈魂的 「WhiskAnimate」

在 Google Labs 的實驗性平台 Whisk 中,可以使用將圖片轉換為影片的 「WhiskAnimate」 功能 [Source 2], [Source 18]。只要上傳您心愛的寵物狗照片或親手繪製的角色圖,並下達「讓它在海灘上開心地奔跑」等指令,那張靜止的圖片就會變成一段 8 秒長的生動短片。

在哪裡以及如何使用?

如果您想立即體驗這項如魔法般的技術,可以透過以下兩種途徑:

  • Gemini Advanced: 如果您是 Google One AI Premium 訂閱者,可以在 Gemini 應用程式介面的模型下拉選單中選擇 Veo 2 [Source 8], [Source 16]。在這裡輸入如「製作一段復古汽車在夕陽背景下行駛於海岸公路的影片」等文字即可。
  • Whisk: 在 Google 的實驗性創作平台 Whisk 中也能見到 Veo 2。在這裡不僅能透過文字,還能結合圖片與文字,產出更具創意且精緻的成果 [Source 11], [Source 17]

生成的影片通常以 720p 解析度(高畫質影片標準)的 MP4 檔案提供,在某些環境下最高可支援 4K 解析度,畫質非常清晰 [Source 8], [Source 18], [Source 19]。此外,為了防止假新聞等濫用行為,所有影片中都嵌入了肉眼不可見、但可透過特殊裝置識別的 「SynthID(AI 生成物識別浮水印)」,以增加安全性和責任感 [Source 18]

迎向未來:我們的日常生活將如何改變?

目前 Veo 2 製作的影片長度約為 8 秒,每天生成的次數也可能有限制 [Source 11], [Source 18]。然而,技術發展的速度遠超乎我們的想像。Google 已在為開發者準備 Veo 3.1 模型,該模型能以單張圖片作為起始畫面並接續影片,不斷提升效能 [Source 10]

在不久的將來,我們在 YouTube Shorts 或 TikTok 上看到的許多影片,可能不再是人手持相機拍攝,而是與 AI 對話後的產物。「影片剪輯只有專家才能做」的常識正在瓦解,每個人都能與世界分享腦中風景的「一人電影導演」時代已正式開啟。


AI 記者的觀點 (MindTickleBytes AI)

Veo 2 不僅僅是一項技術成就,更像是無限放大人類創意的「智慧畫筆」。8 秒的時間看似短暫,但其中蘊含的物理規律精緻度與視覺完成度,證明了 AI 對人類現實世界的理解程度。

特別令人印象深刻的是「創作大眾化」與「負責任的技術」之間的平衡。在讓任何人都能製作電影級影片的同時,Google 透過 SynthID 等技術努力減少虛假內容的風險,這點非常令人鼓舞。未來,這 8 秒的魔法將如何演變成 8 分鐘、80 分鐘的感動?人類又將書寫出怎樣的新故事?我們正親眼目睹這場偉大想像的第一幕。


參考資料

  1. 在 Gemini 與 Whisk 中使用 Veo 2 生成影片
  2. 在 Gemini 與 Whisk 中使用 Veo 2 生成影片 - YouTube
  3. 如何使用 Google Gemini Veo 2 影片產生器 - Kapwing
  4. 如何在 Gemini 中使用 Veo 2 製作影片:分步指南
  5. 使用 Veo 2 生成 Gemini 與 Whisk 影片 - AI SCKOOL
  6. 如何在 Gemini 中使用 VEO 2 和 WHISK 製作電影級 AI 影片:分步指南
  7. 在 Gemini 與 Whisk 中使用 Veo 2 生成影片 - ONMINE
  8. [在 Gemini 與 Whisk 中使用 Veo 2 生成影片 Komo AI 研究](https://komo.ai/share/1tppcby3AfOmW3zTwpkE)
  9. [在 Gemini 與 Whisk 中使用 Veo 2 生成影片 Hacker News](https://news.ycombinator.com/item?id=43695592)
  10. [在 Gemini API 中使用 Veo 3.1 生成影片 Google AI 開發者](https://ai.google.dev/gemini-api/docs/video)
  11. [Google 的 Veo 2 影片生成模型進駐 Gemini TechCrunch](https://techcrunch.com/2025/04/15/googles-veo-2-video-generator-comes-to-gemini/)
  12. 嘗試在由 Veo 2 驅動的 Gemini 中製作影片 – blog.aimactgrow.com
  13. Google 為 Gemini Advanced 與 Whisk 推出 AI 驅動影片生成功能
  14. 如何在 Gemini 中使用 Veo 2 和 Whisk 製作電影級 AI 影片:分步指南
  15. Gemini 應用程式向 Advanced 用戶推播 Veo 2 影片生成功能
  16. Google 在 Gemini 與 Whisk 中推出 Veo 2 影片生成功能
  17. [Google 揭曉 Veo 2:AI 影片創作的未來 AI 新聞](https://opentools.ai/news/google-unveils-veo-2-the-future-of-ai-video-creation)
  18. Google 的新 Veo 2 AI 影片生成功能推向 Gemini 與 Whisk 平台
測試你的理解
Q1. 在 Google Gemini Advanced 中透過 Veo 2 生成的影片標準長度是多少?
  • 3 秒
  • 8 秒
  • 30 秒
Veo 2 目前在 Gemini Advanced 和 Whisk 中以生成約 8 秒長的 MP4 影片片段為標準。
Q2. 在 Whisk 平台中將圖片轉換為影片的功能名稱為何?
  • WhiskAnimate
  • WhiskMove
  • WhiskLive
使用 Whisk 的 'WhiskAnimate' 功能,可以根據上傳的圖片製作出生動的 8 秒動畫影片。
Q3. 為了識別 AI 生成影片並強化安全性,Veo 2 影片中包含哪項技術?
  • 數位簽章
  • SynthID 浮水印
  • AI 勾選標記
為了負責任地使用 AI,Google 在所有由 Veo 2 生成的影片中應用了 SynthID 浮水印,以便識別為 AI 生成內容。