想像成為現實?Google Gemini 搭載的次世代影片 AI「Veo 2」打造的 8 秒魔法

在 Google Gemini 介面中,透過文字提示詞生成的解析度高、具電影感的影片剪輯顯示在螢幕上的樣子
AI Summary

Google 已將能把文字和圖片轉換為電影般 8 秒影片的次世代影片生成模型「Veo 2」整合至 Gemini Advanced 與實驗性工具 Whisk 中。

一行文字化為電影的世界

想像一下。 您想向某人生動地展示昨晚夢見的「穿著太空衣的貓在月球表面華麗衝浪的樣子」。在以前,您必須花數年時間學習複雜的影片剪輯技術,或者花費大量金錢和時間委託專業動畫師。但現在,您只需向 Google Gemini(Google 的人工智慧助理服務)輸入這一行文字即可。短短幾秒鐘內,您腦海中的場景就像魔法般化為生動的影片展現在眼前。Google Gemini

Google 最近宣布已將其最強大且最先進的影片生成模型 「Veo 2」 全面整合至付費訂閱服務 Gemini Advanced 及實驗性創作工具 Whisk 中。Generate videos in Gemini and Whisk with Veo 2 以前屬於專業領域的影片製作,現在僅憑我們每個人日常使用的語言就能實現。

為什麼這很重要?

我們現在比以往任何時候都更深處於「影片時代」。根據最新調查,我們消耗的所有網路數據中,有 65% 以上 是由影片內容佔據的。How to use Google Gemini Veo 2 Video Generator - Kapwing 如同 YouTube、TikTok、Instagram Reels 一樣,我們獲取資訊和尋找樂趣的核心手段已完全從文字和照片轉移到了影片。

但遺憾的是,影片製作仍然存在很高的門檻。不僅需要昂貴的攝影機和燈光,還需要學習數月才能勉強掌握的複雜剪輯軟體。Veo 2 的出現具有革命性意義,因為它將這種「製作的權力」分享給了我們每一個人。學生可以為了作業發表,將課本中的科學原理製作成生動的動畫;小規模業者則無需巨額行銷費用,就能快速製作出宣傳自己產品的簡短且具感官衝擊力的廣告影片。How to use Google Gemini Veo 2 Video Generator - Kapwing

輕鬆理解:Veo 2 如何運作?

1. 領悟物理定律的「數位動畫師」

Veo 2 與以往影片 AI 的關鍵區別在於其 「對現實世界的深度理解」。回想一下早期 AI 生成的影片,常會出現人走路時雙腿交叉、物體突然從空中出現、或是無視重力移動等尷尬且離奇的部分。

然而,Veo 2 更精確地學習了現實世界的物理定律(Physics,即物體因重力落下或碰撞的自然原理)以及人類複雜的動作。Generate videos in Gemini and Whisk with Veo 2

比喻來說,有這樣的差異:

如果說以前的 AI 只是單純快速翻閱數百張照片的「翻頁書(Flipbook)」程度,那麼 Veo 2 就像是一位 「天才動畫師」,它能準確理解球彈起的角度和人走路時手臂自然擺動的軌跡,並親自繪製出來。

藉此,角色的動作變得更流暢,背景描繪也變得真實得令人驚嘆。Google 將此稱為 「電影感寫實主義(Cinematic Realism)」,展現了十足的信心。Generate Gemini and Whisk videos with Veo 2 - AI SCKOOL

2. 為照片注入靈魂的「WhiskAnimate」

這次更新中最有趣的功能之一,就是包含在名為 「Whisk」 的實驗性工具中的 「WhiskAnimate」 功能。Generate videos in Gemini and Whisk with Veo 2 - YouTube

Whisk 是 Google Labs(預先測試 Google 最尖端 AI 技術的實驗空間)正在開發的專案,它不僅利用文字,還能利用現有圖片來創造新的成果。Google’s Veo 2 video generating model comes to Gemini 使用 WhiskAnimate 功能,您可以將相簿中沉睡的一張靜態照片,瞬間變成長達 8 秒、充滿生命力的影片。Google Gemini Advanced Now Lets You Generate 8-Second Video Clips

簡單來說,

這就像是在現實中實現了電影《哈利波特》裡 「會動的相框」。原本靜止的照片人物會對著您微笑,或者背景的樹葉隨風搖曳,提供這種如魔法般的體驗。

現狀:我們可以使用哪些功能

目前 Veo 2 以以下規格提供驚人的創作環境:

當然,就像所有技術一樣,仍有待克服的障礙。影片長度限制在 8 秒,對於包含長篇敘事來說還太短;而實驗性工具 Whisk 可能會根據各國政策限制使用。Whisk- labs.google/fx 但這「8 秒」的時間,對於製作 SNS Shorts 或 Reels 的精華片段,或是建構長篇電影的一個「場景(Scene)」來說,已經是無比強大的工具。

未來會如何?

Veo 2 的出現不僅僅是增加了一個「有趣的技術」,更預示著巨大的變化。

第一,創意的民主化(Democratization of Creativity)。現在,寫作的作家可以在文章中間加入親自製作的短插圖影片,行銷人員在會議中能即興將腦海中的想法視覺化為影片來說服團隊成員,這些都將成為日常。Generate Videos in Gemini and Whisk with Veo 2 - LinkedIn

第二,敘事方式的根本變化。俗話說「百聞不如一見」,在解釋複雜技術或抽象概念時,用 Veo 2 生成的視覺資料將比任何長篇大論都更具說服力。專家評價這是影片生成領域的一次巨大「躍進(Leap forward)」,並期待我們生產和消費內容的語法本身將發生改變。Generate videos in Gemini and Whisk with Veo 2

現在,您也試著和 Gemini 對話吧。您的想像力已準備就緒,即將化為 8 秒雖然短暫但強烈的魔法展現在您眼前。

AI 的觀點

在影片成為人類溝通新「標準語言」的今天,Veo 2 正在打破技術熟練度的高牆,幫助每個人都能透過視覺表達自己的聲音。雖然現在是從 8 秒的短片開始,但這或許是一個精彩的預告,預示著在不久的將來,我們將能與 AI 夥伴合作,共同製作出一整部劇情長片。

參考資料

  1. Generate videos in Gemini and Whisk with Veo 2
  2. Generate videos in Gemini and Whisk with Veo 2 - YouTube
  3. How to use Google Gemini Veo 2 Video Generator - Kapwing
  4. Generate Videos in Gemini and Whisk with Veo 2 - LinkedIn
  5. How to Create Videos in Gemini Using Veo 2: Step-by-Step Guide
  6. Generate Gemini and Whisk videos with Veo 2 - AI SCKOOL
  7. How to create cinematic AI videos in Gemini with Veo 2 and Whisk: Step …
  8. Google Launches Video Generation Veo 2 in Gemini
  9. Google Launches Veo 2 Video Generator for Gemini Advanced…
  10. Whisk- labs.google/fx
  11. You can now generate AI videos in Google Gemini and Whisk
  12. Google Gemini
  13. Google’s Veo 2 video generating model comes to Gemini
  14. Google Gemini Advanced Now Lets You Generate 8-Second Video Clips
  15. Gemini Advanced, Whisk users pick up Veo 2 for shareable cinematic …

事實查核摘要

  • 查核聲明數:13
  • 已驗證聲임數:13
  • 結論:通過 (PASS)
測試你的理解
Q1. 使用 Google 的 Veo 2 模型可生成的影片最大長度是多少?
  • 5 秒
  • 8 秒
  • 15 秒
Google Veo 2 目前可以生成 720p 解析度的 8 秒影片剪輯。
Q2. 將靜態圖片轉換為動畫影片的 Google 實驗性工具名稱為何?
  • Grok
  • Sora
  • Whisk
透過 Google Labs 實驗性專案 Whisk 的 WhiskAnimate 功能,可以將圖片製作成 8 秒長的動態影片。
Q3. Veo 2 相對於前一代模型改進的核心部分為何?
  • 單純提高了畫質。
  • 對物理定律和人類動作的理解度提高了。
  • 自動插入音樂。
Veo 2 更能理解現實世界的物理定律和人類動作,從而實現更流暢、更真實的動態。