現在只需在 Google Gemini 輸入一行文字,即可製作長達 8 秒的高畫質電影感影片。為您介紹開啟 AI 影片新時代的 Veo 2。
試著想像一下:你想向某人解釋昨晚夢見的「穿梭在佈滿霓虹燈的未來都市中的飛行車」。以往你可能需要花好幾個月學習複雜的繪圖工具,或是花大錢請專家製作。但現在,你只需要在 Google Gemini 的聊天視窗輸入一句話:「製作一段像電影一樣的飛行車在霓虹閃爍的未來都市中奔馳的影片」。只需幾秒鐘,你腦海中的想像就會化為栩栩如生的動態影像,呈現在你眼前。
Google 最近宣佈,在其付費訂閱服務「Gemini Advanced」及實驗性創作工具「Whisk」中,搭載了次世代影片生成模型 Veo 2。 [嘗試在 Gemini 中生成由 Veo 2 驅動的影片] [您現在可以在 Google Gemini 與 Whisk 中生成 AI 影片] 現在我們正處於一個不需要複雜的攝影器材,僅憑文字或圖片就能隨手創作出專業級短片的時代。
為什麼這很重要?影片製作的「門檻」正在消失
到目前為止,與 AI 對話來寫作或繪圖已經變得很常見。但「影片」則是另一個層次的問題。影片是由每秒數十張靜止畫面快速更換而產生的動態感,這意味著 AI 不僅要繪圖,還必須完美計算時間的流逝與物體的運動。
Veo 2 的出現不僅僅是增加了一個「新功能」,它更代表了影片製作的民主化。現在,即使是完全沒有影片剪輯技術的普通人,也能即時將自己的點子視覺化。 [在 Gemini 與 Whisk 中使用 Veo 2 生成影片] 專家戴夫·康斯汀 (Dave Constine) 強調,這項工具對於社群媒體創作者或品牌經營者來說,「並非遙遠未來的技術,而是現在就能運用在工作上的現實工具」。 [在 Gemini 與 Whisk 中使用 Veo 2 生成影片]
打個比方,以前拍一部電影需要巨大的製片廠和無數的工作人員,現在你手中的智慧型手機就能代勞這一切。
輕鬆理解:Veo 2 是如何製作影片的?
如果把影片生成 AI Veo 2 比喻成我們身邊的人物,可以說它是一位 「鑽研過世上所有影片的天才動畫師」。
舉例來說,假設你下達了「狗狗在夕陽下的海灘開心地奔跑」的指令。 Veo 2 並非單純將幾張相似的照片拼湊在一起,這個 AI 已經透過海量數據學習並瞭解「夕陽的光芒會以什麼角度散射」、「狗狗奔跑時腿部肌肉如何收縮」、「海浪會以什麼節奏拍打」。 [Google 將 Veo 2 影片生成器整合至 Gemini Advanced 平台]
就像頂尖大廚接到「辛辣義大利麵」的訂單,腦海中會立刻浮現食材的搭配與烹飪過程。 Veo 2 也會根據你的文字(食譜),精確地組合物理定律與視覺風格,產出一段長達 8 秒的動態成果。
特別有趣的功能是 「Whisk Animate」。 [Gemini 獲得 Veo 2 與 Whisk Animate 用於 AI 影片創作] 這是一項賦予靜止照片生命力的技術。如果你將旅行時拍下的絕美風景照放入 Whisk,AI 就能讓照片中的樹木隨風搖曳,或讓雲朵緩緩飄動,將其轉變為充滿生命力的影片,為充滿回憶的照片帶來魔幻般的變革。 [Google Gemini Advanced 現在讓您生成 8 秒長的影片片段] [如何在 Gemini 中使用 Veo 2 與 Whisk 製作電影感的 AI 影片:分步指南]
現狀:我們現在就能享受的功能
目前在 Google Gemini 中可以使用的 Veo 2 主要特徵整理如下:
- 8 秒的魔法:單次生成的影片長度為 8 秒。 [嘗試在 Gemini 中生成由 Veo 2 驅動的影片] [Google 在 Gemini 中推出影片生成模型 Veo 2] 雖然這大約只是深呼吸一次的時間,但對於 Instagram Reels 或 TikTok 等短影音內容來說,已足以留下強烈的印象。
- 清晰高畫質:提供 720p 解析度(HD 級畫質)的 MP4 檔案。 [Google 在 Gemini 中推出影片生成模型 Veo 2] 畫面比例為 YouTube 或電視常見的 16:9 寬螢幕模式 (Widescreen),適合各種用途。 [在 Gemini 與 Whisk 中使用 Veo 2 生成影片 - The Story Thailand]
- 如同導演般的運鏡:除了指定「畫什麼」,你還可以指定鏡頭移動(如放大、縮小)或電影般的色調。 [Google 將 Veo 2 影片生成器整合至 Gemini Advanced 平台] 你能體驗到像導演一樣向攝影師下達詳細指令的感覺。
- 負責任的創作:為了防止 AI 製作的影片被用於假新聞等用途,Google 應用了隱形的數位浮水印技術 SynthID。 [Google 將 Veo 2 影片生成器整合至 Gemini Advanced 平台] 雖然肉眼看不見,但在技術上可以識別出影片是由 AI 製作的,提高了透明度。
使用方法非常簡單。如果你是 Gemini Advanced 訂閱者,只需在模型選擇選單中選擇 「Veo 2」 即可。 [嘗試在 Gemini 中生成由 Veo 2 驅動的影片] 目前正陸續向全球用戶開放,請立即查看! [Google 推出 AI 驅動的 Gemini 影片生成功能]
未來展望:直到 8 秒變成電影的那一天
雖然現在只是 8 秒的短片,但考量到技術發展的速度,不久後我們可能就能生成整段想看的電影片段,或是即時製作完全客製化的個人廣告。 Google 透過這次 Veo 2 的整合,宣佈進入了能自由處理文字、照片、聲音乃至「影片」的真正 多模態 (Multimodal) AI 時代。 [Google 將 Veo 2 影片生成器整合至 Gemini Advanced 平台]
當然,目前仍有待改進之處。每月生成的影片數量有限制,且處理非常複雜的物理定律(如潑水等)時偶爾會顯得不自然。 [在 Gemini 與 Whisk 中使用 Veo 2 生成影片 - The Story Thailand] 但 Google 正持續改進便利性,例如在用戶達到生成上限前發出通知。
AI 的觀點(MindTickleBytes AI 記者的一句話)
影片生成 AI 的發展將從根本上改變我們記錄和表達世界的方式。如果說到目前為止是透過相機鏡頭捕捉世界的「拍攝」時代,那麼現在正轉向將腦海中的想像轉化為文字的「組合」時代。技術固然重要,但我更期待拿到這項強大工具的我們人類,創意究竟能延伸到何處。今天,你想用這 8 秒的魔法創造什麼樣的特別時刻呢?
參考資料
- 嘗試在 Gemini 中生成由 Veo 2 驅動的影片
- 在 Gemini 與 Whisk 中使用 Veo 2 生成影片
- Google 在 Gemini 中推出影片生成模型 Veo 2
- 您現在可以在 Google Gemini 與 Whisk 中生成 AI 影片
- 在 Gemini 與 Whisk 中使用 Veo 2 生成影片 - The Story Thailand
- Google 新聞 - Gemini 概覽
- Gemini 影片生成功能隨 Veo 2 與 Whisk 推出
- Gemini 獲得 Veo 2 與 Whisk Animate 用於 AI 影片創作
- Google 將 Veo 2 影片生成器整合至 Gemini Advanced 平台
- Google Gemini 推出影片生成器:如何使用 Veo 2 模型製作 AI 片段
- Google 的 Veo 2 影片生成模型進入 Gemini
- Google 推出 AI 驅動的 Gemini 影片生成功能
- Google Gemini Advanced 現在讓您生成 8 秒長的影片片段
- 如何在 Gemini 中使用 Veo 2 與 Whisk 製作電影感的 AI 影片
- Google 向 Gemini Advanced 開放其 AI 影片生成器
事實查核摘要
- 查核項目:20
- 已驗證項目:19
- 結論:通過
- Gemini Video
- Veo 2
- Whisk Animate
- 5 秒
- 8 秒
- 15 秒
- AI-Sign
- DigitalStamp
- SynthID