[Google Veo 3.1] AI 影片也能「隨心所欲」操控！更生動的質感與聲音秘密

AI Summary

Google DeepMind 發布的 Veo 3.1 具備更精細的影片質感與原生音效生成功能，並能透過參考圖像保持角色一致，大幅強化了創作者的控制力。

想像一下，你腦海中構思的電影片段呈現在眼前的瞬間。當你輸入「主角與小狗在夕陽下的海邊奔跑」的指令（Prompt，給 AI 的指令）時，AI 就像施展魔法般瞬間生成影片。

但等等，出問題了。製作下一個鏡頭時，主角的臉變得有些微妙。剛才還是棕色頭髮，突然變成了黑髮。就像電影主角毫無預警地換人演一樣尷尬。

許多人在感嘆 AI 影片生成技術的同時，感到遺憾的正是這種「一致性」。「難道不能完全照我想要的樣子延續下去嗎？」現在，Google 推出的最新技術 Veo 3.1 將提供答案。根據 Introducing Veo 3.1: A Smarter Creative Leap with the New Gemini API，我們正正式邁入靈感即行動、內容生成如對話般直觀的時代。

為什麼這很重要？

到目前為止，AI 影片雖然新奇，但創作者很難 100% 隨心所欲地操控。更像是從 AI 隨機繪製的影片中挑選還不錯的「碰運氣」。但 Veo 3.1 不同，它給了創作者更強大的「方向盤」。

[Introducing Veo 3.1 and advanced creative capabilities…

TechNews](https://news-tech.io/en/news/introducing-veo-31-and-advanced-creative-capabilities) 強調這次更新賦予了人們更多的創意控制權。簡單來說，不再是「AI，隨便幫我做個酷的東西」，而是可以下達非常具體的指令：「讓這張照片裡的主角，在這個地方，發出這種聲音並動起來」。

即使不是專家，只要幾張照片就能製作出電影般的影片，且 AI 會自動配上完美的聲音。從 YouTube 創作者到製作個人收藏影片的一般大眾，每個人都握有成為「AI 電影導演」的強大工具。事實上，在 Google 的 AI 電影製作工具「Flow」中，過去 5 個月內已生成了超過 2.75 億支影片，反映出極高的關注度。Introducing Veo 3.1 and advanced creative capabilities - ONMINE

輕鬆理解：Veo 3.1 的三大魔法

Veo 3.1 是在先前模型 Veo 3 的基礎上，經過進一步精細打磨的尖端模型。[Ultimate prompting guide for Veo 3.1

Google Cloud Blog](https://cloud.google.com/blog/products/ai-machine-learning/ultimate-prompting-guide-for-veo-3-1) 讓我們從非專業人士的角度逐一看看具體有哪些變化。

1. 「真實感」的差異：質感與聲音

我們看影片覺得「假假的」或「粗糙」的最大原因在於細微的質感。陽光下的皮膚毛孔、隨風擺動的織物紋理、泛起漣漪的水面。Veo 3.1 捕捉逼真質感的能力大幅提升。Introducing Veo 3.1 and advanced capabilities in Flow

這裡還加入了驚人的「聲音」魔法。如果說以前的影片 AI 只是製作無聲電影，Veo 3.1 則能生成 原生音效 (Native Audio，生成影片時同步產生的音效)。Introducing our state of the art video generation model Veo 3, and… 這不只是隨便配上背景音樂，從自然的對話到與影片動作完美契合的音效 (SFX) 都能同時完成。Introducing Veo 3.1 and new creative capabilities in the Gemini API

打個比方：Veo 3.1 不只是畫質變好的電視，而是升級成了配備環繞音響的最新型 IMAX 影院系統。

2. 用「素材圖像」守護一致性

為了達成前述「主角變來變去」的問題，Google 引入了「Ingredients to video (素材生成影片)」這項創新功能。用戶可以預先提供最多 3 張包含角色、特定物體或背景的 參考圖像 (Reference Image)。Introducing Veo 3.1 and new creative capabilities in the Gemini API

AI 會將這些照片視為珍貴的「素材」，在整個影片中保持角色外貌或風格的一致性。[Veo 3

Google AI Studio](https://aistudio.google.com/models/veo-3)。現在主角從第一幕到最後一幕都能以同一張臉出現了。

打個比方：這就像不再是對廚師說「隨便幫我做點好吃的」，而是給出你喜歡的肉類和蔬菜照片，並具體指定「請用這些材料做菜」。

3. 影片延伸與鏡頭銜接

製作影片時常會覺得「啊，這個鏡頭要是能再長一點就好了」。Veo 3.1 提供以 7 秒為單位持續延長現有影片的功能。Veo 3.1 동영상 이어가기 기능 마스터하기: 7초 증분… - Apiyi.com Blog

此外，只要指定第一幕和最後一幕，它還具備能將中間銜接得流暢自然的「場景轉換 (Transition)」功能。Introducing Veo 3.1 and new creative capabilities in the Gemini API，讓你能完成一段毫無斷層感的流暢影片。

打個比方：這就像組裝樂高積木一樣，把一個個 7 秒的影片積木銜接起來，完成屬於自己的長篇故事。

現況：進展到哪裡了？

Veo 3.1 與其說是全新的技術，不如說是根據用戶回饋細心打磨，將既有 Veo 3 性能發揮到極致的更新版本。Veo 3.1: Google’s Latest AI Video Update — New Features and … 特別是在將靜態圖片轉換為充滿活力的影片 (Image-to-Video) 時，品質提升尤為顯著。Introducing Veo 3.1 and advanced Flow capabilities - AI SCKOOL

現在這項技術同時支援適合手機觀看的直向 (Portrait) 與電影螢幕般的橫向 (Landscape) 格式。因此，無論是 TikTok、Shorts 的短影音，還是電影般的寬螢幕影片，都能維持風格的一致性。[Veo 3

Google AI Studio](https://aistudio.google.com/models/veo-3)

未來將會如何？

Google 期待透過 Veo 3.1，讓 AI 不僅是「代勞」製作影片的秘書，而是成為將人類創作者靈感具現化的「精細助手」。Introducing Veo 3.1: A Smarter Creative Leap with the New Gemini API 未來，我們將能像與朋友聊天般直觀地與 AI 溝通，無需學習複雜的剪輯技術，任何人都能完成高品質的影片。

想像一下，抽屜裡沉睡已久的一張老家合照遇到 Veo 3.1 會如何？或許能聽到照片中家人的笑聲，重新煥發為一段能感受到那天微風拂過衣角的生動回憶影片。這正是技術帶給我們最溫暖且驚人的可能性。

AI 的視角

在 MindTickleBytes 的 AI 記者看來，Veo 3.1 的核心在於「控制權的民主化」。因為以往需要昂貴設備與專業知識的「影片執導」領域，現在已交到了大眾手中。當每個人都能將腦中的想像轉化為具備真實質感與聲音的影像時，特別是維持角色一致性的技術，將成為 AI 影片從一時的「實驗作」邁向「真正內容」的關鍵契機。

參考資料

Introducing Veo 3.1 and advanced capabilities in Flow
Introducing Veo 3.1 and new creative capabilities in the Gemini API

[Ultimate prompting guide for Veo 3.1

Google Cloud Blog](https://cloud.google.com/blog/products/ai-machine-learning/ultimate-prompting-guide-for-veo-3-1)

Introducing Veo 3.1 and advanced creative capabilities - ONMINE
Introducing Veo 3.1 and advanced creative capabilities
Introducing Veo 3.1 and advanced Flow capabilities - AI SCKOOL
Veo 3.1: Google’s Latest AI Video Update — New Features and …

[Introducing Veo 3.1 and advanced creative capabilities…

TechNews](https://news-tech.io/en/news/introducing-veo-31-and-advanced-creative-capabilities)

Introducing our state of the art video generation model Veo 3, and…
[Veo 3 Google AI Studio](https://aistudio.google.com/models/veo-3)
Veo 3.1 동영상 이어가기 기능 마스터하기: 7초 증분… - Apiyi.com Blog
Introducing Veo 3.1 and new creative capabilities in the Gemini API
Introducing Veo 3.1: A Smarter Creative Leap with the New Gemini API
Veo 3.1: My Hands-On Deep Dive into… - CrePal Content Center

FACT-CHECK SUMMARY

Claims checked: 19
Claims verified: 18
Verdict: PASS

Share this article:

測試你的理解

Q1. Veo 3.1 中為了保持角色或風格一致性而提供的新功能名稱為何？

素材生成影片 (Ingredients to video)
影片延伸 (Video Extend)
聲音同步 (Sound Sync)

Veo 3.1 引入了「Ingredients to video」功能，可使用最多 3 張參考圖像來保持角色或物體的一致性。

Q2. Veo 3.1 的影片延伸 (Video Extend) 功能每次可以延長幾秒？

3秒
7秒
15秒

Veo 3.1 的影片延伸技術允許以 7 秒為增量單位延續影片。

Q3. 關於 Veo 3.1 相較於前一版本 Veo 3 的改進點，下列何者「錯誤」？

更豐富的原生音效生成
圖片轉影片的品質提升
僅在無網路連接的本地環境運作

Veo 3.1 提升了音效品質與圖轉影品質，但提供的資料中未提到它是僅限本地運作的模型。