Google 發佈了具備更真實畫質與精細編輯能力的 AI 影片模型「Veo 3.1」,開啟了一個讓任何人都能將想像力轉化為高品質影片的新時代。
想像一下。 你的手機相簿裡存著一張家裡小狗的可愛照片。你把這張照片交給 AI,然後對它說:「幫我做一段影片,讓我家小狗穿著帥氣的太空衣,在月球上蹦蹦跳跳。」
過不了多久,一段宛如好萊塢科幻電影場景般生動的高畫質影片就出現在你眼前。小狗的毛髮在無重力狀態下根根分明地飄動,每當牠的腳接觸到粗糙的月球表面時,甚至能聽到與畫面完美契合的「沙沙」摩擦聲。這不再只是單純讓圖畫動起來,而是誕生了一個充滿聲音與質感的真實「世界」。
這不再是科幻電影裡的橋段。這是 Google DeepMind 最近發佈的最新 AI 影片生成模型 「Veo 3.1」 將為我們日常生活帶來的變革。Introducing Veo 3.1 and advanced capabilities in Flow
為什麼這很重要?
直到現在,用 AI 製作影片還很像是在「靠運氣夾娃娃」。輸入「製作一段絕美的森林影片」,雖然能得到不錯的結果,但很難精確維持你腦海中構思的樹木形狀或特定角色的感覺。AI 往往因為無法 100% 讀懂你的心思,而交出牛頭不對馬嘴的成品。
但 Veo 3.1 不同。這個模型為創作者提供了可以親自調整微小細節的「精準控制器」。Introducing our state of the art video generation model Veo 3, and…
這之所以重要,是因為 創作的門檻將徹底消失。現在,即便沒有學習過專業的剪輯技術,或沒有價值數百萬的高昂設備,只要你有「點子」,就能隨心所欲地製作高品質影片。Google 將此稱為超越工具的 「智慧型創意副駕駛 (Creative co-pilot)」,意指在創作過程中,AI 成為人類的助手,共同並肩飛行。Veo 3.1: Your Gateway to Enhanced Creative Possibilities
輕鬆理解:Veo 3.1 施展的三大魔法
透過以下三個核心功能,我們來看看 Veo 3.1 比起前一代聰明了多少,以及它如何協助我們的創作活動。
1. 像挑選食材般製作影片:「素材生影 (Ingredients to Video)」
如果說以前的 AI 是只看食譜(文字說明)就做菜的廚師,那麼 Veo 3.1 的 「素材生影 (Ingredients to Video)」 功能就像是直接把新鮮食材遞給廚師一樣。Introducing Veo 3.1 and advanced capabilities in Flow
你現在可以提供最多 3 張參考圖片給 AI。Introducing Veo 3.1 and new creative capabilities in the … 比喻來說就像這樣:
- 圖片 1 (主角):你自己畫的獨特角色草圖
- 圖片 2 (背景):你在旅遊時拍下的寧靜森林照片
- 圖片 3 (氛圍):你喜歡的陽光灑落、溫暖的水彩調影像
只要給出這三種「食材」,AI 就能準確維持角色的長相與背景的氛圍,並生成影片。Google News - Google launches Veo 3.1, an AI video generation tool… 「讓我設計的角色在我拍的照片裡玩耍」這個願望,終於能完美實現。Google Launches Veo 3.1 and New Audio Controls in Flow
2. 詢問「後來呢?」的樂趣:「續寫 (Extend)」功能
以往 AI 影片最大的缺點就是長度太短,僅僅幾秒鐘就結束,令人意猶未盡。「續寫 (Extend)」 功能解決了這個遺憾。Introducing Veo 3.1 and new creative capabilities in the … 這就像小孩睡前問:「媽媽,後來主角怎麼了?」父母接著講故事一樣。
Veo 3.1 可以每次以 7 秒為單位 不斷延長現有的影片。透過重複這個過程,甚至能製作出總長度 超過 1 分鐘 的長影片。Veo 3.1 동영상 이어가기 기능 마스터하기: 7초 증분… - Apiyi.com Blog Google Unveils Veo 3.1 & Upgrades Flow with Advanced Abilities 此外,如果你指定了影片的開頭與結尾畫面,AI 還能自動填充中間的內容,這就是「場景過渡 (Transition)」功能,讓故事敘述更加流暢。Introducing Veo 3.1 and new creative capabilities in the …
3. 為影片注入靈魂的聲音:「原生音效 (Native Audio)」
當人類從無聲電影時代跨入有聲電影時代時,曾受到巨大的衝擊。因為有了聲音,影像彷彿獲得了真正的「生命」。Veo 3.1 不僅製作影片,還會為該場景生成完美的音效。這被稱為 「原生音效 (Native Audio)」。Introducing our state of the art video generation model Veo 3, and…
這不僅僅是加上背景音樂而已。它能根據畫面中人物的口型生成對話,或是走在雪地上的「吱吱」聲、微風吹動樹葉的沙沙聲等,生成與影片情境完全同步的音效。Introducing Veo 3.1 and new creative capabilities in the Gemini API 視覺的真實感加上聽覺的沉浸感,讓影片的完成度有了飛躍性的提升。Google Launches Veo 3.1 and New Audio Controls in Flow
現狀:目前發展到哪裡了?
| Veo 3.1 是在 Google DeepMind 現有模型 Veo 3 的基礎上,性能進一步提升的尖端模型。[Ultimate prompting guide for Veo 3.1 | Google Cloud Blog](https://cloud.google.com/blog/products/ai-machine-learning/ultimate-prompting-guide-for-veo-3-1) 它不只是畫質變好,理解並執行使用者指令(提示詞)的能力也變得更加精細。Introducing Veo 3.1 and advanced capabilities in Flow 簡單來說,它變成了一個「非常聽得懂話的 AI」。 |
目前,Veo 3.1 已可透過 Google 的創作工具 「Flow」 使用,也為專業人士開放了 「Gemini API」。Google Unveils Veo 3.1 & Upgrades Flow with Advanced Abilities 特別是在付費預覽版中,使用者可以根據需求選擇高品質的「Veo 3.1」或是生成速度更快的「Veo 3.1 Fast」。Introducing Veo 3.1 and new creative capabilities in the Gemini API
當然,目前還沒到盡善盡美的階段。關於它在實際工作場景中的效率,以及對短影音製作的具體幫助,仍有許多專家正在進行測試與分析。Veo 3.1 Review: Capabilities, Limits, and Real-World Use
未來會有什麼改變?
Veo 3.1 的出現不僅將改變我們消費內容的方式,更將從根本上改變我們「生產」內容的方式。以前為了製作一段影片,需要經過企劃、拍攝、燈光、剪輯、錄音等多個複雜步驟,現在則可以像與 AI 「對話」 一樣產生作品。Introducing Veo 3.1: A Smarter Creative Leap with the New Gemini API
未來,我們可以期待以下驚人的變化:
- 專屬個人的電影:將孩子當主角的繪本做成動畫,或是根據自己寫的短文瞬間製作出個人短片。
- 人人都是廣告製作人:經營小電商的老闆不必花大錢,也能親自為自家產品製作精美的宣傳影片。
- 生動的教育現場:透過 AI 影片,讓原本只能從書本上看到的複雜科學原理或歷史事件,變得像親臨現場般生動。
Google DeepMind 希望透過 Veo 3.1 實現一個靈感即刻化為現實、生成內容像日常對話一樣直觀的世界。Introducing Veo 3.1: A Smarter Creative Leap with the New Gemini API 當你手握這款魔法般的工具時,你最想先製作什麼樣的影片呢?
AI 的視角
MindTickleBytes AI 記者的觀點: Veo 3.1 象徵著 AI 已經超越了單純繪製事物的「生成器」,進化為深諳人類創意意圖的「協作夥伴」。特別是以圖片作為素材的功能以及長影片續寫功能,體現了 Google 致力於將創作主導權歸還給人類想像力的思考。技術門檻已經瓦解,現在我們需要的,只是一個關於「你想講什麼故事」的答案。
參考資料
- Introducing Veo 3.1 and advanced capabilities in Flow
- Introducing Veo 3.1 and new creative capabilities in the Gemini API
-
[Ultimate prompting guide for Veo 3.1 Google Cloud Blog](https://cloud.google.com/blog/products/ai-machine-learning/ultimate-prompting-guide-for-veo-3-1) - Introducing Veo 3.1 and advanced creative capabilities
- Veo 3.1: Google’s Latest AI Video Update — New Features and …
- Veo 3.1 Review: Capabilities, Limits, and Real-World Use
- Introducing Veo 3.1 and new creative capabilities in the Gemini API (Paid Preview)
- Veo 3.1: Your Gateway to Enhanced Creative Possibilities
- Veo 3.1 동영상 이어가기 기능 마스터하기: 7초 증분… - Apiyi.com Blog
- Introducing our state of the art video generation model Veo 3, and…
- Google News - Google launches Veo 3.1, an AI video generation tool…
- Introducing Veo 3.1 and new creative capabilities in the Gemini API (TechNews)
- Google Unveils Veo 3.1 & Upgrades Flow with Advanced Abilities
- Google Launches Veo 3.1 and New Audio Controls in Flow
- Introducing Veo 3.1: A Smarter Creative Leap with the New Gemini API
事實查核摘要 (FACT-CHECK SUMMARY)
- 查核項目:21
- 已證實項目:21
- 結論:通過 (PASS)
- 影片擴展 (Video Extend)
- 素材生影 (Ingredients to Video)
- 原生音效 (Native Audio)
- 以 3 秒為單位
- 以 7 秒為單位
- 以 15 秒為單位
- 聲視品質提升
- 提示詞遵從能力強化
- 新增單純的文字摘要功能