幻想变现实?谷歌 Gemini 搭载的下一代视频 AI 'Veo 2' 创造的 8 秒魔法

谷歌 Gemini 界面中显示通过文本提示生成的电影感高清视频剪辑的画面
AI Summary

谷歌已将能将文本和图像转换为电影级 8 秒视频的下一代视频生成模型 'Veo 2' 集成到 Gemini Advanced 和实验性工具 Whisk 中。

文字成片的时代

想象一下。 你想向某人展示昨晚梦见的“穿着宇航服的猫在月球表面华丽冲浪”的画面。在过去,你可能需要学习多年的复杂视频编辑技术,或者花费大量金钱和时间委托专业动画师。但现在,你只需向谷歌 Gemini(谷歌的 AI 助手服务)输入这句话。只需几秒钟,你脑海中的场景就会像魔法一样呈现在眼前。 Google Gemini

谷歌最近宣布,已将其最强大、最先进的视频生成模型 “Veo 2” 正式集成到付费订阅服务 Gemini Advanced 和实验性创作工具 Whisk 中。 Generate videos in Gemini and Whisk with Veo 2 曾属于专业领域的视频制作,现在仅凭我们日常的语言即可实现。

为什么这很重要?

我们现在比以往任何时候都更深地处于“视频时代”。根据最新调查,我们消费的整个互联网数据中,有 65% 以上 是视频内容。 How to use Google Gemini Veo 2 Video Generator - Kapwing 就像 YouTube、TikTok 和 Instagram Reels 一样,我们获取信息和寻求娱乐的核心手段已完全从文字和照片转移到了视频。

但遗憾的是,视频制作仍然存在很高的准入门槛。不仅需要昂贵的相机和灯光,还需要学习数月才能掌握的复杂编辑软件。Veo 2 的出现极具革命性,因为它将这种“创作权”分享给了我们每一个人。学生们可以为了作业展示将课本中的科学原理制作成生动的动画,小企业主无需高昂的营销费用也能快速制作出推广产品的精美短片。 How to use Google Gemini Veo 2 Video Generator - Kapwing

深入浅出:Veo 2 是如何运作的?

1. 掌握物理规律的“数字动画师”

Veo 2 与之前的视频 AI 相比,最核心的区别在于其对 “现实世界的深度理解”。回想一下早期的 AI 视频,经常会出现人走路时双腿交错、物体凭空出现、或者无视重力移动等尴尬而怪异的画面。

但 Veo 2 经过学习,能更精准地掌握现实中的物理规律(Physics,即物体受重力下落或碰撞的自然原理)以及人体复杂的动作。 Generate videos in Gemini and Whisk with Veo 2

比喻来说:

如果说以前的 AI 只是将数百张照片快速翻动的“翻页书”水平,那么 Veo 2 就像是一位能够准确理解球弹跳的角度、人走路时手臂自然摆动的轨迹,并亲手绘图的 “天才动画师”

得益于此,角色的动作变得更加流畅,背景描写也真实得令人惊叹。谷歌将其称为 “电影感真实感 (Cinematic Realism)”,并对此充满信心。 Generate Gemini and Whisk videos with Veo 2 - AI SCKOOL

2. 为照片注入灵魂的“WhiskAnimate”

本次更新中最有趣的功能之一是集成在名为 “Whisk” 的实验性工具中的 “WhiskAnimate” 功能。 Generate videos in Gemini and Whisk with Veo 2 - YouTube

Whisk 是谷歌实验室(Google Labs,预先测试谷歌尖端 AI 技术的实验空间)正在开发的项目,它不仅利用文本,还能利用现有图像创造新成果。 Google’s Veo 2 video generating model comes to Gemini 使用 WhiskAnimate 功能,可以将相册中沉睡的一张静态照片瞬间变成一段 8 秒长的生动视频。 Google Gemini Advanced Now Lets You Generate 8-Second Video Clips

简单来说,

这就像是在现实中实现了电影《哈利·波特》中 “会动的相框”。照片中静止的人物会对你微笑,背景中的树叶随风摇曳,为你提供这种魔幻般的体验。

现状:我们可以使用的功能

目前 Veo 2 以以下规格提供令人惊叹的创作环境:

当然,正如所有技术一样,目前仍有挑战需要克服。由于视频长度限制在 8 秒,承载长叙事的能力尚显不足;此外,实验性工具 Whisk 可能会因各国政策不同而受到使用限制。 Whisk- labs.google/fx 但这“8 秒”的时间对于制作 SNS Shorts 或 Reels 的精彩片段,或者构成一部长电影中的一个“场景 (Scene)”来说,已经足够强大。

未来展望

Veo 2 的出现预示着巨大的变革,而不仅仅是增加了一项“有趣的技术”。

第一,是 创作的大众化 (Democratization of Creativity)。以后作家可以在文章中插入自己制作的短视频插画,营销人员可以在会议中将瞬间迸发的灵感可视化为视频以说服团队成员,这将成为常态。 Generate Videos in Gemini and Whisk with Veo 2 - LinkedIn

第二,是 叙事方式的根本改变。俗话说“百闻不如一见”,在解释复杂技术或抽象概念时,用 Veo 2 生成的视觉资料将比任何长篇大论都更具说服力。专家们将其评价为视频生成领域的巨大“飞跃 (Leap forward)”,并期待我们生产和消费内容的方式本身会发生改变。 Generate videos in Gemini and Whisk with Veo 2

现在,尝试与 Gemini 对话吧。你的想象力已经准备好化作 8 秒虽然短暂却震撼人心的魔法,呈现在你的眼前。

AI 视角

在视频已成为人类沟通新“标准语言”的今天,Veo 2 正在打破技术门槛这一高墙,帮助每个人通过视觉表达自己的声音。虽然目前是从 8 秒短片开始,但这预示着在不久的将来,我们将与 AI 这一可靠的伙伴合作,共同制作出长篇电影。

参考资料

  1. Generate videos in Gemini and Whisk with Veo 2
  2. Generate videos in Gemini and Whisk with Veo 2 - YouTube
  3. How to use Google Gemini Veo 2 Video Generator - Kapwing
  4. Generate Videos in Gemini and Whisk with Veo 2 - LinkedIn
  5. How to Create Videos in Gemini Using Veo 2: Step-by-Step Guide
  6. Generate Gemini and Whisk videos with Veo 2 - AI SCKOOL
  7. How to create cinematic AI videos in Gemini with Veo 2 and Whisk: Step …
  8. Google Launches Video Generation Veo 2 in Gemini
  9. Google Launches Veo 2 Video Generator for Gemini Advanced…
  10. Whisk- labs.google/fx
  11. You can now generate AI videos in Google Gemini and Whisk
  12. Google Gemini
  13. Google’s Veo 2 video generating model comes to Gemini
  14. Google Gemini Advanced Now Lets You Generate 8-Second Video Clips
  15. Gemini Advanced, Whisk users pick up Veo 2 for shareable cinematic …

事实核查总结

  • 核查声明数:13
  • 验证声明数:13
  • 结论:通过 (PASS)
测试你的理解
Q1. 使用谷歌 Veo 2 模型生成的视频最大长度是多少?
  • 5秒
  • 8秒
  • 15秒
谷歌 Veo 2 目前可以生成 720p 分辨率的 8 秒视频剪辑。
Q2. 谷歌推出的能将静态图像转化为动画视频的实验性工具名称是什么?
  • Grok
  • Sora
  • Whisk
通过谷歌实验室的实验性项目 Whisk 中的 WhiskAnimate 功能,可以将图像转化为 8 秒长的动态视频。
Q3. Veo 2 相比前代模型的核心改进是什么?
  • 仅提高了画质。
  • 提高了对物理规律和人体动作的理解能力。
  • 可以自动插入音乐。
Veo 2 能够更好地理解现实世界的物理规律和人体动作,从而实现更加流畅和真实的动态效果。