写真3枚だけで「同じ主人公」の動画を？Google Veo 3.1が見せる魔法

想像してみてください。大切にしている愛犬の写真1枚、そして前回の休暇で撮った穏やかな森の背景写真があります。この2枚の写真を人工知能（AI）に渡し、「うちのワンちゃんがこの森の中を元気に走り回るTikTok動画を作って」と注文します。しばらくすると、まるで本物のカメラで撮影したかのように自然な縦型動画が、あなたのスマートフォンの画面に現れます。

これまでのAI動画技術が「何が出るかわからない宝くじ」に近かったとすれば、これからは自分好みの材料を正確に投入し、結果をコントロールする「オーダーメイド料理」の領域へと突入しています。Google DeepMindが新たに発表した動画生成モデル「Veo 3.1」が、まさにこのような革新をリードしています。

Veo 3.1 Ingredients to Video: New video generation model updates によれば、このモデルは以前のバージョンよりもはるかに高い一貫性と創造性、そして制作者へのコントロール機能を提供するよう設計されています。YouTube drops AI video feature that might actually work において、Google DeepMindのリードプロダクトマネージャーであるリッキー・ウォン（Ricky Wong）氏は、今回のアップデートが「以前のバージョンと比較して、より優れた一貫性、創造性、コントロールを実現している」と強調し、AI動画制作の新たな基準を提示しました。

なぜこれが重要なのか？ (Why It Matters)

これまでAIで動画を制作する際、クリエイターを最も悩ませてきた問題は「一貫性（Consistency）」でした。動画が流れている間、キャラクターや背景が変わらずに維持される必要がありますが、現実はそうではありませんでした。

例えば、1秒前までは茶色だった主人公の帽子が次のシーンで突然赤色に変わったり、可愛らしい犬の顔が微妙に不気味に歪んだりといった具合です。専門家はこれを「アイデンティティ・ドリフト（Identity drift、対象のアイデンティティが失われる現象）」と呼びますが、これは映画や広告のような高品質な動画を作ろうとする人々にとっては致命的な欠陥でした。[Veo 3.1 Ingredients to Video

Consistent Character AI Video](https://www.vo3ai.com/veo3-ingredients)

Veo 3.1はこの問題に正面から挑みました。クリエイターが希望するキャラクター、物体、あるいはシーンの写真を「参照画像（Reference Image）」として提供すれば、AIがそれを基に動画のすべてのフレームを固定します。Veo 3.1 Ingredients to Video: Use Reference Images for AI Video

また、最近のYouTubeショートやTikTokのように縦型コンテンツが主流である流れを反映し、「ネイティブ縦型モード（9:16比率）」の出力をサポートしています。Google’s Veo now turns portrait images into vertical AI videos 単に横長の動画を上下でカットするのではなく、最初から縦長画面に最も適した構図で動画を描き出すという点が核心です。

わかりやすく解説：「材料から動画へ」 (The Explainer)

今回のアップデートの核となる機能は、名前からして美味しそうな「Ingredients to Video（材料から動画へ）」です。料理人が新鮮な食材を選んで逸品料理を作るように、動画に使用する視覚的要素をユーザーがあらかじめ指定する方式です。

比喩を挙げてみましょう。皆さんがシェフ（AI）に「美味しいパスタを作って」とだけ言えば、シェフは自分の好みでトマトパスタを出すかもしれませんし、クリームパスタを出すかもしれません。しかし、皆さんが「このオーガニック麺とこの特製ソース、そしてこのチーズを使って作って」と材料を直接渡したらどうでしょうか？出来上がるのは、まさに皆さんが想像した通りの味になるはずです。

Veo 3.1は、まさにこの「材料提供」方式を採用しています。

参照画像の提供: ユーザーは主人公のキャラクターや特定の背景写真を最大3枚までAIに渡すことができます。Introducing Veo 3.1 and new creative capabilities in the Gemini API
視覚的な「錨（アンカー）」を下ろす: 提供された写真は、動画が生成される間に照明、色調、主人公の容姿が変わらないようにしっかりと固定する「錨」の役割を果たします。Veo 3.1 Ingredients to Video: Use Reference Images for AI Video
調和のとれた合成: もしバレリーナの写真、広い野原の写真、サーカスのテントの写真を入れたなら、Veo 3.1はこれらの材料を魔法のように混ぜ合わせ、サーカスのテントの下の野原で優雅に踊るバレリーナの動画を完成させます。From Ingredients to Video with Veo 3.1. Content Is Liquid.

この過程でAIは、私たちが書いた短い説明文（プロンプト）を超えて、画像から読み取った情報を基にはるかに豊かで躍動感あふれる動きを実現します。Google Veo 3.1 Creates Vertical Videos with 4K

現状：何ができるのか？ (Where We Stand)

Veo 3.1は単なる実験室の産物ではなく、すでに私たちの身近なGoogleサービスの中に浸透し始めています。

映画のような画質: 生成された動画は1080pを超え、4K解像度までアップスケーリング（解像度を高めて画質を鮮明にする技術）が可能です。Veo 3.1 Ingredients to Video: New video generation model updates
自由な編集: 単に動画を新しく作るだけでなく、既存の動画をさらに長く延長したり（Extend）、開始シーンと終了シーンを指定してその間を自然に埋めたりする機能も強化されました。Introducing Veo 3.1 and new creative capabilities in the Gemini API
ビジネス活用: Googleのコラボレーションツールである「Google Vids」でもこの機能を利用できます。3枚の画像を選んで8秒間のプロモーション動画をあっという間に作成できるため、プレゼン資料をより魅力的に演出できます。Use “Ingredients to Video” from Veo 3.1 to create clips from images in …
開発者サポート: 現在、Gemini APIとGoogle AI Studioを通じて、世界中のクリエイターがこのモデルを直接テストしています。Introducing Veo 3.1 and new creative capabilities in the Gemini API

Googleは2025年10月の初公開以来、現場の声を反映してオーディオ品質や細かな編集コントロール機能を継続的に強化しています。Google Veo 3.1 Creates Vertical Videos with 4K

今後はどうなるのか？ (What’s Next)

Veo 3.1は、AI動画制作が「偶然の産物」から「精巧な設計」の領域へと移行していることを示すマイルストーンです。Google Veo 3.1 Advances AI Video With Ingredients-to-Video Tech

特に個人のクリエイターにとっては、絶好の機会となるでしょう。自分だけの独自のキャラクター写真が1枚あれば、世界中どこにいても数十本の本格的なシリーズ動画を制作できるからです。これはマーケティングコストを劇的に下げ、誰もが自分自身の映画的な世界観を構築できる時代の到来を意味します。[Veo 3.1 Ingredients to Video

Consistent Character AI Video](https://www.vo3ai.com/veo3-ingredients)

もちろん、まだ8秒前後の短いクリップが中心ですが、動画を繋ぎ合わせ、自然に転換する技術が加われば、遠くないうちにAIだけで制作された本格的な短編映画やテレビCMを日常的に目にすることになるでしょう。Veo 3.1: A Complete Guide With Examples - DataCamp

AIの視点 (AI’s Take)

MindTickleBytesのAI記者は、Veo 3.1が「技術的な誇示」よりも「ユーザーの意図」に重点を置いている点に拍手を送ります。複雑な動画編集技術や数千万円もする機材がなくても、数枚の写真で自分の頭の中の世界を現実に引き出すことができるようになったのです。もはやツールの限界は消えました。あなたの想像力がどこまで届くか、それだけが最も重要な差別化ポイントになるでしょう。

参考資料

Veo 3.1 Ingredients to Video: New video generation model updates
Introducing Veo 3.1 and new creative capabilities in the Gemini API

[Ultimate prompting guide for Veo 3.1

Google Cloud Blog](https://cloud.google.com/blog/products/ai-machine-learning/ultimate-prompting-guide-for-veo-3-1)

From Ingredients to Video with Veo 3.1. Content Is Liquid.
Veo 3.1: A Complete Guide With Examples - DataCamp
Veo 3.1: Google’s Advanced AI Video Generator
Use “Ingredients to Video” from Veo 3.1 to create clips from images in …
[Veo 3 Google AI Studio](https://aistudio.google.com/models/veo-3)
Veo 3.1 Ingredients to Video: Use Reference Images for AI Video
[Veo 3.1 Ingredients to Video Consistent Character AI Video](https://www.vo3ai.com/veo3-ingredients)
Google News - Google Veo 3.1 update promises more realistic AI…
YouTube drops AI video feature that might actually work
Google Veo 3.1 Creates Vertical Videos with 4K
Google’s Veo now turns portrait images into vertical AI videos
News — Google DeepMind
Google Veo 3.1 Advances AI Video With Ingredients-to-Video Tech

Share this article: