【Veo 2 速報レビュー】AIで理想のバイク動画は作れる?プロンプト試行錯誤の記録【初心者向け解説】

Veo2 failure image
目次

こんにちは!動画クリエイターのナナスケです。AIを使った動画制作を探求するブログ「AI 加工所」へようこそ!

最近、動画界隈で「すごいAIが出た!」と話題になっているGoogleの動画生成AI「Veo 2」、ついに使えるようになりました!バイクが大好きで、いつかAIでカッコいいバイク動画を作ってみたいと思っていた僕、ナナスケも早速チャレンジしてみることに。

でも…AIで動画を作るのって、ボタンを押したらすぐ完成!…とは、なかなかいかないんですよね。今回は、僕がVeo 2と格闘した最初の記録を、初心者の方にも分かりやすくお伝えしたいと思います!

最初の壁:「プロンプト」ってどう書けばいいの?

まずぶつかったのが、「AIにどうやってお願いしたら、イメージ通りの動画を作ってくれるんだろう?」という疑問。AIに動画を作ってもらうには、**「プロンプト」**と呼ばれる「指示書」みたいなものをテキストで入力する必要があります。

簡単に言うと、[あなたのアイデアや指示(テキスト)] をAIに伝えて、[AIがそれを解釈して動画を生成する] という流れです。

この「指示書」作りが結構むずかしい!まるで、言葉だけで監督さんに「こんな感じで撮ってください!」と伝えるようなもの。どう書けばいいか分からなかったので、AIの先輩である「Gemini」に相談してみることにしました。

ナナスケがGeminiにお願いした内容(ざっくり):

  • レーシングスーツのライダーがヘルメットかぶりながら奥へ歩いていく後ろ姿(最初の数秒)
  • ライダーがバイクにまたがる横からの姿(次の数秒)
  • ライダー目線で、バイクのキーをONにしてメーターが光って、アクセルをブン!とふかす感じ(最後の数秒)
  • 全体的に、本物の映像みたいにしてほしい!

Gemini先生のアドバイス(プロンプトのポイント):

Geminiは、プロンプト作成の重要なポイントを教えてくれました。AIにうまく指示を出すための基本要素と言えるでしょう。

プロンプト要素何を伝えるか?簡単な例
時間指定いつ何が起こるか0-2.5秒: 後ろ姿, 2.5-5秒: バイクにまたがる
カメラアングルどう撮るか後ろから, 横から, ライダー目線
誰が何をするか被写体とアクションレーサーがヘルメット装着, アクセルをひねる
場所や雰囲気どこで?どんな感じ?サーキットで, 夕暮れ時, 明るい感じ
リアルさ/スタイルどんな見た目?リアルな映像, アニメ風

プロンプト案

A realistic video of a motorcycle racer preparing for a race.

[0-2.5 seconds] A wide shot from behind shows a motorcycle racer wearing a full racing suit, including gloves and boots, walking away from the camera towards the background. The racer is in the process of putting on a helmet. The scene is well-lit, possibly outdoors near a racetrack or garage.

[2.51-5.0 seconds] A medium shot from the side captures the motorcycle racer mounting a racing bike. The bike is stationary. The shot clearly shows the racer swinging their leg over the seat and settling into a riding position.

[5.0-8.0 seconds] A first-person point-of-view (POV) shot from the racer’s perspective shows their hands turning the ignition key to the “ON” position. The motorcycle’s dashboard and instruments light up. The racer then briefly twists the throttle, revving the engine, and the sound of the engine is audible. The focus is on the handlebars, instruments, and the racer’s gloved hands.

Google スプレッドシートにエクスポート

なるほど、結構細かく指示する必要があるんですね! 映画の絵コンテを作るのに似てるかもしれません。

もっと細かく!理想の映像を求めて

Geminiのアドバイスをもとに、「もっとこうしたい!」というイメージを具体的にして、さらに指示を細かくしてみました。

ナナスケが追加でお願いした内容(抜粋):

  • 時間は夕暮れのサーキットで!
  • ライダーはプロのテストライダーっていう設定。
  • 最初のシーンは、ライダーのすぐ後ろ(1mくらい)からついていく感じで撮りたい。
  • ライダーはピット(※)の中の通路を歩いている。
    • (※ピット:レース中にマシン整備などをする場所のこと)
  • 次のシーンは、ピットでバイクにまたがるんだけど、ちょっと斜め後ろから、通路の入口あたりから撮ってる感じ。
  • 最後のシーンは、バイクにまたがったライダー目線で、メーターが光ってアクセルをふかした後、ふと顔を上げてピットロード(※)を見て、そっちにピントが合っていく感じ。
    • (※ピットロード:ピットとコースをつなぐ通路のこと)

プロンプト改善案

A realistic video of a manufacturer’s test rider preparing for a session at a racetrack during the late afternoon. The warm hues of the setting sun begin to paint the sky.

[0-2.5 seconds] A medium shot from approximately one meter behind and slightly to the side captures the test rider walking along the pit lane. Fluorescent lights are mounted on the upper sides of the walkway, occasionally flickering to create a dynamic atmosphere. The rider is wearing a full racing suit and is in the process of putting on a helmet. The background shows the typical elements of a pit lane, such as garage doors and equipment.

[2.51-5.0 seconds] The pit garage is illuminated by bright, LED-style lighting, causing reflections to gleam off the racing bike. As the test rider mounts the stationary bike, these reflections shift and move with their body. The camera begins its shot from the pit garage entrance, positioned behind the motorcycle, and smoothly pans to the left side of the bike, capturing the rider’s movement from a new angle. Tools and equipment are subtly visible in the background.

[5.0-8.0 seconds] A first-person point-of-view (POV) shot from the test rider’s perspective shows their hands turning the ignition key to the “ON” position. The motorcycle’s dashboard and instruments illuminate brightly in the dimming light of the late afternoon. The rider then briefly twists the throttle, and the sound of the engine revving is audible. Immediately after revving, the rider slowly raises their gaze (and with it, the camera’s point of view) and looks towards the pit road. The pit road is bathed in the beautiful, warm light of the sunset, with the fading sunlight reflecting off the track surface. The focus gradually shifts from the illuminated instruments to the sunset-lit pit road.

こんな感じで、照明の感じやカメラの動き(カメラワーク)についても、Geminiと相談しながら具体的に言葉にしていきました。「なんとなくカッコよく」じゃなくて、「どうカッコよくしたいか」を言葉にするのが大事なんだな、と実感。

いざ動画生成!…ところが現実は甘くない!

「これなら完璧なはず!」と、渾身のプロンプトをVeo 2に入力!ドキドキしながら待つこと数分…

生成された動画を見て、思わず苦笑いしてしまいました。

出てきた動画はこんな感じ…(理想と現実の比較)

項目ナナスケの理想プランVeo 2 が生成した現実
時間帯夕暮れ
ライダーテストライダー1人ライダーが2人出現
ヘルメット正常に装着1人のヘルメットが点滅(出たり消えたり)
場所ピット通路からピット内への流れピットロード入口付近

Google スプレッドシートにエクスポート


【実際に生成された「失敗動画」👇】


うーん、理想とはほど遠い結果に…プロンプトの難しさを痛感しました。

なんで失敗した? 原因の推測と今後の対策

今回の失敗から、いくつか原因と対策を考えてみました。

失敗の原因(推測):

  1. ライダーの人数指定をしていなかった: 「ライダー」とだけ書いたため、AIが解釈を広げてしまった可能性があります。
  2. ヘルメットの点滅原因は不明: プロンプト内の他の言葉(例えば「ピットの蛍光灯」など)にAIが意図せず反応したか、あるいは単なるAIの生成エラーかもしれません。
  3. 指示が細かすぎた可能性: あまりに多くの要素を細かく指定しすぎると、AIがすべての指示をうまく処理しきれずに、混乱してしまう場合があるようです。

今後の対策:

  1. まずは大まかな指示から試す: 最初から細部を詰めすぎず、全体の構成や主要な要素だけを指示して、AIにある程度の解釈の余地(自由度)を与えてみる。
  2. 「ネガティブプロンプト」を活用する: これは「〇〇は含めないで」「〇〇はしないで」という、いわば「禁止事項」を伝える指示です。例えば、「複数の人物は不要 (no multiple people)」「点滅する要素は不要 (no flickering elements)」のように指定することで、意図しない要素の出現を防ぐ効果が期待できます。

まとめ:AI動画生成は試行錯誤の連続!

というわけで、僕ナナスケのVeo 2初挑戦は、理想のバイク動画にはまだまだ遠い結果となりました。しかし、失敗は成功のもと!

Geminiと相談しながらプロンプトを作成する過程や、実際にAIが生成した予想外の動画を見ることで、たくさんの学びがありました。

これからは、今回の反省を活かして、

  • プロンプトの記述方法(具体性と自由度のバランス)を見直す
  • ネガティブプロンプトを効果的に使ってみる

など、色々な方法を試しながら、理想のバイク動画を目指してチャレンジを続けたいと思います!

AIでの動画制作は、まさに試行錯誤の連続です。でも、自分のアイデアが少しずつ形になっていく過程は、とても面白い体験です。このブログ「AI 加工所」では、これからもVeo 2での動画制作の様子や、初心者・中級者向けのAI動画テクニックなどを発信していく予定です。

皆さんも、AI動画生成に興味があったら、ぜひ一緒にチャレンジしてみませんか? きっと面白い発見があるはずです!

それでは、また次回の記事でお会いしましょう! ナナスケでした。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次