こんにちは! AI動画クリエイターのナナスケです。「AI 加工所」へようこそ!
前回の記事では、Googleの動画生成AI「Veo 2」で理想のバイク動画を作るべく、Gemini先生のアドバイスも参考にプロンプトを練り上げましたが、ライダーが増えたりヘルメットが点滅したりと、思わぬ結果に終わりました。
でも、ここで諦めるわけにはいきません! 今回は「もっとシンプルに指示したら、AIは素直に動いてくれるのでは?」という仮説のもと、再挑戦した記録をお届けします。
作戦変更:シンプル・イズ・ベスト? AIの自由度を高める!
前回の反省から、「もしかして、細かく指示しすぎたのが良くなかったのかも?」と考えました。そこで今回は、AIに与える情報を絞り込み、自由度を高める作戦です。
ナナスケのシンプルなプロンプト案:
- ライダーは1人(人数はしっかり指定!)
- ライダーがバイクに跨る
- ライダー目線でバイクのイグニッションON
これだけ! このシンプルな指示で、Veo 2がどんな映像を作ってくれるのか? 期待半分、不安半分で試してみました。(ちなみに、この方針についてGemini先生に相談したところ、「シンプルな指示でAIの解釈を見るのは良い試みだ」とのお墨付き(?)ももらいました。)
またもや失敗…今度は奇妙なループ&人体消失!?
シンプルなプロンプトをVeo 2に入力し、いざ生成! …しかし、またしてもナナスケの予想を超える珍事が発生しました。
生成された動画の結果:
項目 | ナナスケのシンプルな指示 ✨ | Veo 2 が生成した現実 😵💫 |
---|---|---|
視点 | ライダー目線 | なぜか真横からの視点 |
バイク | (指定なし) | 黒いトライアンフ・スラクストン風バイク |
ライダー | 1人 | 黒スーツ・黒ヘルメットの1人 (OK!) |
アクション | バイクに跨り、イグニッションON | バイクに跨ったり降りたりを繰り返す |
身体 | 正常 | ライダーの足が1本になったりする |
プロンプト案①
A realistic video of a single motorcycle rider interacting with a racing bike.
[0-8 seconds] A first-person point-of-view (POV) shot shows a single motorcycle rider mounting a racing bike and turning the ignition ON. The motorcycle’s dashboard illuminates.
Google スプレッドシートにエクスポート
跨ったり降りたりを延々ループ…そして足が消える!? まるでホラーかバグ映像のような結果に、思わず唖然としてしまいました。
【🎬 1回目の失敗動画(シンプルプロンプト版)👇】
今回の失敗からの考察と新たな仮説
シンプルにしてもダメ…となると、別の原因を探るしかありません。
考察:
- バイクの指定は必要?: 指定しなかったら、AIが具体的なバイク(今回はスラクストン風)を勝手に選んできました。イメージ通りのバイクにするには、やはり型式指定が必要そうです。
- 「人物」は不安定要素?: 前回もライダーが2人になったり、今回も足が消えたり…。もしかしたら、Veo 2(あるいは多くの画像・動画生成AI)は、人物の描写に関して何らかの制限や苦手意識があるのかもしれません。安全上の配慮などもあるのでしょうか…?
- 時間指定は最低限必要: アクションの開始・終了を明確にするため、簡単なものでも時間指定は入れた方が良さそうです。
今後の対策(仮):
- 動画の尺(全体の時間)は指定する。
- 人物を登場させる場合は、念のためネガティブプロンプトで「手足の欠損はさせない (no missing limbs)」などを指定する必要があるかも?(効果は未知数)
次なる挑戦:ならば「バイク」そのものに焦点を!
人物描写が不安定なら、いっそ人物のアクションは最小限にして、「バイクそのもののカッコよさ」を描写することに集中してみよう!と考えました。
今度は、具体的な車種、ライダーの装備、場所、そして「走り」のシーンを指定してみることに。
ナナスケの詳細プロンプト案:
- 登場バイク: 1台
- 車種: 1993年式 DUCATI 900SL
- ライダー装備: 黒ヘルメット、ガンメタと黒のツートンレーシングスーツ
- 場所: 日本のサーキット「オートポリス」の最終コーナーからホームストレートへの区間
- シーン: コーナーからの立ち上がり加速!
これを元に、より詳細な英語プロンプトを作成して(※)、Veo 2に投入しました。 (※参考:A realistic video of a 1993 Ducati 900SL...(中略)... showcasing the bike's speed and agility... cinematic feel...
のような、かなり具体的な指示を出しました。)
プロンプト案②
A realistic video of a 1993 Ducati 900SL racing bike, rendered in hyperrealism, accelerating out of the final corner of the Auto Polis racetrack in Japan, a challenging turn that leads to the start of the home straight. The black bike with gunmetal accents is ridden by a racer in a full black leather racing suit and a black helmet. The bike’s powerful engine roars as it accelerates, dust and tire smoke billowing behind it. The track is surrounded by a vibrant green landscape, with spectators in the background cheering on the rider. The video is shot with a dynamic camera angle, showcasing the bike’s speed and agility as it navigates the challenging corner. The lighting is bright and captures the details of the bike and rider, with realistic reflections and shadows. A cinematic feel is achieved with slow motion shots to accentuate the action and speed. The overall impression is a high-quality visual experience with a racing feel.
またもや衝撃…!今度は物理法則が崩壊!?
詳細なプロンプトで臨んだ三度目の正直! …と思いきや、今度は違う意味で衝撃的な映像が生成されました。
生成された動画の結果:
- バイクがサーキットをコーナリングする動画が生成された!(指示通り!)
- バイクのディテールは少し違うものの、DUCATIっぽいレーシングバイクと、指定に近いレーシングスーツは再現された!(おしい!)
- しかし!左コーナーを曲がっているのに、なぜかバイクが右にバンク(傾いて)いる!
- バイクの動きもどこか不安定…。
物理法則を完全に無視した、ありえないコーナリング映像…! これはこれで、ある意味すごいですが、求めていたリアルなバイク動画とはかけ離れています。
【🎬2回目の失敗動画(物理法則無視版)👇】
今回の考察と、ちょっと方向転換?
リアルなバイクの「動き」をAIに理解させるのは、想像以上に難しいようです。
考察:
- バイクの傾き(バンク角)まで細かく指示する必要があるのか?
- プロンプトで「物理法則に従うこと」と指示すれば変わるのか?(効果は不明…)
- ネガティブプロンプトで「ありえない動きはしない」と指示できる…?(推奨はされないことが多いですが)
うーん、バイクの動画生成、かなり手強いですね…。
次は「車」で試してみます!
バイクという題材が、AIにとって特に難しいのかもしれません。一旦バイクから離れて、もう少し動きがシンプルな(?)「車」をテーマに動画生成を試して、Veo 2の得意なこと、苦手なことへの理解を深めたいと思います。
AI動画生成の道は、まだまだ試行錯誤の連続です! 次回の「車編」でのチャレンジも、またブログで報告しますね。
今回も最後まで読んでいただき、ありがとうございました! ナナスケでした。
コメント