Whisk(ウィスク)使ってみたら…雲が潜水艦になって通り抜けた

これは、Googleが実験的に提供している画像・動画生成AI「Whisk(ウィスク)」を、はじめて触ったときにできた8秒の短い動画。

Googleの画像生成AIというと、リアルな日本人の顔が作れることで知られている「ImageFX」が有名だ。

でも、このWhiskはちょっと違っていて、複数の画像を混ぜ合わせて新しいビジュアルを作り、それを短い動画にしてくれるというサービス。生成画面には「モデル」「背景」「スタイル」っていう3つの枠があって、そこにそれぞれ画像を読み込む仕組みになってる。

今回は、「モデル」には自分の顔写真、「背景」には海辺へドライブに行った場所をもとに描いた絵、「スタイル」にはその時のスナップ写真を使ってみた。

最初はプロンプト(指示文)を何も入れずに、そのまま画像生成してみた。

画像があるのに、欧米人っぽい顔に変えられてしまった。
そこでプロンプトで「日本人の男」と明記し、プロンプト入力サンプルに書かれていたフレーズをパクってアイスクリームを食べさせたりした。雲の表現も絵を描いた時のイメージに近づけようと「不穏な天使のような雲」などと試した。

わけわからんね。
天使はやめて、潜水艦にした。潜水艦好きなんだよね。

メモしてなかったけど、スクリプトはたぶん最終的にはこんな感じ。
「海辺で、眼鏡をかけた禿げ頭の日本人男性が、紺色のニットセーターを着て、アイスクリームを食べている。頭上には青空が広がっているが、潜水艦のような形をした白い雲が下降してくるのを眺めている」
Whiskでは、英語の方が指示が通りやすいって話だったので、Google翻訳で英訳した。


そこそこの画像が出てきたので、「アニメーション化」のボタンを押して動画を生成した。

できあがった動画が、今表示されているこのトップ画像のやつ。
思ってたのとはちょっと違って、男は雲に気づかず、ただアイスに夢中。
背後には潜水艦と言えば潜水艦みたいな雲がすっと通っていくという、なんとも間の抜けたコメディ調の映像になった。

意図とズレているけど、これはこれで面白いかな。


今のところ、生成数に制限はあるけど無料で使用できるので、

もし自分でも試してみたくなったら、こちらからどうぞ:
 https://labs.google/fx/ja/tools/whisk/project