先月あたりからChatGPTの左側メニューがやたら頻繁に変更されて、プロジェクトの管理ができるようになったり、便利になってきている。そのなかで、soraという新しいサービスが使えるようになったので、使ってみた。
最初は、何が何だかわからず、どうやら、画像や動画を生成できるのはわかるのだが、どのように作るのかもわからず、人がアップしたのを見ていたのだが
ようやく理解できた。テキストベースで動画を作成することもできるし、画像を元に、動画をつくることもできる。
下の添付はGIFファイルでダウンロードしたものだが、PNGの画像ファイルをもとに、生成した動画で、動画はmp4かgifでダウンロードすることができる。
この元の画像だって、ChatGPTが生成した画像ファイルであるから、無からしゃべっている動画を生成したことになる。
ChatGPTに、あいうえおん、の母音を話している口の表情を作らせて
会話をしているようなフレームを作ろうと悪戦苦闘していたのだが、
soraでは、約1分ほどで、こんな動画が生成できるので笑ってしまった。
ただし、ChatGPT同様に、作りたいものを作れるようになるにはそれなりにプロンプト次第だから、生成AIに対しての理解を深めていくしかない。
1回の生成で4つの短い動画が生成される。リクエストに対してちょっとづつ違うものだが、動きを要求すると、全くの別人に切り替わってしまう場合も多い。だから、画像を指定して、この子が回転することと、同時に髪の毛が舞うことをストーリーにして伝えると、結果的にこのような動画が生まれる。
超高速で頭を回転させ、鬼の形相になるバージョンなどもあったりもする。生成するまでには込み具合にもよるが数分から10分くらいかかることもある。夜中は結構早い感じがする、1分くらいで生成しているんではないかな。
しっかし、GIFのファイルサイズを見て驚いた12MBもあるわ。フレーム数x画像ファイルだから仕方ないが、mp4では4MBをきるんだから圧縮率すごいですね。