ChatGPT と sora

2025年06月18日

先月あたりからChatGPTの左側メニューがやたら頻繁に変更されて、プロジェクトの管理ができるようになったり、便利になってきている。そのなかで、soraという新しいサービスが使えるようになったので、使ってみた。

最初は、何が何だかわからず、どうやら、画像や動画を生成できるのはわかるのだが、どのように作るのかもわからず、人がアップしたのを見ていたのだが

ようやく理解できた。テキストベースで動画を作成することもできるし、画像を元に、動画をつくることもできる。

下の添付はGIFファイルでダウンロードしたものだが、PNGの画像ファイルをもとに、生成した動画で、動画はmp4かgifでダウンロードすることができる。

この元の画像だって、ChatGPTが生成した画像ファイルであるから、無からしゃべっている動画を生成したことになる。

ChatGPTに、あいうえおん、の母音を話している口の表情を作らせて

会話をしているようなフレームを作ろうと悪戦苦闘していたのだが、

soraでは、約1分ほどで、こんな動画が生成できるので笑ってしまった。

ただし、ChatGPT同様に、作りたいものを作れるようになるにはそれなりにプロンプト次第だから、生成AIに対しての理解を深めていくしかない。

1回の生成で4つの短い動画が生成される。リクエストに対してちょっとづつ違うものだが、動きを要求すると、全くの別人に切り替わってしまう場合も多い。だから、画像を指定して、この子が回転することと、同時に髪の毛が舞うことをストーリーにして伝えると、結果的にこのような動画が生まれる。

超高速で頭を回転させ、鬼の形相になるバージョンなどもあったりもする。生成するまでには込み具合にもよるが数分から10分くらいかかることもある。夜中は結構早い感じがする、1分くらいで生成しているんではないかな。

しっかし、GIFのファイルサイズを見て驚いた12MBもあるわ。フレーム数x画像ファイルだから仕方ないが、mp4では4MBをきるんだから圧縮率すごいですね。

最新のお知らせ

No Image
2025年11月27日
プログラミングにおけるAIの優位性と人間のだめなところ

プログラミングにおけるAIの優位性と人間のだめなところを...

thumb
2025年11月25日
JAZZを聴きながら

https://open.spotify.com/intl-ja/track/2UiXRej8Fdcc04DFL60...

thumb
2025年11月25日
GTSFエディタの開発

GTSFというのは、弾き語りをするときの楽譜を生成するためのテ...

thumb
2025年11月23日
人生史をヒヤリングするAIアプリケーション

手帳學プロジェクトの中で、人生史を作成する。本来は、現...

thumb
2025年11月22日
ギターコード(和音)の構成音とベース音

コード表を、ルート音とコードの種類、そして、ベース音を...

thumb
2025年11月17日
気をつけろ!AIを利用したシステム開発

AIを利用した開発をしていると、一番の気になるところはAPI...

No Image
2025年11月15日
GTSF:(Guitar Tab and Song Format)弾き語り用楽譜生成テキストフォーマット

GTSF(Guitar Tab and Song text Format)とは、ギターで弾き語...

thumb
2025年11月14日
プロトタイプ(試作)とPoC(概念実証)

プロトタイプ(Prototype)とは、「完成前に作る試作モデル...

thumb
2025年11月14日
見える化による安心感~最先端な要件定義

要件定義ってそんな簡単ではないです。 まずは見える化...

thumb
2025年11月14日
コミュニケーション

人間関係やチームでのコミュニケーション方法(伝え方・傾...