オープンAIが「Sora」を一般公開、最長20秒の動画を生成

How to use Sora, OpenAI’s new video generating tool オープンAIが「Sora」を一般公開、最長20秒の動画を生成

オープンAIは、テキストから動画を生成するAIモデル「Sora(ソラ)」の一般提供を開始した。チャットGPTの有料版ユーザーが利用可能で、月額200ドルのプランでは最長20秒までの動画の生成に対応する。 by James O'Donnell2024.12.10

オープンAI(OpenAI)は今日、動画生成モデル「ソラ(Sora)」を一般公開した。この発表は、新製品のリリースとデモが続く12日間のイベント「シップマス(shipmas)」の5日目に行なわれた。この記事では、Soraに関する基本情報と、すぐに使い始める方法を紹介する。

Soraとは?

Soraは、テキスト・プロンプトから動画を生成したり、画像をアニメーション化したり、動画を新しいスタイルでリミックスしたりできるAI動画生成モデルである。オープンAIは2月にこのモデルのプレビューを発表したが、今回初めて広く利用可能となった。

今回のリリースにおける新要素は?

Soraの基本機能(シンプルなプロンプトで動画を作成)は2月にプレビューされたものと変わらないが、今回のリリースでは速度とコストの改善が図られている。また、いくつかの新機能も追加されている。特に「ストーリーボード」と「フィード」は注目の新機能だ。

ストーリーボードは、複数のAI生成動画をタイムライン上で組み合わせ、1つの動画にまとめる機能である。従来の動画編集ソフト、例えばアドビ・プレミアプロ(Adobe Premiere Pro)に近い操作が可能だ。

フィードは、クリエイティブな作品の共有やインスピレーションの提供を目的としたギャラリー機能である。ユーザーはSoraで生成した動画を投稿したり、他の動画の作成プロンプトを確認・微調整したりできる。

Soraで何ができるのか?

Soraを使用することで、テキスト・プロンプトから動画を生成したり、「リミックス」というツールを使って動画のスタイルや要素を変更したりできる。さらに、前述の「ストーリーボード」機能を活用して複数のクリップを組み合わせて1本の動画に仕上げることも可能だ。また、Soraにはムーディーなフィルム・ノワールやストップ・モーション風のダンボールやペーパークラフトなど、いくつかのプリセットスタイルが用意されており、それらを動画に適用できる。作成した動画をトリミングしたりループに設定したりすることも可能だ。

誰が使える?

Soraを使うためには、オープンAIのプレミアム・プランのいずれかを購読する必要がある。チャットGPTプラス(月額20ドル)またはチャットGPTプロ(月額200ドル)のどちらかである。どちらのプランにも、他のオープンAI製品へのアクセスが含まれている。プラスのユーザーは最大720pの解像度で、長さ5秒までの動画を生成でき、月50本までという制限がある。一方、プロのユーザーは1080pの解像度で最大20秒の動画を生成でき、1回のプロンプトから最大5つのバリエーション動画を生成可能だ。プロのユーザーは月500本までという制限があるが、順番待ちリストに登録してサイトのトラフィックが少ない時に動画を生成させる「リラックス」モードは無制限だ。

どちらのプランでも、縦長、横長、正方形の3つのアスペクト比で動画を生成することが可能だ。一方、プランに加入していないユーザーは、Soraで生成された動画を閲覧するフィード機能のみ利用できる。

オープンAIは今日からSoraのグローバルで展開を開始しているが、同社によれば「欧州の大部分」では展開にもう少し時間がかかるとしている。

https://wp.technologyreview.com/wp-content/uploads/2024/12/ScreenRec-Sora.mp4

どこでアクセスできる?

SoraはチャットGPTとは独立したサービスとして提供されており、アクセスするにはSora.comに移動してチャットGPTプラスまたはプロのアカウントでログインする。ただし、本記事の公開時点ではアクセスが集中し、新規登録は一時停止されている。

これまでの経緯は?

Soraが初公開された2月以降、他のテック企業も動画生成ツールを次々と発表している。メタのムービー・ジェン(MovieGen)グーグルのベオ(Veo)などだ。一方で、反発の声も多い。オープンAIがSoraをアーティストの作品を訓練データとして使用しながら報酬を支払っていない点に抗議し、Soraの早期アクセス権を提供されたアーティストの一部がツールをリークする事態も発生している。

今後の展開は?

新しいモデルがリリースされるたびに問題となるのは、その悪用である。例えば、ディープフェイクやその他違法・非倫理的な目的で使用される可能性が懸念されるが、オープンAIがどのような措置を講じたのかは、現時点ではまだ分かっていない。オープンAIのある従業員はモデレーションと安全性について、「初日から完璧ではないかもしれない」と述べている。

また、Soraによる動画生成は、チャットGPTのようなテキスト生成と比較してはるかに多くの計算能力とエネルギーを消費する。AIブームですでに大量のエネルギーが消費されており、温暖化ガス排出量の抑制を目指すテック企業各社は課題を突きつけられている。Soraなどの動画モデルが広く利用可能になることで、問題がさらに悪化する可能性がある。