KADOKAWA Technology Review
×
【冬割】 年間購読料20%オフキャンペーン実施中!
オープンAIが「Sora」を一般公開、最長20秒の動画を生成
OpenAi
How to use Sora, OpenAI’s new video generating tool

オープンAIが「Sora」を一般公開、最長20秒の動画を生成

オープンAIは、テキストから動画を生成するAIモデル「Sora(ソラ)」の一般提供を開始した。チャットGPTの有料版ユーザーが利用可能で、月額200ドルのプランでは最長20秒までの動画の生成に対応する。 by James O'Donnell2024.12.10

この記事の3つのポイント
  1. オープンAIが動画生成AI「ソラ(Sora)」を一般公開した
  2. ソラはテキストから動画生成やリミックスなどが可能である
  3. 各社から動画生成AIの発表が続くが、悪用防止策や環境負荷などの課題も
summarized by Claude 3

オープンAI(OpenAI)は今日、動画生成モデル「ソラ(Sora)」を一般公開した。この発表は、新製品のリリースとデモが続く12日間のイベント「シップマス(shipmas)」の5日目に行なわれた。この記事では、Soraに関する基本情報と、すぐに使い始める方法を紹介する。

Soraとは?

Soraは、テキスト・プロンプトから動画を生成したり、画像をアニメーション化したり、動画を新しいスタイルでリミックスしたりできるAI動画生成モデルである。オープンAIは2月にこのモデルのプレビューを発表したが、今回初めて広く利用可能となった。

今回のリリースにおける新要素は?

Soraの基本機能(シンプルなプロンプトで動画を作成)は2月にプレビューされたものと変わらないが、今回のリリースでは速度とコストの改善が図られている。また、いくつかの新機能も追加されている。特に「ストーリーボード」と「フィード」は注目の新機能だ。

ストーリーボードは、複数のAI生成動画をタイムライン上で組み合わせ、1つの動画にまとめる機能である。従来の動画編集ソフト、例えばアドビ・プレミアプロ(Adobe Premiere Pro)に近い操作が可能だ。

フィードは、クリエイティブな作品の共有やインスピレーションの提供を目的としたギャラリー機能である。ユーザーはSoraで生成した動画を投稿したり、他の動画の作成プロンプトを確認・微調整したりできる。

Soraで何ができるのか?

Soraを使用することで、テキスト・プロンプトから動画を生成したり、「リミックス」というツールを使って動画のスタイルや要素を変更したりできる。さらに、前述の「ストーリーボード」機能を活用して複数のクリップを組み合わせて1本の動画に仕上げることも可能だ。また、Soraにはムーディーなフィルム・ノワールやストップ・モーション風のダンボールやペーパークラフトなど、いくつかのプリセットスタイルが用意されており、それらを動画に適用できる。作成した動画をトリミングしたりループに設定したりすることも可能だ。

誰が使える?

Soraを使うためには、オープンAIのプレミアム・プランのいずれかを購読する必要がある。チャットGPTプラス(月額20ドル)またはチャットGPTプロ(月額200ドル)のどちらかである。どちらのプランにも、他のオープンAI製品へのアクセスが含まれている。プラスのユーザーは最大720pの解像度で、長さ5秒までの動画を生成でき、月50本までという制限がある。一方、プロのユーザーは1080pの解像度で最大20秒の動画を生成でき、1回のプロンプトから最大5つのバリエーション動画を生成可能だ。プロのユーザーは月500本までという制限があるが、順番待ちリストに登録してサイトのトラフィックが少ない時に動画を生成させる「リラックス」モードは無制限だ。

どちらのプランでも、縦長、横長、正方形の3つのアスペクト比で動画を生成することが可能だ。一方、プランに加入していないユーザーは、Soraで生成された動画を閲覧するフィード機能のみ利用できる。

オープンAIは今日からSoraのグローバルで展開を開始しているが、同社によれば「欧州の大部分」では展開にもう少し時間がかかるとしている。

どこでアクセスできる?

SoraはチャットGPTとは独立したサービスとして提供されており、アクセスするにはSora.comに移動してチャットGPTプラスまたはプロのアカウントでログインする。ただし、本記事の公開時点ではアクセスが集中し、新規登録は一時停止されている。

これまでの経緯は?

Soraが初公開された2月以降、他のテック企業も動画生成ツールを次々と発表している。メタのムービー・ジェン(MovieGen)グーグルのベオ(Veo)などだ。一方で、反発の声も多い。オープンAIがSoraをアーティストの作品を訓練データとして使用しながら報酬を支払っていない点に抗議し、Soraの早期アクセス権を提供されたアーティストの一部がツールをリークする事態も発生している。

今後の展開は?

新しいモデルがリリースされるたびに問題となるのは、その悪用である。例えば、ディープフェイクやその他違法・非倫理的な目的で使用される可能性が懸念されるが、オープンAIがどのような措置を講じたのかは、現時点ではまだ分かっていない。オープンAIのある従業員はモデレーションと安全性について、「初日から完璧ではないかもしれない」と述べている。

また、Soraによる動画生成は、チャットGPTのようなテキスト生成と比較してはるかに多くの計算能力とエネルギーを消費する。AIブームですでに大量のエネルギーが消費されており、温暖化ガス排出量の抑制を目指すテック企業各社は課題を突きつけられている。Soraなどの動画モデルが広く利用可能になることで、問題がさらに悪化する可能性がある。

人気の記事ランキング
  1. The biggest AI flops of 2024 「7つの失敗」で振り返る 2024年のAIシーン
  2. Promotion Innovators Under 35 Japan × CROSS U 無料イベント「U35イノベーターと考える研究者のキャリア戦略」のご案内
  3. The humans behind the robots 家事ロボット、実は8割は遠隔操作 あなたは受け入れられますか?
ジェームス・オドネル [James O'Donnell]米国版 AI/ハードウェア担当記者
自律自動車や外科用ロボット、チャットボットなどのテクノロジーがもたらす可能性とリスクについて主に取材。MITテクノロジーレビュー入社以前は、PBSの報道番組『フロントライン(FRONTLINE)』の調査報道担当記者。ワシントンポスト、プロパブリカ(ProPublica)、WNYCなどのメディアにも寄稿・出演している。
▼Promotion 冬割 年間購読料20%off
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。2024年受賞者決定!授賞式を11/20に開催します。チケット販売中。 世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を随時発信中。

特集ページへ
MITTRが選んだ 世界を変える10大技術 2024年版

「ブレークスルー・テクノロジー10」は、人工知能、生物工学、気候変動、コンピューティングなどの分野における重要な技術的進歩を評価するMITテクノロジーレビューの年次企画だ。2024年に注目すべき10のテクノロジーを紹介しよう。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る