KADOKAWA Technology Review
×
始めるならこの春から!年間サブスク20%オフのお得な【春割】実施中
オープンAIが「Sora」を一般公開、最長20秒の動画を生成
OpenAi
How to use Sora, OpenAI’s new video generating tool

オープンAIが「Sora」を一般公開、最長20秒の動画を生成

オープンAIは、テキストから動画を生成するAIモデル「Sora(ソラ)」の一般提供を開始した。チャットGPTの有料版ユーザーが利用可能で、月額200ドルのプランでは最長20秒までの動画の生成に対応する。 by James O'Donnell2024.12.10

この記事の3つのポイント
  1. オープンAIが動画生成AI「ソラ(Sora)」を一般公開した
  2. ソラはテキストから動画生成やリミックスなどが可能である
  3. 各社から動画生成AIの発表が続くが、悪用防止策や環境負荷などの課題も
summarized by Claude 3

オープンAI(OpenAI)は今日、動画生成モデル「ソラ(Sora)」を一般公開した。この発表は、新製品のリリースとデモが続く12日間のイベント「シップマス(shipmas)」の5日目に行なわれた。この記事では、Soraに関する基本情報と、すぐに使い始める方法を紹介する。

Soraとは?

Soraは、テキスト・プロンプトから動画を生成したり、画像をアニメーション化したり、動画を新しいスタイルでリミックスしたりできるAI動画生成モデルである。オープンAIは2月にこのモデルのプレビューを発表したが、今回初めて広く利用可能となった。

今回のリリースにおける新要素は?

Soraの基本機能(シンプルなプロンプトで動画を作成)は2月にプレビューされたものと変わらないが、今回のリリースでは速度とコストの改善が図られている。また、いくつかの新機能も追加されている。特に「ストーリーボード」と「フィード」は注目の新機能だ。

ストーリーボードは、複数のAI生成動画をタイムライン上で組み合わせ、1つの動画にまとめる機能である。従来の動画編集ソフト、例えばアドビ・プレミアプロ(Adobe Premiere Pro)に近い操作が可能だ。

フィードは、クリエイティブな作品の共有やインスピレーションの提供を目的としたギャラリー機能である。ユーザーはSoraで生成した動画を投稿したり、他の動画の作成プロンプトを確認・微調整したりできる。

Soraで何ができるのか?

Soraを使用することで、テキスト・プロンプトから動画を生成したり、「リミックス」というツールを使って動画のスタイルや要素を変更したりできる。さらに、前述の「ストーリーボード」機能を活用して複数のクリップを組み合わせて1本の動画に仕上げることも可能だ。また、Soraにはムーディーなフィルム・ノワールやストップ・モーション風のダンボールやペーパークラフトなど、いくつかのプリセットスタイルが用意されており、それらを動画に適用できる。作成した動画をトリミングしたりループに設定したりすることも可能だ。

誰が使える?

Soraを使うためには、オープンAIのプレミアム・プランのいずれかを購読する必要がある。チャットGPTプラス(月額20ドル)またはチャットGPTプロ(月額200ドル)のどちらかである。どちらのプランにも、他のオープンAI製品へのアクセスが含まれている。プラスのユーザーは最大720pの解像度で、長さ5秒までの動画を生成でき、月50本までという制限がある。一方、プロのユーザーは1080pの解像度で最大20秒の動画を生成でき、1回のプロンプトから最大5つのバリエーション動画を生成可能だ。プロのユーザーは月500本までという制限があるが、順番待ちリストに登録してサイトのトラフィックが少ない時に動画を生成させる「リラックス」モードは無制限だ。

どちらのプランでも、縦長、横長、正方形の3つのアスペクト比で動画を生成することが可能だ。一方、プランに加入していないユーザーは、Soraで生成された動画を閲覧するフィード機能のみ利用できる。

オープンAIは今日からSoraのグローバルで展開を開始しているが、同社によれば「欧州の大部分」では展開にもう少し時間がかかるとしている。

どこでアクセスできる?

SoraはチャットGPTとは独立したサービスとして提供されており、アクセスするにはSora.comに移動してチャットGPTプラスまたはプロのアカウントでログインする。ただし、本記事の公開時点ではアクセスが集中し、新規登録は一時停止されている。

これまでの経緯は?

Soraが初公開された2月以降、他のテック企業も動画生成ツールを次々と発表している。メタのムービー・ジェン(MovieGen)グーグルのベオ(Veo)などだ。一方で、反発の声も多い。オープンAIがSoraをアーティストの作品を訓練データとして使用しながら報酬を支払っていない点に抗議し、Soraの早期アクセス権を提供されたアーティストの一部がツールをリークする事態も発生している。

今後の展開は?

新しいモデルがリリースされるたびに問題となるのは、その悪用である。例えば、ディープフェイクやその他違法・非倫理的な目的で使用される可能性が懸念されるが、オープンAIがどのような措置を講じたのかは、現時点ではまだ分かっていない。オープンAIのある従業員はモデレーションと安全性について、「初日から完璧ではないかもしれない」と述べている。

また、Soraによる動画生成は、チャットGPTのようなテキスト生成と比較してはるかに多くの計算能力とエネルギーを消費する。AIブームですでに大量のエネルギーが消費されており、温暖化ガス排出量の抑制を目指すテック企業各社は課題を突きつけられている。Soraなどの動画モデルが広く利用可能になることで、問題がさらに悪化する可能性がある。

人気の記事ランキング
  1. Promotion MITTR Emerging Technology Nite #32 Plus 中国AIをテーマに、MITTR「生成AI革命4」開催のご案内
  2. AI companions are the final stage of digital addiction, and lawmakers are taking aim SNS超える中毒性、「AIコンパニオン」に安全対策求める声
  3. This Texas chemical plant could get its own nuclear reactors 化学工場に小型原子炉、ダウ・ケミカルらが初の敷地内設置を申請
  4. Tariffs are bad news for batteries トランプ関税で米電池産業に大打撃、主要部品の大半は中国製
ジェームス・オドネル [James O'Donnell]米国版 AI/ハードウェア担当記者
自律自動車や外科用ロボット、チャットボットなどのテクノロジーがもたらす可能性とリスクについて主に取材。MITテクノロジーレビュー入社以前は、PBSの報道番組『フロントライン(FRONTLINE)』の調査報道担当記者。ワシントンポスト、プロパブリカ(ProPublica)、WNYCなどのメディアにも寄稿・出演している。
▼Promotion
MITTRが選んだ 世界を変える10大技術 2025年版

本当に長期的に重要となるものは何か?これは、毎年このリストを作成する際に私たちが取り組む問いである。未来を完全に見通すことはできないが、これらの技術が今後何十年にもわたって世界に大きな影響を与えると私たちは予測している。

特集ページへ
日本発「世界を変える」U35イノベーター

MITテクノロジーレビューが20年以上にわたって開催しているグローバル・アワード「Innovators Under 35 」。世界的な課題解決に取り組み、向こう数十年間の未来を形作る若きイノベーターの発掘を目的とするアワードの日本版の最新情報を発信する。

特集ページへ
フォローしてください重要なテクノロジーとイノベーションのニュースをSNSやメールで受け取る