OpenAI releases its new o3-mini reasoning model for free

オープンAI、推論モデル「o3-mini」を無料提供

オープンAIは新たな推論モデル「o3-mini」を発表し、ChatGPTの無料版ユーザー向けに提供開始した。同社初の無料で使える推論モデルとなる。 by Scott J Mulligan2025.02.03

1月30日にマイクロソフトがオープンAIの推論モデル「o1」をCopilot（コパイロット）ユーザー向けに展開すると発表したのに続き、オープンAI（OpenAI）は新たな推論モデル「o3-mini」をChatGPT（チャットGPT）の無料版ユーザー向けに提供開始した。これにより、大多数のユーザーが初めてオープンAIの推論モデルにアクセスできるようになる。これまで同社の推論モデルは、ChatGPTの有料プラン「Pro」および「Plus」の契約ユーザーに限定されていた。

推論（Reasoning）モデルは、「思考の連鎖（chain of thought）」という手法を用いて、モデルに与えられた問題を段階的に処理し、回答を生成する。このアプローチにより、モデルはプロセス内での誤りを特定し、回答を出す前に修正することが可能になる。その結果、より綿密で正確な回答が得られる一方で、モデルが回答前に一時停止するため、待機時間が長くなることもある。オープンAIによると、「o3-mini」の回答速度は「o1-mini」と比較して24%向上しているという。

このタイプのモデルは、特に複雑な問題を解決するのに効果的である。そのため、博士号レベルの数学的課題に取り組んでいる場合には、試してみる価値があるだろう。また、従来のモデルでは高度なプロンプト（指示テキスト）への対応が不十分だった場合、この新しい推論モデルがその課題を克服する可能性がある。o3-miniを無料版で試すには、ChatGPTで新しいプロンプトを開始する際に「Reason（日本語では「理由」となっている）」を選択するだけでいい。

推論モデルは新たな能力を備えているが、それには相応のコストが伴う。オープンAIの「o1-mini」は、同社の非推論モデルである「GPT-4o mini」と比べて、運用コストが20倍高い。オープンAIによれば、新モデル「o3-mini」の入力トークンあたりのコストは「o1-mini」より63%低いものの、入力トークン100万個あたりのコストは1.10ドルで、依然として「GPT-4o mini」の約7倍に相当する。

この新モデルは、AI業界に衝撃を与えたディープシーク（DeepSeek）の新モデル公開からわずか2週間も経たないタイミングでの登場となった。ディープシークの新モデルはオープンAIの最上位モデルと同等の性能を持つとされるが、訓練コストはわずか約600万ドルと主張されている。一方で、オープンAIの「GPT-4」の訓練コストは1億ドル以上と推定されており、この差は注目に値する（この主張には疑問の声も上がっており、現在精査が進められている）。

さらに、ディープシークの推論モデルの運用コストは入力トークン100万個あたり0.55ドルであり、これは「o3-mini」の半分である。オープンAIはコスト削減においてまだ改善の余地があることが示されている。また、推論モデルは回答を生成するために膨大な計算処理を必要とするため、他のモデルタイプに比べてエネルギーコストも大幅に高いと推定されている。

推論モデルの新たな波は、安全性に関しても新たな課題を提起している。オープンAIは「熟考型アラインメント（deliberative alignment）」と呼ばれる手法を用いてoシリーズのモデルを訓練しており、推論の各段階で内部ポリシーを参照させることで、ルール違反がないかを確認している。

しかし、オープンAIは「o3-mini」が「o1」と同様に、脱獄（ジェイルブレイク）や「安全性評価の回避」において、非推論モデルよりも優れていることを発見した。推論モデルはその高度な能力ゆえに、他のモデルタイプよりも制御が難しい。o3-miniは、モデルの自律性に関して「中リスク（medium risk）」と評価された最初のモデルであり、これは特定のコーディング・タスクにおいて従来のモデルよりも優れていることが理由とされている。オープンAIは、この評価が「自己改善とAI研究の加速の可能性の高まり」を示すものであると説明している。ただし、o3-miniは依然として現実世界の研究タスクには不向きであり、もしこの能力が向上すれば「高リスク」と評価され、オープンAIはその公開を制限する可能性がある。

人気の記事ランキング

スコット・J・マリガン [Scott J Mulligan]米国版 AI担当記者: 政策、ガバナンス、AIの内部構造などを取材するAI担当記者。AIに特化した若手ジャーナリスト育成プログラム「ターベル・フェローシップ（Tarbell Fellowship）」の支援を受けている。ヴァイス（VICE）ニュースでのドキュメンタリー映像制作、ビデオゲーム・デザイナーなどを経て現職。

▼Promotion