OpenAIは、AI推論モデルのo3とo4-miniを発表した。これらのモデルは、ユーザーからの質問に対して、回答を出す前に考える能力を備えている。o3は、従来のモデルを上回る数学、コーディング、推論、科学、視覚理解の能力を示しており、一方でo4-miniは価格、速度、性能のバランスを重視し、開発者がAIモデルを選ぶ際の重要な要素となっている。
これらの新しいモデルは、ChatGPT内でのウェブ閲覧やPythonコードの実行、画像処理、画像生成など、ツールを使用して回答を生成することができる。OpenAIは、これらのモデルと、より高い信頼性を持つ回答を作成するために時間を多くかける「o4-mini-high」と呼ばれるバリエーションを、Pro、Plus、Teamプランの購読者向けに提供している。
新モデルは、GoogleやMeta、xAIなどとの激しい競争を勝ち抜くためのOpenAIの取り組みの一環として位置づけられている。以前の推論モデルの発表後、他の企業も同様の機能を持つモデルを迅速にリリースし、性能としてはOpenAIのモデルに匹敵またはそれを超えるものとなっている。特に、推論モデルがAIシステムの性能を引き出すための主導的要因として作用しており、業界全体の動向が変わりつつある。
OpenAIによると、o3はコーディング能力を測定するSWE-benchのテストにおいて69.1%という最高のスコアを記録している。また、o4-miniも68.1%のスコアを達成しており、次に優れたモデルのo3-miniは49.3%であり、外部競合のClaude 3.7 Sonnetは62.3%を記録している。
新しい能力として、o3とo4-miniは「画像を使って考える」ことができ、ユーザーがアップロードした画像を分析してから回答を作成する。この能力により、ぼやけた画像や低品質な画像でも理解でき、ズームや回転などの操作を行うことができる。
また、o3とo4-miniは、ChatGPTのCanvas機能を利用してブラウザ内でPythonコードを実行し、現在のイベントに関する問い合わせをウェブ検索できる。
すべてのモデルは、OpenAIの開発者向けAPIであるChat Completions APIとResponses APIを通じて利用可能である。開発者にとってo3は、性能の向上を考慮しつつ、1百万トークンあたり10ドルという比較的低価格で提供される。o4-miniの料金はo3-miniと同じく、1百万トークンあたり1.10ドルとなる。
さらに、オープンAIは今後数週間以内に、他のリソースをより多く活用して回答を生成するo3のPro版を、ChatGPT Pro購読者向けに発表する予定である。CEOのサム・アルトマン氏は、o3とo4-miniがChatGPTにおける立ち下がりのモデルになる可能性があることを示唆しており、今後のGPT-5モデルに統合される可能性を他の情報とともに伝えた。
最新のo3とo4-miniは、OpenAIのAI推論技術の新たな局面を示しており、今後も注目が集まるだろう。
