OpenAI、推論可能な初のAIであるo1を起動し、ChatGPTと統合

Written by

in

OpenAI は、推論機能を備えた初の AI モデルである o1 および o1-mini を導入し、それらを …

噂は正しかった。 OpenAI は、推論機能を備えた初の人工知能モデルであるo1とo1-miniを発表しました。これらは社内で Strawberry として知られているテクノロジーを利用しており、科学、数学、プログラミングなどの分野に関連する複雑なタスクを解決するように設計されています。今日の時点では、これらはChatGPTの有料バージョンで利用可能であり、ミニ版はすぐに無料版に追加される予定です。

「私たちのテストでは、次期モデルのアップデートは、物理学、化学、生物学の難しいベンチマーク課題において博士課程の学生と同様のパフォーマンスを示しました。また、数学とプログラミングにおいても優れていることがわかりました。「国際数学オリンピック (IMO)」の資格試験では、 GPT-4o は問題の 13% しか正しく解決できませんでしたが、推論モデルのスコアは 83% でした」と OpenAI は o1 について述べています。

OpenAI は o1 をプレビューとしてリリースしたため、その機能の 100% がまだ ChatGPT に統合されていません。つまり、画像を扱うことも、Web 上の情報を検索することもできません。いずれにせよ、サムアルトマンの関係者は、この新しい人工知能は機能の点で大きな飛躍を示すものであると考えており、それがそれを o1 と名付けることに決めた理由です。

このスタートアップは、新しい AI が複雑な問題や指示を解決したり、他の言語モデルでは失敗した単純な質問に答えたりする例を示すビデオをいくつか公開しました。以下では、OpenAI o1 がテキストプロンプトからビデオゲームを最初から作成し、GPT-4o が正しく答えることができなかったStrawberryという単語に R がいくつあるか尋ねられたときに正しく答えていることがわかります。

OpenAI o1 answers a famously tricky question for large language models. pic.twitter.com/5ZlQIOBWEd
— OpenAI (@OpenAI) September 12, 2024

ChatGPT で o1 を使用すると、GPT-4o や他の OpenAI モデルと比較して応答時間に遅れが生じます。これはまさに、人工知能が迅速な応答をトリガーするのではなく、その推論機能を使用して、要求または問い合わせられた内容を解決しているためです。新しいテクノロジーの目標は、より正確な答えを提供するだけでなく、幻覚に終止符を打つことでもあります。これは、AI が間違いを犯したり、答えを発明したりしないという意味ではありません。しかし、その開発者らは、以前のバージョンの GPT よりもその頻度が減ったと述べています。

「O1 は、医療研究者が細胞配列データに注釈を付けるために使用したり、物理学者が量子光学に必要な複雑な数式を生成したり、あらゆる分野の開発者が複数ステップのワークフローを作成して実行したりするために使用できます。」
OpenAI

ChatGPT は、OpenAI の o1 および o1-mini による推論機能を追加します

OpenAI からは、o1 のトレーニングがカスタムメイドのデータセットと新しい最適化アルゴリズムを使用して実行されたとコメントされました。 GPT-4o や以前のモデルとは異なり、この AI はトレーニングパターンを模倣するのではなく、強化学習を使用して提示された問題を独自に解決します。

以前はQ* または Q-Starとして知られていた Strawberry の使用により、サムアルトマンの会社で内部短絡が発生しました。したがって、同社がセキュリティに特に重点を置いているのは当然のことです。 OpenAI は、o1 の開発には、より堅牢なセキュリティ対策の実装、厳格なテスト、および各国の当局や規制機関との協力が伴うことを示しています。

同様に、OpenAI は、o1は脱獄の影響を受けにくいと主張しています。つまり、ユーザーがその安全対策を回避しようとする試みに対してです。「当社の最も厳しいジェイルブレイクテストの 1 つで、GPT-4o のスコアは 22 (0 から 100 のスケールで) でしたが、o1 プレビューモデルのスコアは 84 でした」と AI の責任者は述べています。

o1-mini は小型バージョンで、o1 よりも最大 80% 安価であり、その速度も際立っています。 OpenAI によると、 o1-mini は特にプログラミングタスクで優れています。共有されている興味深い事実の 1 つは、新しいモデルが ChatGPT 経由で単純なテキスト応答を提供するのにどれくらいの時間がかかるかということです。 GPT-4o がわずか 3 秒で応答したのと同じように、o1-mini は 9 秒、o1 は 32 秒で応答しました。その余分な時間は、新しい AI が考え、応答を推論するのに費やします。

ChatGPT の統合と価格

本日より、 ChatGPT Plus および Teamサブスクライバーは、チャットボットモデル選択メニューから OpenAI o1 および o1-mini にアクセスできるようになります。一方、来週、この可能性はEnterprise プランと Eduプランのユーザーに提供されます。以前に示したように、ChatGPT の無料バージョンは o1-mini を受け取ることになりますが、それがいつになるかはまだ不明です。

少なくとも最初は、起動時に ChatGPT を介した o1 モデルへのクエリの数が制限されることに注意してください。 Plus および Team ユーザーの場合、OpenAI o1-preview では 1 週間あたり 30 メッセージ、o1-mini では 50 メッセージという制限があります。

開発者にとって、OpenAI は API のレベル 5 までの o1 モデルの使用を可能にしますが、料金を支払う用意が必要です。新しい AI へのアクセスは、同社の他のモデルよりも大幅に高価です。具体的には、o1-preview の費用は 100 万トークンあたり 15 ドル、100 万トークンあたり 60 ドルです。これは、同量のトークンに対する GPT-4o のコストのそれぞれ 3 倍と 4 倍です。

OpenAI は、o1 および GPT シリーズモデルの発売を継続する予定であるため、新しいテクノロジーは以前のテクノロジーに置き換わるものではありません。さらに、将来的には文書や画像の処理、Web ブラウジングのサポートを追加するために AI を更新することを約束しました。

参考資料一覧

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/
https://www.theverge.com/2024/9/12/24242439/openai-o1-model-reasoning-strawberry-chatgpt
https://openai.com/index/introducing-openai-o1-preview/

OpenAI、推論可能な初のAIであるo1を起動し、ChatGPTと統合

ChatGPT は、OpenAI の o1 および o1-mini による推論機能を追加します

ChatGPT の統合と価格