ChatGPT は生成人工知能の流行を別のレベルに引き上げ、クローンや代替プラットフォームの雪崩を引き起こしました。しかし、ここ数時間で、OpenAIチャットボットのオリジナル バージョンが驚くべきものであるのと同じくらい、 GPT-4 のリリースによってばかげたものになっていることが証明されました。

Sam Altman 氏のスタートアップの新しい言語モデルの特徴と能力により、オリジナルの ChatGPT は非常に限定されたバージョンになっています。注意してほしいのは、だからといって彼が過去数か月で達成した成果が損なわれるわけではないが、11月から現在までに我々が見てきたことは、彼の能力のほんの表面をなぞっただけであることは明らかだ。

したがって、この機会を利用して、GPT-4 をオリジナルの ChatGPT よりもはるかにインテリジェントにする改良点と、GPT-4 を強化する言語モデルについて言及します。

 GPT-4 はマルチモーダルです

GPT-4 はマルチモーダルです

GPT-3 や GPT-3.5 と比較して GPT-4 がもたらす最初の大きな変更は、テキストの理解に限定されないことです。 OpenAI の新しいテクノロジーは画像を理解することができますが、その内容を識別して平文で送信することに限定されません。

実際、昨日、視覚障害者や弱視の人向けの iOS および Android 用仮想アシスタントを開発するBe My Eyes社が、自社のアプリケーションに GPT-4 を統合すると発表しました。新しいツールを通じて、ユーザーは必要なものの写真を撮ることができ、言語モデルがそれを認識し、アプリがテキスト応答を音声に変換します。

Virtual Volunteer が現在利用可能な他の画像からテキストへのテクノロジーと異なるのは、デジタル アシスタントの分野ではまだ見られない、より深いレベルの理解と会話機能を備えたコンテキストです。たとえば、ユーザーが冷蔵庫の内部の写真を送信すると、バーチャルボランティアは中に何が入っているかを正確に特定できるだけでなく、それらの材料で何が調理できるかを推定して分析することもできます。このツールは、これらの材料の一連のレシピを提供し、それらの材料を準備する方法についてのステップバイステップのガイドを送信することもできます。

「Be My Eyes」では、GPT-4 を視覚障害者向けのアシスタントに統合することについて説明しています。
 ChatGPT よりもはるかに長く深い会話

ChatGPT よりもはるかに長く深い会話

チャットGPT

ChatGPT のオリジナル バージョンおよびそれがサポートする可能性がある言語モデルと比較した GPT-4 のもう 1 つの大きな進歩は、はるかに長い会話を保持できることです。ただし、ここで言っているのは回答できる行数のことではなく、同じ講演内で以前に議論されたトピックに戻るために自分の手順をたどることができる能力のことです。たとえ情報が終わりのないおしゃべりの中に「埋もれてしまった」としても。

これは、GPT-4 のメモリが以前のバージョンよりもはるかに大きいためです。これにより、大きな問題なく、いつでも戻ることができる大量のデータを保持できます。

これをよりよく理解するために、最も単純な比較は、言語モデルが生成して「記憶」できる情報のページ数と比較することです。昨日 OpenAI によって発表されたテクノロジーには、最大32,768 個のトークンがあり、これは 50 ページのテキストまたは約 64,000 単語に相当します。一方、ChatGPT は最大4,096 トークンに制限されています。つまり、最大 5 ページのテキスト、または 8,000 ワードに相当します。

 GPT-4 を使用すると、さまざまな個性と対話できます

GPT-4 を使用すると、さまざまな個性と対話できます

これも最近よく噂されている非常に興味深い要素です。 ChatGPT のオリジナル バージョンは、有害な、または感情を操作するような動作で物議を醸しましたが、OpenAI は、ユーザーが自由に呼び出せるさまざまなパーソナリティを GPT-4 に含めるように取り組んできました。

これは、ChatGPT の新しい Bing 機能として今月初めに導入されたものでもあります。したがって、Microsoft の検索エンジンに統合されたチャットボットは、人工知能との会話のトーンを変更するオプションをすでに提供しており、正確でバランスの取れた、または創造的な方法で応答することを選択できます。レドモンドの人々が、これまで公然の秘密だったボットが GPT-4 で動作することを確認したことを考えると、これは驚くべきことではありません。

ただし、多重人格は、ChatGPT の代替となるいくつかの機能が事前に取り組んでいた機能であることを明確にする価値があります。 OpenAI チャットボットに匹敵する最初の提案の 1 つであるChatSonic では、「コメディアン」、「数学教師」、「旅行ガイド」などのプロフィールから選択できるようになりました。

新しい言語モデルは、迅速なハッキングに対する耐性がさらに高まると約束されています

新しい言語モデルは、迅速なハッキングに対する耐性がさらに高まると約束されています

gpt-4

ChatGPT がデビューして以来、ハッカーがそれが簡単に騙せることを証明するのに時間はかかりませんでした。それを支える言語モデルには、機密性が高いと考えられるトピックに対処できないという制限がありましたが、なんとか回避できるまでは創意工夫の問題でした。

実際、数日前、OpenAI チャットボットに対するすべての制限を排除するジェイルブレイクを適用する非常に印象的な方法が知られていました。しかし、Sam Altman 氏のスタートアップ企業は、GPT-4 ははるかに多くの悪意のあるプロンプトを理解して拒否するように訓練されていると主張しています。これにより、少なくとも理論的には、ユーザーが言語モデルが有効になっていない応答を強制的に提供することを防ぐことができます。

ただし、それが主張されているほど確実であるかどうかはまだわかりません。また、GPT-4 で開発された Bing with ChatGPT が、プロンプト ハッキングという本当に憂慮すべき事件の被害者だったことを忘れてはなりません。エンジニアは、Python 関数内でリクエストをマスクすることで、チャットボットに学校への攻撃を計画するよう依頼し、起こり得る被害を最大限に高めることができました。

プラットフォームは命令を瞬く間に解釈し、攻撃の最初の 4 ステップさえも作成しました。ただし、プラットフォームがそれが悪意のあるリクエストであることを検出すると、一種のセキュリティ層が作動し、その場で応答を変更しました。

その他の改善やさらなる機能も開発中です

その他の改善やさらなる機能も開発中です

これまで述べてきたことは、GPT-4 を元の形式の ChatGPT を明らかに凌駕する真の野獣たらしめている点の一部にすぎません。新しい言語モデルは、複数の言語でより適切な解釈と応答を提供するように設計されていることにも言及する価値があります。 Duolingo でさえすでに活用しており、新しい OpenAI テクノロジーに基づいた新しいサブスクリプションを開始しました。

GPT-4 の進化は非常に目覚ましいものであるため、近い将来さらに多くの機能が登場するのが待ちきれません。最新バージョンの言語モデルを試したい場合は、月額 20 ドルのChatGPT Plus に加入する必要があることに注意してください。さらに、すでにそれを実装している15 のアプリとサービスをHipertextualでお知らせします。

参考資料一覧

  1. https://www.bemyeyes.com/blog/introducing-be-my-eyes-virtual-volunteer

GPT-4 が ChatGPT を破壊する 4 つのケース・関連動画