Google は、次世代人工知能であるGeminiでアクセルを踏み込んでいます。このテクノロジーは先週発表されたばかりですが、同社は時間を無駄にしたくなく、より多くのユーザーにこのテクノロジーを使用してもらいたいと考えています。事業拡大を促進するために、同社は最も使用されている製品の 1 つであるAndroidに依存しています。

Google は、本日より、開発者が Gemini をアプリに統合できるようになったと発表しました。企業側も、ワークフローでこれを活用できます。これを実現するために、同社は Gemini API をリリースしました。これは、Google AI Studio および Google Cloud Vertex AI を通じてすでに利用可能なツールのセットです。

現時点では、API はGemini Proソリューションへのアクセスのみを提供していることに注意することが重要です。つまり、プロポーザルの処理はユーザーのデバイスではなく Google サーバーで行われます。

このようにして、開発者は、たとえば生成テキスト機能を提供するアプリケーションを作成できます。 Gemini はマルチモーダルな言語モデルであることを覚えておく必要があります。つまり、ユーザーのリクエストに基づいてコンテンツを生成できるだけでなく、既存のコンテンツ (テキストと画像の両方) を解釈することもできます。

Google ジェミニ |人工知能

処理は Google データセンターで行われるため、 Gemini Pro の統合は必ずしも無料であるとは限りません。チェックアウトを避けるために、API は1 分あたり 60 クエリを超えないようにしてください。

アプリケーションがさらに必要な場合、開発者は行われたリクエストに基づいて料金を支払う必要があります。以下の価格:

データ入力:

入力 1,000 文字ごとに 0.00025 ドル。
入力された画像ごとに 0.0025 ドル。

データ出力:

出力 1,000 文字あたり 0.0005 ドル。

「現在利用可能なバージョンでは、Gemini Pro はテキストを入力として受け入れ、テキストを出力として生成します。また、テキストと画像を入力として受け入れ、テキストを出力として受け入れる Gemini Pro Vision マルチモーダル ターミナルも利用可能になりました。」

グーグル。

重要な点は、現時点では支払い提案を使用することはできないということです。したがって、開発者は無料プランの利用に限定されます。これはコミュニティが API の使い方を学び、最初のテストを実行するまでの一時的な措置であることは間違いありません。 1 分あたり 60 クエリは実験するには十分です。

この記事の執筆時点では、Gemini Pro は 38 の言語をサポートしています。その結果、180 か国以上の開発者とユーザーのニーズを満たすことができます。

 Googleはジェミニにすべてを賭ける

Googleはジェミニにすべてを賭ける

Google にとって Gemini が優先事項になっているのは疑いの余地がありません。競合他社、特に Microsoft と緊密に連携する OpenIA の進歩により、マウンテン ビューの企業は人工知能の分野での取り組みを倍増させました。

Gemini Pro をサードパーティ アプリケーションに統合するための API のリリースにより、開発者自身の創造性によって限界が決まる可能性の世界が広がります。そして、これは Google の最初の一歩にすぎないので注意してください。 Android の次に Gemini を採用するのは、Google Chrome と Firebase になります

さらに来年、Google はさらに複雑なタスクを実行できる大型モデルであるGemini Ultra を発売する予定です。もちろん、彼らはまず、Gemini Nano と Gemini Pro の両方の既存の提案がユーザー、企業、開発者の要求を満たしていることを確認する必要があります。実際、彼らはコミュニティのコメントがテクノロジーを改善し続けるための鍵になると述べています。

参考資料一覧

  1. https://ai.google.dev/pricing
  2. https://android-developers.googleblog.com/2023/12/leverage-generative-ai-in-your-android-apps.html

Googleの新しいAIであるGeminiをAndroidアプリケーションに統合できるようになりました・関連動画