デバイス上で人工知能タスクを実行できる言語モデルであるGemini Nano がPixel 8 と Pixel 8a で利用できるようになりました。 Google は、モバイル デバイスに複数の機能を統合する新しいアップデートの到着を発表しました。最も印象的なのは、I/O 2024 中に発表された AI です。

テクノロジー大手は、新しいオプションを追加し、エラーを修正する Google Pixel の毎月のアップデートである新しい機能ドロップを発表しました。 6 月のアップデートにより、Pixel 8 および Pixel 8a で Gemini Nano にアクセスできるようになります。 Recorder アプリケーションでトランスクリプトの詳細な要約を作成できるようになりました。

Google の人工知能は、録音に参加している人々の名前を検出して含めることができるため、テキストの文字起こしが改善されます。ユーザーは概要を Google ドキュメントに直接送信して、インタビューや授業などのアクティビティを追跡できるようになります。

唯一の詳細は、アクセスできるようにするには、まず Pixel で開発者モードを有効にする必要があるということです。完了したら、 [システム] > [開発者向けオプション]のモバイル設定内で Gemini Nano をアクティブ化するだけです。 GoogleはAIで提供する新機能の詳細を明らかにしておらず、ユーザーの介入が必要であるという事実から、これは発売前のテスト段階であると思われる。

YouTubeビデオ

ジェミニナノとは

Gemini Nano は、Google の大規模な言語モデル ファミリーの最小かつ最も効率的なバージョンです。デバイスのハードウェア上で実行するように特別に設計されているため、素早い応答が必要なタスク (テキストの要約など) に最適です。

Gemini Nanoの利点の 1 つは、インターネット接続がない場合でも動作できることです。これは、モデルがデバイス自体に保存されるため、Google のサーバーと通信する必要がないためです。この機能は、信号がない状況や、データをプライベートに保ちたいタスクの場合に役立ちます。

Gemini Nano マルチモード

このモデルは、Recorder や Gboard アプリケーションなど、いくつかの Google 製品ですでに使用されています。 1 つ目では、Gemini Nano を使用して、録音の概要を自動的に生成できるデバイス上の概要機能をアクティブにします。一方、Gboard は、オフラインでもスマートで正確な応答機能を提供するために使用されます。

I/O 2024 開発者カンファレンス中に、Google はGemini Nano の次のバージョンがマルチモーダルになる発表しました。人工知能モデルは、携帯電話にテキスト、画像、ビデオ、音声認識機能を追加します。マルチモーダル機能は、OpenAI の最も強力な AI である GPT-4o などのモデルにあります。

Pixel の最新アップデートでその他のニュースが発表されます

6 月の機能ドロップでは、発信者番号通知などの新機能も Pixel に追加されます。電話帳に登録していない知らない番号から電話がかかってきた場合は、 「検索」ボタンを押すとG​​oogleで検索できます。この機能は、Truecaller Web サイトで番号を識別するという古いトリックを置き換える可能性があります。

Pixel 8a、Pixel 8、Pixel 8 Pro に追加されたもう 1 つの重要な機能は、USB-C ケーブルを介してモバイルをより大きな画面に接続できることです。ユーザーは、画面をミラーリングして映画やビデオを視聴したり、1 台のモニターで単に作業したりするオプションを利用できます。

最後に、Pixel のカメラ アプリは、シャッターを押すだけでHDR+ 写真の最高の瞬間を自動的に識別します。このアプリでは、カメラのレンズを手動で選択することもできるため、写真を撮影する際の制御が強化されます。

これらおよびその他の機能がアップデートで Pixel デバイスに追加されます。

参考資料一覧

  1. https://blog.google/products/pixel/pixel-feature-drop-june-2024/#footnote-1
  2. https://blog.google/products/pixel/pixel-feature-drop-june-2024

Google、新しいアップデートでPixel 8とPixel 8aにGemini Nanoを搭載・関連動画