更新情報

Gemini:Gemini 3.5 Flashに「Computer Use」機能が標準搭載

タケイ

Googleは、Gemini 3.5 FlashにComputer Useを組み込んだと発表しました。

公式ブログでは、Computer Useを「Gemini 3.5 Flashに組み込まれたツール」として説明しており、ブラウザやモバイル、デスクトップ環境を見て、推論し、操作するAIエージェントを作るための仕組みだとしています。

開発者向けドキュメントを見ると、Gemini 3.5 Flashが推奨モデルで、スクリーンショットを見ながらクリック、入力、スクロールといったUIアクションを返す流れになっています。

実際の操作はクライアント側で実行し、Geminiは「次にどこを押すべきか」「何を入力すべきか」を返す設計ですね。

私が気になったのは、安全面の説明です。Googleは、支払い、購入、外部送信のような不可逆操作や機密操作ではユーザー確認を挟む仕組み、間接プロンプトインジェクションを検出したときに停止する仕組みを案内しています。

AIエージェントが便利になるほど、勝手に操作される怖さも増えるので、このあたりはかなり現実的な設計に寄せてきた印象です。

ただ、今すぐPixelやChromebookの標準機能として誰でも使える、という話ではありません。Gemini APIやGemini Enterprise Agent Platformから使う開発者・企業向けの発表です。

それでも、将来的に「画面を見て手順を進めるGemini」が身近な端末に入ってくる下地としては、かなり大きな一歩だなあと感じます。

スポンサーリンク
ABOUT ME
タケイマコト
タケイマコト
Chromebook愛好家
埼玉県在住のサラリーマン。 Chromebook(クロームブック)の魅力を広めるために勝手に活動する「Chromebookマニア」です。 パソコン7割(Chromebook、レッツノート、マウスコンピュータ)、ガジェット3割(デジタル手書き、スマホ)でやってます。
Multiplex広告
記事URLをコピーしました