Google「Gemini Omni」発表。会話だけで動画編集できるマルチモーダルAIがChromebookの動画制作を変える
どうも、Gemini Omniの発表で動画生成まわりがまた一段とAI寄りになってきたなあと感じているタケイ(@pcefancom)です。
GoogleがGemini Omniを発表しました。最初に展開されるGemini Omni Flashは、画像・音声・動画・テキストを入力に使い、動画を生成・編集できるマルチモーダルモデルです。Googleによると、Geminiアプリ、Google Flow、YouTube Shorts、YouTube Create Appに展開され、Google AI Plus/Pro/Ultra加入者はGeminiアプリとFlowで利用可能。YouTube ShortsとYouTube Create Appでは無料ユーザーにも今週から展開される流れになっています。1
「会話で動画を編集する」という発想

個人的に面白いなあと感じたのは、単なる動画生成AIではなく「会話で編集を積み重ねられる」と説明されている点です。
撮影済みの動画に対して、背景・動き・スタイル・カメラアングルを自然言語で変えていく使い方が想定されています。
「夕焼けのシーンを冒頭に追加して、BGMを明るくして、テンポよくつなげて、テロップは左下に配置して」みたいな指示を投げるだけで、タイムライン上の編集が進んでいくイメージですね。
これまでの動画生成AIは「ワンショットで作って終わり」が多かったんですが、Gemini Omniは編集ソフトの代替に近い使い方を狙っている感じがします。Chromebookユーザーにとっては、重い動画編集アプリを入れにくいという制約があるので、ブラウザ上で会話ベースで編集が完結するなら、これはかなり追い風です。
ブログ運営目線で何が変わるか
私の場合、レビュー記事用の短尺動画、YouTube Shorts、X向けの補足動画を作る場面が結構あるんですが、ここの作業負担がかなり変わりそうと感じています。
製品の静止画を投げて「30秒のショート動画にして、BGMはテック系で、テロップは商品名を強調」みたいに振れるなら、撮影や編集にかけていた時間を記事執筆側に回せます。
Google Flowとの連携もポイントで、Gemini Omniで構成・演出・カットを提案してもらってから、Flow側で高品質な映像を生成するワークフローが想定されています。アイデア出しから完成まで一気通貫でAIに任せられる構造になってきました。
GoogleはGemini Omniについて、Geminiの推論能力と生成能力を組み合わせ、「any input」から動画を作れるモデルとして説明しています。1
加えて、AI生成であることを示すSynthIDウォーターマークが自動で付与される仕様も入っています。商用利用やブログ掲載を考えると、この透かしの扱いは事前にチェックしておきたいところ。
気になる点と現時点の評価
注意点として、動画生成の品質、日本語プロンプトでの安定性、商用利用時の権利関係は実際に試して確認したい部分です。
特に日本語の指示で細かいニュアンス(「もう少しテンポ早く」「夕焼けの色味を強めに」など)がどこまで伝わるかは、海外モデルだと毎回引っかかるポイント。Veo系の生成品質をベースにしているなら映像クオリティ自体は期待できますが、編集指示の追従精度がどこまで上がっているかは触ってみないと分かりません。
料金面では、Google AI Plus/Pro/Ultraの加入者向けが先行で、無料ユーザーはYouTube Shorts経由で部分的に試せる構造。C
hromebookユーザーが普段使いするなら、Google AI Plusあたりが現実的な落としどころになりそうです。
まとめ
GoogleがGeminiを「文章生成」だけでなく「動画編集の作業環境」にまで広げてきた意味は大きいです。ChromeOSとの相性も良く、ブラウザとAIだけで動画コンテンツが作れる時代がいよいよ現実的になってきたなあという印象す。
Chromebookで動画編集を諦めていた人ほど、Gemini Omniの展開は注目しておく価値がありそうですね。
実機検証できたら、Chromebook上での挙動を中心に別記事でレビュー予定です。
