
グーグルのGemini Omniは、画像、音声、テキスト、動画を統合的に理解し、対話を通じて動画を生成・編集できる新たなマルチモーダルAIです。まずはOmni Flashとして、YouTube Shortsなどで10秒程度の動画作成が可能になります。単なる素材の継ぎ合わせではなく、物理法則や文化、歴史、科学を理解した高品質な映像を生み出します。将来的には、音声から映像、映像から音声を生成するなど、応用範囲はさらに広がります。クリエイターや広告業界にも変革をもたらす可能性を秘めています。
翻訳・要約には細心の注意を払っていますが、投資判断等は必ず一次情報をご確認の上、自己責任で行ってください。
📩 毎朝メールで受け取る:Substackで無料購読する