Анонс · 19 мая 2026 · Google I/O

Gemini Omni
видео из всего

Первая unified omni-модель Google. Принимает текст, изображения, аудио и видео одновременно — генерирует 4K-видео в один проход, без промежуточных моделей.

4K качество видео
10 с длина ролика
быстрее Flash-серия
$100 AI Ultra / мес

Что умеет Gemini Omni

Text → Video

Генерация видео из текста

Пишешь описание сцены — получаешь видео 4K с нативным аудио. Модель понимает контекст, физику объектов и корректно рендерит текст внутри кадра — включая кириллицу.

Physics-aware

Физика объектов

Модель понимает гравитацию, fluid dynamics и кинетическую энергию. Объекты движутся по законам физики — без артефактов рук и деформаций.

Direct Editing

Редактирование без перегенерации

Меняете один элемент — объект, освещение, ракурс — модель вносит правку точечно, не пересоздавая всю сцену.

Video Remix

Трансформация существующих видео

Загружаете клип — Omni переделывает стиль, расширяет сцену, добавляет персонажей или меняет окружение через промпт.

Native Audio

Аудио в один проход

Голос и музыка генерируются синхронно с видео — не постпроцессинг отдельной моделью, а единый нейронный проход.

Multimodal Input

Любой тип входных данных

Текст, изображения, видео, аудио — одновременно. Omni-архитектура обрабатывает все модальности в едином контексте.

Gemini Omni vs конкуренты

МодельВходные данныеНативное аудиоТекст в видеоПрямое редактирование
Gemini OmniТекст + Изображение + Видео + Аудио
Veo 3.1Только видео (отдельный проход)
Sora (OpenAI)Только видеоОграниченно
Seedance 2.0Только видео
Runway Gen-4Текст + ИзображениеОграниченно

* Sora закрыта OpenAI в апреле 2026. Данные: Google I/O 2026, публичные анонсы.

Где и как получить доступ

Лето 2026

Gemini Omni Flash

Облегчённая версия Flash. Цена пока не объявлена. По аналогии с Gemini 3.5 Flash — значительно быстрее и дешевле.

Июнь 2026 (ориент.)

API + Vertex AI

API и Vertex AI выйдут через 2–4 недели после 19 мая. Цены на токены не объявлены.

Для разработчиков: API доступен ориентировочно к середине июня 2026. Google Flow (google.com/flow) уже работает с Gemini Omni. YouTube-интеграция для создателей — сроки не объявлены.

Gemini Omni через API уже доступен

Генерируйте и редактируйте видео через REST API — текст, изображение и видео как входные данные. Тарификация per-second, оплата кредитами.

🎬 Без видеовхода

Длительность720P / 1080P4K
4 сек90 кр $0.45210 кр $1.05
6 сек120 кр $0.60240 кр $1.20
8 сек150 кр $0.75270 кр $1.35
10 сек180 кр $0.90300 кр $1.50

🎞️ С видеовходом (Video Remix)

КачествоСтоимость
720P / 1080P240 кр $1.20
4K360 кр $1.80

💡 Пополнение баланса на высоком тире — бонус 10%. Эффективная стоимость ≈ 90% от прайса.

Кто написал и проверил

Материал основан на прямом репортаже с Google I/O 2026 и анализе официальных источников Google.

Максим Наговицын

Маркетинг-стратег · IT-предприниматель · Вайбкодер

Санкт-Петербург

10+ лет в маркетинге, 300+ клиентских проектов. Создал GoBanana (228K+ пользователей, 11.6 млн ₽), Neuroscribe (58K+ пользователей) и VibeCoderz. Строит AI-продукты без программистов через Claude Code, Cursor и Windsurf.

228K+ пользователей GoBanana
300+ клиентских проектов
10+ лет в маркетинге и IT
Вайбкодинг AI-продукты Programmatic SEO GEO для AI-поисковиков

Елисавета Наговицына

SEO-стратег · AI-продуктолог · Контент-маркетолог

Москва

Со-основатель GoBanana и NeuroScribe. 400K+ органических переходов за 3 месяца. 17+ реализованных SEO/GEO-стратегий. Автор первичного репортажа о Google I/O 2026 на vibecoderz.ru — источника этого материала.

400K+ органических переходов / 3 мес
1 700+ единиц контента
17+ реализованных стратегий
SEO / GEO-контент Промпт-инжиниринг AI-продукты Автоматизация маркетинга

Первоисточник материала: «Google I/O 2026: все анонсы» — репортаж Елисаветы Наговицыной на VibeCoderz.ru, опубликован 19 мая 2026.

Всё о Gemini Omni

Что такое Gemini Omni?
Gemini Omni — первая unified omni-модель от крупного AI-провайдера с нативным видеовыходом. Анонсирована Google 19 мая 2026 на Google I/O. Принимает текст, изображения, видео и аудио одновременно, генерирует видео 4K-класса в один проход — без промежуточных моделей.
Чем Gemini Omni отличается от Veo 3?
Veo 3 — специализированная видеомодель с отдельным аудиопроходом. Gemini Omni — единая omni-архитектура для всех модальностей. Построена на базе Veo, но принимает текст, изображения, аудио и видео как входные данные одновременно и выдаёт видео с нативным аудио за один проход.
Что умеет Gemini Omni прямо сейчас?
Прямо сейчас: Text→Video (генерация видео из текста), Direct in-chat editing (точечное редактирование без полной перегенерации), Video Remix (трансформация загруженного клипа), нативное аудио и голос синхронно с видео, Physics-aware анимация, мультиязычный текст внутри видео включая кириллицу.
Сколько стоит Gemini Omni?
Gemini Omni доступен для подписчиков AI Ultra — $100/мес (новый план) или $200/мес (старый план, снижен с $250). Два видеогенерации за один запрос потребляют 86% дневной квоты AI Ultra. Gemini Omni Flash выйдет летом — цена не объявлена.
Когда выйдет Gemini Omni API для разработчиков?
API и Vertex AI доступ ожидается через 2–4 недели после анонса 19 мая 2026, то есть ориентировочно к середине июня 2026.
Как использовать Gemini Omni в России?
Через Gemini-приложение (gemini.google.com) с подпиской AI Ultra. Геоограничения зависят от настроек аккаунта Google. API для разработчиков выйдет через 2–4 недели. Проверяйте доступность в настройках аккаунта — регионы могут отличаться.
Что такое Gemini Omni Flash?
Gemini Omni Flash — облегчённая версия Gemini Omni. По аналогии с Gemini 3.5 Flash (в 4 раза быстрее, дешевле на треть) — Flash-версия будет быстрее и дешевле полной модели. Дата выхода: лето 2026.
Какие форматы и разрешение у Gemini Omni?
Gemini Omni поддерживает соотношения сторон 9:16 (вертикальное), 1:1 (квадрат) и 16:9 (горизонтальное). Качество 4K-класса. Максимальная длина — 10 секунд в текущей версии.
Что такое Video Remix в Gemini Omni?
Video Remix — загружаете существующий видеоклип, Gemini Omni переделывает его, расширяет или миксует согласно текстовому промпту. Можно изменять окружение, добавлять персонажей, трансформировать стиль, сохраняя основной контент.
Что такое Direct in-chat editing?
Функция редактирования видео без полной перегенерации. Просите изменить один элемент — объект, освещение, ракурс — и модель меняет только его, сохраняя остальную сцену. Значительно экономит квоту и время.
Чем Gemini Omni лучше Sora от OpenAI?
Sora была закрыта OpenAI в апреле 2026. На момент закрытия Gemini Omni превосходил её по: нативному аудио в один проход, мультиязычному тексту внутри видео (включая CJK и кириллицу), physics-aware анимации, прямому редактированию. Кроме того, Gemini Omni — omni-архитектура, Sora — узкоспециализированная видеомодель.
Что такое Physics-aware в Gemini Omni?
Physics-aware означает, что модель понимает законы физики: гравитацию, fluid dynamics, кинетическую энергию. Объекты в генерируемых видео движутся реалистично — падают, текут, взаимодействуют с другими объектами по законам физики. Это решает «Will Smith test» — главную проблему предыдущих видеомоделей с реалистичностью рук.
Что показали на демо Gemini Omni на Google I/O 2026?
Два ключевых демо: 1) «Профессор на доске» — написание тригонометрического доказательства мелом с читаемым текстом в видео — впервые в AI-видео. 2) «Spaghetti test» — двое едят спагетти с натуральными взаимодействиями рук и объектов.
Поддерживает ли Gemini Omni русский язык в видео?
Да. Gemini Omni поддерживает мультиязычный текст внутри видео, включая кириллицу, латиницу и CJK (китайский, японский, корейский). Рекламные ролики, субтитры, надписи на объектах — на русском языке с корректным отображением.
Что такое omni-архитектура?
Единая нейросетевая архитектура, принимающая и генерирующая несколько типов данных одновременно: текст, изображения, видео, аудио. В отличие от pipeline-систем, где разные модели обрабатывают разные типы данных по очереди — в omni-архитектуре всё происходит в едином сквозном процессе.
Как Gemini Omni связан с Google Flow?
Google Flow — профессиональный инструмент создания видеоконтента. С Omni Flow берёт сырые съёмки, добавляет визуальные эффекты, трансформирует окружение, добавляет персонажей через промпт. Новый Flow Agent создаёт до 16 уникальных вариантов видео из одного изображения. Доступен уже сейчас.
Какая разница между Gemini Omni и Gemini 3.5 Flash?
Это разные модели с разными задачами. Gemini 3.5 Flash — текстовая и мультимодальная reasoning-модель (в 4 раза быстрее frontier-моделей, дешевле на треть). Gemini Omni — специализирована на генерации видео с нативным аудио. Flash не генерирует видео, Omni оптимизирован именно под него.
Можно ли использовать Gemini Omni бесплатно?
Нет. Gemini Omni требует подписки AI Ultra ($100/мес). Gemini Omni Flash, когда выйдет летом 2026, может стать доступен на более дешёвых планах — официально не подтверждено.
Какие конкуренты у Gemini Omni?
Из актуальных конкурентов: Veo 3.1 (Google, только видео), Seedance 2.0 (ByteDance), Kling 2.0 (Kuaishou), Runway Gen-4. Sora (OpenAI) закрыта в апреле 2026. Gemini Omni — единственная omni-архитектура с нативным аудио и physics-aware анимацией.
Что такое Gemini Omni Pro?
Gemini Omni Pro — полная версия модели (в отличие от Omni Flash — облегчённой). Именно Pro-версия доступна для AI Ultra подписчиков сейчас. Детальные технические различия Flash и Pro не объявлены.
Когда Gemini Omni Flash выйдет для разработчиков?
Лето 2026 — официальная формулировка от Google. Точная дата не объявлена. API для полной версии Omni выйдет раньше — через 2–4 недели после анонса 19 мая.
Что такое Google I/O 2026?
Ежегодная конференция разработчиков Google, прошедшая 19–20 мая 2026. Главные анонсы: Gemini Omni, Gemini 3.5 Flash, личный агент Gemini Spark, Antigravity 2.0, переосмысленный поиск, умные очки Samsung, Universal Cart. CEO DeepMind Демис Хассабис объявил, что AGI «в нескольких годах».
Как нативное аудио генерируется в Gemini Omni?
Аудио — голос и музыка — генерируются синхронно с видео в единый проход через ту же omni-архитектуру. Это не постпроцессинг отдельной моделью. Модель учитывает физику движения при генерации звука, что даёт более реалистичный результат.
YouTube получит интеграцию с Gemini Omni?
YouTube-интеграция Gemini Omni для создателей контента ожидается — точные сроки не объявлены. Google Flow уже работает с Omni. YouTube также обновил поиск с Ask YouTube — умный поиск по видеотеке с точечными ответами.
Как подключить Gemini Omni к своему проекту?
Пока только через Gemini-приложение. API и Vertex AI выйдут через 2–4 недели после 19 мая 2026 — ориентировочно середина июня. После выхода API подключение будет через Google AI Studio (aistudio.google.com) или Vertex AI SDK — аналогично другим Gemini-моделям.
Что такое Spaghetti test и при чём тут Gemini Omni?
Spaghetti test — неформальная проверка видеомоделей на реалистичность: сцена с едой требует корректной анимации рук, ложки и взаимодействия объектов. Предыдущие модели проваливали этот тест. На демо Google I/O 2026 Gemini Omni успешно воспроизвёл сцену с двумя людьми, едящими спагетти — с натуральными движениями рук.
Как Gemini Omni влияет на контент-маркетинг?
Значительно. Нативная генерация читаемого текста внутри видео (включая кириллицу) + нативное аудио = готовые рекламные ролики, Reels, Shorts из текстового промпта. Для контент-маркетинга это сокращает производственный цикл видео с недель до минут. Google Flow с Omni уже доступен.

Когда что выходит

  1. 19 мая 2026 — Сегодня

    Gemini Omni доступен в Gemini-приложении для подписчиков AI Ultra. Google Flow получает Omni внутри. Antigravity 2.0 и Gemini 3.5 Flash запускаются глобально.

  2. Следующая неделя

    Gemini Spark выходит в бета для AI Ultra подписчиков в США.

  3. Середина июня 2026 (ориент.)

    Gemini Omni API и Vertex AI — доступ для разработчиков. Gemini 3.5 Pro выходит в следующем месяце.

  4. Лето 2026

    Gemini Omni Flash — облегчённая версия. Gemini Spark через MCP подключается к сторонним инструментам. Docs Live и Gmail Live роллаутятся на Android/iOS.

  5. Осень 2026

    Android XR очки Samsung выходят в продажу. Aluminum OS (слияние Android + ChromeOS) на ноутбуках Acer, Asus, Dell, HP, Lenovo.