Odyssey показала Starchild-1 — мультимодальную world model, которая одновременно создаёт изображение и звук во время генерации сцены. Компания называет её первой системой такого типа, работающей в реальном времени.
Модель не рендерит заранее готовый ролик по промту. Она продолжает сцену кадр за кадром и реагирует на действия пользователя по ходу генерации. Odyssey пока показала только preview. Сроки публичного запуска компания не раскрыла. Детали — в материале Postium.
Читайте также: 7 лучших нейросетей для генерации видео
Нейросеть Starchild-1 — что умеет и как работает
Starchild-1 относится к классу world models — моделей, которые учатся симулировать поведение окружающего мира по видео, движению объектов и взаимодействиям внутри сцены.
Главная особенность модели — синхронная генерация аудио и видео. Starchild-1 одновременно предсказывает следующий видеокадр и следующий аудиофрагмент, чтобы сцена сохраняла связность не только визуально, но и по звуку.
Odyssey делает акцент на работе в реальном времени. Обычные генераторы видео вроде Veo или Sora создают ролик целиком после запуска генерации. Пользователь ждёт результат, а сама сцена уже не меняется.
Starchild-1 работает ближе к игровому движку: сцена продолжает строиться во время взаимодействия. Пользователь может менять направление камеры, движение или действия внутри сцены, а модель перестраивает видео и звук на лету.
В опубликованных демо Odyssey показывает прогулки по улицам, движение транспорта, интерьеры и окружение с пространственным звуком. Модель поддерживает длинные непрерывные сцены вместо коротких отдельных клипов.
Почему это важно? Большинство ИИ-видеогенераторов до сих пор работают как офлайн-рендер: пользователь вводит запрос, получает ролик и при каждом изменении сцены запускает генерацию заново.
World models идут в другую сторону — к интерактивным средам, где ИИ постоянно поддерживает симуляцию мира и реагирует на действия в реальном времени.
Для Odyssey это попытка занять нишу между генераторами видео и игровыми движками. Такие модели могут использоваться в интерактивных фильмах, играх, виртуальных пространствах и ИИ-интерфейсах, где сцена не фиксирована заранее.
Итог: вышла Starchild-1 — нейросеть для генерации открытого мира.



