Компания Google DeepMind объявила о формировании новой исследовательской команды, задача которой — разработка «world-models» — генеративных ИИ-систем, способных симулировать физические среды в реальном времени для приложений в играх, робототехнике и интерактивных системах.
По словам компании, новая группа будет возглавлена исследователем Тима Брукса (Tim Brooks) и сосредоточится на масштабной подготовке данных, мультимодальных системах и низкоуровневой симуляции для агентов. Работа включает интеграцию с текущими проектами DeepMind, такими как мультимодальная модель Gemini и видео генератор Veo. The Verge
Ключевые технические особенности инициативы:
- моделирование физических сред и взаимодействий объектов, что позволяет представлять не просто текст или изображение, а интерактивную среду, в которой агент может действовать;
- снижение задержки (latency) и улучшение UX-опыта: агенты не просто отвечают на запросы, а реагируют на изменения среды «на лету», создавая интерфейсы ближе к реальности;
- применение подхода on-device и edge-симуляций: симуляции могут быть выполнены локально без необходимости постоянной связи с облаком, что сокращает зависимость от сети и обеспечивает автономность.
С точки зрения индустрии это важный шаг. World-models позволяют переходить от пассивного генерации (текст, картинка) к активному взаимодействию: игры, симуляции роботов, обучение агентов и интерфейсы, где ИИ ведёт себя как среда, а не просто инструмент. Это может привести к новым видам приложений, где UX строится вокруг реактивности и контекста, а не предзаготовленной логики.
Кроме того, инициатива усиливает конкуренцию в области архитектур ИИ и мультимодальности — компании, которые освоят средства моделирования среды и интеграции с «агентами», получат преимущество в задачах с низкой задержкой, интерактивностью и локальным исполнением. Это близко к направлениям Re: II: модели и инструменты, скорость реакции, inference, UX-фокус, on-device.
Важно отметить: проект находится на ранней стадии, и DeepMind пока набирает специалистов, публикуя вакансии. Коммерческого релиза или точных сроков пока нет. Но сама постановка задачи показывает, что разработка ИИ движется не только к генерации текста и изображений, но к созданию целых цифровых миров, в которых система может «думать» и «действовать» в режиме реального времени.