Google DeepMind запускает команду «world-modeling»

Google DeepMind запускает команду «world-modeling» для игр и робототехники

~1 мин чтения

Компания Google DeepMind объявила о формировании новой исследовательской команды, задача которой — разработка «world-models» — генеративных ИИ-систем, способных симулировать физические среды в реальном времени для приложений в играх, робототехнике и интерактивных системах.

По словам компании, новая группа будет возглавлена исследователем Тима Брукса (Tim Brooks) и сосредоточится на масштабной подготовке данных, мультимодальных системах и низкоуровневой симуляции для агентов. Работа включает интеграцию с текущими проектами DeepMind, такими как мультимодальная модель Gemini и видео генератор Veo. The Verge

Ключевые технические особенности инициативы:

  • моделирование физических сред и взаимодействий объектов, что позволяет представлять не просто текст или изображение, а интерактивную среду, в которой агент может действовать;
  • снижение задержки (latency) и улучшение UX-опыта: агенты не просто отвечают на запросы, а реагируют на изменения среды «на лету», создавая интерфейсы ближе к реальности;
  • применение подхода on-device и edge-симуляций: симуляции могут быть выполнены локально без необходимости постоянной связи с облаком, что сокращает зависимость от сети и обеспечивает автономность.

С точки зрения индустрии это важный шаг. World-models позволяют переходить от пассивного генерации (текст, картинка) к активному взаимодействию: игры, симуляции роботов, обучение агентов и интерфейсы, где ИИ ведёт себя как среда, а не просто инструмент. Это может привести к новым видам приложений, где UX строится вокруг реактивности и контекста, а не предзаготовленной логики.

Кроме того, инициатива усиливает конкуренцию в области архитектур ИИ и мультимодальности — компании, которые освоят средства моделирования среды и интеграции с «агентами», получат преимущество в задачах с низкой задержкой, интерактивностью и локальным исполнением. Это близко к направлениям Re: II: модели и инструменты, скорость реакции, inference, UX-фокус, on-device.

Важно отметить: проект находится на ранней стадии, и DeepMind пока набирает специалистов, публикуя вакансии. Коммерческого релиза или точных сроков пока нет. Но сама постановка задачи показывает, что разработка ИИ движется не только к генерации текста и изображений, но к созданию целых цифровых миров, в которых система может «думать» и «действовать» в режиме реального времени.

QR Telegram

Подписывайтесь на наш Telegram

Новости, сводки и разборы

Читайте также