Google DeepMind представила Genie 2 — первую универсальную модель для генерации интерактивных 3D-миров по тексту или изображению.
Новая разработка компании позволяет создавать целые виртуальные пространства — например, «лес с рекой и динозаврами» — где пользователь или агент может свободно перемещаться и взаимодействовать с окружением.
Что умеет Genie 2
- Генерация полноценного трёхмерного мира из одного изображения или фразы — например, из фотографии или текстового описания.
- Модель самостоятельно выводит правила игровой логики: физику, столкновения, взаимодействие, поведение объектов и персонажей без необходимости ручного программирования сценариев.
- Интеграция с игровыми движками — через API модель может быть подключена к Unity или Unreal Engine и применена в разработке игр, симуляций и виртуальных опытов.
Почему это важно
Модель Genie 2 открывает новый этап в развитии ИИ-инструментов для создания виртуальных миров. Раньше генерация игровых уровней или симуляций требовала команд дизайнеров и программистов, теперь начало проекта можно задать простым изображением или фразой.
Это значит:
- Разработчики и студии любого масштаба могут быстрее прототипировать окружения и механики.
- Учёные-инженеры получат множество новых сред для тренировки «агентов» — моделей, роботов и автономных систем.
- Потенциал применения вне игр — от обучения, VR/AR до симуляций городов и инфраструктуры.
Что остаётся неясным
- Масштаб коммерческого релиза: пока Genie 2 описывается как исследовательская система, детали лицензирования или стоимости доступа ещё не раскрыты.
- Степень готовности: хотя публикации подчеркивают интерактивность, остаётся открытым вопрос, насколько устойчиво модель работает в сложных сценариях с длительной навигацией.
- Этические и практические риски: генерация «безграничных миров» может потребовать новых подходов к контролю контента и безопасности.