ИИ от Google: Ваш виртуальный мир меняется к лучшему! - FutureBots
Контакты
Мы в соц. сетях:
Бесплатный аудит

ИИ от Google: Ваш виртуальный мир меняется к лучшему!

Blog-header-sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds@2x.png

ИИ от Google: Ваш виртуальный мир меняется к лучшему!

ИИ для бизнеса: как DeepMind SIMA 2 открывает новые горизонты для автоматизации и прибыли

Google DeepMind представила SIMA 2 — новое поколение их универсального ИИ-агента. Этот агент интегрирует языковые и аналитические возможности модели DeepMind Gemini, что позволяет ему не просто следовать инструкциям, а понимать и активно взаимодействовать с окружающей средой. Это прорыв, который кардинально меняет подход к автоматизации бизнес-процессов.

От игр к реальным бизнес-задачам: эволюция SIMA

SIMA 1, как и многие проекты DeepMind (например, AlphaFold), обучалась на сотнях часов видеоигр, чтобы научиться играть в 3D игры как человек. Эта версия, представленная в марте 2024 года, могла выполнять базовые инструкции в различных виртуальных средах. Однако её эффективность при выполнении сложных задач составляла всего 31% против 71% у человека.

Сейчас, Senior Research Scientist DeepMind, Джо Марино, отмечает, что SIMA 2 — это значительный шаг вперёд. Это более универсальный агент, способный выполнять сложные задачи даже в ранее невиданных средах. Более того, SIMA 2 является самообучающимся агентом, который улучшается на основе собственного опыта. Это ключевой шаг к созданию универсальных роботов и систем сильного искусственного интеллекта (AGI).

SIMA 2
DeepMind заявляет, что SIMA 2 удваивает производительность SIMA 1. Изображение: Google DeepMind

Gemini 2.5 flash-lite и AGI: что это значит для вашего бизнеса

SIMA 2 работает на базе модели Gemini 2.5 flash-lite. AGI, или сильный искусственный интеллект, по определению DeepMind, — это система, способная выполнять широкий спектр интеллектуальных задач, обучаться новым навыкам и обобщать знания в различных областях.

Исследователи DeepMind подчёркивают, что работа с так называемыми «воплощёнными агентами» (embodied agents) критически важна для достижения универсального интеллекта. Джо Марино объяснил, что воплощённый агент взаимодействует с физическим или виртуальным миром, воспринимая входные данные и выполняя действия, подобно роботу или человеку. В то же время, бездумный агент может просто управлять вашим календарём, делать заметки или выполнять код. SIMA 2 выходит за рамки простого геймплея.

«Мы требуем от него понимать, что происходит, понимать, что пользователь просит его сделать, а затем отвечать осмысленным способом, что на самом деле довольно сложно», — говорит Джейн Ванг, старший научный сотрудник DeepMind.

Интеграция Gemini позволила SIMA 2 удвоить производительность своего предшественника, объединив передовые языковые и логические способности Gemini с воплощёнными навыками, развитыми в процессе обучения.

SIMA 2 в действии
Изображение: Google DeepMind

Практическая демонстрация и реальные кейсы

Марино продемонстрировал SIMA 2 в игре «No Man’s Sky», где агент описывал своё окружение (каменистую поверхность планеты) и определял свои следующие шаги, распознавая и взаимодействуя со спасательным маяком. SIMA 2 также использует Gemini для внутреннего анализа. В другой игре, когда его попросили пройти к дому цвета спелого помидора, агент продемонстрировал свой мыслительный процесс: «спелые помидоры красные, значит, я должен пойти к красному дому», после чего нашёл его и приблизился. Работа на Gemini также означает, что SIMA 2 следует инструкциям, основанным на эмодзи: «Вы даете ему инструкцию 🪓🌲, и он отправится рубить дерево,» — объясняет Марино.

Марино также показал, как SIMA 2 может перемещаться по новосозданным фотореалистичным мирам, созданным Genie (моделью мира DeepMind), правильно идентифицируя и взаимодействуя с объектами, такими как скамейки, деревья и бабочки.

Самообучающийся агент SIMA 2
DeepMind утверждает, что SIMA 2 — самообучающийся агент. Изображение: Google DeepMind

Самообучение и автоматизация: будущее вашего бизнеса

Gemini позволяет SIMA 2 самосовершенствоваться без большого количества человеческих данных. Если SIMA 1 полностью обучалась на игровом процессе человека, то SIMA 2 использует его как основу для создания надёжной начальной модели. Когда команда помещает агента в новую среду, она просит другую модель Gemini создавать новые задачи, а отдельную модель вознаграждения — оценивать попытки агента. Используя этот самогенерируемый опыт в качестве обучающих данных, агент учится на своих ошибках и постепенно улучшает производительность, по сути, обучая себя новому поведению методом проб и ошибок, подобно человеку, но под руководством ИИ-обратной связи, а не человека.

DeepMind рассматривает SIMA 2 как шаг к созданию более универсальных роботов.

«Если мы подумаем о том, что должна делать система для выполнения задач в реальном мире, например, робот, я думаю, что есть два компонента, — сказал Фредерик Бессе, старший инженер-исследователь DeepMind. — Во-первых, это высокоуровневое понимание реального мира и того, что нужно сделать, а также некоторые рассуждения».

Если вы попросите гуманоидного робота в вашем доме проверить, сколько банок с фасолью у вас в шкафу, система должна понять все различные понятия — что такое фасоль, что такое шкаф — и переместиться в это место. Бессе говорит, что SIMA 2 больше касается этого высокоуровневого поведения, чем низкоуровневых действий, которые он называет управлением такими вещами, как физические суставы и колёса.

Команда отказалась назвать конкретные сроки внедрения SIMA 2 в физические роботизированные системы. Бессе сообщил, что недавно представленные DeepMind базовые модели робототехники — которые также могут рассуждать о физическом мире и создавать многоступенчатые планы для выполнения миссии — обучались иначе и отдельно от SIMA.

Хотя нет конкретных сроков для выпуска полной версии SIMA 2, Джейн Ванг отмечает, что цель состоит в том, чтобы показать миру, над чем работала DeepMind, и увидеть возможности для сотрудничества и потенциального использования.

🚀 Получите бесплатный аудит от ИИ прямо сейчас в нашем Telegram-боте: @futurebotsru_bot