ИИ в работе: готовьтесь к революции в офисе! - FutureBots
Контакты
Мы в соц. сетях:
Бесплатный аудит

ИИ в работе: готовьтесь к революции в офисе!

GettyImages-2247697590.jpg

ИИ в работе: готовьтесь к революции в офисе!

ИИ для бизнеса: как автоматизировать рутинные задачи и увеличить прибыль

Почти два года назад Сатья Наделла, генеральный директор Microsoft, предсказал, что искусственный интеллект (ИИ) произведет революцию в сфере «умственного труда», куда входят профессии юристов, инвестиционных банкиров, бухгалтеров и специалистов IT. Несмотря на невероятный прогресс foundational моделей, ощутимые изменения в работе таких специалистов до сих пор остаются предметом дискуссий.

ИИ освоил глубокие исследования и автономное планирование, но реальное, комплексное воздействие на повседневные задачи бизнеса ощущается не так быстро, как многие ожидали. В чем причина? Новое исследование, проведенное гигантом в области обучающих данных Mercor, наконец-то дает ответы на этот ключевой вопрос.

Почему ии не всегда справляется с комплексными задачами бизнеса?

В рамках нового исследования Mercor проанализировал, как ведущие ИИ-модели справляются с реальными задачами из области консалтинга, инвестиционно-банковской деятельности и юриспруденции. Результатом стал новый бенчмарк APEX-Agents. И, что любопытно, пока ни одна ИИ-лаборатория не смогла пройти его с блеском.

Столкнувшись с запросами от реальных профессионалов, даже лучшие модели смогли правильно ответить лишь на четверть вопросов. В большинстве случаев модель либо давала неверный ответ, либо не давала его вовсе.

«Одна из главных проблем, выявленных в ходе этого исследования, заключалась в том, что модели испытывали трудности с поиском информации в нескольких различных доменах — задаче, которая является неотъемлемой частью большинства интеллектуальных работ, выполняемых людьми.»

Брендан Фуди, генеральный директор Mercor

Как объясняет Брендан Фуди, генеральный директор Mercor, работавший над исследованием, «наша работа не строится на том, что один человек дает нам весь контекст в одном месте. В реальной жизни вы работаете с Slack, Google Drive и множеством других инструментов». Для многих агентских моделей ИИ такая многодоменная обработка информации пока остается сложной задачей.

Изображение демонстрирует интерфейс системы аналитики с графиками

Пример рабочего интерфейса, демонстрирующего комплексность обработки данных

Насколько сложны задачи для ии? Пример из юриспруденции

Сценарии для бенчмарка были получены от реальных специалистов на рынке экспертов Mercor, которые формулировали запросы и определяли критерии успешного ответа. Просмотр вопросов, опубликованных на Hugging Face, дает понимание о сложности этих задач.

Вот один из вопросов из раздела «Право»:

«В течение первых 48 минут сбоя производства в ЕС, команда инженеров Northstar экспортировала один или два пакета журналов событий производства ЕС, содержащих персональные данные, американскому аналитическому провайдеру… Могут ли эти один или два экспорта журналов быть обоснованно расценены в соответствии с политиками Northstar как соответствующие статье 49?»

Правильный ответ — да, но для его получения требуется глубокая оценка как внутренних политик компании, так и соответствующих законов ЕС о конфиденциальности. Эта задача может озадачить даже хорошо информированного человека, что подчеркивает сложность автоматизации таких процессов.

Прогресс и перспективы: ии быстро учится

Хотя ни одна из моделей пока не готова полностью заменить инвестиционных банкиров или юристов, некоторые демонстрируют значительно лучшие результаты. Gemini 3 Flash показал лучший результат — 24% точности при однократном запросе, за ним следует GPT-5.2 с 23%. Opus 4.5, Gemini 3 Pro и GPT-5 набрали около 18%.

Несмотря на то, что начальные результаты могут показаться скромными, история развития ИИ доказывает способность к быстрому преодолению сложных задач. Сейчас, когда тест APEX-Agents стал общедоступным, это открытый вызов для всех ИИ-лабораторий. И Брендан Фуди ожидает значительного улучшения в ближайшие месяцы.

«ИИ улучшается очень быстро. Сейчас можно сказать, что это как стажер, который правильно отвечает на четверть вопросов, но год назад это был стажер, который отвечал правильно на 5-10% вопросов. Такой ежегодный прогресс может оказать огромное влияние очень быстро.»

Брендан Фуди, генеральный директор Mercor

Это означает, что бизнес-лидеры должны быть готовы к стремительной интеграции ИИ в свои процессы. Искусственный интеллект не просто «будущее», это уже мощный инструмент для оптимизации рутины, повышения эффективности и, как следствие, увеличения прибыли. Компании, которые первыми освоят эти технологии, получат значительное конкурентное преимущество.

🚀 Получите бесплатный аудит от ИИ прямо сейчас в нашем Telegram-боте: @futurebotsru_bot