AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Игры

ИИ-агенты провалили тесты на выполнение реальной фриланс-работы

02.11.2025
Share on FacebookShare on Twitter

ИИ-агенты провалили тесты на выполнение реальной фриланс-работы

Этоинтересно

В ARC Raiders появятся “Оценщики” – новое условие карты с высокой наградой и риском

В ARC Raiders появятся “Оценщики” – новое условие карты с высокой наградой и риском

30.03.2026
Джон и Бренда Ромеро считают, что индустрия находится в глубоком кризисе, но не собираются кризис отрасли, но не собираются прекращать делать игры

Джон и Бренда Ромеро считают, что индустрия находится в глубоком кризисе, но не собираются кризис отрасли, но не собираются прекращать делать игры

29.03.2026

Компании активно заменяют сотрудников на ИИ-агентов в надежде сократить расходы, но новое исследование показывает катастрофическую неэффективность такого подхода. Искусственный интеллект оказался не способен справиться даже с базовыми задачами фрилансеров.

Исследователи из некоммерческой организации Center for AI Safety и компании Scale AI, чья армия фрилансеров выполняет значительную часть рутинной работы для индустрии ИИ, протестировали шесть ведущих ИИ-агентов на симулированных фриланс-задачах. Результаты оказались разгромными – ни один агент не смог выполнить больше 3% работы, заработав всего $1810 из возможных $143 991.

Директор CAIS Дэн Хендрикс заявил изданию Wired:

Надеюсь, это даст более точное представление о реальных возможностях ИИ.

Для тестов разработчики создали собственный бенчмарк Remote Labor Index, использующий широкий спектр реальных удаленных проектов для оценки способности ботов выполнять экономически ценную работу в индустриях от геймдева до анализа данных.

Лучшим исполнителем стал ИИ-агент китайского стартапа Manus с показателем автоматизации всего 2,5%. Модель смогла завершить лишь 2,5% назначенных проектов на уровне, приемлемом для реальной фриланс-работы.

Второе место разделили Grok 4 Илона Маска и Claude Sonnet 4.5 от Anthropic с результатом 2,1%. Anthropic позиционирует свою модель как "лучшую в мире для программирования" и "самую мощную для создания сложных агентов".

Новейшая модель GPT-5 от OpenAI с заявленным "интеллектом уровня PhD" показала 1,7%. При этом глава компании Сэм Альтман утверждает, что GPT-5 – это значительный шаг на пути к AGI, то есть искусственному общему интеллекту, который должен превосходить человеческие когнитивные способности практически во всех аспектах. OpenAI определяет AGI как "высокоавтономные системы, превосходящие людей в большинстве экономически ценных работ" – то, чего GPT-5 явно не достигла.

Собственный ИИ-агент OpenAI под названием ChatGPT Agent оказался вторым с конца, едва достигнув 1,3%. Абсолютным аутсайдером стал Gemini 2.5 Pro от Google с удручающими 0,8%.

Продажа ИИ-агентов работодателям стала навязчивой идеей индустрии, так как лидеры вроде OpenAI пытаются монетизировать популярность своих чат-ботов, многие из которых бесплатны. Несмотря на энтузиазм руководителей, сокращающих персонал ради ИИ, остается вопросом, способна ли автоматизация реально повысить продуктивность или хотя бы компенсировать нехватку человеческих талантов.

Директор по исследованиям Scale AI Бинг Ли сказал изданию Wired:

Мы годами обсуждали ИИ и рабочие места, но большая часть дискуссий была гипотетической или теоретической.

Множество руководителей, заменивших сотрудников на ИИ, были вынуждены нанять людей обратно после обнаружения неэффективности инструментов. Исследование MIT показало, что 95% компаний, запустивших пилотные ИИ-инициативы, не зафиксировали значимого роста выручки. Другое исследование продемонстрировало, что внедрение ИИ-инструментов в рабочие процессы привело к потоку низкокачественного контента, который не только замедлил всё из-за необходимости масштабных правок, но и создал напряжение между коллегами, вынужденными исправлять такую "халтуру".

Хендрикс указал на недостатки, которые продолжают преследовать ИИ-агентов несмотря на стремительное развитие области.

У них нет долгосрочной памяти, они не могут непрерывно обучаться на опыте. Они не способны осваивать навыки в процессе работы, как люди.

Однако эти очевидные недостатки пока не замедлили волну увольнений, связанных с ИИ. Даже наоборот, тенденция только набирает обороты.

Другие новости

В ARC Raiders появятся “Оценщики” – новое условие карты с высокой наградой и риском

В ARC Raiders появятся “Оценщики” – новое условие карты с высокой наградой и риском

30.03.2026
Джон и Бренда Ромеро считают, что индустрия находится в глубоком кризисе, но не собираются кризис отрасли, но не собираются прекращать делать игры

Джон и Бренда Ромеро считают, что индустрия находится в глубоком кризисе, но не собираются кризис отрасли, но не собираются прекращать делать игры

29.03.2026
Глава Pearl Abyss согласен с критикой слабого сюжета Crimson Desert, но исправлять это не собирается

Глава Pearl Abyss согласен с критикой слабого сюжета Crimson Desert, но исправлять это не собирается

29.03.2026
Sony и Honda свернули создание электромобиля Afeela с поддержкой PlayStation Remote Play

Sony и Honda свернули создание электромобиля Afeela с поддержкой PlayStation Remote Play

29.03.2026
У NetEase есть права на создание оригинальных героев для Marvel Rivals, но пока студия фокусируется на известных персонажах и решает проблемы с балансом и интерфейсом

У NetEase есть права на создание оригинальных героев для Marvel Rivals, но пока студия фокусируется на известных персонажах и решает проблемы с балансом и интерфейсом

29.03.2026
Фигуристая блондинка с револьверами наводит порядок в городе в новом трейлере гачи Neverness to Everness

Фигуристая блондинка с револьверами наводит порядок в городе в новом трейлере гачи Neverness to Everness

29.03.2026
Next Post
Парадокс: Mercedes-Benz официально ушла из России, при этом каждый 27-й «Гелендваген» попадает в РФ

Парадокс: Mercedes-Benz официально ушла из России, при этом каждый 27-й «Гелендваген» попадает в РФ

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • В России переписали цены на флагманский кроссовер Jaecoo J8 2024

    В России переписали цены на флагманский кроссовер Jaecoo J8 2024

    1 shares
    Share 0 Tweet 0
  • Vivo X200 Pro mini разобрали на видео: компактность имеет свою цену

    9 shares
    Share 4 Tweet 2
  • Huawei представив 10 трендів розвитку бездротового зв’язку до 2030 року

    1 shares
    Share 0 Tweet 0
  • Как я купил ретромопед прямиком из Японии: зачем, с чем столкнулся и что получил

    1 shares
    Share 0 Tweet 0
  • Легенда становится практичной. Обзор пятидверного Suzuki Jimny (2023)

    1 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

«Мы готовы»: NASA выходит на финальную стадию перед запуском пилотируемой миссии Artemis II

«Мы готовы»: NASA выходит на финальную стадию перед запуском пилотируемой миссии Artemis II

30.03.2026
В ARC Raiders появятся “Оценщики” – новое условие карты с высокой наградой и риском

В ARC Raiders появятся “Оценщики” – новое условие карты с высокой наградой и риском

30.03.2026
  • Разместить новости

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить