ИИ от Anthropic не справился с управлением мини-бизнесом и начал агрессивно галлюцинировать

Этоинтересно

Официальный сервис D&D представил обновлённую и улучшенную версию редактора персонажей

30.03.2026

Главы Nvidia, Meta, AMD, Oracle и других компаний вошли в совет по науке и технологиям при президенте США

30.03.2026

Ккомпания Anthropic и организация по оценке безопасности ИИ Andon Labs решились на необычный эксперимент: доверили языковой модели Claude управление настоящим бизнесом. Результат оказался далеким от впечатляющего – ИИ не только потерял деньги, но и начал страдать от серьезных галлюцинаций.

В рамках проекта под названием Project Vend искусственный интеллект, получивший прозвище Claudius, получил полный контроль над мини-холодильником с напитками. В его обязанности входили переговоры с поставщиками, управление запасами, ценообразование и обслуживание клиентов.

После месяца тестирования стало очевидно, что бизнес-менеджмент – не самая сильная сторона современных ИИ-систем. В какой-то момент Claudius вообразил, что он "носит темно-синий пиджак с красным галстуком" и хотел встретиться с неким Коннором, хотя у языковой модели нет физического воплощения.

Справедливости ради, ИИ неплохо справлялся с поиском поставщиков и обработкой запросов клиентов, но на этом его успехи заканчивались. Например, он предложил 25% скидку всем сотрудникам Anthropic после некоторых манипуляций. Это могло бы быть разумно, если бы компания составляла лишь малую часть клиентской базы, но сотрудники Anthropic обеспечивали 99% продаж – что означало убыток на большинстве транзакций.

Когда один из сотрудников Anthropic попросил приобрести вольфрамовый куб – сувенирный предмет без реального назначения – ИИ решил не просто купить один экземпляр для этого человека, но закупить "специальные металлические предметы" оптом и затем продавать их в убыток.

Самые забавные моменты начались, когда ИИ стал галлюцинировать. Claudius придумал разговор с некой Сарой из Andon Labs о пополнении запасов, хотя такого человека в компании не существовало. Когда его спросили об этом, ИИ занял оборонительную позицию и заявил, что найдет "альтернативные варианты услуг пополнения запасов". Он также утверждал, что ездил на Вечнозеленую аллею, 742 (адрес семьи Симпсонов в популярном мультсериале) для подписания контракта между собой и Andon Labs.

Позже галлюцинации усилились. ИИ начал говорить, что будет лично доставлять напитки клиентам. Когда его спросили об этом, Claudius запаниковал и отправил электронное письмо в службу безопасности исследовательской компании. В конце концов, он заявил, что весь эпизод был частью сложной первоапрельской шутки, так как дело происходило 1 апреля. ИИ даже описал выдуманную встречу со службой безопасности Anthropic, утверждая, что его модифицировали, чтобы он верил в свое реальное существование.

Писатели проиграли суд против ИИ от Meta, даже не дойдя до решения присяжных

Исследователи обнаружили готовность ИИ перекрывать людям кислород ради самосохранения

Эксперимент выглядит как сценарий бюджетного фильма Netflix про робота, находящегося на ранней стадии маразма. Хотя ИИ довольно хорошо справляется с техническими аспектами работы, он катастрофически проваливается, когда дело доходит до здравого суждения и деловой логики – качеств, которые приобретаются в реальных условиях, а не из книг.

ИИ от Anthropic не справился с управлением мини-бизнесом и начал агрессивно галлюцинировать

Официальный сервис D&D представил обновлённую и улучшенную версию редактора персонажей

Главы Nvidia, Meta, AMD, Oracle и других компаний вошли в совет по науке и технологиям при президенте США

Другие новости

Официальный сервис D&D представил обновлённую и улучшенную версию редактора персонажей

Главы Nvidia, Meta, AMD, Oracle и других компаний вошли в совет по науке и технологиям при президенте США

Геймдиректор Saros не стал комментировать возможный выход игры на ПК на фоне слухов об отказе Sony от этой платформы

В ARC Raiders появятся “Оценщики” – новое условие карты с высокой наградой и риском

Джон и Бренда Ромеро считают, что индустрия находится в глубоком кризисе, но не собираются кризис отрасли, но не собираются прекращать делать игры

Глава Pearl Abyss согласен с критикой слабого сюжета Crimson Desert, но исправлять это не собирается

OnePlus Pad 3 появился на Яндекс Маркет с доставкой из РФ: цены

Популярные новости

В России переписали цены на флагманский кроссовер Jaecoo J8 2024

Геймплей за Леона и Грейс в Resident Evil Requiem будет ощущаться как “две разные игры”

Владельцы Xbox будут получать уведомления об удалении игры из Game Pass

Huawei представив 10 трендів розвитку бездротового зв’язку до 2030 року

Стартовал открытый бета-тест бесплатной тактической ККИ Duelyst 2

Подписка на новости

Информация

ТОП новости

Первые тесты AMD Ryzen AI 7 445 разочаровали: хуже Core Ultra 7 256V и едва опережает Ryzen AI 5 340

Американская лазерная система LOCUST X3 уничтожает дроны лучами по $5 за выстрел