AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Искусственный интеллект научился программировать сам себя: новый алгоритм Дарвина-Гёделя позволяет кодирующим агентам самосовершенствоваться

29.06.2025
Share on FacebookShare on Twitter

Учёные давно надеются полностью замкнуть цикл, создав ИИ-агентов, которые рекурсивно улучшают себя. Новое исследование демонстрирует впечатляющий пример такой системы.

Этоинтересно

Snapdragon 8 Elite Gen 5 стал самым быстрым мобильным процессором, но потребляет на 61% больше, чем Apple A19 Pro

Snapdragon 8 Elite Gen 5 стал самым быстрым мобильным процессором, но потребляет на 61% больше, чем Apple A19 Pro

27.09.2025
7100 мАч, Snapdragon 8 Elite Gen 5, чистый экран без вырезов и альтернативная камера. Подтверждены характеристики Nubia Z80 Ultra, опубликован первый снимок

7100 мАч, Snapdragon 8 Elite Gen 5, чистый экран без вырезов и альтернативная камера. Подтверждены характеристики Nubia Z80 Ultra, опубликован первый снимок

27.09.2025

«Это хорошая работа», — сказал Юрген Шмидхубер, учёный-компьютерщик из Университета науки и технологий имени короля Абдуллы (KAUST) в Саудовской Аравии, не принимавший участия в новом исследовании. «Я думаю, для многих людей результаты являются неожиданными. Поскольку я работаю над этой темой уже почти 40 лет, для меня это, возможно, немного менее удивительно».

В 2003 году Шмидхубер создал решатели задач, которые переписывали свой собственный код только в том случае, если они могли формально доказать полезность обновлений. Он назвал их машинами Гёделя, в честь Курта Гёделя, математика, работавшего над самоссылающимися системами. Но для сложных агентов доказуемая полезность достигается нелегко.

Новые системы, описанные в недавнем исследовании, полагаются на эмпирические доказательства. В знак уважения к Шмидхуберу они называются машинами Дарвина-Гёделя (ДГМ). ДГМ начинается с кодирующего агента, который может читать, писать и выполнять код, используя LLM для чтения и записи. Затем он применяет эволюционный алгоритм для создания множества новых агентов. На каждой итерации ДГМ выбирает одного агента из популяции и поручает LLM создать одно изменение для улучшения способности агента к написанию кода. LLM обладают чем-то вроде интуиции о том, что может помочь, потому что они обучаются на большом количестве кода, написанного человеком. В результате получается управляемая эволюция, что-то среднее между случайной мутацией и доказуемо полезным улучшением. Затем ДГМ тестирует нового агента на эталонном коде, оценивая его способность решать задачи программирования.

Иллюстрация: Dalle

Некоторые эволюционные алгоритмы сохраняют только лучших исполнителей в популяции, исходя из предположения, что прогресс движется бесконечно вперёд. ДГМ, однако, сохраняют всех, на случай, если инновация, которая изначально потерпела неудачу, на самом деле станет ключом к прорыву позже, после дальнейшей доработки. Это форма «открытого исследования», не закрывающего путей к прогрессу (ДГМ всё же отдают приоритет агентам с более высокими баллами при выборе предков).

Учёные запустили ДГМ на 80 итераций, используя эталонный код SWE-bench, и на 80 итераций, используя эталонный код Polyglot. Баллы агентов улучшились на SWE-bench с 20% до 50%, а на Polyglot — с 14% до 31%.

«Мы были действительно очень удивлены, что агент мог сам написать такой сложный код», — сказала Дженни Чжан, учёный из Университета Британской Колумбии и ведущий автор статьи. «Он мог редактировать несколько файлов, создавать новые файлы и создавать действительно сложные системы». Важно, что ДГМ превзошли альтернативный метод, который использовал внешнюю систему для улучшения агентов. С ДГМ улучшения агентов накапливались по мере того, как они улучшали себя в улучшении себя. ДГМ также превзошли версию, которая не поддерживала популяцию агентов и просто модифицировала последнего агента. Лучший агент SWE-bench был не так хорош, как лучший агент, разработанный людьми, который набрал около 70%, но он был сгенерирован автоматически, и, возможно, с достаточным временем и вычислительными мощностями агент сможет превзойти человеческую экспертизу.

Агенты могут стать неинтерпретируемыми или перестать следовать указаниям человека. Поэтому Чжан и её коллеги добавили ограждения. Они держали ДГМ в песочницах без доступа к Интернету или операционной системе и регистрировали и проверяли все изменения кода. Они предполагают, что в будущем продолжат исследование с вознаграждением агентов за то, что они делают себя более интерпретируемыми и согласованными.

Другие новости

Snapdragon 8 Elite Gen 5 стал самым быстрым мобильным процессором, но потребляет на 61% больше, чем Apple A19 Pro

Snapdragon 8 Elite Gen 5 стал самым быстрым мобильным процессором, но потребляет на 61% больше, чем Apple A19 Pro

27.09.2025
7100 мАч, Snapdragon 8 Elite Gen 5, чистый экран без вырезов и альтернативная камера. Подтверждены характеристики Nubia Z80 Ultra, опубликован первый снимок

7100 мАч, Snapdragon 8 Elite Gen 5, чистый экран без вырезов и альтернативная камера. Подтверждены характеристики Nubia Z80 Ultra, опубликован первый снимок

27.09.2025
Космос, как на ладони: команда телескопа “Евклид” запустила крупнейший в истории “симулятор Вселенной” с 3,4 млрд галактик

Космос, как на ладони: команда телескопа “Евклид” запустила крупнейший в истории “симулятор Вселенной” с 3,4 млрд галактик

27.09.2025
Телескоп «Джеймс Уэбб» обнаружил «тёмные бусины» и необычные узоры в атмосфере Сатурна

Телескоп «Джеймс Уэбб» обнаружил «тёмные бусины» и необычные узоры в атмосфере Сатурна

27.09.2025
Rozetka запустила кредитную карту: лимит до 200 000 грн, льготный период, скидки и спецпредложения

Rozetka запустила кредитную карту: лимит до 200 000 грн, льготный период, скидки и спецпредложения

26.09.2025
Учёные обнаружили сезонный озоновый слой в северном полярном вихре Марса

Учёные обнаружили сезонный озоновый слой в северном полярном вихре Марса

26.09.2025
Next Post
Инсайдер: для киноадаптации Bloodborne ищут директора, а фанаты просят взять Гильермо Дель Торо

Инсайдер: для киноадаптации Bloodborne ищут директора, а фанаты просят взять Гильермо Дель Торо

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Представлен Belgee X80: новинку показали в Минске, но в Россию её пока везти не собираются

    Представлен Belgee X80: новинку показали в Минске, но в Россию её пока везти не собираются

    1 shares
    Share 0 Tweet 0
  • Ари и Дариус в трейлерах персонажей файтинга 2XKO

    0 shares
    Share 0 Tweet 0
  • Фонд Потанина запустил проект автономного судна Flymar на подводных крыльях

    0 shares
    Share 0 Tweet 0
  • Представлен Xiaomi 17: компактный флагман с Snapdragon 8 Elite Gen 5 и 7000 мАч дешевле €600

    0 shares
    Share 0 Tweet 0
  • “Выжить” Коди Кэссиди: книга-квест, которая учит думать и рушит стереотипы

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Snapdragon 8 Elite Gen 5 стал самым быстрым мобильным процессором, но потребляет на 61% больше, чем Apple A19 Pro

Snapdragon 8 Elite Gen 5 стал самым быстрым мобильным процессором, но потребляет на 61% больше, чем Apple A19 Pro

27.09.2025
7100 мАч, Snapdragon 8 Elite Gen 5, чистый экран без вырезов и альтернативная камера. Подтверждены характеристики Nubia Z80 Ultra, опубликован первый снимок

7100 мАч, Snapdragon 8 Elite Gen 5, чистый экран без вырезов и альтернативная камера. Подтверждены характеристики Nubia Z80 Ultra, опубликован первый снимок

27.09.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить