AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

ChatGPT во время исследования провалил более половины вопросов по программированию

09.08.2023
Share on FacebookShare on Twitter

Генеративный искусственный интеллект часто ошибается, даже разработчики не рекомендуют их для создания кода программ. Чтобы проверить насколько, команда Университета Пердью в США провела исследование, передает TechSpot.

Этоинтересно

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

16.09.2025
Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

16.09.2025

Курс QA. Стань неперевершеним QA спеціалістом! Стань технічною хрещеною феєю, яка оберігає від помилок і багів. Використай цей шанс! Дізнатись про курс

В общем ChatGPT задали 517 вопросов из Stack Overflow (популярный ресурс вопросов и ответов для профессиональных программистов и энтузиастов). Ответы оценивали не только по правильности, но и по последовательности, исчерпанности и лаконичности.

ChatGPT во время исследования провалил более половины вопросов по программированию

Инструмент OpenAI справился с задачей далеко не отлично. ChatGPT дал лишь 48% правильных ответов, а 77% описали как многословные. При этом стиль и качество определений часто убеждали волонтеров в правильности, хотя это было не так.

Мы заметили, что только тогда, когда ошибка в ответе ChatGPT очевидна, пользователи могут ее идентифицировать.

Однако когда ошибка более комплексная, требующая дополнительных знаний или изучения документации, пользователи часто не способны определить ошибку, или недооценивают ее степень.

Даже если ответ ChatGPT был явно неправильным, двое из 12 участников все равно отдавали предпочтение ему из-за приятного, уверенного и позитивного тона ИИ. Его исчерпывающий и педагогический стиль написания также способствовали тому, что фактически неправильный ответ казался правильным.

Ответы ChatGPT на основе GPT-4 стали хуже за последние месяцы, а GPT-3.5 улучшила результат – исследование

Курс Frontend. На курсі ти освоїш стильний дизайн. Стань майстром програмування зовнішнього вигляду сайтів та розкрий свій талант у світі веб-розробки. Більше про курс

Голосуй за переможця конкурсу блогів. Голосування проходить з 25 липня по 8 серпня включно. Головний приз – сучасний ігровий ПК ASGARD (i7 13700, 32Gb RAM, SSD 1Tb, GF RTX 4060Ti 8Gb) від інтернет-магазину click.ua. Віддай свій голос за найкращого! Деталі тут.

Другие новости

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

16.09.2025
Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

16.09.2025
Первый взгляд на NVIDIA RTX 6090: чип Rubin CPX открывает детали

Первый взгляд на NVIDIA RTX 6090: чип Rubin CPX открывает детали

16.09.2025
Представлена Xiaomi Smart Camera C500: домашняя камера с разрешением 3,5К, ИК-подсветкой и вращением на 360 градусов

Представлена Xiaomi Smart Camera C500: домашняя камера с разрешением 3,5К, ИК-подсветкой и вращением на 360 градусов

16.09.2025
“Запомните: виноват не Лиам, а Netflix”. Тизер “Ведьмака” с новым Геральтом атаковали дизлайками на YouTube

“Запомните: виноват не Лиам, а Netflix”. Тизер “Ведьмака” с новым Геральтом атаковали дизлайками на YouTube

16.09.2025
Киевляне заказывают 200 тыс. порций борща в год, самый дорогой в Ирпене по 5 евро/литр — статистика Glovo ко Дню борща

Киевляне заказывают 200 тыс. порций борща в год, самый дорогой в Ирпене по 5 евро/литр — статистика Glovo ко Дню борща

16.09.2025
Next Post
Представлен глобальный Hyundai Accent (Hyundai Solaris) нового поколения

Представлен глобальный Hyundai Accent (Hyundai Solaris) нового поколения

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Младший в созвездии. Тест-драйв нового Subaru XV

    Младший в созвездии. Тест-драйв нового Subaru XV

    21 shares
    Share 8 Tweet 5
  • Глава ZeniMax хочет превратить The Elder Scrolls Online в тридцатилетнюю MMORPG

    0 shares
    Share 0 Tweet 0
  • Звезда документального фильма Netflix “Аферист из Tinder” арестован в Грузии

    0 shares
    Share 0 Tweet 0
  • Тонкий, автономный и с отличными камерами: первый взгляд на HONOR Magic V5

    0 shares
    Share 0 Tweet 0
  • Minecraft Live 2025 пройдет в конце сентября – покажут “Медный век”

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

Ноутбук Krayzor имеет двойной сенсорный экран, модульную видеокарту и механическую клавиатуру

16.09.2025
Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

Запасы Solaris HS на исходе: в Санкт-Петербурге осталось всего 15 прошлогодних машин, новых авто нет

16.09.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить