AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

DeepSeek представила модель ИИ V3.2-exp: двукратное снижение затрат на вывод в операциях с длинным контекстом

01.10.2025
Share on FacebookShare on Twitter
DeepSeek представила модель ШІ V3.2-exp: дворазове зниження витрат на виведення в операціях з довгим контекстом

Исследователи компании DeepSeek представили новую экспериментальную модель V3.2-exp, созданную для существенного снижения затрат на вывод при работе с большими объемами контекста. Анонс появился на платформе Hugging Face, а также выложили связанную научную статью с описанием системы на GitHub.

Этоинтересно

Самые интересные новые фильмы октября

Самые интересные новые фильмы октября

01.10.2025
Средиземноморская диета снижает проявления псориаза на 75 %

Средиземноморская диета снижает проявления псориаза на 75 %

01.10.2025

Ключевой особенностью новой модели является система DeepSeek Sparse Attention, сложный механизм, подробно показанный в схеме ниже. Суть в том, что используется модуль под названием «скоростной индексатор», который приоритезирует отдельные фрагменты окна контекста. После этого другая подсистема — «система точного отбора токенов» — отбирает конкретные токены из этих фрагментов для загрузки в ограниченное окно внимания модуля. В сочетании эти механизмы позволяют моделям Sparse Attention эффективно работать с большими фрагментами контекста при относительно небольшой нагрузке на серверы.

DeepSeek представила модель ШІ V3.2-exp: дворазове зниження витрат на виведення в операціях з довгим контекстом

В длинноконтекстных задачах преимущества такого подхода особенно заметны. Предварительное тестирование DeepSeek показало, что цена обычного API-запроса может сокращаться почти вдвое, когда речь идет о работе с большим контекстом. Хотя для получения окончательных выводов требуются дальнейшие исследования, открытость весов модели и ее доступность на Hugging Face позволят сторонним экспертам быстро проверить заявленные результаты.

Новая модель DeepSeek является частью ряда прорывов в сфере оптимизации стоимости вывода — то есть затрат на работу уже натренированной ИИ-модели, что отличается от высоких затрат на этапе ее обучения. В этом случае исследователи стремились заставить базовую трансформерную архитектуру работать эффективнее, и, по их словам, потенциал для улучшения здесь действительно значителен.

Компания DeepSeek, базирующаяся в Китае, имеет особое положение на рынке ИИ, особенно на фоне восприятия этой отрасли как конкурентной борьбы между США и Китаем. В начале года компания привлекла внимание к себе моделью R1 (которая собирает множество данных пользователя и искажает информацию о Китае), обученной преимущественно с помощью методов обучения с подкреплением и при этом с гораздо меньшими затратами, чем у американских конкурентов. Впрочем, ожидаемого прорыва в методах обучения R1 не вызвала, и за последние месяцы DeepSeek отошла от всеобщего внимания.

Новый подход Sparse Attention, скорее всего, не вызовет такого же ажиотажа, как R1. Но он может стать важным уроком для американских компаний, которые пытаются снизить затраты на вывод и сделать работу своих моделей более экономной.

Источник: techcrunch

Другие новости

Самые интересные новые фильмы октября

Самые интересные новые фильмы октября

01.10.2025
Средиземноморская диета снижает проявления псориаза на 75 %

Средиземноморская диета снижает проявления псориаза на 75 %

01.10.2025
Как над ними только не издевались: автомобили Lada Iskra прошли масштабные испытания, имитирующие 150 000 км пробега или 6 лет эксплуатации

Как над ними только не издевались: автомобили Lada Iskra прошли масштабные испытания, имитирующие 150 000 км пробега или 6 лет эксплуатации

01.10.2025
10 моделей машин по цене от 750 тыс. до 1,66 млн рублей. Составлен топ-10 самых доступных новых автомобилей в России в октябре 2025 года

10 моделей машин по цене от 750 тыс. до 1,66 млн рублей. Составлен топ-10 самых доступных новых автомобилей в России в октябре 2025 года

01.10.2025
Мгновенные переводы по всему миру: Visa разрешит расчеты в стейблкоинах

Мгновенные переводы по всему миру: Visa разрешит расчеты в стейблкоинах

01.10.2025
Volkswagen Passat Pro 2026 поступил в продажу: 3 экрана на передней панели и 10 подушек безопасности в базе — всего 169,9 тыс. юаней (2 млн рублей)

Volkswagen Passat Pro 2026 поступил в продажу: 3 экрана на передней панели и 10 подушек безопасности в базе — всего 169,9 тыс. юаней (2 млн рублей)

01.10.2025
Next Post
Как над ними только не издевались: автомобили Lada Iskra прошли масштабные испытания, имитирующие 150 000 км пробега или 6 лет эксплуатации

Как над ними только не издевались: автомобили Lada Iskra прошли масштабные испытания, имитирующие 150 000 км пробега или 6 лет эксплуатации

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Младший в созвездии. Тест-драйв нового Subaru XV

    Младший в созвездии. Тест-драйв нового Subaru XV

    24 shares
    Share 10 Tweet 6
  • Почти 1500 км на баке бензина, и это реальность. Exlantix ET и Exlantix ES установили национальный рекорд по дальности хода среди гибридов в России

    1 shares
    Share 0 Tweet 0
  • Звезда WWE претендует на роль Джейсона Вурхиза в перезапуске “Пятницы, 13-е”

    1 shares
    Share 0 Tweet 0
  • Samsung представила Galaxy Tab A11 и A11+: Helio G99, Dolby Atmos и 7 лет обновлений от €180

    1 shares
    Share 0 Tweet 0
  • EA объявила даты начала первого сезона Battlefield 6

    1 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Самые интересные новые фильмы октября

Самые интересные новые фильмы октября

01.10.2025
Средиземноморская диета снижает проявления псориаза на 75 %

Средиземноморская диета снижает проявления псориаза на 75 %

01.10.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить