AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Alibaba совершила прорыв в обработке больших текстов: модель QwenLong-L1 способна на анализ документов любой длины за секунды

04.06.2025
Share on FacebookShare on Twitter

Компания Alibaba Group представила QwenLong-L1 – новую архитектуру, позволяющую большим языковым моделям (LLM) эффективно обрабатывать чрезвычайно длинные входные данные. Эта разработка открывает новые возможности для корпоративных приложений, требующих анализа обширных документов, таких как подробные корпоративные отчёты, многостраничные финансовые ведомости или сложные юридические контракты.

Этоинтересно

Первые реакции на «Формулу-1» с Брэдом Питом — как «Топ Ган: Мэверик», но на колесах

Первые реакции на «Формулу-1» с Брэдом Питом — как «Топ Ган: Мэверик», но на колесах

06.06.2025
Секретное блошиное оружие поможет создать батут для бактерий

Секретное блошиное оружие поможет создать батут для бактерий

06.06.2025

До недавнего времени способность больших моделей с рассуждениями (LRM) к работе с длинными текстами оставалась серьёзной проблемой. Хотя прогресс в области обучения с подкреплением (RL) значительно улучшил их навыки решения задач, эффективность таких моделей резко снижалась при обработке текстов, превышающих 4000 токенов. Разработчики QwenLong-L1 в своей статье отмечают, что это ограничение препятствует практическому применению LRM в областях, требующих взаимодействия с обширными базами знаний, например, в научных исследованиях.

Иллюстрация: VentureBeat / Ideogram

Ключевое отличие QwenLong-L1 – многоэтапный подход к обучению. Процесс включает три основных стадии. Сначала модель проходит этап контролируемой тонкой настройки (SFT) на примерах рассуждения с длинными контекстами, что закладывает основу для точного извлечения информации из больших объёмов данных. Далее следует поэтапное обучение с подкреплением (RL), где длина входных документов постепенно увеличивается, что обеспечивает стабильную адаптацию модели к более сложным задачам. Наконец, на заключительном этапе используется выборка сложных примеров из предыдущих этапов, что стимулирует модель к освоению самых трудных задач и исследованию различных путей рассуждения.

Важной особенностью QwenLong-L1 является гибридная система вознаграждения. Она сочетает в себе строгую проверку на основе правил, гарантирующую точность, и оценку, производимую другой LLM, которая сравнивает смысловое содержание сгенерированного ответа с эталонным. Это позволяет более гибко обрабатывать различные варианты правильных ответов, характерные для длинных и сложных документов.

Тестирование QwenLong-L1 на семи эталонных наборах данных для задач вопрос-ответ на основе документов (DocQA) показало впечатляющие результаты. Модель QWENLONG-L1-32B продемонстрировала производительность, сопоставимую с Anthropic’s Claude-3.7 Sonnet Thinking, и превзошла модели OpenAI o3-mini и Qwen3-235B-A22B. Более компактная модель QWENLONG-L1-14B превзошла Google Gemini 2.0 Flash Thinking и Qwen3-32B.

Примечательно, что обучение с помощью QwenLong-L1 привело к появлению у модели специализированных навыков рассуждения в длинном контексте: лучшее «заземление» ответов (связывание ответов с конкретными частями документа), постановка промежуточных целей, отслеживание ошибок и их исправление, а также верификация ответов. Alibaba выпустила код QwenLong-L1 и веса для обученных моделей, что открывает широкие возможности для её применения в различных областях, включая юридическую сферу, финансы и сферу обслуживания.

Другие новости

Первые реакции на «Формулу-1» с Брэдом Питом — как «Топ Ган: Мэверик», но на колесах

Первые реакции на «Формулу-1» с Брэдом Питом — как «Топ Ган: Мэверик», но на колесах

06.06.2025
Секретное блошиное оружие поможет создать батут для бактерий

Секретное блошиное оружие поможет создать батут для бактерий

06.06.2025
Уникальный экспортный ВАЗ-2107 с редким мотором продают в России: 34 года, а пробег — всего 160 км

Уникальный экспортный ВАЗ-2107 с редким мотором продают в России: 34 года, а пробег — всего 160 км

06.06.2025
Спор между Маском и Трампом валит крипторынок и акции

Спор между Маском и Трампом валит крипторынок и акции

06.06.2025
Культовый космосим Star Wars X-Wing 1993 года превратился в современную игру с поддержкой ВР

Культовый космосим Star Wars X-Wing 1993 года превратился в современную игру с поддержкой ВР

06.06.2025
Линию Mercedes порезали на лом, завод переходит на сборку Exeed. На парковке бывшего завода Hyundai уже нет мест, собранные авто отправляют на другие площадки

Линию Mercedes порезали на лом, завод переходит на сборку Exeed. На парковке бывшего завода Hyundai уже нет мест, собранные авто отправляют на другие площадки

06.06.2025
Next Post
Город Старбейс компании SpaceX только появился, а уже угрожает жителям выселением

Город Старбейс компании SpaceX только появился, а уже угрожает жителям выселением

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Ninja Gaiden: Ragebound от создателей Blasphemous выйдет в конце июля

    Ninja Gaiden: Ragebound от создателей Blasphemous выйдет в конце июля

    1 shares
    Share 0 Tweet 0
  • Necromunda: Hired Gun – темная сторона Warhammer 40K

    17 shares
    Share 7 Tweet 4
  • Через две недели на ПК и консолях выйдет Vessels of Decay — пиксельный ретро-экшен про постапокалиптическую Скандинавию и мифических монстров

    0 shares
    Share 0 Tweet 0
  • Рекордные 8 лет гарантии, адаптация для России, 469 л.с. и полный привод — от 6 млн рублей. В России представили премиум-машины Exeed Exlantix ES и ET

    0 shares
    Share 0 Tweet 0
  • Утечка данных клиентов Coinbase оказалась связана с подрядной компанией в Индии

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Первые реакции на «Формулу-1» с Брэдом Питом — как «Топ Ган: Мэверик», но на колесах

Первые реакции на «Формулу-1» с Брэдом Питом — как «Топ Ган: Мэверик», но на колесах

06.06.2025
Секретное блошиное оружие поможет создать батут для бактерий

Секретное блошиное оружие поможет создать батут для бактерий

06.06.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить