AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

ИИ Chain-of-Zoom увеличивает фото в 256 раз без потери деталей

04.06.2025
Share on FacebookShare on Twitter
ИИ Chain-of-Zoom увеличивает фото в 256 раз без потери деталей

Раздел Технологии выходит при поддержке

Этоинтересно

На фоне падения крипторынка ETF-фонды потеряли почти $1 млрд на фоне падения крипторынка

На фоне падения крипторынка ETF-фонды потеряли почти $1 млрд на фоне падения крипторынка

20.08.2025

Envision запускает в продажу умные очки с ИИ для слепых и слабовидящих

20.08.2025

Исследователи из Южной Кореи разработали инструмент Chain-of-Zoom на основе искусственного интеллекта, способный в 256 раз увеличить фото с низким разрешением, сгенерировав реалистичную детализацию.

Ученые из KAIST AI под руководством Кима Джечула стремились решить проблему улучшения качества фото с низким разрешением, сохраняя четкую и реалистичную детализацию. Традиционные системы сверхвысокого разрешения для отдельного изображения работают по принципу угадывания недостающих деталей в запросах по увеличению масштаба изображения.

Генеративные модели обучены создавать реалистичные версии фото с низким разрешением, предсказывая те детали, которых не хватает на изображении. Однако эффективность таких моделей зависит от того, по какой технологии они обучались. Они часто становятся неэффективными при необходимости выхода за привычные пределы.

«Современные модели превосходны в отношении масштабных коэффициентов, на которых они были обучены, но терпят неудачу, когда их просят увеличить изображение, выходящее за этот диапазон», — объясняют разработчики из KAIST AI.

Chain-of-Zoom эффективно преодолевает ограничения, используя пошаговый процесс масштабирования. Этот ИИ не растягивает изображение в 256 раз за один подход, ведь тогда картинка была бы размытой, а детали выдуманными. Вместо этого Chain-of-Zoom пошагово масштабирует изображение, опираясь на каждый предыдущий шаг, используя модель сверхвысокого разрешения — например, хорошо обученную модель диффузии — для уточнения изображения.

К тому же, языковая модель Vision-Language также участвует, генерируя языковые подсказки, которые помогают Chain-of-Zoom представить, что должно появиться в изображении на следующем этапе. Vision-Language подбирает несколько точных словосочетаний, вроде: «прожилки листа», «текстура меха», «кирпичная стена» и тому подобное, которые направляют ИИ к дальнейшей детализации изображения.

В то время как масштаб увеличивается, первоначальное изображение теряет четкость и визуально становится трудно распознать контекст. В этот момент речевые подсказки играют решающее значение. Однако генерирование правильных речевых подсказок непростое дело. Стандартные языковые модели могут повторяться, генерировать странные словосочетания и неверно интерпретировать входные данные.

ШІ Chain-of-Zoom збільшує фото у 256 разів без втрати деталей
КАИСТ ИИ

Для оптимизации этого процесса исследователи использовали обучение с подкреплением и обратной связью с человеком. Они научили свою модель генерации подсказок соответствовать предпочтениям человека, используя технику, называемую обобщенной оптимизацией политики вознаграждения.

Обучение происходило с использованием трех видов обратной связи:

  • Человек-критик оценивал подсказки, сгенерированные языковой моделью, на соответствие изображению;
  • Речевая модель получала наказание за запутанные и некорректные фразы;
  • Специальный фильтр отсеивал текст, который повторялся.

В процессе обучения подсказки становились более четкими, конкретными и полезными. Результаты Chain-of-Zoom оценивались с использованием нескольких безреферентных метрик качества, таких как NIQE и CLIPIQA. На четырех уровнях увеличения (4×, 16×, 64×, 256×) CoZ последовательно превосходил альтернативы, особенно в высших масштабах.

Другие преимущества этого инструмента заключаются в том, что базовая модель сверхвысокого разрешения не требует переобучения. Chain-of-Zoom будет очень удобным для приложений, требующих быстрого, высокоточного масштабирования без использования сложных вычислительных мощностей.

Chain-of-Zoom может найти применение в медицине, где улучшенная детализация может расширить возможности диагностики, в сфере видеонаблюдения с камер, где необходима высокая детализация объектов, в восстановлении старых фото, научной визуализации, в сферах микроскопии и астрономии.

СпецпроектыКолаборація WhiteBIT і культового Гуся: робіть покупки в відомих мережах та знаходьте криптобонусиrobota.ua запускає велике оновлення для захисту пошукачів роботи: від антифрод-системи до безпечного чату

Весомым недостатком этой технологии является то, что после значительного увеличения размера фото оригинал фактически исчезнет, а останется только его искусственная копия, сгенерированная ИИ. Таким образом, технология может использоваться с целью манипулирования визуальными данными для создания фейковых изображений.

«Высококачественная генерация на основе входных данных с низким разрешением может вызвать опасения относительно дезинформации или несанкционированной реконструкции конфиденциальных визуальных данных», — признают разработчики.

Прячьте ваши SMS: китайцы читают текст на расстоянии 1,3 км лазером без всякой оптики

Результаты были опубликованы на сервере препринтов arXiv

Источник: ZMEScience

Раздел Технологии выходит при поддержке

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков.

Другие новости

На фоне падения крипторынка ETF-фонды потеряли почти $1 млрд на фоне падения крипторынка

На фоне падения крипторынка ETF-фонды потеряли почти $1 млрд на фоне падения крипторынка

20.08.2025

Envision запускает в продажу умные очки с ИИ для слепых и слабовидящих

20.08.2025
«Параллельный» Toyota RAV4 подорожал в России: теперь за популярный кроссовер просят больше 2,3 млн рублей под заказ (на 150 тыс. рублей больше, чем месяц назад)

«Параллельный» Toyota RAV4 подорожал в России: теперь за популярный кроссовер просят больше 2,3 млн рублей под заказ (на 150 тыс. рублей больше, чем месяц назад)

20.08.2025
“Нас обоих тошнило”: Софи Тернер рассказала о “мерзкой” интимной сцене с “братом по Игре престолов” в новом хорроре

“Нас обоих тошнило”: Софи Тернер рассказала о “мерзкой” интимной сцене с “братом по Игре престолов” в новом хорроре

20.08.2025

Envision запускает в продажу умные очки с ИИ для слепых и слабовидящих

20.08.2025
Рассекречен совершенно новый «Москвич»: «Москвич M70» получит мощный 2,0-литровый мотор и 9-ступенчатый «автомат»

Рассекречен совершенно новый «Москвич»: «Москвич M70» получит мощный 2,0-литровый мотор и 9-ступенчатый «автомат»

20.08.2025
Next Post
BTC и “треугольник” на пути к $105 000: 3 графика указывают на 6%-й рост

BTC и “треугольник” на пути к $105 000: 3 графика указывают на 6%-й рост

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Россияне распробовали китайский премиум: продажи Hongqi растут на падающем рынке, самая популярная модель — кроссовер Hongqi HS5

    Россияне распробовали китайский премиум: продажи Hongqi растут на падающем рынке, самая популярная модель — кроссовер Hongqi HS5

    4 shares
    Share 2 Tweet 1
  • Котик или лев? Тест-драйв Peugeot 2008

    10 shares
    Share 4 Tweet 3
  • TSMC представила техпроцесс A16 (1,6 нм) — Apple iPhone сможет получить чипы на нем в 2027 году

    3 shares
    Share 1 Tweet 1
  • Корейский программист потратил $330 на настоящее надгробие для Internet Explorer

    2 shares
    Share 1 Tweet 1
  • Бета Call of Duty: Black Ops 7 стартует в начале октября

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

На фоне падения крипторынка ETF-фонды потеряли почти $1 млрд на фоне падения крипторынка

На фоне падения крипторынка ETF-фонды потеряли почти $1 млрд на фоне падения крипторынка

20.08.2025

Envision запускает в продажу умные очки с ИИ для слепых и слабовидящих

20.08.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить