AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Нейросеть обучили распознавать птиц по пению даже при наличии фонового шума

28.01.2022
Share on FacebookShare on Twitter

Нейросеть обучили распознавать птиц по пению даже при наличии фонового шума

Этоинтересно

В соцсетях появляются видео работы Gaming Copilot от Microsoft: больше вопросов, чем ответов

В соцсетях появляются видео работы Gaming Copilot от Microsoft: больше вопросов, чем ответов

20.03.2026
Factor One – гоночный байк от Bugatti, который запрещено использовать в гонках

Factor One – гоночный байк от Bugatti, который запрещено использовать в гонках

20.03.2026

В последние годы автономные записывающие устройства (Autonomous recording unit или ARU) упростили запись тысяч часов звуков в лесах. Эти данные используют для лучшего понимания работы экосистем, отслеживания поведения животных и птиц, их количества, определения критических мест обитания и т.д. Например, если в лесу много дятлов, то в нем полно сухостоя.

Однако изучение аудиоданных вручную занимает огромное количество времени, а специалисты по пению птиц встречаются не часто. Помочь в этом может искусственный интеллект. Занимающееся ИИ подразделение Google представило нейросеть, способную быстро и с высокой точностью классифицировать пернатых по пению.

Аудиоклассификация видов птиц на основе машинного обучения (ML) оказалась сложной: птицы часто поют вместе, нет четких записей голосов отдельных птиц, на которых можно было бы обучить нейросеть, ИИ часто не слышат голоса распространенных видов, так как обучены искать более редкие и т.д.

Поэтому исследователи разработали новый неконтролируемый метод, называемый смешанным инвариантным обучением разделения звуков на аудиозаписях (MixIT). Исходный код есть на GitHub.

MixIT может разделять одноканальные записи на несколько отдельных дорожек с трелями птиц, а также различает фоновый шум. Для этого нейросети «скормили» записи с ARU пения птиц из Xeno-Canto и Macaulay Library. Затем доработали алгоритм распознавания трелей EfficientNet. Исследователи разделили звук на пятисекундные сегменты, а затем создали мел-спектрограммуНейросеть обучили распознавать птиц по пению даже при наличии фонового шумаНейросеть обучили распознавать птиц по пению даже при наличии фонового шумаСпектрограмма, где частота выражена не в Гц, а в мелах. каждого сегмента. Классификатор EfficientNet идентифицировал виды птиц по изображениям мел-спектрограммы, обучаясь на аудиозаписях из Xeno-Canto и Macaulay Library.

«Мы подготовили два отдельных классификатора, один для видов в горах Сьерра-Невада и один — для северной части штата Нью-Йорк. Эти классификаторы не обучаются на разделенном аудио. Мы также представили несколько новых методов для улучшения обучения классификаторов. Таксономическое обучение требовало от классификатора сделать метки для каждого уровня таксономии видов (род, семейство и порядок), что позволяет модели изучить группы видов, прежде чем добраться до тонких различий между похожими видами. Мы также обнаружили, что случайная фильтрация нижних частот полезна для имитации далеких звуков во время обучения: по мере удаления источника звука высокочастотные участки затухают раньше, чем низкочастотные. Это было особенно эффективно для идентификации видов из выскогорья Сьерра-Невады, где пение птиц распространяется на очень большие расстояния», — отметили в подразделении Google.

По словам исследователей, разделение аудио с помощью новой модели MixIT улучшило производительность классификатора, что проверили на трех независимых реальных наборах данных. Особенно успешно ИИ идентифицировал тихие и фоновые трели пернатых.

https://itc.ua/wp-content/uploads/2022/01/birbsep_aiblog_high_sierras.mp4

Не обошлось без «минусов». Иногда наблюдалось чрезмерное разделение одной песни на несколько каналов, что может привести к неправильной классификации. А когда поют несколько птиц, самая четкая трель нередко получала более низкую оценку после разделения. Это может быть связано с потерей контекста окружающей среды или другими артефактами.

В 2018 году в рамках Bird Audio Detection challenge с помощью глубокого обучения удалось научить искусственный интеллект распознавать птиц по их пению. В рамках некоторых тестов точность достигала 88-89%, что довольно далеко от идеала.

Другие новости

В соцсетях появляются видео работы Gaming Copilot от Microsoft: больше вопросов, чем ответов

В соцсетях появляются видео работы Gaming Copilot от Microsoft: больше вопросов, чем ответов

20.03.2026
Factor One – гоночный байк от Bugatti, который запрещено использовать в гонках

Factor One – гоночный байк от Bugatti, который запрещено использовать в гонках

20.03.2026
SoftBank готовится построить в Огайо один из самых больших дата-центров в мире — на 10 ГВт (как у девяти ядерных реакторов)

SoftBank готовится построить в Огайо один из самых больших дата-центров в мире — на 10 ГВт (как у девяти ядерных реакторов)

20.03.2026
Как на самом деле работает DLSS 5? Ютубер опубликовал ответы NVIDIA

Как на самом деле работает DLSS 5? Ютубер опубликовал ответы NVIDIA

20.03.2026
Пожилая женщина провела шесть месяцев в тюрьме и потеряла дом из-за ошибки системы распознавания лиц

Пожилая женщина провела шесть месяцев в тюрьме и потеряла дом из-за ошибки системы распознавания лиц

20.03.2026
Электрический монстр Xiaomi YU7 GT: 990 л.с., 705 км запаса хода и автопилот

Электрический монстр Xiaomi YU7 GT: 990 л.с., 705 км запаса хода и автопилот

20.03.2026
Next Post
Бета iOS 15.4 нарушает главный принцип Apple? Face ID теперь в маске

Бета iOS 15.4 нарушает главный принцип Apple? Face ID теперь в маске

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Обзор vivo V29: в свете ауры

    Обзор vivo V29: в свете ауры

    3 shares
    Share 1 Tweet 1
  • Кнопка-колёсико — почему Nothing додумалась, а другие нет? Обзор CMF Neckband Pro для спорта за 24$

    2 shares
    Share 1 Tweet 1
  • Рецензія на фільм «Безславні кріпаки»

    14 shares
    Share 6 Tweet 4
  • Азарт, комфорт и стиль. Тест-драйв Renault Arkana Puls

    20 shares
    Share 8 Tweet 5
  • lifecell запускає акцію «Літній драйв» з безлімітним інтернетом на вихідні, свята й у нічний час

    2 shares
    Share 1 Tweet 1

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

В соцсетях появляются видео работы Gaming Copilot от Microsoft: больше вопросов, чем ответов

В соцсетях появляются видео работы Gaming Copilot от Microsoft: больше вопросов, чем ответов

20.03.2026
Factor One – гоночный байк от Bugatti, который запрещено использовать в гонках

Factor One – гоночный байк от Bugatti, который запрещено использовать в гонках

20.03.2026
  • Разместить новости

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить