AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Нейросеть обучили распознавать птиц по пению даже при наличии фонового шума

28.01.2022
Share on FacebookShare on Twitter

Нейросеть обучили распознавать птиц по пению даже при наличии фонового шума

Этоинтересно

Платформа QVAC от Tether позволит ИИ-агентам работать локально и обеспечит автономные транзакции BTC и USDT

Платформа QVAC от Tether позволит ИИ-агентам работать локально и обеспечит автономные транзакции BTC и USDT

15.05.2025
«Чудовище Франкенштейна» от Nvidia: компания «перезапустит» GeForce RTX 5090D, но она получит всего 24 ГБ памяти и 14 080 ядер CUDA вместо 21 760

«Чудовище Франкенштейна» от Nvidia: компания «перезапустит» GeForce RTX 5090D, но она получит всего 24 ГБ памяти и 14 080 ядер CUDA вместо 21 760

15.05.2025

В последние годы автономные записывающие устройства (Autonomous recording unit или ARU) упростили запись тысяч часов звуков в лесах. Эти данные используют для лучшего понимания работы экосистем, отслеживания поведения животных и птиц, их количества, определения критических мест обитания и т.д. Например, если в лесу много дятлов, то в нем полно сухостоя.

Однако изучение аудиоданных вручную занимает огромное количество времени, а специалисты по пению птиц встречаются не часто. Помочь в этом может искусственный интеллект. Занимающееся ИИ подразделение Google представило нейросеть, способную быстро и с высокой точностью классифицировать пернатых по пению.

Аудиоклассификация видов птиц на основе машинного обучения (ML) оказалась сложной: птицы часто поют вместе, нет четких записей голосов отдельных птиц, на которых можно было бы обучить нейросеть, ИИ часто не слышат голоса распространенных видов, так как обучены искать более редкие и т.д.

Поэтому исследователи разработали новый неконтролируемый метод, называемый смешанным инвариантным обучением разделения звуков на аудиозаписях (MixIT). Исходный код есть на GitHub.

MixIT может разделять одноканальные записи на несколько отдельных дорожек с трелями птиц, а также различает фоновый шум. Для этого нейросети «скормили» записи с ARU пения птиц из Xeno-Canto и Macaulay Library. Затем доработали алгоритм распознавания трелей EfficientNet. Исследователи разделили звук на пятисекундные сегменты, а затем создали мел-спектрограммуНейросеть обучили распознавать птиц по пению даже при наличии фонового шумаНейросеть обучили распознавать птиц по пению даже при наличии фонового шумаСпектрограмма, где частота выражена не в Гц, а в мелах. каждого сегмента. Классификатор EfficientNet идентифицировал виды птиц по изображениям мел-спектрограммы, обучаясь на аудиозаписях из Xeno-Canto и Macaulay Library.

«Мы подготовили два отдельных классификатора, один для видов в горах Сьерра-Невада и один — для северной части штата Нью-Йорк. Эти классификаторы не обучаются на разделенном аудио. Мы также представили несколько новых методов для улучшения обучения классификаторов. Таксономическое обучение требовало от классификатора сделать метки для каждого уровня таксономии видов (род, семейство и порядок), что позволяет модели изучить группы видов, прежде чем добраться до тонких различий между похожими видами. Мы также обнаружили, что случайная фильтрация нижних частот полезна для имитации далеких звуков во время обучения: по мере удаления источника звука высокочастотные участки затухают раньше, чем низкочастотные. Это было особенно эффективно для идентификации видов из выскогорья Сьерра-Невады, где пение птиц распространяется на очень большие расстояния», — отметили в подразделении Google.

По словам исследователей, разделение аудио с помощью новой модели MixIT улучшило производительность классификатора, что проверили на трех независимых реальных наборах данных. Особенно успешно ИИ идентифицировал тихие и фоновые трели пернатых.

https://itc.ua/wp-content/uploads/2022/01/birbsep_aiblog_high_sierras.mp4

Не обошлось без «минусов». Иногда наблюдалось чрезмерное разделение одной песни на несколько каналов, что может привести к неправильной классификации. А когда поют несколько птиц, самая четкая трель нередко получала более низкую оценку после разделения. Это может быть связано с потерей контекста окружающей среды или другими артефактами.

В 2018 году в рамках Bird Audio Detection challenge с помощью глубокого обучения удалось научить искусственный интеллект распознавать птиц по их пению. В рамках некоторых тестов точность достигала 88-89%, что довольно далеко от идеала.

Другие новости

Платформа QVAC от Tether позволит ИИ-агентам работать локально и обеспечит автономные транзакции BTC и USDT

Платформа QVAC от Tether позволит ИИ-агентам работать локально и обеспечит автономные транзакции BTC и USDT

15.05.2025
«Чудовище Франкенштейна» от Nvidia: компания «перезапустит» GeForce RTX 5090D, но она получит всего 24 ГБ памяти и 14 080 ядер CUDA вместо 21 760

«Чудовище Франкенштейна» от Nvidia: компания «перезапустит» GeForce RTX 5090D, но она получит всего 24 ГБ памяти и 14 080 ядер CUDA вместо 21 760

15.05.2025
MediaTek представила Dimensity 9400e ─ субфлагманский чип с ray tracing и Wi-Fi 7

MediaTek представила Dimensity 9400e ─ субфлагманский чип с ray tracing и Wi-Fi 7

14.05.2025
Intel всё же выпустит конкурента для GeForce RTX 5060? Компания намекнула, что Arc B770 всё-таки выйдет

Intel всё же выпустит конкурента для GeForce RTX 5060? Компания намекнула, что Arc B770 всё-таки выйдет

14.05.2025
Вышел новый трейлер «Супермена» — без Генри Кавилла, но с «суперкамео»

Вышел новый трейлер «Супермена» — без Генри Кавилла, но с «суперкамео»

14.05.2025
Nvidia, это такая шутка? Мобильная GeForce RTX 5090 Laptop иногда отстаёт от RTX 4090 Laptop, а в среднем быстрее лишь на несколько процентов

Nvidia, это такая шутка? Мобильная GeForce RTX 5090 Laptop иногда отстаёт от RTX 4090 Laptop, а в среднем быстрее лишь на несколько процентов

14.05.2025
Next Post
Бета iOS 15.4 нарушает главный принцип Apple? Face ID теперь в маске

Бета iOS 15.4 нарушает главный принцип Apple? Face ID теперь в маске

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • ТОП 7 геймпадов: лучшие модели контроллеров в 2025 году

    ТОП 7 геймпадов: лучшие модели контроллеров в 2025 году

    1 shares
    Share 0 Tweet 0
  • Игроки Oblivion Remastered были удивлены загадкой призрачной лошади, но разгадка оказалась простой

    1 shares
    Share 0 Tweet 0
  • Урезанной версии Snapdragon 8 Gen 5 не будет: чем это плохо?

    1 shares
    Share 0 Tweet 0
  • Большой, с приятной картинкой и адекватной ценой: обзор QLED Digma 65" DM-LED65UQB31

    0 shares
    Share 0 Tweet 0
  • Vivo S30 Pro mini получит горячую новинку серии MediaTek Dimensity

    0 shares
    Share 0 Tweet 0

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

Infinix показала в РФ концерты в честь двухлетия Honkai: Star Rail

Infinix показала в РФ концерты в честь двухлетия Honkai: Star Rail

15.05.2025
Warner Bros. вернула своему стримингу название HBO Max

Warner Bros. вернула своему стримингу название HBO Max

15.05.2025
  • Разместить новости

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

© 2006-2024 AZON.mobi
Новости высоких технологий. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить