AZON.моби
  • Новости
  • Обзоры
  • Смартфоны
  • Игры
  • Криптовалюты
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
AZON.моби
No Result
View All Result
AZON.моби
Home Новости

Нейросеть обучили распознавать птиц по пению даже при наличии фонового шума

28.01.2022
Share on FacebookShare on Twitter

Нейросеть обучили распознавать птиц по пению даже при наличии фонового шума

Этоинтересно

NVIDIA GTX 1080 Ti против RTX: последняя ошибка Дженсена Хуанга

NVIDIA GTX 1080 Ti против RTX: последняя ошибка Дженсена Хуанга

12.03.2026
Богиня Ушань: в Китае открылся самый длинный эскалатор в мире

Богиня Ушань: в Китае открылся самый длинный эскалатор в мире

12.03.2026

В последние годы автономные записывающие устройства (Autonomous recording unit или ARU) упростили запись тысяч часов звуков в лесах. Эти данные используют для лучшего понимания работы экосистем, отслеживания поведения животных и птиц, их количества, определения критических мест обитания и т.д. Например, если в лесу много дятлов, то в нем полно сухостоя.

Однако изучение аудиоданных вручную занимает огромное количество времени, а специалисты по пению птиц встречаются не часто. Помочь в этом может искусственный интеллект. Занимающееся ИИ подразделение Google представило нейросеть, способную быстро и с высокой точностью классифицировать пернатых по пению.

Аудиоклассификация видов птиц на основе машинного обучения (ML) оказалась сложной: птицы часто поют вместе, нет четких записей голосов отдельных птиц, на которых можно было бы обучить нейросеть, ИИ часто не слышат голоса распространенных видов, так как обучены искать более редкие и т.д.

Поэтому исследователи разработали новый неконтролируемый метод, называемый смешанным инвариантным обучением разделения звуков на аудиозаписях (MixIT). Исходный код есть на GitHub.

MixIT может разделять одноканальные записи на несколько отдельных дорожек с трелями птиц, а также различает фоновый шум. Для этого нейросети «скормили» записи с ARU пения птиц из Xeno-Canto и Macaulay Library. Затем доработали алгоритм распознавания трелей EfficientNet. Исследователи разделили звук на пятисекундные сегменты, а затем создали мел-спектрограммуНейросеть обучили распознавать птиц по пению даже при наличии фонового шумаНейросеть обучили распознавать птиц по пению даже при наличии фонового шумаСпектрограмма, где частота выражена не в Гц, а в мелах. каждого сегмента. Классификатор EfficientNet идентифицировал виды птиц по изображениям мел-спектрограммы, обучаясь на аудиозаписях из Xeno-Canto и Macaulay Library.

«Мы подготовили два отдельных классификатора, один для видов в горах Сьерра-Невада и один — для северной части штата Нью-Йорк. Эти классификаторы не обучаются на разделенном аудио. Мы также представили несколько новых методов для улучшения обучения классификаторов. Таксономическое обучение требовало от классификатора сделать метки для каждого уровня таксономии видов (род, семейство и порядок), что позволяет модели изучить группы видов, прежде чем добраться до тонких различий между похожими видами. Мы также обнаружили, что случайная фильтрация нижних частот полезна для имитации далеких звуков во время обучения: по мере удаления источника звука высокочастотные участки затухают раньше, чем низкочастотные. Это было особенно эффективно для идентификации видов из выскогорья Сьерра-Невады, где пение птиц распространяется на очень большие расстояния», — отметили в подразделении Google.

По словам исследователей, разделение аудио с помощью новой модели MixIT улучшило производительность классификатора, что проверили на трех независимых реальных наборах данных. Особенно успешно ИИ идентифицировал тихие и фоновые трели пернатых.

https://itc.ua/wp-content/uploads/2022/01/birbsep_aiblog_high_sierras.mp4

Не обошлось без «минусов». Иногда наблюдалось чрезмерное разделение одной песни на несколько каналов, что может привести к неправильной классификации. А когда поют несколько птиц, самая четкая трель нередко получала более низкую оценку после разделения. Это может быть связано с потерей контекста окружающей среды или другими артефактами.

В 2018 году в рамках Bird Audio Detection challenge с помощью глубокого обучения удалось научить искусственный интеллект распознавать птиц по их пению. В рамках некоторых тестов точность достигала 88-89%, что довольно далеко от идеала.

Другие новости

NVIDIA GTX 1080 Ti против RTX: последняя ошибка Дженсена Хуанга

NVIDIA GTX 1080 Ti против RTX: последняя ошибка Дженсена Хуанга

12.03.2026
Богиня Ушань: в Китае открылся самый длинный эскалатор в мире

Богиня Ушань: в Китае открылся самый длинный эскалатор в мире

12.03.2026
8000 мАч, перископная камера и компактный корпус с экраном 6,32 дюйма: инсайдер сообщил о скором выхода нового смартфона

8000 мАч, перископная камера и компактный корпус с экраном 6,32 дюйма: инсайдер сообщил о скором выхода нового смартфона

12.03.2026
Intel представила процессоры Core Ultra 7 270K Plus и Core Ultra 5 250K Plus

Intel представила процессоры Core Ultra 7 270K Plus и Core Ultra 5 250K Plus

12.03.2026
Представлен совершенно новый роскошный Mercedes-Benz, и это вовсе не седан.  Mercedes-Benz VLE 2028 получил 409 л.с., полный привод и особо комфортный салон

Представлен совершенно новый роскошный Mercedes-Benz, и это вовсе не седан.  Mercedes-Benz VLE 2028 получил 409 л.с., полный привод и особо комфортный салон

12.03.2026
Разработчики “Clair Obscur: Expedition 33” против Оливера Гея: чем закончился иск из-за названия игры

Разработчики “Clair Obscur: Expedition 33” против Оливера Гея: чем закончился иск из-за названия игры

12.03.2026
Next Post
Бета iOS 15.4 нарушает главный принцип Apple? Face ID теперь в маске

Бета iOS 15.4 нарушает главный принцип Apple? Face ID теперь в маске

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Популярные новости

  • Nothing Phone (2a) получил еще одну лимитку: рендеры и живые фото

    Nothing Phone (2a) получил еще одну лимитку: рендеры и живые фото

    17 shares
    Share 7 Tweet 4
  • Xiaomi Redmi Turbo 4 во всех цветах на подборке живых фото

    3 shares
    Share 1 Tweet 1
  • Мы спросили, вы ответили: мнения об "экологичной" упаковке Pixel 9

    2 shares
    Share 1 Tweet 1
  • Большая подборка живых фото Xiaomi 14 Ultra в трех цветах

    4 shares
    Share 2 Tweet 1
  • Индийский магазин выдал все секреты и дату анонса Moto G84

    2 shares
    Share 1 Tweet 1

Подписка на новости


Информация

Использование любых материалов сайта разрешается при условии ссылки на AZON.mobi
Интернет-СМИ должны использовать прямую открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала.
Редакция сайта может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

Мы в соцсетях

ТОП новости

NVIDIA GTX 1080 Ti против RTX: последняя ошибка Дженсена Хуанга

NVIDIA GTX 1080 Ti против RTX: последняя ошибка Дженсена Хуанга

12.03.2026
Богиня Ушань: в Китае открылся самый длинный эскалатор в мире

Богиня Ушань: в Китае открылся самый длинный эскалатор в мире

12.03.2026
  • Разместить новости

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

No Result
View All Result
  • Новости
  • Игры
  • Криптовалюты
  • Обзоры
  • Смартфоны

Наши контакты: Telegram/WhatsApp/Viber: +972546406116
E-mail: [email protected]

© 2006-2026 AZON.mobi
Новости высоких технологий, обзоры IT. All rights reserved.

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить