Все новости

В СПбГУ создали Shazam для птиц

Новое мобильное приложение, использующее обученную нейросеть, способно отличить пение одной птицы от другой и определить их виды.

Выпускник Санкт-Петербургского государственного университета Олег Кенунен разработал программное обеспечение на основе нейронной сети, которое поможет как любителям наблюдения за птицами, так и орнитологам-профессионалам. Об этом сообщает пресс-релиз СПбГУ.

Нейросетью называют программу, состоящую из соединенных и взаимодействующих процессоров (искусственных «нейронов»). В отличие от обычных программ она не программируется, а лишь обучается. В нейросеть отправляют входящую информацию, включающую как исходные данные, так и их классификацию. Например, как звук соловьиных (или иных) трелей, так и данные о том, что так поет соловей или какая-то другая птица. Когда в систему будет введено достаточное количество разных записей, она построит математическую связь между определенными образцами трелей и тем, какой именно вид птиц их поет. На следующем этапе в нейросеть загружают только звуки, а она должна сама оценить, кто именно их издает.

Олег Кенунен создал мобильное приложение на основе такой нейросети с двумя основными целями. Первая — помощь орнитологам-любителям, вторая — автоматизация работы орнитологов-профессионалов. Сегодня так называемый бёрдвотчинг (от английских слов bird — птица, watching — наблюдение) является массовым хобби на Западе. В США до 20 процентов взрослого населения время от времени им занимаются. Однако если увидеть поющую птицу сравнительно просто, то точно определить ее вид гораздо сложнее. Как правило, расстояние до нее велико, к тому же птицы часто прячутся в ветках. Существующие приложения для распознавания птиц делают это с помощью анализа фотографий или не основанного на нейросетях весьма грубого анализа голосов.

Новое приложение заметно отличается от всех существующих. Его клиентская часть устанавливается на мобильный телефон и лишь записывает звуковые сигналы. Затем она отправляет их серверной части программы, которая с помощью нейросети и определяет, какую конкретно поющую птицу записал мобильный клиент. Это позволяет обойти одну из главных проблем нейросетей — требовательность к вычислительным мощностям, затрудняющую их применение на смартфонах для действительно сложных задач.

Пока программа узнает только двадцать видов птиц (среди них — соловья, зяблика, дрозда). Зато уже сейчас, еще до начала полевых испытаний, она корректно отличает один вид от другого с вероятностью более 90 процентов. Это уже не так плохо, с учетом того, что запись идет на микрофон смартфона, не предназначенного для захвата удаленных от телефона источников звука. Разработчик программы отмечает, что точность приложения можно сильно поднять, если библиотеку голосов дополнять, тем самым продолжая обучать нейронную сеть. Чем больше программа проанализирует записей, тем выше будет точность распознавания.

Пока полноценное тестирование можно провести разве что на синицах, поскольку большинство других птиц еще не прилетело с зимовий. Но летом разработчик проведет серию полевых экспериментов, чтобы найти слабые места нейросети и устранить их. Уже через несколько месяцев он планирует выложить бета-версию приложения для свободного скачивания.

Особо отмечается, что если доработать систему и снабдить ее дополнительными массивами обучающих данных, то с ее помощью можно будет записывать голоса птиц в нескольких точках леса, а потом определять расположение разных особей и проводить автоматический учет их численности. Теоретически эта технология позволяет покрыть весь лес и вести запись, например, в течение суток или недели. Для ученого-орнитолога без такого программного обеспечения эта задача может оказаться слишком трудоемкой. До сих пор биологи в ряде стран мира продолжают обнаруживать новые виды птиц как раз потому, что ручной поиск птиц занимает столько времени, что исследовать все интересные в орнитологическом отношении места на планете уже нет возможности.