Nocmig – artbestämning av nattflyttande fåglar med hjälp av ljudfiler

Bakgrund
2021-11-11
För en tid sedan lästa jag en mycket intressant artikel i ”Fåglar i Stockholmstrakten” 3:2021 som handlade om att artbestämma nattflyttare på Landsort genom att analysera spektrogram från ljudfiler. Googlar man på ”nocmig” får man upp en hel del i ämnet. Personen i artikeln hade köpt en ”Song Meter SM4” från https://www.wildlifeacoustics.com/products/song-meter-sm4 som kostar närmare 10000 SEK och placerat denna på fågelstationen på Landsort i Stockholms södra skärgård. Jag bestämde mig för att testa med billigare prylar jag hade hemma (en Zoom H1n ljudinspelare och en billig mikrofon jag använt till systemkameran) och lyckades faktiskt spela in lite. Nu var ju mikrofonen rätt simpel och tiden i slutet på flyttsäsongen, men jag fick en del rödvingetrastar att fastna. Med en bättre riktmikrofon är jag övertygad om att man kan få minst lika bra resultat som med SM4 om man riktar den mot natthimlen.

Tekniken som de flesta verkar använda är att ta upp ljudfilerna i t ex Audacity och manuellt leta igenom dessa och vid träff antingen lyssna sig till vilken fågel det är (vilket inte alltid är möjligt p g a mycket låg volym) eller att studera spektrogrammet och sedan jämföra med filer från xeno-canto om man nu inte är en van användare och direkt kan se art. Företaget som säljer SM4 har även en programvara (Kaleidoscope) som analyserar ljudfiler och bygger kluster på likartade läten som man sedan själv får artbestämma. Fördelen är att man spar tid och får allt serverat i CSV-filer, som man sedan kan bygga vidare på. Nackdelen är att licensen kostar runt 4000 SEK per år och recensioner jag läst om funktionen är inte helt övertygande. Dessutom får man betala för molntjänster m m som kanske inte är aktuellt.

En del tycker säkert att det här sättet är ett för stort sidospår från fågelskådandet, men med enbart egna öron en natt i mörkret är det omöjligt att upptäcka allt det som man kan med hjälp av lite teknik. Dessutom har jag jobbat med IT-teknik i över 40 år och gillar att klura ut lösningar och få dem att fungera. Den här sidan skriver jag mest för egen dokumentation, men kanske kan den också få andra att våga ge sig på detta. För själva analysdelen med hjälp av programvara krävs en del datorvana.

Första testet
2021-11-11
Första ljudinspelningarna jag gjorde skapade WAV-filer i stereo på cirka 2 timmar och 30 minuter vardera och varje fil blev cirka 2 GB stor. Jag installerade både Kaleidoscope Lite och Audacity för att skapa spektrogram från filerna. Vilket program man använder är en smaksak och båda är gratis. Det krävs några inställningar i Audacity för att få ett bra resultat och dessa kan man hitta på nätet. Det gäller att manuellt bläddra sig igenom filen och upptäcka de ställen där det kan vara intressanta ljud. Dålig mikrofon, nära till lokalgatan och alldeles i slutet på flyttsäsongen gjorde att resultatet blev rätt skralt, men hittade enstaka ljud i spektrogrammet bland allt annat ovidkommande. De allra flesta fynden var ohörbara och man fick alltså antingen jämföra ljudbilden med filer på xeno-canto eller klippa ut utsnittet, skapa en WAV-fil och skicka denna till BirdNET:s onlinetjänst för analys (https://birdnet.cornell.edu/api/).

Vad som behöver göras är framför allt att köpa en bättre riktmikrofon, hitta en bättre plats att placera den på och hitta verktyg för att analysera stora ljudfiler.

Test av programvara för analys av ljudfiler
2021-11-13
Jag har nu installerat den programvara som ligger till grund för analyserna som BirdNET gör och den finns att ladda ner gratis från https://github.com/kahst/BirdNET. Det finns även en BirdNET-Lite som jag ännu inte testat. I den större versionen är det möjligt att ladda in flera stora ljudfiler i t ex WAV-format och programmet analyserar en efter en och skriver sedan en rapport i form av en textfil som man enkelt kan importera i Excel och bearbeta vidare där.

För att installera programmet krävs en dator med operativsystemet Ubuntu. Troligen fungerar det även med andra Linux-dialekter, men det är Ubuntu som rekommenderas. Jag plockade fram en gammal laptop och gjorde installationen. När man sedan började processa filerna visade det sig att programmet var väldigt hungrigt på processorkraft, men speciellt på internminne och analysen avbröts när minnesanvändningen gick i taket. Jag skapade därför en virtuell Ubuntu-installation i min stationära dator med hjälp av VMware Workstation Player som fritt kan laddas ner på nätet. I denna kan man tilldela så mycket processorkraft och internminne som behövs. Även när detta är gjort tar analyserna en bra stund. För att endast ta med de arter som kan vara aktuella för en viss plats och tid på året kan man ange detta som parametrar i kommandosträngen. Det jag märkte är att för att programmet ska ta hänsyn till plats (och därmed exkludera osannolika arter) är att man måste ange latitud och longitud med fem decimaler. Det går att ställa in ”rimlighetsnivå” för att ytterligare exkludera osannolika arter från rapporten. De stereofiler jag hade gjorde jag om till mono och då gick analysen lite snabbare.

Programmet verkar fungera alldeles utmärkt tekniskt och funktionsmässigt, även om jag fick en del konstiga resultat, men det beror säkert på dåliga ljudfiler och man måste alltid göra en rimlighetsbedömning av resultatet och eventuellt kolla vidare.

I den rapport som skapas för varje fil finns bl a hur långt in i filen i sekunder ett läte har hittats. Man kan då enkelt gå in i t ex Audacity och leta upp det stället och jämföra spektrogrammet med t ex xeno-canto. Artnamnen anges på engelska, men med funktionen LETARAD i Excel kan man automatiskt leta upp det svenska namnet i ett annat exceldokument som innehåller arterna på flera språk.

Nu återstår närmast att köpa en bättre mikrofon och spela in några ljudfiler från tomten dagtid där man vet vilka arter som rör sig och se om programmet kommer fram till samma resultat.
Jag uppdaterar här fortlöpande.

Nytt test
2021-11-21
Ny test är nu gjord, den här gången med att bara använda själva ljudinspelaren utan extern mikrofon. Inspelningen gjordes under 2,5 timmar vid fågelmatningen där det var en hel del fåglar plus en del bakgrundsljud.  För att få ett rimligt resultat har jag bara tagit med värden som är större än 0,8 i ”Minimum confidence threshold”, som kan ställas in när man kör analysen, men som jag nu gjorde i Excel efteråt. Har man ett lägre värde fick man med mindre troliga arter (t ex vattenrall!), men det varierar säkert med var och hur inspelningen gjorts och man får alltid göra en rimlighetsbedömning. Troligen blir programmet mindre exakt i analysen om det förkommer väldigt många ljud på kort tid. Efter lite efterarbete i Excel blev resultatet följande.