This is main content

Onbekende mestsilo’s opsporen: welke data heb je daarvoor nodig?

27 mei 2021

Het Brabants Omgevings Datalab (BOD) is de centrale plek van de drie Brabantse Omgevingsdiensten en de Provincie Noord-Brabant waar data wordt binnengehaald, bewerkt en gevisualiseerd, om tot informatie van toegevoegde waarde te komen. 

In het nieuwsbericht van 12 mei van data scientist Esmee Kramer las je dat het BOD een image recognition project is gestart voor het opsporen van ‘onbekende’ mestsilo’s. Hoe werkt dat nu precies en welke data zijn daarvoor nodig? In dit vervolg vertelt ze er meer over. 

Image recognition is de techniek waarbij een computermodel ‘getraind’ wordt om bepaalde objecten op (lucht)foto’s te herkennen. Wij gaan dus een model trainen gericht op het kunnen herkennen van mestsilo’s. Je kunt een model als een ‘black box’ zien: Je stopt er bepaalde data in, het model doet iets met die data, en geeft vervolgens een bepaalde output. 

Ongestructureerde data

Bij een image recognition model willen we dat het model bepaalde objecten gaat leren herkennen. Als input moeten we het model zo veel mogelijk voorbeelden van dat object, in ons geval mestsilo’s, geven. De data die we nodig hebben zijn dus luchtfoto’s met een mestsilo erop. Foto’s zijn een vorm van ongestructureerde data. Daarbij is het belangrijk dat alle verschillende soorten, kleuren, vormen en maten van mestsilo’s in je input data zitten. Hierdoor kan het model namelijk ook beter verschillende mestsilo’s herkennen. 

Openbare bronnen en het annoteren van foto’s

We vonden al vrij snel een openbare dataset op internet (OpenStreetMap), met daarin XY- coördinaten van een heleboel mestsilo’s, oftewel hun precieze geografische locatie. Mijn collega en ik hebben samen een script (=stuk code) geschreven waarmee we op basis van deze coördinaten de bijbehorende luchtfoto kunnen ontsluiten. Daarvoor gebruiken we ook een openbare bron, van de overheid (Publieke Dienstverlening Op de Kaart, PDOK). We verzamelen de luchtfoto’s van heel Nederland, want bij dit soort modellen geldt vaak: hoe meer, hoe beter. Mijn laptop moest in een weekend wat overuren draaien om meer dan 10.000 van deze luchtfoto’s binnen te halen.

Maar dan zijn we er nog niet. We moeten het model namelijk ook nog leren wáár de mestsilo op de foto te zien is. Ook hiervoor hebben we een script geschreven, waarin we als het ware automatisch een rechthoek om de mestsilo op de luchtfoto tekenen. Dit geven we ook mee als input aan het image recognition model.

Deze eerste fase van data verzameling en voorbereiding kost vaak veel tijd, zo ook bij dit project. Nu alle inputdata verzameld zijn, start de volgende fase: het trainen van het model. Daarover vertelt Esmee Kramer in een volgend artikel meer!

Lees meer over het BOD in het nieuwsbericht van 22 april 2021 op onze website.

Luchtfoto silo's BOD

Meer informatie 

Contactpersoon van het BOD bij de ODZOB is Jeroen Bax, e-mailadres jeroen.bax@odzob.nl