Wetenschappers vergaren een schat aan informatie uit beelden die zijn gemaakt door drones en satellieten. Die momentopnames geven belangrijk inzicht in de veranderingen die op de planeet plaatsvinden, zoals in populaties dieren, in vegetatie, in afval op de oceaan of de grootte van gletsjers. Bovendien kunnen experts neurale netwerken trainen om beelden razendsnel te verwerken en er objecten in aan te wijzen en te classificeren.
“Toch kan geen van de huidige AI-programma’s makkelijk schakelen tussen het herkennen van het ene soort object en het andere. Bijvoorbeeld tussen het aanwijzen van puin en het aanwijzen van een boom of een gebouw,” zegt prof. Devis Tuia, hoofd van het Environmental Computational Science and Earth Observation Laboratory van de École Polytechnique Fédérale de Lausanne (EPFL). “Momenteel moeten programmeurs de algoritmes nog trainen op elk nieuw soort object. Dat doen ze via het invoeren van enorme hoeveelheden gegevens uit het veld.” Marc Rußwurm van Wageningen University & Research wil dit veranderen, samen met Tuia en collega’s van Massachusetts Institute of Technology, Yale University en Jülich Research Center. Daarvoor hebben ze METEOR ontwikkeld: een applicatie die zich als een ‘kameleon’ kan aanpassen. Dit systeem kan algoritmes trainen om nieuwe objecten te herkennen na invoer van maar een paar beelden.
Slechts vier of vijf goede beelden nodig voor training nieuwe taak
Als het gaat om het classificeren van afbeeldingen, kunnen neurale netwerken in een ogenblik doen waar mensen uren voor nodig hebben. Deze netwerken worden getraind op basis van gegevens die door mensen zijn beoordeeld en geannoteerd. Hoe meer van zulke gegevens een neuraal netwerk ter beschikking heeft, hoe nauwkeuriger de uitkomsten zullen zijn. Bomen en gebouwen kunnen er in verschillende regio’s bijvoorbeeld heel anders uitzien. Voor betrouwbare herkenning zullen de algoritmen van een neuraal netwerk dus moeten beschikken over veel verschillende beelden van objecten, en onder diverse omstandigheden.
“Het probleem bij omgevingswetenschappen is dat het vaak niet mogelijk is om een dataset te verkrijgen die groot genoeg is om AI-programma's te trainen voor ons onderzoek,” zegt Marc Rußwurm, voorheen postdoc bij EPFL en tegenwoordig universitair docentbij Wageningen University & Research. “Vooral niet bij het bestuderen van verschijnselen die specifiek voorkomen in een bepaalde regio, zoals het uitsterven van een inheemse boomsoort. Of bij objecten die statistisch gezien klein zijn in aantal, maar die zich verspreid over een groot gebied bevinden, zoals afval in de oceanen.”
Een andere uitdaging bij het trainen van neurale netwerken op basis van drone- en satellietbeelden heeft te maken met het brede scala aan beeldresoluties en kleurenspectra, en het type apparaat dat wordt gebruikt. Om dit probleem te omzeilen is METEOR zo ontworpen dat het aanpasbaar is, en in staat is tot ‘meta-learning’. Het neemt als het ware een verkorte route naar taken die eerder - maar in een andere context - met succes zijn uitgevoerd. “We hebben algoritmen en methoden ontwikkeld waarmee neurale netwerken de resultaten van eerder uitgevoerde opdrachten kunnen generaliseren,” legt Rußwurm uit. “Diezelfde strategie kunnen ze dan gebruiken bij nieuwe situaties.” Dankzij deze nieuwe methode heeft METEOR maar vier of vijf goede beelden nodig om met resultaten te komen die betrouwbaar genoeg zijn.
Profijt van verschillen in resolutie
Om de applicatie te testen, pasten de onderzoekers een bestaand neuraal netwerk aan. Dat was getraind om wereldwijd verschillende soorten landgebruik te classificeren op basis van beelden uit verschillende regio's. De onderzoekers pasten het netwerk zo aan, dat het vijf herkenningstaken kan uitvoeren: het meten van het oppervlak aan vegetatie in Australië, het identificeren van ontbossingzones in het Braziliaanse regenwoud, het lokaliseren van veranderingen in Beiroet na de explosie in 2020, het opsporen van afval in oceanen, en het herkennen van verschillende typen stedelijk gebied (industriegebieden, zakelijke districten, en woonwijken met hoge, gemiddelde en lage bevolkingsdichtheid). Afhankelijk van het probleem werden telkens een klein aantal dronebeelden met hoge resolutie en RGB-satellietbeelden gebruikt. “We ontdekten dat als we METEOR voedden met slechts een kleine dataset, de resultaten vergelijkbaar waren met die van AI-programma's die langer en met veel meer gegevens waren getraind,” zegt Rußwurm.
De onderzoekers gaan de basis van het AI-systeem nu trainen op een groot aantal taken, zodat het zich verder kan perfectioneren tot ‘kameleon’. Op die manier is het systeem nog makkelijker aan te passen aan talloze herkenningstaken. Ook willen de onderzoekers de applicatie combineren met een gebruikersinterface, zodat mensen op afbeeldingen van hoge kwaliteit kunnen klikken die ze door het neurale netwerkprogramma voorgesteld krijgen. “Omdat het programma maar een paar afbeeldingen te zien krijgt, is de relevantie ervan heel belangrijk,” zegt Rußwurm.