Dataset
Er is een dataset gebruikt met daarin een lijst met ritten waar vervoerders op kunnen bieden. In de dataset staan ongeveer duizend routes, waarvan onder andere de ophaallocatie, afleverlocatie, frequentie per jaar en afstand in kilometers bekend zijn.
Omdat de mogelijkheden voor de agent met elke extra locatie exponentieel toenemen, is ervoor gekozen om de locaties te clusteren. Door dit te combineren met gegevens over hoeveel ritten er vertrekken of aankomen, ontstaat een eerste indicatie van de ophaal- en afleverclusters waar je waarschijnlijk leeg rijdt.
Reinforcement learning
Voor de proof-of-concept is gebruikgemaakt van reinforcement learning, een techniek binnen machine learning waarmee een agent kan leren op basis van een simulatie. Bij het trainen begint de agent elke keer op een willekeurige ophaallocatie, onderneemt hij acties en krijgt hij daarvoor scores. Op basis van die scores past de agent zijn neurale netwerk steeds aan, zodat hij in het vervolg een betere voorspelling doet. Op haar website legt Bullit Digital de aanpak stap voor stap uit.
In slechts tien minuten trainen werd een negatieve score omgedraaid in een positieve. Na zo’n vierduizend iteraties leerde het systeem nog steeds iets nieuws; de gemiddelde score bleef langzaam stijgen.
Meer weten over de mogelijkheden van AI voor de logistiek? Neem contact op.