Onderzoeksteam van de NYU Tandon ontwikkelt systeem waarmee voertuigen AI-modellen kunnen doorgeven als berichten in een sociaal netwerk, zelfs wanneer ze elkaar niet direct ontmoeten.
Een onderzoeksteam onder leiding van de NYU Tandon School of Engineering heeft een manier ontwikkeld voor zelfrijdende voertuigen om indirect kennis over wegomstandigheden te delen, zodat elk voertuig kan leren van de ervaringen van andere voertuigen, zelfs wanneer ze elkaar zelden op de weg ontmoeten.
Het onderzoek, gepresenteerd in een paper op de conferentie van de Association for the Advancement of Artificial Intelligence op 27 februari 2025, pakt een hardnekkig probleem in kunstmatige intelligentie aan: hoe voertuigen kunnen leren van elkaar terwijl ze hun gegevens privé houden. Normaal gesproken delen voertuigen alleen wat ze hebben geleerd tijdens korte directe ontmoetingen, wat de snelheid waarmee ze zich kunnen aanpassen aan nieuwe omstandigheden beperkt.
"Beschouw het als het creëren van een netwerk van gedeelde ervaringen voor zelfrijdende auto's," zei Yong Liu. Liu is professor aan de Electrical and Computer Engineering-afdeling van NYU Tandon en lid van het Center for Advanced Technology in Telecommunications and Distributed Information Systems en van NYU WIRELESS. "Een auto die alleen in Manhattan heeft gereden, kan nu bijvoorbeeld leren over wegomstandigheden in Brooklyn van andere voertuigen, zelfs als hij daar zelf nooit rijdt. Dit zou elk voertuig slimmer maken en beter voorbereid op situaties die het zelf niet heeft meegemaakt," zei Liu.
De onderzoekers noemen hun nieuwe aanpak Cached Decentralized Federated Learning (Cached-DFL). In tegenstelling tot traditionele Federated Learning, die afhankelijk is van een centrale server om updates te coördineren, stelt Cached-DFL voertuigen in staat om hun eigen AI-modellen lokaal te trainen en deze modellen direct met andere voertuigen te delen.
Wanneer voertuigen binnen 100 meter van elkaar komen, gebruiken ze snelle apparaat-naar-apparaat communicatie om getrainde modellen uit te wisselen in plaats van ruwe gegevens. Cruciaal is dat ze ook modellen kunnen doorgeven die ze hebben ontvangen van eerdere ontmoetingen, waardoor informatie verder kan verspreiden dan alleen via directe interacties. Elk voertuig houdt een cache bij van maximaal 10 externe modellen en werkt zijn AI elke 120 seconden bij. Om te voorkomen dat verouderde informatie de prestaties vermindert, verwijdert het systeem automatisch oudere modellen op basis van een vervaldrempel, zodat voertuigen de voorkeur geven aan recente en relevante kennis.
De onderzoekers testten hun systeem via computersimulaties, waarbij de straatindeling van Manhattan als sjabloon werd gebruikt. In hun experimenten bewoog het virtuele voertuig zich met een snelheid van ongeveer 14 meter per seconde over het stadsnetwerk, waarbij het bij kruispunten bochten nam op basis van waarschijnlijkheid, met een kans van 50% om rechtdoor te gaan en gelijke kans om af te slaan naar andere beschikbare wegen.
In tegenstelling tot conventionele gedecentraliseerde leermethoden, die problemen ondervinden wanneer voertuigen elkaar niet vaak ontmoeten, stelt Cached-DFL voertuigen in staat om modellen indirect door het netwerk te sturen, net zoals berichten zich verspreiden in vertragingstolerante netwerken, die zijn ontworpen om met intermitterende connectiviteit om te gaan door gegevens op te slaan en door te sturen totdat een verbinding beschikbaar is. Door als relais te fungeren, kunnen voertuigen kennis doorgeven, zelfs als ze bepaalde omstandigheden nooit persoonlijk ervaren.
"Het is een beetje zoals hoe informatie zich verspreidt in sociale netwerken," legde Liu uit. "Apparaten kunnen nu kennis doorgeven van anderen die ze hebben ontmoet, zelfs als die apparaten elkaar nooit direct tegenkomen."
Dit multi-hop overdrachtsmechanisme vermindert de beperkingen van traditionele model-uitwisselingsbenaderingen, die afhankelijk zijn van onmiddellijke één-op-één uitwisselingen. Door voertuigen als relais te laten fungeren, stelt Cached-DFL het leren in een hele vloot in staat om efficiënter te verspreiden dan wanneer elk voertuig beperkt zou zijn tot alleen directe interacties.
De technologie stelt verbonden voertuigen in staat om te leren over wegomstandigheden, verkeerslichten en obstakels, terwijl de gegevens privé blijven. Dit is vooral nuttig in steden waar auto's verschillende omstandigheden tegenkomen, maar zelden lang genoeg samenkomen voor traditionele leermethoden.
De studie toont aan dat de snelheid van het voertuig, de grootte van de cache en de vervaldatum van het model de leerefficiëntie beïnvloeden. Snellere snelheden en frequente communicatie verbeteren de resultaten, terwijl verouderde modellen de nauwkeurigheid verminderen. Een groepsgebaseerde cachingstrategie verbetert het leren verder door prioriteit te geven aan diverse modellen uit verschillende gebieden in plaats van alleen de nieuwste.
Nu AI van gecentraliseerde servers naar edge-apparaten verschuift, biedt Cached-DFL een veilige en efficiënte manier voor zelfrijdende auto's om collectief te leren, waardoor ze slimmer en adaptiever worden. Cached-DFL kan ook worden toegepast op andere netwerk systemen van slimme mobiele agenten, zoals drones, robots en satellieten, voor robuust en efficiënt gedecentraliseerd leren om zwarmintelligentie te bereiken.
De onderzoekers hebben hun code openbaar beschikbaar gesteld. Meer details zijn te vinden in hun technische rapport.
Beeld: Julien Tromeur Pixabay