Installaties hebben een belangrijke rol in de vitale processen binnen onze maatschappij. Het is van groot belang dat installaties betrouwbaar functioneren. Tegenwoordig worden veel aspecten van installaties met sensoren gemonitord. Deze monitoringdata biedt interessante kansen op het gebied van onderhoud in bijvoorbeeld de industrie-, infrastructuur-, en bouwsector, maar wordt nog zeker niet in alle gevallen ten volle benut. Hoewel er een verschuiving zichtbaar is richting conditie-afhankelijk en voorspellend onderhoud, is de conventionele methode van onderhoud, gebaseerd op statistieken (gemiddelde tijd tot falen etc.), nog altijd gangbaar. Dit heeft echter een zeer star karakter. De beschikbaarheid van data in combinatie met geavanceerde machine learning-algoritmes maakt het mogelijk dynamische onderhoudsplannen uit te voeren, waarbij anticiperend kan worden gehandeld. Dit kan een significante reductie in onderhoudskosten en uitvaltijd betekenen.
Kwaliteit van de data bepaalt betrouwbaarheid
Data kan dus gebruikt worden om met behulp van machine learning-modellen te voorspellen of onderhoud van een installatie nodig is. Uiteraard betekent dit wel dat de data betrouwbaar dient te zijn. Dit is echter niet altijd het geval. Dit kan verschillende oorzaken hebben, zoals bijvoorbeeld defecte sensoren of incorrecte labeling in registraties. Aangezien machine learning-modellen met data worden getraind, heeft dit ook een effect op de betrouwbaarheid van het voorspellende model. Daarom is het gewenst om incorrecte data uit de dataset te verwijderen alvorens een model te trainen. Dit is echter voor complexe vraagstukken zeker niet triviaal. Doordat vele aspecten een rol spelen is het vaak niet mogelijk om met klassieke statistische methoden grote afwijkingen te detecteren en te verwijderen.
Methode verwijdert zelf incorrecte data
Om een methode te ontwikkelen om betrouwbare modellen te trainen waarmee voorspellend onderhoudsplannen opgesteld kunnen worden hebben wij onderzoek gedaan naar een dataset aangaande het functioneren van waterpompen. Deze dataset bevat een grote hoeveelheid aan variabelen (zoals waterkwaliteit, hoeveelheid etc.) om uiteindelijk te voorspellen of een bepaalde waterpomp functioneert naar behoren, functioneert maar onderhoud nodig heeft of geheel niet functioneert. In dit onderzoek werd snel duidelijk dat een deel van de dataset onbetrouwbaar was. Vervolgens hebben wij een zelf-consistente methode ontwikkeld waarbij een model wordt getraind, welke iteratief wordt gebruikt om incorrecte data te verwijderen en onjuist verwijderde data ook weer terug te plaatsen. Met een correlatie-analyse wordt dit proces gecontroleerd. Hierdoor wordt de dataset gestaag opgeschoond en wordt een model getraind waarmee betrouwbare voorspellingen kunnen worden gedaan met betrekking tot benodigd onderhoud. Dit onderzoek is in een artikel samengevat en gepubliceerd op het wetenschappelijk archief HAL archives.
Publicatie HAL archives: klik hier voor de publicatie (pdf).
Voor meer informatie of vragen kunt u contact opnemen met onze adviseur Robbert-Jan Dikken. Zijn contactgegevens vindt u rechtsboven op deze pagina.