Steven 19.07.2019
Je leest veel verschillende termen: Machine Learning (ML), Artificial Intelligence (AI), Augmented Reality (AR), Internet of Things (IoT), …
Machine Learning is een onderdeel van AI . Het past de techniek van AI toe op machines. Het algoritme leert om zelfstandig te beslissen op basis van training.
Augmented Reality en IoT staan hier los van. We bespreken deze termen in een volgende artikel meer in detail.
ML baseert zich op een algoritme dat data analyseert en er een betekenis aan geeft. Het algoritme start altijd van een ruwe dataset. Dat is meestal de productiedata van jouw machine. Om bruikbare informatie uit die data te halen is een analyse nodig. Het is die analyse die via Machine Learning automatisch verloopt.
Een goed voorbeeld uit de computerwereld is de detectie van spam-emails. De ruwe data zijn de emails die de gebruiker ontvangt. Om uit te maken of de email spam is, is een analyse nodig.
De analyse van machine-data gaat verder dan klassieke evaluaties (min/max, gemiddelde, …). Uit de data worden eerst kenmerken (features) gehaald. Die features verwerkt het ML algoritme vervolgens in een resultaat (label).
Het algoritme bepaalt zelf hoe de verschillende features zich tot mekaar verhouden. Je hoeft als gebruiker geen verband tussen deze features op te geven. Let er wel op dat je alle features van invloed opgeeft. Zo is het bijvoorbeeld veel moeilijker om een email als spam aan te duiden wanneer je de afzender van de email niet kent.
Machine Learning gebruik je wanneer je beschikt over een grote dataset die continu groeit. Zo’n dataset manueel analyseren is tijdrovend en inefficient. Met Machine Learning haal je nuttige informatie uit de dataset.
Stel je even voor dat je een ML algoritme hebt opgezet. Het algoritme geeft jouw betrouwbare labels uit jouw dataset. Vraag jezelf af wat je hier nu mee kan doen:
Begin met jezelf deze drie vragen te stellen:
Indien de data zelf onvolledig is, kan Machine Learning je niet helpen. Zoals altijd geldt ook hier dat interpretatie van het resultaat nodig is.
Stel daarna zowel geklasseerde als niet-geklasseerde data beschikbaar aan het ML-algoritme. Hiermee train je het algoritme. Geklasseerde data is data die voorzien is van een label. Niet-geklasseerde data heeft nog geen label. Geklasseerde data bestaat vervolgens uit labels met hoge betrouwbaarheid (door bv. eigen verificatie) en labels met lage betrouwbaarheid (bv. toegekend met een andere methode).
De moeilijkste stap is het verzamelen van een goede dataset en het formuleren van een goed label. Een Machine Learning algoritme opzetten is heel eenvoudig geworden. Je kan hiervoor online bibliotheken gebruiken.
Data logger voor lasapparatuur. Data opslag in een centrale database, met uitgebreide visualisatie en filter mogelijkheden.
Reageren