Machine Learning: wat en hoe?

Steven      19.07.2019

Wat is Machine Learning

Je leest veel verschillende termen: Machine Learning (ML), Artificial Intelligence (AI), Augmented Reality (AR), Internet of Things (IoT), ...

Machine Learning is een onderdeel van AI . Het past de techniek van AI toe op machines. Het algoritme leert om zelfstandig te beslissen op basis van training.

Augmented Reality en IoT staan hier los van. We bespreken deze termen in een volgende artikel meer in detail.

Het principe achter Machine Learning

ML baseert zich op een algoritme dat data analyseert en er een betekenis aan geeft. Het algoritme start altijd van een ruwe dataset. Dat is meestal de productiedata van jouw machine. Om bruikbare informatie uit die data te halen is een analyse nodig. Het is die analyse die via Machine Learning automatisch verloopt.

Een goed voorbeeld uit de computerwereld is de detectie van spam-emails. De ruwe data zijn de emails die de gebruiker ontvangt. Om uit te maken of de email spam is, is een analyse nodig.

De analyse van machine-data gaat verder dan klassieke evaluaties (min/max, gemiddelde, ...). Uit de data worden eerst kenmerken (features) gehaald. Die features verwerkt het ML algoritme vervolgens in een resultaat (label).

Het algoritme bepaalt zelf hoe de verschillende features zich tot mekaar verhouden. Je hoeft als gebruiker geen verband tussen deze features op te geven. Let er wel op dat je alle features van invloed opgeeft. Zo is het bijvoorbeeld veel moeilijker om een email als spam aan te duiden wanneer je de afzender van de email niet kent.

Wanneer gebruik je Machine Learning

Machine Learning gebruik je wanneer je beschikt over een grote dataset die continu groeit. Zo'n dataset manueel analyseren is tijdrovend en inefficient. Met Machine Learning haal je nuttige informatie uit de dataset.

Stel je even voor dat je een ML algoritme hebt opgezet. Het algoritme geeft jouw betrouwbare labels uit jouw dataset. Vraag jezelf af wat je hier nu mee kan doen:

  • Kan je besparen op onderhoud van de machine? 
  • Detecteer je vroegtijdig kwaliteits-afwijkingen?
  • Optimaliseer je de productieplanning?

Hoe begin je eraan

Begin met jezelf deze drie vragen te stellen:

  1. Welke eigenschap wil je uit jouw dataset halen?
  2. Hoe ziet jouw dataset eruit?
  3. Welke eigenschappen hebben invloed op een betrouwbaar resultaat?

Indien de data zelf onvolledig is, kan Machine Learning je niet helpen. Zoals altijd geldt ook hier dat interpretatie van het resultaat nodig is.

Stel daarna zowel geklasseerde als niet-geklasseerde data beschikbaar aan het ML-algoritme. Hiermee train je het algoritme. Geklasseerde data is data die voorzien is van een label. Niet-geklasseerde data heeft nog geen label. Geklasseerde data bestaat vervolgens uit labels met hoge betrouwbaarheid (door bv. eigen verificatie) en labels met lage betrouwbaarheid (bv. toegekend met een andere methode).

En nu?

De moeilijkste stap is het verzamelen van een goede dataset en het formuleren van een goed label. Een Machine Learning algoritme opzetten is heel eenvoudig geworden. Je kan hiervoor online bibliotheken gebruiken.

Trefwoorden klik voor meer informatie

Interessant? gebruik de knoppen om te delen


Lees ook

Metabase data analyse

Big data eenvoudig voorgesteld met Metabase

Steven      18.11.2019

Steeds vaker is de data set zeer groot of dynamisch. Dit artikel bespreekt hoe Metabase big data snel visualiseert en interpreteert.
Keep node.js application running on shared hosting

How to keep node.js running on shared hosting

Steven      02.08.2019

Here is how to keep your node.js application running on shared hosting. It uses the pm2 process manager and crontab jobs to check and restart.
webapplicatie VSE Technologies - datalogging & monitoring lasapparatuur

VSE technologies - datalogging & visualisatie van lasapparatuur

De VSE Technologies datalogger verzamelt data van de lasapparatuur. Een centrale database slaat deze op. Een gebruikersinterface geeft de data weer, en laat eenvoudig filteren toe.