SAMENVATTING

13.1 Wat is machinaal leren

Algoritmen voor machinaal leren kunnen aan de hand van een aantal gegeven voorbeelden leren classificeren. Nieuwe voorbeelden zullen ze vervolgens indelen in één van de klassen.
Voorbeelden worden gekenmerkt door hun attributen. De verzameling voorbeelden wordt ook wel de gegevensverzameling genoemd.
De algoritmen worden vaak getraind op een deel van de gegevensverzameling, de trainingset. Vervolgens wordt met het restant, ‘de testset’, gekeken hoe het algoritme de voorbeelden daarvan kan classificeren. Een maat voor de betrouwbaarheid is het generaliserend vermogen dat bepaald kan worden met n-fold cross-validation, waarbij de gegevensverzameling steeds verdeeld wordt in verschillende training- en testsets.