SAMENVATTING
13.1 Wat is machinaal leren
Algoritmen voor machinaal leren
kunnen aan de hand van een aantal gegeven voorbeelden leren classificeren. Nieuwe
voorbeelden zullen ze vervolgens indelen in één van de klassen.
Voorbeelden worden gekenmerkt door hun attributen. De verzameling voorbeelden wordt ook
wel de gegevensverzameling genoemd.
De algoritmen worden vaak getraind op een deel van de gegevensverzameling, de trainingset.
Vervolgens wordt met het restant, de testset, gekeken hoe het algoritme de
voorbeelden daarvan kan classificeren. Een maat voor de betrouwbaarheid is het generaliserend vermogen
dat bepaald kan worden met n-fold cross-validation, waarbij de gegevensverzameling steeds
verdeeld wordt in verschillende training- en testsets.