SAMENVATTING

13.5 Overfitting en probleemrepresentatie

Bij alle algoritmen voor machinaal leren moet op twee zaken gelet worden: overfitting en kennisrepresentatie.

Overfitting treedt op als een algoritme te lang getraind wordt op een trainingset. De classificatie van de trainingset wordt dan wel steeds beter, maar de classificatie van de testset wordt steeds minder goed. Op tijd stoppen met trainen en een zo eenvoudig mogelijke modellering kunnen dit probleem voorkomen.

Voorbeelden, zowel om te leren als om te testen, zullen altijd op een bepaalde wijze moeten worden gerepresenteerd, willen ze aan een algoritme voor machinaal leren kunnen worden aangeboden. Een goede keuze van de representatie kan het probleem aanmerkelijk vereenvoudigen.