INTRODUCTIE

13 Machinaal leren

Automatische leertechnieken spelen in toenemende mate een rol in de kennistechnologie. Met behulp van deze technieken kan een computer automatisch kennisrepresentaties genereren zonder dat daarbij een expliciete beschrijving van die kennis nodig is. In zekere zin lijkt machinaal leren op menselijk leren. Door confrontatie met een verzameling voorbeelden uit een of meer klassen, tracht het leeralgoritme de discriminerende en generaliserende kenmerken te extraheren die bepalend zijn voor het lidmaatschap van een klasse.

Een voorbeeld van een toepassing is het herkennen van handgeschreven postcodes. Het is bijzonder moeilijk gebleken een expliciete kennisrepresentatie (bijvoorbeeld een verzameling als-dan-regels) te definiëren van handgeschreven letters en cijfers. Maar een automatische leertechniek is wel in staat om uit een groot aantal voorbeelden van handgeschreven postcodes automatisch een kennisrepresentatie op te bouwen, op basis waarvan nieuwe voorbeelden kunnen worden herkend.

Leertechnieken worden toegepast op twee typen van taken: classificatietaken (zoals het herkennen van postcodes) en regressietaken (bijvoorbeeld het voorspellen van beurskoersen). Dit hoofdstuk beperkt zich tot de toepassing van leeralgoritmen op classificatietaken (zie hoofdstuk 10). Het onderzoeksgebied dat zich bezighoudt met automatische leertechnieken staat bekend als machine learning of machinaal leren.

Leeralgoritmen zijn goed te karakteriseren door de mate waarin ze abstraheren uit de verzameling leervoorbeelden. Zo bestaan er leeralgoritmen die in het geheel niet abstraheren, omdat de geleerde kennisrepresentatie enkel bestaat uit letterlijke kopieën van alle leervoorbeelden. Daarentegen zijn er ook leeralgoritmen die volledig abstraheren, door bijvoorbeeld een verzameling voorbeelden samen te vatten in één of meer regels. Dit hoofdstuk geeft een overzicht van machinaal leren (ml) door het bespreken van enkele veelgebruikte leeralgoritmen op het abstractiecontinuüm.