10.3 Classificatiemethoden
In deze paragraaf worden enkele methoden geïntroduceerd die als basis kunnen dienen voor de implementatie van classificatiesystemen. Uitgegaan wordt van een zeer simpele methode,
MC-1, waarbij op basis van de bekende gegevens direct klassen worden gezocht die een oplossing kunnen zijn. Deze extreem simpele methode wordt in een paar stappen verfijnd tot MC-4, waarbij steeds meer gebruik wordt gemaakt van de kennis over de gegevens en de oplossingen.Voordat de methoden worden behandeld, wordt nog kort ingegaan op het kennisniveau en het symboolniveau bij classificatiemethoden.
10.3.1 Kennis- en symboolniveau bij classificatiemethoden
Lees uit Stefik: paragrafen 7.4 en 7.4.1 (pagina 588 tot en met 592).
Stefik rekent de data-abstractie, afbeeldingsrelaties en verfijningsrelaties tot het kennisniveau van de classificatiemethoden. De wijze waarop gegevens en conclusies in het systeem worden gerepresenteerd en de algoritmen voor het vinden van oplossingen, zoals de verschillende zoekmethoden, rekent hij tot het symboolniveau.
10.3.2 Classificatie door uitputtend testen
Lees uit Stefik:paragraaf 7.4.2 (pagina 592 en 593).
De methode
MC-1 is de simpelste methode die voor classificatie gebruikt kan worden: ga met de beschikbare data een voor een alle mogelijke oplossingen na. Aan kwesties zoals het ontbreken van gegevens of het overblijven van verschillende oplossingen wordt geen aandacht besteed. Ook wordt niet ingegaan op eventuele data-abstractie.10.3.3 Reductie van het aantal mogelijke oplossingen
Lees uit Stefik: paragraaf 7.4.3 (pagina 593 en 594).
Als er mogelijkheden zijn op eenvoudige wijze het aantal kandidaat-oplossingen sterk te beperken, dan kan veel sneller worden geclassificeerd. Als bijvoorbeeld op grond van één bekend gegeven 90 % van de kandidaatoplossingen kan worden verwijderd, dan hoeft nog slechts de resterende 10 % te worden doorzocht. Eén van de manieren daarvoor is data-abstractie. Van de beschikbare gegevens wordt geabstraheerd door een algemenere omschrijving van de gegevens te geven, waar mogelijk maar een beperkt deel van de oplossingsverzameling aan voldoet.
In de methode
MC-2 wordt nog nauwelijks aandacht besteed aan stopcriteria of eventuele andere complicaties zoals meer of geen oplossingen.10.3.4 Classificatie met gebruikmaking van hiërarchie in de oplossingsverzameling.
Lees uit Stefik: paragraaf 7.4.4 (pagina 594 tot en met 596).
Als de oplossingsverzameling hiërarchisch is gestructureerd, kan efficiënt naar kandidaatoplossingen worden gezocht: zodra een bepaalde klasse niet overeenkomt met de gegevens, kan de klasse, inclusief subklassen, worden verwijderd van de lijst met mogelijke oplossingen. Door breadth-first te zoeken kan dit tot een snelle reductie van het aantal mogelijke oplossingen leiden.
In de methode
MC-3 wordt breadth-first gezocht, hetgeen betekent dat de knooppunten van de oplossingshiërarchie in een vaste volgorde worden doorlopen. Zijn er onvoldoende gegevens bekend om een bepaalde klasse al dan niet te accepteren, dan zullen aanvullende gegevens beschikbaar moeten komen.10.3.5 Gegevensgestuurde hiërarchische classificatie
Lees uit Stefik: paragraaf 7.4.5 (pagina 596 tot en met 599).
In het algemeen zullen een aantal, maar nog niet alle gegevens beschikbaar zijn om een object te classificeren. In de methode
MC-3 wordt uitgegaan van de hiërarchische structurering van de oplossingsverzameling, die altijd op dezelfde wijze wordt doorzocht. Dit kan leiden tot het opvragen van gegevens die niet relevant zijn.In de methode
MC-4 wordt op basis van de beschikbare gegevens bij aanvang van het classificatieproces eerst nagegaan welke oplossingsklassen de gegevens kunnen verklaren. Vervolgens wordt uitgaande van deze klassen doorgezocht.10.3.6 Praktijkvoorbeelden van classificatiemethoden
Lees uit Stefik: paragrafen 7.4.6, 7.47 en 7.5 (pagina 599 tot en met 607).
Op pagina 599 staat 7.3.6 waar 7.4.6 had moeten staan.