UITWERKINGEN
10.1 Classificatie
a Dit kan als classificatie worden opgevat als we er vanuit gaan dat er 10
klassen zijn waartoe de proefwerken kunnen behoren, de klasse met cijfer 1, de klasse met
cijfer 2, enzovoorts. Op grond van de kenmerken van het proefwerk (aantal goed gemaakte
opgaven en onderdelen daarvan) zal de leraar vaststellen tot welke klasse het behoort.
b Dit is zeker als classificatie op te vatten: spotters letten op allerlei
kenmerken en details van vliegtuigen om vast te stellen met wat voor type ze te maken
hebben. Ervaren spotters kunnen gedetailleerder vast stellen met voor type ze te maken
hebben (een Boeing uit dat en dat jaar, gebouwd voor die en die maatschappij en gebruikt
voor een bepaalde taak), dan onervaren spotters (dat is een Boeing).
c Dit is zeker classificatie. Op grond van kenmerken als instrumentatie,
basisritmes en muziekpatronen wordt vastgesteld van wat voor muziek er sprake is,
klassiek, jazz, pop, of meer gedetailleerd ska, funk, hiphop, house, enzovoorts.
d Het maken van een indeling van muziekstijlen is eigenlijk het maken van klassen
waaraan concrete muziek-CDs kunnen worden toegewezen. Dit valt dus niet onder
classificatie zelf, maar is wel noodzakelijk om later te kunnen gaan classificeren.
e Het onderzoeken van een patiėnt door een arts is geen classificatie. Tijdens een
onderzoek stelt een arts allerlei kenmerken vast. Pas op grond van die kenmerken zal hij
gaan kunnen classificeren. Overigens zal in de praktijk het classificatieproces (het
vaststellen van de ziekte van een patiėnt) niet makkelijk te onderscheiden zijn van de
andere activiteiten van de arts. Op grond van eerste waarnemingen zal een arts al een
eerste classificatie uitvoeren en vervolgens door onderzoek nadere gegevens verzamelen om
preciezer te kunnen classificeren.
f Op basis van de kenmerken van het ziektebeeld kiest de arts voor een bepaalde
therapie of medicatie. Als we er vanuit gaan dat voor iedere therapie of medicatie bekend
iw welke ziektebeelden er mee bestreden kunnen worden, hebben we hier dus met
classificatie te maken.
a Gegevensruimte: {zwaarden, rechte steven, ronde bodem}. Ieder van de elementen
van deze verzameling kan 0 of 1 zijn (of onbekend).
Oplossingsruimte: {botter, skūtsje, hoogaars, schokker, Staverse bol}
b
c De gegevensvector is in dit geval (1, 0, ?). Door de gegevens te propageren,
komen bij de oplossingsklassen de volgende vectoren te staan:
botter (1, 1, ?)
skūtsje (1, 1, ?)
hoogaars (1, 0, ?)
schokker (1, 0, ?)
Staverse bol (0, 1, ?)
De eerste twee zijn dus consistent met de gegevens, de laatste drie niet.
d Om de tabel met de afbeeldingsrelatie op te stellen moet voor iedere klasse
worden nagegaan wat de waarden van de relevante gegevens moeten zijn om een object tot de
betreffende klasse toe te delen. In dit geval blijken alle gegevens relevant te zijn,
zodat de tabel geen vraagtekens bevat. De tabel gaat er als volgt uit zien:
Afbeeldingsrelatie
S1 | S2 | S3 | S4 | S5 | |
D1 | 1 | 1 | 1 | 1 | 0 |
D2 | 0 | 0 | 1 | 1 | 0 |
D3 | 1 | 0 | 0 | 1 | 1 |
Zie de uitwerking van opgave 1 op pagina 840 van Stefik (waar op pagina 840 Section 7.1 staat moet Section 7.2 staan).
a Een hiėrarchische indeling ziet er als volgt uit:
b Als we de gegevens D1 tot en met D12 noemen, er vanuit gaande dat met ieder van die gegevens een bepaalde klasse wordt gekarakteriseerd, dan kan het classificatieprobleem als volgt grafisch worden weergegeven, waarbij we gebruik maken van de hiėrarchische structuur in de oplossingsverzameling:
c Uitgaande van wederzijdse uitsluiting (mutual exclusief) concluderen we dat we met een skūtsje te maken hebben.
(Dit is de uitwerking van opgave 2 op pagina 557 in Introduction to knowledge systems)
Door bij iedere klasse de vector op te schrijven met het minimaal aantal gegevens dat bekend moet zijn om tot de betreffende klasse te kunnen besluiten, wordt een aantal vectoren verkregen dat redelijk gemakkelijk kan worden vergeleken. De vectoren bij de verschillende klassen zijn:
S1: (1, 1, ?, 1, ?, ?, ?, ?)
S2: (?, 1, ?, 1, ?, ?, ?, ?)
S3: (?, 1, 1, 1, ?, ?, ?, ?)
S4: (?, ?, ?, 1, ?, ?, ?, ?)
S5: (?, ?, ?, ?, 1, 1, ?, ?)
S6: (?, ?, ?, 1, ?, 1, 1, ?)
S7: (?, ?, ?, 1, ?, 1, 1, 1)
S8: (?, ?, ?, ?, ?, ?, ?, ?)
Nu is gemakkelijk in te zien dat S4 ouder is van S2 en S6 , S2 ouder is van S1 en S3 , enzovoorts. De grafische weergave van de hiėrarchische classificator kan nu worden getekend:
(Dit is de uitwerking van opgave 3 op pagina 557/559 in Introduction to knowledge systems)
consistente klassen | meest specifiek overeenstemmende | verwijderd op grond van wederzijdse uitsluiting | inconsitente gegevens | |
a | S4, S6 | S6 | | nee |
b | S4, S6, S7 | S7 | | nee |
c | S1, S2, S3, S4 | S3 | S5 | nee |
d | S1 S7 | S2, S7 | ? | ja |
e | S1 S7, S9 | S9 | S1 S7 | nee |
f | S1 S7, S9 | S2, S9 | S1, S3 S7 | ja |
g | S1 S4 | S1, S3 | ? | ja |
h | S2, S4 | S2 | | nee |
i | S9 | | | nee |
Zie de uitwerking van opgave 4 op pagina 840/841 van Stefik (waar op pagina 840 Section 7.1 staat moet Section 7.2 staan).
(Dit is de uitwerking van opgave 5 op pagina 559/560 in Introduction to knowledge systems)
a D1, D4, D6
b consistent: S1, S2, S3; inconsistent: S4,
S5; overeenkomst: S1; unieke oplossing veronderstelling: S1
c consistent: S1, S2, S3; inconsistent: S4,
S5; overeenkomst: S1, S3; als een unieke oplossing wordt
verondersteld, dan zijn de gegevens inconsistent.