UITWERKINGEN

10.1 Classificatie

Uitwerking 10.1.1

a – Dit kan als classificatie worden opgevat als we er vanuit gaan dat er 10 klassen zijn waartoe de proefwerken kunnen behoren, de klasse met cijfer 1, de klasse met cijfer 2, enzovoorts. Op grond van de kenmerken van het proefwerk (aantal goed gemaakte opgaven en onderdelen daarvan) zal de leraar vaststellen tot welke klasse het behoort.
b – Dit is zeker als classificatie op te vatten: spotters letten op allerlei kenmerken en details van vliegtuigen om vast te stellen met wat voor type ze te maken hebben. Ervaren spotters kunnen gedetailleerder vast stellen met voor type ze te maken hebben (een Boeing uit dat en dat jaar, gebouwd voor die en die maatschappij en gebruikt voor een bepaalde taak), dan onervaren spotters (dat is een Boeing).
c – Dit is zeker classificatie. Op grond van kenmerken als instrumentatie, basisritmes en muziekpatronen wordt vastgesteld van wat voor muziek er sprake is, klassiek, jazz, pop, of meer gedetailleerd ska, funk, hiphop, house, enzovoorts.
d – Het maken van een indeling van muziekstijlen is eigenlijk het maken van klassen waaraan concrete muziek-CD’s kunnen worden toegewezen. Dit valt dus niet onder classificatie zelf, maar is wel noodzakelijk om later te kunnen gaan classificeren.
e – Het onderzoeken van een patiėnt door een arts is geen classificatie. Tijdens een onderzoek stelt een arts allerlei kenmerken vast. Pas op grond van die kenmerken zal hij gaan kunnen classificeren. Overigens zal in de praktijk het classificatieproces (het vaststellen van de ziekte van een patiėnt) niet makkelijk te onderscheiden zijn van de andere activiteiten van de arts. Op grond van eerste waarnemingen zal een arts al een eerste classificatie uitvoeren en vervolgens door onderzoek nadere gegevens verzamelen om preciezer te kunnen classificeren.
f –Op basis van de kenmerken van het ziektebeeld kiest de arts voor een bepaalde therapie of medicatie. Als we er vanuit gaan dat voor iedere therapie of medicatie bekend iw welke ziektebeelden er mee bestreden kunnen worden, hebben we hier dus met classificatie te maken.

> Opgave 10.1.1

Uitwerking 10.1.2

a – Gegevensruimte: {zwaarden, rechte steven, ronde bodem}. Ieder van de elementen van deze verzameling kan 0 of 1 zijn (of onbekend).
Oplossingsruimte: {botter, skūtsje, hoogaars, schokker, Staverse bol}

b
f1001.gif (1357 bytes)

c – De gegevensvector is in dit geval (1, 0, ?). Door de gegevens te propageren, komen bij de oplossingsklassen de volgende vectoren te staan:
– botter (1, 1, ?)
– skūtsje (1, 1, ?)
– hoogaars (1, 0, ?)
– schokker (1, 0, ?)
– Staverse bol (0, 1, ?)
De eerste twee zijn dus consistent met de gegevens, de laatste drie niet.
d – Om de tabel met de afbeeldingsrelatie op te stellen moet voor iedere klasse worden nagegaan wat de waarden van de relevante gegevens moeten zijn om een object tot de betreffende klasse toe te delen. In dit geval blijken alle gegevens relevant te zijn, zodat de tabel geen vraagtekens bevat. De tabel gaat er als volgt uit zien:

Afbeeldingsrelatie

  S1 S2 S3 S4 S5
D1 1 1 1 1 0
D2 0 0 1 1 0
D3 1 0 0 1 1

> Opgave 10.1.2

Uitwerking 10.1.3

Zie de uitwerking van opgave 1 op pagina 840 van Stefik (waar op pagina 840 ‘Section 7.1’ staat moet ‘Section 7.2’ staan).

> Opgave 10.1.3

Uitwerking 10.1.4

a – Een hiėrarchische indeling ziet er als volgt uit:

f1002.gif (2407 bytes)

b – Als we de gegevens D1 tot en met D12 noemen, er vanuit gaande dat met ieder van die gegevens een bepaalde klasse wordt gekarakteriseerd, dan kan het classificatieprobleem als volgt grafisch worden weergegeven, waarbij we gebruik maken van de hiėrarchische structuur in de oplossingsverzameling:

f1003.gif (2536 bytes)

c – Uitgaande van wederzijdse uitsluiting (mutual exclusief) concluderen we dat we met een skūtsje te maken hebben.

> Opgave 10.1.4

Uitwerking 10.1.5

(Dit is de uitwerking van opgave 2 op pagina 557 in ‘Introduction to knowledge systems’)

Door bij iedere klasse de vector op te schrijven met het minimaal aantal gegevens dat bekend moet zijn om tot de betreffende klasse te kunnen besluiten, wordt een aantal vectoren verkregen dat redelijk gemakkelijk kan worden vergeleken. De vectoren bij de verschillende klassen zijn:

S1: (1, 1, ?, 1, ?, ?, ?, ?)
S2: (?, 1, ?, 1, ?, ?, ?, ?)
S3: (?, 1, 1, 1, ?, ?, ?, ?)
S4: (?, ?, ?, 1, ?, ?, ?, ?)
S5: (?, ?, ?, ?, 1, 1, ?, ?)
S6: (?, ?, ?, 1, ?, 1, 1, ?)
S7: (?, ?, ?, 1, ?, 1, 1, 1)
S8: (?, ?, ?, ?, ?, ?, ?, ?)

Nu is gemakkelijk in te zien dat S4 ouder is van S2 en S6 , S2 ouder is van S1 en S3 , enzovoorts. De grafische weergave van de hiėrarchische classificator kan nu worden getekend:

f1004.gif (1468 bytes)

> Opgave 10.1.5

Uitwerking 10.1.6

(Dit is de uitwerking van opgave 3 op pagina 557/559 in ‘Introduction to knowledge systems’)

  consistente klassen meest specifiek overeenstemmende verwijderd op grond van wederzijdse uitsluiting inconsitente gegevens
a S4, S6 S6 nee
b S4, S6, S7 S7 nee
c S1, S2, S3, S4 S3 S5 nee
d S1 – S7 S2, S7 ? ja
e S1 – S7, S9 S9 S1 – S7 nee
f S1 – S7, S9 S2, S9 S1, S3 – S7 ja
g S1 – S4 S1, S3 ? ja
h S2, S4 S2 nee
i S9 nee

> Opgave 10.1.6

Uitwerking 10.1.7

Zie de uitwerking van opgave 4 op pagina 840/841 van Stefik (waar op pagina 840 ‘Section 7.1’ staat moet ‘Section 7.2’ staan).

> Opgave 10.1.7

Uitwerking 10.1.8

(Dit is de uitwerking van opgave 5 op pagina 559/560 in ‘Introduction to knowledge systems’)

a – D1, D4, D6
b – consistent: S1, S2, S3; inconsistent: S4, S5; overeenkomst: S1; unieke oplossing veronderstelling: S1
c – consistent: S1, S2, S3; inconsistent: S4, S5; overeenkomst: S1, S3; als een unieke oplossing wordt verondersteld, dan zijn de gegevens inconsistent.

> Opgave 10.1.8