OPGAVEN
13.2 Memory-based learning
Ve volgende tien voorbeelden representeren een gegevensverzameling waarbij de twee attributen respectievelijk de lengte en de breedte van een persoon representeren. Ieder voorbeeld is gelabeld met het geslacht van de bijbehorende persoon.
voorbeeld | lengte (m) | breedte (m) | geslacht |
1 | 2,0 | 0,45 | M |
2 | 1,6 | 0,40 | V |
3 | 1,7 | 0,45 | M |
4 | 1,4 | 0,40 | V |
5 | 1,5 | 0,45 | M |
6 | 1,7 | 0,35 | V |
7 | 1,8 | 0,60 | M |
8 | 1,7 | 0,45 | V |
9 | 1,9 | 0,40 | M |
10 | 1,5 | 0,50 | V |
a Bepaal de classificatie van voorbeeld 1 met een 1-nearest neighbour algoritme.
b Bepaal de classificatie van voorbeeld 1 met een 3-nearest neighbour algoritme.
In sommige implementaties van het 1-nn-algoritme wordt de wortel uit de formule voor de
afstand achterwege gelaten. Stel, een computer heeft voor de berekening van de term (a
b)2 precies t tijdseenheden nodig.
a Hoeveel tijdseenheden nemen de berekeningen voor classificatie van een nieuw
voorbeeld in beslag, indien het aantal attributen per voorbeeld 2 is en het aantal
opgeslagen voorbeelden 10 is?
b Beantwoordt vraag a voor 2 attributen en 100 voorbeelden.
c Beantwoordt vraag a voor 4 attributen en 100 voorbeelden.