OPGAVEN
13.1 Wat is machinaal leren
Veronderstel dat een bank de gegevens van alle cliënten aan algoritmevoor een machinaal leren wil aanbieden om de kredietwaardigheid van nieuwe cliënten te voorspellen. Bedenk een aantal attributen (minimaal 6) dat voor deze taak van belang is, en geef de daarbij behorende attribuutwaarden.
Wat kunt u zeggen over het generaliserend vermogen van een machinaal leren algoritme
toegepast op een gegevensverzameling indien na training:
de prestatie op de trainingset hoger is dan de prestatie op de testset
de prestatie op de trainingset gelijk is aan de prestatie op de testset.
Gegeven is een gegevensverzameling bestaande uit 100 voorbeelden, genummerd van 1 t/m 100. Op welke wijzen wordt de gegevensverzameling opgedeeld in training- en testsets wanneer gebruik wordt gemaakt van de methode n-fold cv voor n = 2 en n = 4?