Uitleg
Dimensiereductie maakt het aantal features (dimensies) in data kleiner. Dit helpt omdat veel features tot inefficiëntie leiden: langzamere training, meer overfitting, en moeilijkere interpretatie. Bovendien zijn veel features often redundant of irrelevant.
Er zijn twee benaderingen: feature selection (kies subset van bestaande features) en feature extraction (creëer nieuwe features die veel informatie samenvatten). PCA is een populaire feature extraction-methode. t-SNE en UMAP worden veel gebruikt voor visualisatie.
Dimensiereductie verbetert model-prestaties, training-snelheid, en interpreteerbaarheid. Het helpt ook "curse of dimensionality" te bestrijden waarbij modellen slecht presteren in hoog-dimensionale ruimtes met beperkte data.
⚡ Voorbeelden
- •PCA reduceert 1000 pixel-features van afbeeldingen tot 50 components met minimaal informatie-verlies
- •Feature selection verwijdert irrelevante features, versnelling van modeltraining met 10x
- •t-SNE visualiseert 100-dimensionale data in 2D voor menselijk begrip