Machine Learning
Algoritmen die leren van data
26 begrippenAlle begrippen
AUC
GemiddeldArea Under the Curve: één getal (0-1) dat het algehele prestatie van een classificatie-model samenvat.
Bagging
GemiddeldEen ensemble-methode die modellen parallel traint op willekeurige steekproeven met vervanging van dezelfde dataset.
Boosting
GevorderdEen ensemble-techniek die sequentieel modellen traint, waarbij elk model de fouten van vorige modellen probeert te corrigeren.
Classificatie
BeginnerEen machine learning-taak waarbij data wordt ingedeeld in vooraf gedefinieerde categorieën, zoals spam of geen spam.
Clustering
BeginnerEen unsupervised machine learning-techniek die soortgelijke gegevenspunten groepeert zonder vooraf gelabelde categorieën.
Cross-validatie
GemiddeldEen techniek om model-prestaties te evalueren door data in meerdere delen op te splitsen en herhaaldelijk te testen.
Decision Tree
GemiddeldEen machine learning-algoritme dat beslissingen neemt door vragen sequentieel te stellen, zoals een stroomdiagram van ja/nee vragen.
Dimensiereductie
GemiddeldTechnieken om het aantal features in data te verminderen terwijl belangrijke informatie behouden blijft.
Distillatie
GevorderdDistillatie is een techniek waarbij de kennis van een groot AI-model wordt overgedragen naar een kleiner, sneller model.
Ensemble-learning
GemiddeldEen techniek die veel modellen combineert om betere voorspellingen te maken dan elk model afzonderlijk.
F1-Score
GemiddeldEen enkele metriek die precision en recall in één getal combineert: harmonic mean van beiden.
Feature Engineering
GemiddeldHet proces van creëren, selecteren en transformeren van inputvariabelen om model-prestaties te verbeteren.
Gradient Descent
GemiddeldEen optimalisatie-algoritme dat stap voor stap parameters van een model aanpast om fouten te minimaliseren.
K-Means
GemiddeldEen populair ongecontroleerd leer-algoritme dat data in k clusters verdeelt door centroids te minimaliseren.
K-Nearest Neighbors
BeginnerEen simpel algoritme dat een datapunt classifieert op basis van zijn k dichtstbijzijnde buren in de trainingsset.
Lineaire Regressie
BeginnerHet eenvoudigste regressie-algoritme dat een rechte lijn fit door data om continue waarden te voorspellen.
Logistische Regressie
GemiddeldEen lineair classificatie-algoritme dat waarschijnlijkheden voorspelt met een S-vormige (sigmoid) functie.
Loss-functie
GemiddeldEen wiskundige functie die meet hoe groot de fout is tussen voorspellingen van een model en werkelijke waarden.
Naive Bayes
GemiddeldEen probabilistische classificatie-algoritme gebaseerd op Bayes-stelling met aanname van onafhankelijkheid tussen features.
PCA
GevorderdPrincipal Component Analysis: techniek om data naar lagerdimensionale ruimte te transformeren met behoud van variantie.
Precision en Recall
GemiddeldTwee belangrijke metrieken voor classificatie: precision meet juistheid, recall meet volledigheid van voorspellingen.
Random Forest
GemiddeldEen ensemble-algoritme dat veel decision trees combineert voor meer nauwkeurige voorspellingen dan één boom.
Regressie
BeginnerEen machine learning-techniek om een continu waarde te voorspellen op basis van invoergegevens, zoals huizenprijzen voorspellen.
Regularisatie
GemiddeldEen techniek die overfitting voorkomen door modellen complexiteit te beperken en grote gewichten af te straffen.
ROC-curve
GemiddeldEen grafiek die de trade-off tussen true positive rate en false positive rate toont over alle classificatie-drempels.
Support Vector Machine
GevorderdEen classificatie-algoritme dat een lijn (of hyperplane) zoekt die twee klassen het best scheidt.
Over deze categorie
Wat is Machine Learning?
Algoritmen die leren van data