Uitleg
De F1-score is het harmonic mean van precision en recall: F1 = 2 * (precision * recall) / (precision + recall). Het combineert beide metrieken in één getal, nuttig wanneer je balance wilt tussen false positives en false negatives.
F1-score varieert van 0 tot 1, waarbij 1 perfect is (precision=1, recall=1) en 0 het slechtst. F1-score is vooral nuttig voor ongebalanceerde datasets waar accuracy misleidend kan zijn.
F1-score is evenwichtig: het geeft gelijk gewicht aan precision en recall. Weighted F1-score kan gebruikt worden om klassen anders te wegen. Macro F1 gemiddelden F1 per klasse, micro F1 gemiddelde globally.
⚡ Voorbeelden
- •Model A: precision=0.9, recall=0.5 heeft F1=0.64. Model B: precision=0.7, recall=0.7 heeft F1=0.7 (beter)
- •Ongebalanceerde dataset: accuracy is misleidend (95% bij altijd dominant class), F1 is beter
- •Multi-class: macro F1 geeft gelijk gewicht aan alle klassen, micro F1 aan alle voorbeelden