Uitleg
Labels zijn de "antwoordsleutel" in je trainingsgegevens. In supervised learning heb je zowel invoer (features) als correcte antwoorden (labels) nodig.
Bijvoorbeeld: in een e-mailspam-detectiemodel zijn de invoers de e-mailinhoud, en de labels zijn "spam" of "geen spam" voor elke e-mail. Het model leert de relatie tussen invoer en label.
Labels moeten accuraat zijn. Als je labels verkeerd zijn, zal het model slechte dingen leren. Dit heet "label noise" en is een groot probleem in machine learning. Het is waarom het handmatig labelen van grote datasets duur en arbeidsintensief kan zijn.
⚡ Voorbeelden
- •In huisprijsvoorspelling: feature is "aantal kamers", label is "actuele huisprijs"
- •In beeldclassificatie: feature is "pixeldata van afbeelding", label is "kat" of "hond"
- •In sentimentanalyse: feature is "tweet tekst", label is "positief" of "negatief"