Feature Engineering

Het proces van creëren, selecteren en transformeren van inputvariabelen om model-prestaties te verbeteren.

Uitleg

Feature engineering is het kunst- en vakwerk van het creëren van effectieve inputvariabelen (features) voor machine learning-modellen. Goede features leiden tot betere modellen; slechte features leiden tot slechte resultaten, ongeacht het algoritme.

Feature engineering omvat: het creëren van nieuwe features door bestaande te combineren, het transformeren van features (logaritmie, normalisering), het schalen van features, en het selecteren van relevante features. Domeinkennis is cruciaal: experts weten welke features belangrijk zijn.

Automatische feature selection-methoden helpen, maar menselijke intuïtie is onvervangbaar. De uitdrukking "garbage in, garbage out" onderstreept dat data-kwaliteit en feature-kwaliteit fundamenteel zijn. Feature engineering is typisch 70-80% van het ML-werk.

Voorbeelden

  • Voor huizenprijsprognose: creëer feature "prijs per vierkante meter" uit prijs en grootte
  • Voor email-spam: creëer features voor woordfrequentie, verzender-domein, aanwezigheid van links
  • Voor weersvoorspellingen: zonnecyclus-features verbeteren temperatuur-modellen

Trefwoorden

input-creatietransformatieselectiedomain-knowledge

Gerelateerde termen

Gerelateerde begrippen

Dimensiereductie

Over deze term

Wat is Feature Engineering?

Het proces van creëren, selecteren en transformeren van inputvariabelen om model-prestaties te verbeteren.