OCR

Optical Character Recognition - techniek om gedrukte of handgeschreven tekst in afbeeldingen in editable tekst om te zetten.

Uitleg

OCR (Optical Character Recognition) zet afbeeldingen van tekst in machine-leesbare tekst om. Gegeven een foto van een document of handschrift, extraheert OCR de werkelijke karakters.

Traditionale OCR gebruikte patroonherkenning; moderne OCR gebruikt deep learning. CNN's herkennen karakters met hoge nauwkeurigheid, zelfs met verschillende fonts, rotaties en kwaliteit.

OCR heeft veel toepassingen: documentverwerking, archieven digitalisering, credit card/ID scanning en meer. Het is nu so goed dat even handschrift kan worden herkend.

Voorbeelden

  • Scannen van fysieke documenten met je smartphone converteert ze automatisch naar editable PDF
  • Banken gebruiken OCR voor cheque-processing en het extracteren van bedragen uit documenten
  • Google Lens gebruikt OCR om tekst van menu's en borden te lezen en te vertalen

Trefwoorden

tekstherkenningdigitaliseringdocument-verwerkingkarakter-extractie

Gerelateerde termen

Gerelateerde begrippen

Beeldherkenning

Over deze term

Wat is OCR?

Optical Character Recognition - techniek om gedrukte of handgeschreven tekst in afbeeldingen in editable tekst om te zetten.