Uitleg
Spraakherkenning (speech recognition) gebruikt deep neural networks om audio in tekst om te zetten. Dit is kernfunctionaliteit van virtuele assistenten, dicteersoftware en tolken. Modern spraakherkenning bereikt menselijk-niveau nauwkeurigheid.
Transformer-modellen hebben spraakherkenning revolutionair verbeterd.
⚡ Voorbeelden
- •Google Speech API transcribeert spreken naar tekst
- •Zoom real-time subtiteling via spraakherkenning
- •Dicteersoftware voor handen-vrije tekstinvoer
Trefwoorden
audiotranscriptiespraaktekstnauwkeurig