Wat is OCR en hoe werkt het?
Je scant een document of maakt een foto van een gedrukte pagina, en je krijgt een afbeeldingsbestand. Het ziet eruit als tekst, maar voor een computer is het slechts pixels -- rijen en rijen kleurgegevens zonder begrip van de letters, woorden of betekenis die ze vertegenwoordigen. Optische Tekenherkenning, universeel bekend als OCR, is de technologie die deze kloof overbrugt. Het analyseert de vormen in een afbeelding en zet ze om in daadwerkelijke teksttekens die je kunt zoeken, selecteren, kopiëren, bewerken en vertalen.
Hoe OCR werkt: het technische proces
1. Beeldvoorbewerking
Voordat de tekst wordt geanalyseerd, maakt de OCR-software de afbeelding schoon. Dit omvat het converteren naar grijswaarden, het aanpassen van helderheid en contrast, het verwijderen van ruis en het rechtzetten van scheefstand of rotatie.
2. Lay-outanalyse
De software identificeert de structuur van de pagina: waar zijn de kolommen, koppen, alinea's, afbeeldingen, tabellen en bijschriften?
3. Tekensegmentatie
Elke tekstregel wordt opgebroken in individuele tekens.
4. Tekenherkenning
Dit is de kern van OCR. Elk gesegmenteerd teken wordt vergeleken met een database van bekende tekenvormen. Moderne systemen gebruiken convolutionele neurale netwerken (CNN's) die zijn getraind op miljoenen tekstmonsters.
5. Nabewerking
De herkende tekst wordt verfijnd met behulp van woordenboeken en taalmodellen.
Waarvoor kan OCR worden gebruikt?
- Gescande documenten doorzoekbaar maken. Na het uitvoeren van OCR kun je zoeken op specifieke woorden in duizenden gescande pagina's.
- Gedrukte boeken en artikelen digitaliseren.
- Gegevens extraheren uit bonnetjes en facturen.
- Tekst in foto's lezen. Vertaal-apps gebruiken OCR om tekst op borden, menu's en productlabels te identificeren.
- Formulieren en aanvragen verwerken.
- Toegankelijkheid. Schermlezers kunnen OCR-verwerkte tekst hardop voorlezen.
OCR op je iPhone
Je iPhone is een krachtig OCR-apparaat. Met de juiste app kun je een pagina scannen met de camera en binnen seconden volledig doorzoekbare, selecteerbare tekst hebben. PDF Creator - Scanner & OCR combineert een hoogwaardige documentscanner met een nauwkeurige OCR-engine, waardoor elk fysiek document wordt omgezet in een doorzoekbare, bewerkbare PDF. Scan, herken en beheer je documenten op één plek met 29 professionele PDF-tools binnen handbereik.