Wat is OCR en hoe werkt het?

Optische tekenherkenning (OCR) uitgelegd in eenvoudige taal. Leer hoe OCR afbeeldingen en scans omzet in doorzoekbare tekst, de toepassingen, beperkingen en beste apps.

Wat is OCR en hoe werkt het?

Je scant een document of maakt een foto van een gedrukte pagina, en je krijgt een afbeeldingsbestand. Het ziet eruit als tekst, maar voor een computer is het slechts pixels -- rijen en rijen kleurgegevens zonder begrip van de letters, woorden of betekenis die ze vertegenwoordigen. Optische Tekenherkenning, universeel bekend als OCR, is de technologie die deze kloof overbrugt. Het analyseert de vormen in een afbeelding en zet ze om in daadwerkelijke teksttekens die je kunt zoeken, selecteren, kopiëren, bewerken en vertalen.

Hoe OCR werkt: het technische proces

1. Beeldvoorbewerking

Voordat de tekst wordt geanalyseerd, maakt de OCR-software de afbeelding schoon. Dit omvat het converteren naar grijswaarden, het aanpassen van helderheid en contrast, het verwijderen van ruis en het rechtzetten van scheefstand of rotatie.

2. Lay-outanalyse

De software identificeert de structuur van de pagina: waar zijn de kolommen, koppen, alinea's, afbeeldingen, tabellen en bijschriften?

3. Tekensegmentatie

Elke tekstregel wordt opgebroken in individuele tekens.

4. Tekenherkenning

Dit is de kern van OCR. Elk gesegmenteerd teken wordt vergeleken met een database van bekende tekenvormen. Moderne systemen gebruiken convolutionele neurale netwerken (CNN's) die zijn getraind op miljoenen tekstmonsters.

5. Nabewerking

De herkende tekst wordt verfijnd met behulp van woordenboeken en taalmodellen.

Waarvoor kan OCR worden gebruikt?

  • Gescande documenten doorzoekbaar maken. Na het uitvoeren van OCR kun je zoeken op specifieke woorden in duizenden gescande pagina's.
  • Gedrukte boeken en artikelen digitaliseren.
  • Gegevens extraheren uit bonnetjes en facturen.
  • Tekst in foto's lezen. Vertaal-apps gebruiken OCR om tekst op borden, menu's en productlabels te identificeren.
  • Formulieren en aanvragen verwerken.
  • Toegankelijkheid. Schermlezers kunnen OCR-verwerkte tekst hardop voorlezen.

OCR op je iPhone

Je iPhone is een krachtig OCR-apparaat. Met de juiste app kun je een pagina scannen met de camera en binnen seconden volledig doorzoekbare, selecteerbare tekst hebben. PDF Creator - Scanner & OCR combineert een hoogwaardige documentscanner met een nauwkeurige OCR-engine, waardoor elk fysiek document wordt omgezet in een doorzoekbare, bewerkbare PDF. Scan, herken en beheer je documenten op één plek met 29 professionele PDF-tools binnen handbereik.

Try PDF Creator for Free

29 PDF tools. Scan with OCR. Merge, split, compress, watermark. Everything on your iPhone.

Download PDF Creator Gratis