Zo gebruik je een tekstherkenningstool

© PXimport

Zo gebruik je een tekstherkenningstool

Geplaatst: 2 januari 2021 - 13:16

Aangepast: 25 november 2022 - 10:42

Dirk Schoofs

Digitale bestanden omzetten naar bewerkbare tekst is relatief eenvoudig. Wanneer het gaat om een artikel in een magazine of om een dossier dat uit vijftien pagina’s tekst bestaat, dan zie je er uiteraard tegenop om alles over te typen. Gebruik een online tekstherkenningstool, dat bespaart heel veel tijd.

Stap 1: Foto

Tekstherkenning is de loop der jaren ontzettend verbeterd. Als je een tegenwoordig een scanner koopt, zit daar vaak een ocr-pakket (optical character recognition) bij waarmee je snel een vel papier of een bundeltje tekst inscant en daarna omzet naar tekst. Heb je wel een scanner maar geen ocr-app of heb je zelfs geen scanner, dan moet je andere wapens inzetten. In dit voorbeeld maken we met de smartphone een foto van een artikel in een tijdschrift. Het gaat om het voorwoord waarin ook een foto staat. Bovendien hebben we de foto in de breedte genomen, want de tekst is opgemaakt in drie kolommen. Zou de tekstherkenning rekening houden met de kolomverdeling?

Stap 2: Uploaden

Het is de bedoeling dat je de foto uploadt naar een ocr-website. Dat kan op verschillende manieren, je kunt dat doen vanuit je fotobibliotheek, vanaf je smartphone of vanaf je desktopcomputer. In ons geval laden we al onze foto’s automatisch op naar Google Foto’s. Binnenkort vindt een verandering plaats op Google Foto's. Daar roteren we deze foto, zodat die netjes horizontaal staat en daarna downloaden hem naar de map Downloads op onze computer. Vervolgens ga je naar de jpg2doc-website waar je de foto uploadt. Je kunt maximaal twintig foto’s achtereenvolgens uploaden voor het geval je een Word-bestand wilt samenstellen op basis van een stapeltje foto’s.

Je moet kiezen tussen foto’s of video’s.

© PXimport

Stap 3: Word-formaat en Nederlands

Om het vlot te laten verlopen, moet je hier twee instellingen aanpassen. Bij Convert to kies je het uitvoerformaat. Dat kan zijn Word 2007-2019, Word 2003, OpenDocument Tekst, ePub, maar ook een doorzoekbare pdf of een ander formaat. Wanneer je de Word-indeling selecteert, vraagt het online programma in welke taal het document is opgesteld. Hier kies je dus Dutch. Heb je nog een foto van een tweede, derde of volgende pagina’s dan herhaal je de instellingen. Tenslotte klik je op de rode knop Convert. De browser zal automatisch aangeven wanneer het geconverteerde document klaar is om te downloaden. Het resultaat is behoorlijk. De online converter heeft zelfs de kolommenstructuur behouden, het aantal ocr-foutjes is beperkt (maar zijn er wel) en zelfs de foto in het document is als een afzonderlijk bestand toegevoegd.

Deel dit artikel
Voeg toe aan favorieten