zaterdag 1 augustus 2015

Tekstherkenning (OCR) in Lightroom


Soms fotografeer je zaken alleen voor administratieve doeleinden. Een bord in de dierentuin over de kenmerken van een dier bijvoorbeeld of in musea en historische plekken. Eigenlijk zouden we onze foto's natuurlijk ook graag kunnen doorzoeken op basis van deze informatie. Nu, dat gaat helaas (nog) niet in Lightroom 6 maar er is wel een soort ‘workarround’. De methode die ik hier beschrijf is gebaseerd op Windows.

Allereerst is een zogenaamde OCR engine nodig die de teksten (die voorkomen in een afbeelding) kan omzetten naar leesbare tekst. OCR staat voor Optische Character Recognition (Optische karakter herkenning) en die doet dus precies dat. 

Bekende, commerciële applicaties komen onder andere van Omnipage en ABBYY maar er zijn ook gratis alternatieven en het is leuk om daar eens mee te beginnen. Dit om te zien of de methodiek bevalt, een programma kopen kan natuurlijk altijd nog.

Het programma dat ik hier verder beschrijf is FreeOCR en die kan hier worden gedownload. De installatie (Windows) betreft een eenvoudige next-next-finish en de verschillende taalpakketten worden meteen mee geïnstalleerd (althans bij de versie 5.4.1 van mei 2015. Voorheen moest dat nog afzonderlijk worden gedaan).

De handelingen hierna zijn als volgt:

Open in Lightroom een afbeelding waarvan je de tekst doorzoekbaar wilt maken. De kwaliteit van de uiteindelijke tekst wordt beter wanneer je eerst wat verbeteringen aanbrengt.



De bronafbeelding van mijn voorbeeld:

Zet de afbeelding zo recht mogelijk, krop de tekst zo veel mogelijk en voeg contrast toe zodat de tekst optimaal leesbaar wordt. Dat mag op zowel de afbeelding zelf als op een (virtuele) kopie. Dat ziet er dan als volgt uit:



Klik vervolgens met de rechtermuisknop op de afbeelding en kies in het contextmenu voor Exporteren/Exporteren en zet de instellingen als volgt (klik op afbeelding voor een grotere versie):



NB: Bij bestandsnaamgeving is het belangrijk om de naam inderdaad als test.tif in te stellen. Anders wordt de afbeelding namelijk niet automatisch in het OCR programma geopend.

Wanneer je klaar bent met alle instellingen kun je het opslaan als preset (In goed Nederlands ‘Voorinstelling’), hierdoor zijn deze exportinstellingen een volgende keer met 1 klik beschikbaar. Dat kan in het linker menu met de knop ‘Toevoegen’. 
Geef de voorinstelling een herkenbare naam. Ik heb hem gewoonweg OCR genoemd.

FreeOCR opent nu. De foto staat aan de linkerkant. De tekst verschijnt straks aan de rechterkant (daar staat nu alleen nog maar een instructietekst):



Stel als eerste de OCR taal in, rechtsboven. In mijn geval is dat Nederlands: NLD


Maak nu het rechterscherm leeg d.m.v. het rode kruisje dat midden tussen de beide schermen in staat (bovenste icoontje):

Klik nu op de OCR knop in de menubalk en kies daar voor (Current page):


De tekst in het rechtervenster kan nu met de muis geselecteerd (of deels geselecteerd) worden en gekopieerd (sneltoetscommando: Ctrl+C).

Ga nu terug naar Lighroom, daar kan de tekst geplakt worden in het trefwoorden- of het bijschrijft veld:

Uiteraard hoef je je niet te beperken tot de foto waarvan je de tekst hebt geïsoleerd. Vaak zal de informatie namelijk van toepassing zijn op een hele set afbeeldingen. Zo'n set kan in een enkele handeling van dezelfde informatie worden voorzien door dit in de Bibliotheek modus te doen in zogenaamde Grid view (wanneer alle foto’s niet alleen onderaan staan maar ook boven in het grote venster).

Als laatste nog even een opmerking. Voordat een nieuwe foto ‘geOCRd’ wordt moet FreeOCR eerst afgesloten worden. Alleen bij het opstarten van het programma wordt de afbeelding test.tif ingelezen, vandaar…

Het lijken heel wat handelingen maar dat valt in de praktijk reuze mee. Wanneer je het eenmaal hebt ingesteld werkt het een stuk sneller dan de tekst van het plaatje met de hand overtypen in het trefwoorden veld... (of alleen al het lezen van bovenstaande tekst...) zoals je in het filmpje kunt zien:

Mocht je geen separate OCR applicatie willen (of mogen) installeren dan zijn er ook online opties zoals deze van Microsoft: https://azure.microsoft.com/nl-nl/services/cognitive-services-form/computer-vision/