dinsdag 4 december 2012

Meta data jungle


Na het recente S.M.A.R.T artikel al weer een saai stuk hoor ik je vragen?
Tja, ik probeer het natuurlijk zo leuk mogelijk op te schrijven maar zaken als EXIF, IPTC en XMP blijven, zeker voor de niet-professionele fotograaf, een beetje ondoorgrondelijke materie. Eigenlijk is dit juist voor hen omdat de professional zich er (hopelijk!) al voldoende in verdiept heeft.

Waarom zou je je überhaupt in deze materie willen verdiepen?
Zolang foto’s nog steeds niet goed op hun werkelijke inhoud (terug)gevonden kunnen worden zijn we nog altijd afhankelijk van wat er ooit aan extra gegevens (metadata) aan de foto’s is meegegeven, al dan niet automatisch. Het is dan goed dat je enige kennis van zaken hebt.
Over onderwerpen als Exif, Iptc en Xmp is natuurlijk heel veel te vinden op internet, waaronder wikipedia (en dan met name de engelstalige editie) of metadata.org maar dat is over het algemeen gefragmenteerde informatie. Overigens dan wel weer vaak diep en gedetailleerd uitgewerkt.
Dit artikel is daarentegen meer bedoeld om inzicht te verschaffen in waar je nu als fotograaf mee te maken krijgt en hoe de verschillende standaarden en technieken zich ten opzicht van elkaar verhouden. Wil je daarna meer weten, sla dan zeker de genoemde bronnen er nog even op na! Je kunt ook een vraag of reactie achterlaten op dit artikel, hieronder.

Metadata?
Een foto is net als ieder ander computerbestand een reeks nullen en enen. De computer weet aan de opbouw daarvan dat het a) een afbeelding betreft en b) hoe die er op je beeldscherm moet uitzien. Echter zitten er nog meer zaken in het bestand verwerkt die je niet meteen ziet en één daarvan is metadata. Dat zijn overigens gewoon gegevens over het betreffende bestand. Bijvoorbeeld over hoe groot het bestand is of wanneer die voor het laatst is bewerkt. Er worden ook specifieke ‘foto zaken’ als metadata opgenomen (was de flitser aan of niet, de sluitertijd, diafragma, etc) en er is zelfs ruimte gereserveerd waar je een eigen beschrijving of trefwoorden kunt registreren! Hiervoor gebruik je echter meestal een applicatie die dat ‘onder water’ voor je regelt. Je bent je er in de meeste gevallen misschien niet eens van bewust wanneer het gebeurt.

Zoals gezegd worden er in het fotobestand zelf dus gegevens opgenomen die geen onderdeel uitmaken van de afbeelding. Je kunt dit zelf snel even checken door bijvoorbeeld een (niet al te groot) JPG afbeelding te openen in kladblok. Je zult in de eerste regels waarschijnlijk meteen al zaken herkennen. 

Deze gegevens zijn niet alleen ‘leesbaar’ voor mensen maar ook voor applicaties. Die herkennen het ‘soort’ meta data aan ‘kopjes’ die er voor zijn gereserveerd. Deze secties worden Image Resource Blocks genoemd (IRB).

Welke metadata?
Helaas bestaan er een heel aantal standaarden, in de inleiding heb ik de belangrijkste al even genoemd:

Exif
Staat voor Exchangeable Image File Format en hier worden voornamelijk gegevens in bewaard die door de camera zelf zijn gegenereerd zoals datum van de opname, locatie (GPS), sluitertijd, diafragma, flitsvermogen, brandpuntsafstand, merk en type van camera en objectief enz, enz.


Omdat je er zelf nauwlijk iets aan toe kunt voegen lenen Exif gegevens zich met name voor statistische analyses zoals “met welk objectief of brandpuntsafstand heb ik nu de meeste foto’s gemaakt?”. 

Er zijn applicaties (Exif Tool) waarmee je wel Exif informatie kunt manipuleren. Daarbij is het belangrijk om te weten dat Exif formeel alleen maar ASCII tekens ondersteund. Bij gebruik van leestekens die hier buiten vallen zullen je foto’s elders in de wereld heel andere meta data tonen..
Kortom, behalve dat Exif er ook niet expliciet voor gemaakt is leent het zich ook niet zo goed om eigen gegevens in onder te brengen.

IPTC
Staat voor International Press Telecommunications Council en IPTC is zowel een standaard als een sectie binnen je foto bestand. De begrippen worden helaas (te) vaak door elkaar gehaald in het dagelijks verkeer en dat is verwarrend.

Met de IPTC standaard is namelijk niets mis, dat gaat over de gegevens die je als gebruiker zelf toevoegt aan je afbeeldingen zoals de namen van de personen op je foto.
Echter wordt de IPTC metadata sectie NIET meer gebruikt. (Het gaat hier om IPTC IIM) In plaats daarvan is er een andere ruimte voor IPTC gereserveerd binnen je foto’s, namelijk de XMP sectie... (Volg je het nog?). Als we het dus over IPTC-Core en/of over IPCT Extension hebben dan gaat dus feitelijk over XMP.


Je eigen gegevens kun je dus prima kwijt in je foto’s maar tegenwoordig alleen op een andere plek in je bestanden dan voor 2005. Gelukkig regelt je beheer software (catalogus programma, photo browser, DAM applicatie) dit, als het goed is, allemaal voor je maar het kan geen kwaad je hiervan bewust te zijn. Bij het selecteren van een programma zul je hier dan rekening mee willen houden.

Nog even voor de volledigheid; je kunt natuurlijk altijd nog gegevens schrijven binnen de oude IPTC (IIM) sectie maar veel programma’s lezen deze niet meer of niet correct uit. Veiliger is dus om je IPTC gegevens binnen de XMP ruimte te schrijven zoals de moderne DAM applicaties dat netjes (automatisch) voor je zullen doen. Bij de meeste DAM applicaties zul je dus echt zelf nadere actie moeten ondernemen om nog in de ‘oude’ IPTC sectie te schrijven. 

PLUS
Plus is een metadata standaard, specifiek voor licentiedoeleinden. Daarnaast is er tooling beschikbaar waarmee tekensets kunnen worden gegenereerd ter identificatie van (ondermeer) copyrighthouders, gebruikers en gebruikersvoorwaarden. Ik zal er hier verder niet op ingaan omdat ik de indruk heb dat het voornamelijk op de amerikaanse markt is toegesneden. Later kom ik hier vast nog eens op terug.DUBLIN CORE

Dit is oorspronkelijk een standaard uit de bibliotheekwereld en het omvat vijftien basis componenten. Vijf daarvan komen overeen met IPTC velden. Binnen DAM applicaties ben ik nimmer Dublin Core velden tegengekomen.


XMP
Staat voor Extensible Metadata Platform, een standaard die door Adobe is ontwikkeld. XMP is gebaseerd op het (bekendere) XML formaat en het is niet alleen geschikt om vooraf gedefinieerde gegevens over je foto’s in kwijt te kunnen (IPTC) maar ook eigen gedefinieerde velden. Daarmee is het een zeer flexibele standaard, met name voor de toekomst.

XMP kan op twee manieren in combinatie met je foto’s ingezet worden:

De eerste manier is met behulp van een separaat (XMP) bestand. Deze bestanden noemen we ook wel sidecar bestanden en ze hebben altijd dezelfde naam als het beeldbestand. Stel, je hebt een bestand 2012_10_0100.NEF. Wanneer je nu wat aanpassingen hebt aangebracht met bijvoorbeeld Adobe Camera Raw, dan zie je in dezelfde directory een extra bestand verschijnen: 2012_10_0100.XMP. Wanneer je dit bestand nu weg zou gooien dan zijn ook al je bewerkingen weg.


Sidecar bestanden zijn een logisch antwoord op de gesloten (RAW) bestandsformaten van de camera leveranciers. RAW bestanden kunnen eigenlijk alleen (veilig) bewerkt worden met software van dezelfde fabrikant als die van de camera maar dat wil je misschien wel niet altijd. Cameravreemde fabrikanten beschikken echter niet over alle informatie van alle RAW formaten en daardoor lopen ze te veel risico om fouten in de bestanden aan te brengen. En dit geeft weer een verhoogd risico op corruptie en onbruikbare bestanden, iets dat een fotograaf natuurlijk nooi wil. Eerder schreef ik dit artikel over PIEware waarin ik wat dieper op deze materie in ga.


Vrijwel alle RAW converters werken tegenwoordig dan ook met deze sidecar bestanden, hoewel de onderlinge uitwisselbaarheid vaak weer niet optimaal is. Ik zal daarover hier niet verder uitwijden maar me richten op de tweede manier om gebruik te maken van XMP, namelijk als een sector binnen het beeldbestand, vergelijkbaar dus met hoe dat gaat bij IPTC en EXIF.

Welke van de beide XMP methodes je gebruik ligt overigens sterk aan de software die je gebruikt, vaak kun je daarin zelf ook nog keuzes maken. Gebruik je het JPG of DNG bestandsformaat dan kun je rustig kiezen voor XMP als sectie binnen het bestand en zijn separate sidecar bestanden niet nodig. (Over de keuze al dan niet voor het DNG RAW formaat heb ik eerder geschreven en zal ik op deze plek verder niet ingaan. Link1, Link2)

XMP omvat dus ondermeer de standaarden IPTC Core, IPTC extensions, Dublin Core en Plus.

Nadere orientatie?
Eerder heb ik al aangegeven dat je nauwlijks of geen handelingen hoeft te verrichten om metadata naar je hand te zetten. De achtergrondinformatie over de verschillende bestaande standaarden heb ik met name gegeven om wat meer inzicht te verschaffen. In de dagelijkse praktijk zal de metadata afhandeling plaatsvinden binnen de applicaties die je daarvoor gebruikt. Op photometadata.org staan handleidingen met betrekking tot dit onderwerp voor een aantal veelgebruikte applicaties:

Wanneer je vóór 2005 al metadata hebt toegevoegd en/of aangepast in je foto’s dan heb je meer reden om je in deze materie te verdiepen dan wanneer je nog niet zo lang geleden bent begonnen. Voor 2005 waren er namelijk nog nauwlijks applicaties die de gegevens in de XMP sector wegschreven zoals dat nu de voorkeur heeft. Al die data staat dus nog in de ‘oude’ IPTC (IIM) sector. Je huidige DAM applicatie zal daar wel goed mee om moeten kunnen gaan en deze velden op zijn minst moeten uitlezen. Test dit dus goed voordat je tot aanschaf overgaat van een (nieuwe) applicatie.

Karakter sets (ASCII, ANSI, UTF-8, ETC):
Voordat je concrete meta data aan je afbeeldingen gaat toevoegen is het goed je een beetje te verdiepen in de te gebruikern karakters, vooral wanneer het waarschijnlijk is dat je vreemde leestekens zult gaan gebruiken of wanneer je EXIF velden gaat muteren.
Het is namelijk niet vanzelfsprekend leestekens (vooral vreemde) overal ter wereld correct zullen worden weergegeven. Het ASCII teken 227 bijvoorbeeld (ALT+227) geeft op ons toetsenbord een Ò te zien maar in Amerika een π en in centraal Europa een Ń.


Ik zal er hier niet al te diep op ingaan maar onhoud dat UTF-8 volgens wikipedia het beste geschikt voor toepassingen rondom meta data. Ook niet-ASCII tekens zullen dan correct worden weergegeven op iedere pc. Je kunt je natuurlijk ook beperken tot het gebruik van alleen ‘gewone’ leestekens.

Wat nu?
Wanneer je rekening wilt houden met alle aspecten die ik hier heb genoemd kun je daar misschien wel een dagtaak aan krijgen. En dat terwijl je helemaal niet achter je computer wilt zitten maar liever naar buiten gaat om foto’s te maken!
Aan de andere kant wil je hoogstwaarschijnlijk wel dat anderen jouw foto’s te zien krijgen, zowel nu als in de toekomst. Een goede organisatie is dan van belang en ik hoop dat de kennis daarvoor met behulp van dit artikel iets is toegenomen zodat je jezelf op cruciale momenten de goede vragen kunt stellen. Bijvoorbeeld bij de aanschaf van een (nieuw) beheer/catalogus programma om je foto’s mee te beheren.

Wanneer je de opgedane kennis wilt gebruiken om je foto’s beter vindbaar te maken op internet (SEO – Search Engine Optimization) dan komt daar nog heel wat meer bij kijken. Deze verdieping op de materie zal ik een andere keer aanbrengen.

donderdag 1 november 2012

Phase One Capture One versie 7 alternatief voor Media Pro?


Een paar weken geleden heeft Phase One versie 7 van hun RAW converter Capture One (CO7) uitgebracht. 
Daar waar de vorige versies zich voornamelijk bezig hielden met beeldbewerking en je voor het beheren van je collectie afhankelijk was van (ook van Phase One) Media Pro (MP) software heeft men er nu voor gekozen om een behoorlijke DAM (Digital Asset Management) functionaliteit in te bouwen, althans die indruk krijg je als je de site bezoekt.

Is CO7 daarmee nu ook meteen een alternatief voor Media Pro?

Deze vraag is relevant omdat Media Pro een tijdje geleden is overgenomen van Microsoft (die het daarvoor weer had overgenomen van iView) en dus een schare gebruikers heeft die nog nooit met Capture One hebben gewerkt. Wellicht heeft een groot deel van de gebruikers zelfs een voorkeur voor een andere RAW converter. Het is in ieder geval bekend dat veel gebruikers van Media Pro heel bewust hebben gekozen voor een geheel zelfstandige DAM applicatie, dus volkomen losstaand van welke RAW converter dan ook. De mensen die een combinatie van RAW converter en DAM juist wel handig vonden zijn vermoedelijk al wel overgestapt naar Lightroom.
Dus het is de vraag of de huidige gebruikersgroep wel zit te wachten op een overgang van Media Pro naar Capture One. Ik denk dat ik het antwoord hierop al wel weet.

Omdat Phase One zich niet in de kaarten laat kijken en vrijwel nooit uitspraken doet over wat ze voor de toekomst in petto hebben is de belangrijkste vraag dus of CO met versie 7 nu een alternatief is geworden voor MP. Want, mocht dat het geval blijken dan kun je ook de volgende stap verwachten; uitfaseren van Media Pro en de gebruikers dwingen over te stappen naar Capture One…

Nadere beschouwing leert echter dat, hoewel er DAM functionaliteit aan CO7 is toegevoegd, deze nog zeer beperkt is. Zaken die erg belangrijk zijn voor een ‘echte’ DAM zijn weggelaten of zitten er nog niet in, zoals:
  •          Zoeken op ontbrekende foto’s
  •          Duplicaten vinden
  •          Ondersteuning voor heel veel media formaten. CO7 ondersteunt bijvoorbeeld geen PSD’s, een onder fotografen veel gebruikt formaat

Hoewel ik het programma zelf niet heb getest blijkt uit de fora dat er toch nog heel wat bugs in CO7 zitten, waaronder één met het DNG formaat. Deze issues zullen er waarschijnlijk binnenkort wel uitgehaald zijn maar een uitbreiding van functionaliteit hoeven we niet meteen te verwachten.
Ik denk dus dat we naar de transitie zitten te kijken die Phase One voor ogen heeft om uiteindelijk tot een Lightroom achtige applicatie te komen met zowel RAW converter als DAM functionaliteit. Dat dit voor de workflow een vereenvoudiging kan betekenen weten we van Lightroom. Daar staat tegenover dat de huidige gebruikersgroep van MP hier waarschijnlijk niet op zit te wachten.

Omdat CO7 dus nog geen alternatief is voor MP heb ik toch nog een kleine hoop dat Phase One Media Pro zal door ontwikkelen zodat het daarmee nog een tijdje als zelfstandige DAM kan worden gebruikt. Hopelijk zien we daar op niet al te lange termijn iets van terug.
Op een definitieve zelfstandige status van MP hoeven we waarschijnlijk niet te rekenen, gezien de stap die nu is gezet met Capture One. Een schrale troost is dat het de trouwe gebruikers enige tijd geeft om zich te oriënteren op iets anders. 

maandag 1 oktober 2012

S.M.A.R.T



We gaan hier geen S.M.A.R.T. doelen bepalen (Specifiek, Meetbaar, Acceptabel, Realistisch, Tijd) maar stoeien met diagnostische tools voor je harde schijf (Self Monitoring, Analysis and Reporting Technology).
Waarom een artikel over iets triviaals als een harde schijf op deze foto blog?
Nou, dat is heel eenvoudig eigenlijk. Omdat je kostbare foto’s, ondanks de toenemende populariteit van zogenaamde Solid State Drives (SSD), over het algemeen nog altijd op ‘gewone’ (dat wil zeggen: kwetsbare) harde schijven staan. SSD’s worden weliswaar al wel vaak gebruikt als opstartschijf voor het besturingssysteem vanwege hun snelheid maar voor de opslag van grote hoeveelheden data zijn ze (voor de meesten) nog te duur.



‘Normale’ harde schijven hebben bewegende onderdelen zoals de ‘platters’ (de ronddraaiende magnetische schijven) en de lees/schrijf arm die bij iedere lees- of schrijf actie de kop naar de juiste plek boven de ronddraaiende schijf positioneert. Dit draaien gaat met hoge snelheden (vanaf 4800 toeren tot wel 15.000 toeren) en het positioneren van de lees/schrijf arm komt erg precies. Als alles goed gaat raakt hij de draaiende schijf (net) niet. Nooit. Wanneer dat toch gebeurt, is dat vrijwel zeker het (plotselinge) einde van een harde schijf.
Toch is er iets waar je meer rekening dient te houden en dat is slijtage. Alle bewegende onderdelen hebben daar last van en ook jouw harde schijf, met al je dierbare herinneringen, zal het dus een keer begeven. De vraag is alleen; wanneer?
Nu, daar komen de SMART tools bij kijken. Met deze tools kun je namelijk min of meer de status in de gaten houden. Er is geen garantie dat je voortijdig problemen zult ontdekken maar de kans daarop is wel veel groter dan wanneer je alleen maar afwacht.
Factoren die een hoger(e) voorspellend karakter hebben op aanstaande uitval van de harde schijf dan andere factoren zijn:

  • Nonzero read error rates
  • Spin retry rates
  • Reallocated sector count
    (of eigenlijk iedere foutmelding waarin het woord ‘sector’ voorkomt). Enkele bad sectoren mogen voorkomen maar wanneer ze gaan groeien is er zeker iets aan de hand!

Het is aan te bevelen om niet alleen periodiek een SMART controle in te plannen maar ook je nieuwe schijven hier meteen aan te onderwerpen. Nog voordat je ze ‘echt’ in dienst neemt dus. Uitval van harde schijven komen statistisch namelijk het vaakst voor meteen na ingebruikname of pas na een aantal jaren trouwe dienst.
Besturingssystemen (en zelfs moderne moederborden) hebben al SMART functionaliteit ingebouwd (Apple, Vista, Win 7) maar wanneer je van daaruit een waarschuwing ontvangt is het meestal al erg laat, soms wellicht al te laat om al je data te redden. Je kunt meer SMART functionaliteit toevoegen middels software van derden zoals GSmart van Smartmontools, Active Hard Disk Monitor van LSoft (beide voor het windows platform) of SMART Reporter (voor het Apple platform). Overigens stellen de fabrikanten voor hun eigen merk harde schijf ook vaak (zonder meerkosten) tools beschikbaar, dus het loont de moeite om dit nog even na te kijken op de betreffende site. Het is namelijk verstandig om de periodieke controles te doen met meer dan één tool. Het komt namelijk regelmatig voor dat de ene tool een ontwikkeling opmerkt die een andere tool niet opmerkt...
SMART monitoring is helaas niet altijd mogelijk. Zo kunnen PATA en SATA schijven die rechtstreeks zijn aangesloten op het moederbord probleemloos worden gemonitord en soms ook eSATA poorten. Schijven die echter zijn aangesloten via FireWire of USB kunnen over het algemeen niet worden gevolgd. Wanneer je dit wel graagt wilt kun je de aanschaf van een externe dockingstation overwegen. Deze moet dan wel via eSATA op je PC zijn aangesloten natuurlijk maar check voor aanschaf (een paar tientjes) wel even of hij SMART compatible is of vraag of je hem kunt retourneren wanneer dat niet het geval blijkt.

Wie nog even (dieper) de techniek in wil duiken kan overigens hier op wikipedia terecht.

Wanneer je vreemde ontwikkelingen ontdekt in één van je metingen, overweeg dan om de schijf proactief te vervangen door een nieuwe. Als het goed is heb je daar nu dan ook daadwerkelijk even de tijd voor.


Mocht je onregelmatigheden ontdekken bij een nieuwe schijf, breng hem dan (met de metingen uitgeprint) meteen retour met een claim op garantie.


Het lijkt vervelend om je met deze materie te moeten bezighouden maar ik hoop je er van te hebben overtuigd dat het wellicht beter is om toch (af en toe) even te doen?

woensdag 5 september 2012

Checklist digitaal fotobeheer




Dit is een kort overzicht van de zaken die je als digitaal fotograaf eigenlijk goed geregeld zou moeten hebben.

Met dank aan www.dpbestflow.org waar de meeste van de onderstaande tips vandaan komen.

Heb je alle vragen met een Ja beantwoord? Dan is je DAM omgeving uitstekend ingericht en kan ik je op dit vlak niet veel meer leren.

Mocht je her en der toch eens Nee hebben ingevuld of mocht het niet duidelijk zijn wat er met een bepaalde vraag bedoeld wordt dan kun je op dpbestflow terecht voor een uitgebreidere beschrijving (in het Engels) van de afzonderlijke punten en kun je er ook zien welke maatregelen je kunt nemen.


Veel zaken heb ik echter op deze plaats ook al eens eerder besproken of ga ik dat nog eens doen.
Systeem opzet

Hardware
  • Heb je geïnvesteerd in de beste monitor die je je kunt veroorloven?
  • Is de monitor goed gekalibreerd in een optimaal verlichte omgeving en zorg je er voor dat dit zo blijft?
  • Heb je voldoende harde schijf opslagcapaciteit?
  • Onderhoud je je computer en besturingssysteem goed?

Opname
  • Fotografeer je in RAW? Dit geeft niet alleen de hoogste kwaliteit maar ook de meeste flexibiliteit voor eventuele correcties

Kleur
  • Sluit je altijd kleurprofielen in de foto’s in en probeer je dat ook zo te houden?
  • Gebruik je een grote kleurruimte (dit t.b.v. beeldbewerkingsdoeleinden) zoals Adobe RGB (8 of 16 bit) of ProPhotoRGB (16 bit)?
  • Kalibreer je ook je printer?
  • Begrijpen je klanten (en anderen die met jouw foto’s te maken hebben) kleurbeheer?

Beeldbewerking
  • Gebruik je Parametrische beeldbewerkers? Deze zogenaamde PIE ware werkt namelijk ‘non-destructive’
  • Gebruik je (om dezelfde ‘non-destructive’ redenen) ook ‘lagen’ en ‘slimme objecten’  op master bestanden in PhotoShop?

Bestandsformaat
  • Gebruik je TIFF of PSD als werkbestandsformaat?
  • Gebruik je JPG of TIFF als opleverformaat?
  • Gebruik je TIFF of PSD als bestandsformaat bij het archiveren van gerenderde master bestanden?
  • Gebruik je het DNG formaat om je RAW bestanden te archiveren?

Opslag en Organisatie


Bestandsbeheer
  • Krijgen je foto’s allemaal een unieke naam?
  • Is de naamconventie die je hanteert gemakkelijk te onthouden en te gebruiken?
  • Gebruik je folders en subfolders om je bestanden ‘fysiek’ in op te slaan en t.b.v. organisatie doeleinden?
  • Gebruik je zowel meta-data als catalogus software om je foto collectie inhoudelijk te beheren en je zoekopdrachten te stroomlijnen?
  • Is je workflow georganiseerd rond de thema’s ‘capture’, ‘ingestion’ ‘werk’ en ‘archief’?

Metadata
  • Worden je contactgegevens en copyright informatie in al je foto’s ingebed?
  • Gebruik je bulk-meta data in de ‘keywords’ (trefwoorden) om je foto’s te beschrijven?
  • Gebruik je de meta-data velden (IPTC) voor de doeleinden waarvoor ze gemaakt zijn, zoals bijvoorbeeld locatie?
  • Ben je je bewust dat sommige software meta-data weer kan vernielen?

Back-up
  • Maak je gebruik van de 3-2-1 backup methodiek? (3 kopieën, 2 verschillende media waarvan er 1 elders wordt bewaard)?
  • Is het onderscheid tussen je primaire bestanden en je backup bestanden helder?
  • Wordt je backup geautomatiseerd (gescheduled) uitgevoerd in plaats van handmatig?
  • Maak je periodiek een kloon van je systeem om onnodig tijdverlies te voorkomen bij eventuele herinrichtingen?

Behoud


Archiveren
  • Archiveer je eenmaal binnengehaalde foto’s vroeg in het proces?
  • Archiveer je je master bestanden met lagen ook?
  • Migreer je periodiek naar nieuwe media? (Om verlies bij uitval van oude media te voorkomen en om een optimale toegangstijd te behouden)
  • Migreer je naar de nieuwste bestandsformaten om te voorkomen dat je met verouderde formaten blijft zitten?
  • Maak je gebruik van het open gedocumenteerde DNG formaat?

Data Validatie
  • Valideer je belangrijke handelingen met je bestanden om er zeker van te zijn dat er geen data in het proces verloren is gegaan?
  • Valideer je regelmatig zowel je primaire bestanden als je back-up?
  • Weet je dat een DNG archief met een veel grotere mate van zekerheid gevalideerd kan worden dan andere bestandsformaten?
  • Gebruik je WORM media als onderdeel van je archief opzet? (omdat deze met volledige zekerheid kan worden gevalideerd). WORM = Write Once – Read Many, DVD of Blue Ray recordables bijvoorbeeld (geen rewritables dus)

vrijdag 10 augustus 2012

Mooie foto's zoeken





Wanneer je een foto zoekt van bijvoorbeeld het strand wil je niet zo maar een foto maar het liefst één met mooie kleuren, een optimale belichting en een goede compositie. Of het nu op internet is of op je eigen computer.

De ontwikkelaars van Xerox zijn bezig met een algoritme die in de toekomst in zoekmachines gebruikt kan worden. Dit algoritme begrijpt de inhoud van foto’s en kan deze zelfs filteren op slechte of goede esthetische elementen. Een dergelijk mechanisme maakt het mogelijk om altijd de beste foto’s bovenaan in je zoekresultaten te tonen. Xerox noemt dit vooralsnog Aesthetic Quality Image Search.

Het algoritme van Aesthetic Quality Image Search kijkt echt naar het beeld zelf en selecteert dus NIET op basis van meegegeven (tekst) metadata (tags). Hij kan dus een goede foto van een slechte onderscheiden, of althans, dat is de bedoeling.

Veel bestaande technieken zijn gebaseerd op het herkennen van delen van het beeld. Wanneer er bijvoorbeeld wielen en een weg worden herkend dan zal het waarschijnlijker zijn dat de foto een auto dan een giraffe bevat. Echter onderscheidt Xerox zich hiervan door expliciet te kijken naar de kwaliteit van de afbeelding. Wat maakt de ene foto beter dan de andere? Waarom springt die ene er bovenuit? Xerox meent daar dus een antwoord op te hebben met het algoritme dat momenteel wordt ontwikkeld.

Xerox heeft in de pilot een aantal categorieën voorgedefinieerd:

Strand:

Xerox beschouwt een goede strandfoto als een niet te drukke foto met intense kleuren of dramatische zwart/witte wolkenlucht. Ook worden lange belichtingen herkend waardoor de beweging van het water gevangen wordt.

Slecht belichte opnames worden snel als slecht gekenmerkt evenals foto’s waarin subjecten op willekeurige posities staan, hier ‘kijkt’ het algoritme bijvoorbeeld naar de regel van derden.

Vogels:

Bij Vogels en andere dieren krijgen de foto’s waarop de dieren relatief groot zijn afgebeeld een hogere ranking dan die waarop ze kleiner staan. Daarnaast wordt gekeken naar een rustige achtergrond zodat het onderwerp mooi vrij komt te staan. In de ‘slechte’ opnames komen ook de kleuren van het verenpracht minder tot hun recht dan op de goede.

Boot:Veel verticale lijnen, silhouetten en een eenvoudige rustige achtergrond. Kleur is een belangrijke factor. Slechte foto’s zijn plat, vlak en hebben uitgebeten witte partijen.

Luchten:

Een goede lucht is een dramatische lucht. Foto’s met goede silhouetten krijgen een hogere ranking net zoals zwart/wit luchten. Overbelichte opnames waarin alles blauw is, is een indicatie van lage kwaliteit.

Bloemen:


Het subject vult het hele beeld. Heldere bloemen voor een donkere achtergrond doen het goed vanwege de grote impact. Uitgevreten kleuren doen het juist slecht evenals een drukke achtergrond. Ook hier wordt voor wat betreft de compositie weer naar de regels van derden gekeken.

Portret:

Een portret wordt als goed beschouwd wanneer de vorm van het gezicht goed herkend wordt, ook wel chiaroscuro genoemd. De overgang van licht naar donker en dus met schaduwpartijen. De achtergrond is overwegend donder voor een optimaal contrast met het hoofdonderwerp.

Heel direct licht (zon of flitslicht) wordt negatief beoordeeld, net als onnatuurlijke expressies en uitdrukkingen in het gezicht.

Waterval:

Vallend water (lange belichting) wordt hoger gewaardeerd dan ‘bevroren’ water.
Slechte indicatoren zijn hier een compositie met het hoofdonderwerp in het midden van de foto en/of saaie kleuren.

Aesthetic Quality Image Search:

Deze optie bevind zich nog in de Alpha fase dus het gaat zeker nog even duren voordat we dit in een of andere vorm terug gaan zien in zoekmachines en/of DAM applicaties. Toch is het zeker leuk om alvast even een kijkje in de toekomst te gaan nemen op:

https://services.open.xerox.com/WebApp2.svc/aesthetic-search/#categoryId=5&threshold=60&max_results=40

zondag 1 juli 2012

Deel 2 van 2 over m'n DAM workflow

Vorige maand, in het eerste deel van mijn workflow beschreef ik 12 concrete stappen die ik altijd doorloop en welke ik dan afvink in onderstaande Excel sheet:



De dingen die ik vervolgens nog wil doen met de foto’s hebben voornamelijk een organisatorisch doel en zijn over het algemeen veel meer over de tijd verspreid. Soms bijvoorbeeld gebruik ik foto’s uit het verleden voor een nieuwe toepassing en dat wil ik dan toch vastleggen.
In het eerste deel van m’n workflow gebruik ik meerdere applicaties maar dit laatste deel doe ik voornamelijk binnen mijn Digital Asset Management applicatie.
Een aantal voorbeelden van dergelijke zogenaamde DAM’s zijn IdImager, Canto Cumulus, ACDsee, Aperture en Expression Media (EM). Toevallig gebruik ikzelf laatstgenoemde (tegenwoordig MediaPro). De ideeën en de principes die ik beschrijf zijn echter voor alle DAM’s van toepassing.


Wanneer foto’s ‘binnenkomen’ in een DAM zijn ze nog ongeorganiseerd. De enige vorm van organisatie is de folderstructuur waaronder de bestanden zijn opgeslagen en de DAM kan bovendien vaak wel iets met de meta data die in de bestanden is opgeslagen zoals de datum:


Aan de hand van de datum waarop de foto’s zijn genomen worden ze automatisch gerubriceerd. Voor bovenstaande hiërarchie heb ik dan ook helemaal niets hoeven doen, de DAM heeft dit geheel automatisch voor me gedaan. Door te klikken op een bepaalde datum worden alle foto’s van die betreffende dag getoond. Door te klikken op een maand worden alle foto's getoond die de gedurende die maand zijn genomen.

EXIF
Vergelijkbare metadata zoals de datum (gegevens die dus al 'in' het bestand zitten) zijn het merk en model van je camera, de locatie (mits de camera voorzien is van een GPS module), sluitertijd, diafragma, ISO enzovoort.
Deze ‘meegebakken’ gegevens worden vaak in de zogenaamde EXIF ruimte van de foto opgenomen. De meeste DAM’s kunnen deze prima lezen maar ze veranderen of invullen wanneer ze leeg zijn is vaak moeilijker.



IPTC
Voor de gegevens die gebruikers vaak aan foto’s willen toevoegen is de IPTC ruimte bedacht. Je kunt hierbij bijvoorbeeld denken aan gegevens als: de naam van de fotograaf, de namen van de personen die op de foto staan, copyright gegevens, trefwoorden enz. Behalve dat de DAM kan helpen bij het aanbrengen van deze gegevens kan hij vervolgens de gegevens ook weer prima gebruiken voor je organisatiedoeleinden maar daarover later meer.


In bovenstaand voorbeeld is te zien dat er geen IPTC gegevens ingevuld zijn (Annotations, Keywords, etc)


Kleurcode (label)
De vorige keer ben ik geëindigd met het toekennen van het rode label aan alle nieuw ingebrachte foto’s:


Dat doe ik om de nieuwe, nog niet georganiseerde foto’s, te kunnen onderscheiden van de rest. Dit om ze te kenmerken als ‘hier moet alle tagging nog mee gebeuren’. Mocht je namelijk geen tijd hebben om dit meteen te doen dan herken je op een later moment snel de opnames die je nog van metadata moet voorzien. Zodra ik er naar mijn mening klaar mee ben, dat wil zeggen alle basis organisatorische zaken heb afgehandeld, verwijder ik het rode label weer. Onder deze basis versta ik: Waardering, Locatie, Personen, Trefwoorden en tenslotte, de synchronisatie van de waardering naar de trefwoorden.

(Ster)waardering
Het allerbelangrijkste dat je kunt doen voor je foto’s is er een waardering aan meegeven in de vorm van sterren. Standaard bieden de meeste DAM’s rating mogelijkheden van 0 tot 5 sterren:

Het waarderen van je foto’s hoef je niet op dit moment in de workflow te doen. Je zou het bijvoorbeeld ook prima kunnen doen tijdens de allereerste beoordeling in stap 3 of bij de integriteitscontrole in stap 6. Op die momenten doorloop je alle foto’s namelijk al een keer visueel (stuk voor stuk). Op zich dus een mooi moment om niet alleen de missers er uit te gooien of de kleuren te corrigeren maar meteen ook aan te geven of de betreffende foto één of meer sterren waard is. Op deze blog heb ik al eerder over deze materie geschreven (sept 2010) maar in het kort doe ik altijd het volgende. Tijdens stap 3 geef ik alle foto’s die ook maar enige potentie hebben één ster mee. 
Ik kies dus voor Weggooien/Houden (Pick/No-Pick) en daarna voor de keuze Geen Ster/Wel Ster. Hoeveel sterren een foto dan waard is beoordeel ik pas later wanneer ik de opname’s vaker voorbij heb zien komen en het beter kan beoordelen.

Wanneer je sterren wilt gaan gebruiken om je waardering uit te drukken lees dan mijn artikel hierover van mei 2009 hierover er nog eens op na:



Het is namelijk erg belangrijk om het methodisch aan te pakken zodat je een foto vandaag net zo gaat waarderen als dat je dat een jaar geleden zou hebben gedaan en zoals je dat volgende week gaat doen.


Copyright
Wanneer je dat nog niet in stap 1 (ingest) hebt gedaan kun je dat nu alsnog doen. Of wanneer je per ongeluk het verkeerde sjabloon hebt gebruikt kun je de gegevens wijzigen. Gelukkig kan dit ook batchgewijs voor alle nieuw ingekomen afbeeldingen tegelijk zodat het je maar weinig tijd kost.


Zorg er wel voor dat het ingevuld is want anders is het wel heel gemakkelijk voor iemand anders om jouw foto’s ongeoorloofd te gebruiken. Lees ook m’n waarschuwing tegen Orphanworks van september 2009.


Auteur
Hetzelfde als voor Copyright geldt hier ook. Als het goed is staat dit al correct ingesteld maar anders kan het alsnog eenvoudig en snel (batchgewijs) aangepast worden.


Locatie
Mocht je fototoestel (nog) niet van een GPS voorzien zijn dan is het handig om aan te geven waar de opname gemaakt is. Bij de meeste DAM’s kan dit overigens batchgewijs zodat je dat met alle foto’s van een shoot tegelijk kunt doen.




Personen
Iets dat potentieel erg veel tijd kan kosten is het aangeven van de personen die op de foto staan. Dit is wellicht niet in alle gevallen nodig dus denk er even over na of een algemene beschrijving als “dagje uit in de dierentuin van Emmen met Klaas en Eva en hun kids Tessa en Gert.” Deze kun je namelijk aan de hele serie meegeven in het ‘caption’ veld (afhankelijk van de gebruikte DAM soms ook ‘titel’ of ‘onderwerp’ veld). Het voordeel is dat dit batchgewijs kan en dus snel terwijl je wel snel op een van de namen kunt zoeken. Om dit zoeken is het in eerste instantie natuurlijk begonnen.

Omdat er een IPTC veld bestaat voor personen wil je deze wellicht toch daadwerkelijk vullen met de namen van de mensen op de foto. Je kunt dan overwegen om dit alleen te doen bij foto’s met een bepaalde waardering.
NB: Gezichtsherkenning zoals Picasa die bijvoorbeeld kent werkt geweldig maar het kent een belangrijk nadeel; de gegevens zijn niet overdraagbaar. Dat wil zeggen dat het niet in de foto wordt geregistreerd. Toch verwacht ik dat ook serieuze DAM's met deze functionaliteit zullen worden uitgerust aangezien het erg veel handmatig werk kan voorkomen.

Trefwoorden (Keywords)
Hier loop je wel erg veel risico dat het je (te) veel tijd gaat kosten want wat zet je er nu allemaal in?
Alleen de onderwerpen die je op de foto ziet of ook associaties, conceptuele begrippen e.d.? Moeten de verschillende trefwoorden er in alle mogelijke vervoegingen in of niet. Loop je alle foto’s bij langs of alleen de beste?


Over dit onderwerp schreef ik al twee keer eerder. De eerste keer was al in 2008 en toen ging ik met name in op de onderlinge verbanden of hiërarchie tussen trefwoorden; de context.

De tweede keer dat ik het onderwerp keywording behandelde ging expliciet over organisatie op basis van conceptuele begrippen als ‘geluk’, ‘toekomst’ e.d. omdat alleen de menselijke geest in staat is om die te koppelen aan het betreffende beeld.
De meeste andere zaken (gezichtsherkenning is daarvan een recent voorbeeld) zullen, al dan niet op termijn, geautomatiseerd mogelijk worden is mijn verwachting.



In een moderne DAM kunnen Keywords (trefwoorden) zelfs vaak in een hierachie worden ondergebracht.

Synchronisatie Waardering > Trefwoorden
Omdat de Rating (sterwaardering) een van de belangrijkste kenmerken is die je aan een foto mee kunt geven schrijf ik dit ook weg in het ‘Keywords’ veld (Van een foto met een enkele ster noteer ik RM:STAR1 in het trefwoord veld):


De belangrijkste reden hiervoor is dat je vrij snel per ongeluk de sterwaardering kunt veranderen (doordat je per ongeluk meerdere foto’s tegelijk hebt geselecteerd bijvoorbeeld). De ‘schade’ is dan weer vrij snel te herstellen.
Ook is de onderlinge compatibiliteit tussen verschillende DAM systemen niet zo goed. Sterwaarderingen komen vaak niet mee van de ene omgeving naar een andere. In tegenstelling tot de trefwoorden (of keywords), dit veld is het meest compatible en kun je dus prima voor migratietoepassingen ‘misbruiken’.



Verwijderen van het rode label
Wanneer alle metadata aan de opnames zijn toegevoegd kan het rode label weer verwijderd worden.


Hoe de organisatie verder op te zetten?
Nadat alle metadata aan de foto’s is toegewezen begint het eigenlijk pas. Je maakt de foto’s natuurlijk met een bepaald doel voor ogen. Soms als herinnering aan een gebeurtenis, soms is het in opdracht van iets of iemand. Maar altijd ligt er een reden aan ten grondslag en het is goed om dat te registreren in je DAM.

Centraal in de organisatie binnen een DAM staat een ‘virtuele’ folderstructuur. Je kunt bijvoorbeeld een dergelijke folderstructuur maken:

Opdrachtgevers > Bouwbedrijven > Bouwbedrijf Jansen

De foto’s die je hebt gemaakt komen daar dan onder te vallen

Heb je echter bijvoorbeeld een foto gemaakt van een pand dat gebouwd is door het bedrijf Jansen in opdracht van firma Pietersen. Of Jansen nu een klant van je is of niet (hij kan het tenslotte altijd worden), je wilt deze foto misschien ook onderbrengen in:

Opdrachtgevers > Administratiekantoren > Pietersen

Nu, in een folderstructuur zoals we die inmiddels wel kennen kan dit alleen maar door een kopie van de oorspronkelijke foto te maken. Bij virtuele folders hoeft dat niet, je kunt een foto in meerdere folders onderbrengen zonder dat daarvan kopieën worden gemaakt. Je kunt folderstructuren opzetten zo uitgebreid en zo ingewikkeld als je kunt bedenken, ook voor tijdelijke toepassingen (een project bijvoorbeeld).

Nadat je bent begonnen met het opzetten van je structuur (je zult er altijd aan blijven schaven en toevoegen) wil je natuurlijk alle foto’s die aan de criteria voldoen er in gaan onderbrengen. Daarvoor komen de gegevens die je ooit als metadata aan de foto’s hebt toegevoegd van pas. Je doet een zoekdracht waarbij je zoekt op relevante gegevens die je ooit hebt ingevuld. Je kunt meerdere velden combineren (zoals de sterwaardering) om precies die foto’s te vinden die je zoekt. Deze sleep je vervolgens naar de aangemaakte categorie.

Het werkt ook vaak andersom; je bent al een tijdje op zoek om de juiste zoekcombinatie te vinden en als dat dan uiteindelijk tot het gewenste resultaat heeft geleid maak je daar een nieuwe virtuele folder (Categorie) voor aan. De eerstvolgende keer is het resultaat dan veel sneller voorhanden. Dit is de manier waarop ik hier zelf mee omga. Ik zorg ervoor dat alle relevante zaken als metadata in mijn foto’s ondergebracht zijn zodat ze met de juiste zoekopdracht altijd weer snel kunnen worden gevonden. Doet zich dan een situatie voor waarbij ik een collectie foto’s moet samenstellen, bijvoorbeeld een jubileum of een reünie dan plaats ik verschillende zoekopdrachten en combineer die dan in een enkele categorie.

Bijzondere categorieën zijn de tijdelijke welke je gebruikt ten behoeve van de interne organisatie, deze noem ik ‘Utility sets’. Het rode label is daar eigenlijk ook een voorbeeld van maar ik heb specifiek voor deze toepassing de volgende categorieën (of virtuele folders) aangemaakt:



Vooral oudere foto’s, van voor de invoering van mijn huidige workflow, missen nog wel eens wat gegevens. Wanneer ik de tijd heb ga ik er actief naar op zoek, waarbij m’n DAM overigens ook weer prima tools aan boord heeft, maar meestal struikel ik er per ongeluk over wanneer ik ergens anders mee bezig ben. In zo’n geval valt me bijvoorbeeld op dat de waardering mij niet goed voorkomt en dat er personen op de foto staan die niet genoteerd zijn. Ik sleep de foto dan op deze beide categorieën. Af en toe open ik zo’n categorie en corrigeer dan een aantal foto’s.




In ‘listview’ kan ik zelf aangeven welke gegevens ik getoond wil hebben en in bovenstaand voorbeeld zijn dat Staat (provincie), stad, locatie, rating, land en copyright. Zoals je ziet is de getoonde selectie verre van compleet. Of eigenlijk ontbreekt alles nog, ik sleep alle bestanden dan ook naar alle afzonderlijke categorieën.

Privé versus publieke data
Nog een reden voor het gebruik van een DAM is dat je in staat bent om onderscheid te maken hoe er met de verschillende gegevens om zal worden gegaan. Een DAM heeft in eerste instantie een eigen database waarin de data zoals je keywords worden opgeslagen. Pas wanneer je daartoe opdracht geeft (synchroniseert) worden de gegevens echt ‘in’ de foto opgeslagen in de zogenaamde EXIF ruimte. Nu, door daar op een berekende manier mee om te gaan kun je vrij veel informatie over een foto bewaren zonder dat die meteen met de hele wereld gedeeld worden wanneer je een foto bijvoorbeeld op een website plaatst. In november 2009 schreef ik eerder over deze materie.

Back-up
Nu, ook over back-ups heb ik meermalen geschreven maar daar is ook een goede reden voor. Het is namelijk enorm belangrijk dat je dit goed inricht en je gedegen voorbereid op calamiteiten want het is niet de vraag of die zich zullen voordoen maar alleen wanneer…

In deel 1 van dit artikel zijn in stap 5 diverse facetten van de back-up aan de orde geweest. Mocht je enige twijfel hebben over de inrichting van jouw eigen back-up, sla genoemd artikel er dan nog zeker even op na.

Ten slotte
Naast dat ik lang nog niet alle relevante onderwerpen heb uitgewerkt heb ik ze in deze beide artikelen ook nog eens slechts summier besproken. (En ondanks dat zijn het toch nog vrij uitgebreide artikelen geworden…)
Kortom, ik ben erg benieuwd naar jouw mening of vraag! Dat kan op deze plek als reactie op dit artikel.


In dat kader is mijn oproep van enkele weken geleden ook zeker nog relevant. De vraag was toen of er belangstelling zou zijn voor een boek waarin alle onderwerpen rondom het beheer van digitale foto’s gedetailleerd uitgewerkt zijn. Mocht je de enquête nog niet hebben ingevuld, lees m’n oproep dan nog even na.

Aangezien mijn statistieken aangeven dat ik maandelijks toch bijna 2000 bezoekers heb (meer dan 25.000 in totaal tot nu toe) zou het leuk zijn om op deze plek wat feedback te krijgen.