måndag 25 juni 2012

Öppet bildarkiv: filformat och bildstorlek


Inför det kommande projektet Öppet bildarkiv, som är beskrivet i ett inlägg nedan, har vi börjat diskutera lite olika lösningar för hur vi ska tillgängliggöra vårt högupplösta bildmaterial, och i dessa diskussioner har ett antal frågetecken uppstått som vi hoppas att ni kan hjälpa oss med.

I ett tidigare projekt inom LSH har riktlinjer för arkivering av digitala bilder satts upp och alla högupplösta
bilder som arkiveras idag sparas i två exemplar. Det ena exemplaret utgör ett digitalt negativ, där filformatet för digitalt födda bilder (från digital systemkamera) är DNG, medan filformatet för digitaliserade bilder (från analogt bildmaterial) är TIFF. Detta negativexemplar sparas obearbetat, med kamerans alternativt skannerns färgrymd, och med 16-bitars bitdjup. Det andra exemplaret är en s.k. masterfil, d.v.s. en bearbetad bild, som färdigställs för att kunna användas till tryck, webbpublicering, etc. Dessa bilder sparas i filformatet TIFF, i Adobe RGB, med 8-bitars bitdjup och sparas med ca 100 mb filstorlek. Vi har valt dessa kriterier för arkivering dels för att bilderna ska kunna nyttjas i ett långt framtidsperspektiv, dels av kostnadsmässiga skäl (det skulle gå att arkivera ännu större bilder, men lagringsutrymme är tyvärr en ekonomisk faktor som vi måste ta hänsyn till).

Inför att vi ska tillgängliggöra vårt högupplösta bildarkiv så undrar vi vilket/vilka filformat och vilka filstorlekar vi ska använda oss utav.

Ett alternativ är att vi tillgängliggör bilderna i JPEG-format, med väldigt låg komprimeringsgrad (d.v.s. större filer, men utan att bildfilerna tar ”skada” av JPEG-formatets komprimering). En högupplöst bild skulle kunna tillgängliggöras i A3-format, och hålla en filstorlek kring ca 10-15 mb. Vi skulle även kunna tillgängliggöra bilderna i ett mindre format, A4, med en filstorlek om ca 3-5 mb.

Eller finns det användningsområden för de högupplösta bilderna som gör att TIFF-formatet är att föredra?

Och vore det intressant att kunna ta del av de s.k. negativfilerna? (det finns t.ex. en samling digitaliserade glasnegativ där det vore möjligt att tillgängliggöra negativen, så att man som användare själv får ”framkalla” bilden så som man vill ha den).

Hjälp oss gärna med dessa funderingar!


/ Fredrik Andersson - Digital samordnare

6 kommentarer:

  1. Varför inte PNG för både masterfil och webbförmedling? Det skulle spara er mycket lagringsutrymme och kompressionen i PNG är loss-less och baserad på en öppen algoritm.

    SvaraRadera
  2. Bra fråga! Jag är ingen expert på filformat men jag skulle rekommendera en komprimerad version och inte allt för hårt skruvad på som klarar typ A3. Det borde täcka 99,99% av användningen.

    Jag har personligen stött på en förläggare/fotograf/bildredigerare som vill ha obearbetade filer, tiff/dng/png. Filer som fotoarkivarien INTE "kluddat" med. Dvs: En stor bild som lämnar utrymme för ett proffs att anpassa efter tänkt användning. Tilläggas kan att den här personen var höggradigt irriterad över att inte få rätt produkt från institutionerna. Han sade ungefär: "Hur fan har ni råd att ha folk som sitter och pillar med det? GE MIG RÅFILEN FÖR BÖVELEN!!!".

    SvaraRadera
  3. Kul att ni frågar. Bra jobbat! Jag säger som Chris Anderson: snart kommer lagring och överföring vara så billigt att det inte är lönt att mäta kostnaden, (http://www.wired.com/techbiz/it/magazine/17-07/mf_freer?currentPage=all, respektive http://en.wikipedia.org/wiki/Too_cheap_to_meter). Samma tekniska utveckling kommer att gälla upplösning vid scanning och fotografering. Sedan kan vi förstås inte helt och hållet undvika att vi säkert måste scanna in saker igen om ett tag (när luktscanning eller hologramtekniken eller något annat som vi inte vet vad det är idag kommer), men vi kan vara lite framför kurvan och välja så högupplöst det bara går. Om lagringskostnaden blir för stor - varför inte lägga materialet på Wikimedia Commons? :-)

    SvaraRadera
  4. Det kan vara så att det är lagring är billigt och kommer bli ännu billigare. Men det finns många andra kostnader mer än hårrdiskens yta. Hastighet, backup, hastigheten på backup osv. Det är därför av största intresse att se hur bilder kan bli så små som möjligt utan att vi ger avkall på arkivbeständighet.

    Avseende formatval: Det är nog väldigt viktigt att välja de verkligen stora och vedertagna formaten. Då minskar man risken att filerna inte är kompatibla med framtida verktyg. Tiff, jpg och DNG - alla med de vanligaste formerna av icke förstörande kompression när det är möjligt. Allt annat ter sig som riskfyllt. Hos kunder utanför ABM sektorn ser vi ofta att udda format straffar sig i längden (PhotoCD, CorelDraw, Freehand, Gamla PNG osv, flersidiga Tiff).

    Jag har en kund som får betala motsvarande 3 heltidstjänster för sin fillagring till Volvo IT. Det rör sig alltså om betydande summor för lagring.

    De lagrar alla sina filer på följande sätt
    Basfil-Scannad:
    Tiff med LZW kompression
    Metadata inbakad i XMP format

    Basfil-Digital:
    DNG med en "framkallad" Jpeg fil i fullupplösning. På så sätt kan vi alltid extrahera ut hur fotografen ansåg att bilden skulle se ut även om vi använder andra verktyg än vad fotografen en gång använde.
    Metadata inbakad i XMP format

    Leveransfil:
    Detta är den framkallade bilden, vi automatgenererar den från DNG filen genom att Fotoware ColorFactory extraherar den inbakade filen.
    Filen är normalt JPEG med högsta kvalitet men kan om fotograf eller scanner operatör så anser behövas sparas i tiff-lzw.
    Metadata inbakad i XMP format: Metadatan hämtas varje gång en ny Leveransfil hämtas ut från basfilslagret

    Skiss:
    Detta är en lågupplöst variant som används i system och på den publika internetsajten. http://digitalastadsmuseet.stockholm.se/fotoweb/
    De gamla varianterna är på 800 pixlar, medan

    Om man är inloggad på sajten och har fått rättigheter kan man beställa en leverans- eller basfil genom att använda sig av ColorFactorys Archive management: Man stoppar in en skissbild i en mapp och efter någon sekund har ColorFactory letat rätt på t.ex. basfilen och lagt ut den för nedladdning.

    Filerna har alltid alla metadata från respektive samlingssystem inbakat i XMP format. Detta garanterar att upphov och alla andra viktiga fakta finns med i bilden om de exporteras från museet.

    Vi har också skapat en integration mot Stockholmskällan - vi exporterar Leveransfilen och ser till att metadata struktureras enligt deras schema. Därefter kopieras filen till deras inmapp och de läser av bildens metadata och skapar datapost med automatik.

    Hälsar Johan Leide

    SvaraRadera
  5. Öppet bildarkiv är ett utmärkt projekt att ha som en pilot i det uppdrag som Digisam har när det gäller att ta fram underlag för allmänna råd för bl.a. format. Så vi deltar gärna i det fortsatta arbetet.
    Hälsningar Digisam/rolf

    SvaraRadera
  6. Tack för kommentarer om lagring men lagringen har vi under kontroll. Vi undrar hur bilderna ska vara för att kunna *användas* på bästa sätt. Vi har funderat på råfiler (även om jag aldrig hört någon ryta för bövelen i desperation efter en råfil, kul!)och vi kommer lägga ut bilder på Wikimedia commons, men vi tror att det är användbart att högupplösta filer går att ladda ner direkt i emuseumplus.lsh.se och via K-samsök, alltså funkar det inte enbart med commons. Vi ska titta på PNG! Andra förslag?
    / Karin Nilsson

    SvaraRadera