Data: mietintöjä

28.7.2021

Olen pohtinut. Jos kuva on tuhannen sanan veroinen, ja jos sanotaan että sana on keskimäärin noin 6 kirjainta, ja että kirjain olisi yhden tavun, niin jotta kuva olisi tehokkaampi informaation välitys- ja säilytysmekanismi kuin teksti niin sen olisi mahduttava alle 6 kilotavun tiedostoon. Jos mietimmekin vain sen kuvailemista, mitä kuvassa on kuvattuna, niin tekstimuotoinen kuvaus kyseisistä asioista on hyvin usein pienempi kuin kuvatiedosto. En siis mieti itse kuvatiedoston kuvailemista, niin kuin pakkausalgoritmi (tai Kolmogorov-kompleksisuus) käsittäisi "datan kuvailemisen", vaan sitä, mitä ihminen ymmärtää kuvaa katsoessaan.

Toki pitää myös kysyä, mitä tietoa haluamme säilyttää: onko sommitelma ja valaistus taiteellinen, onko esineessä joitain kuvioita, joiden tarkka kuvailu on pitkäjänteistä ja hankalaa, onko kuvan tarkoitus olla tieteellinen mittaus, liittyykö kuvaan tunteita? Mars-luotain voisi kuvakilotavujen sijaan lähettää hitaalla kaistallaan takaisin Maahan "täällä on hiekkaista ja kylmää, ja täällä on nyrkin kokoisia rosoisia kiviä, ja taivas on himmeän pinkki, ja tuolla näkyy Maapallo kirkkaana tähtenä, ja kivet ovat punertavia ja mustia", mutta siitä ei tule samanlainen fiilis, että Mars on oikea paikka. Kuva Tiananmenin aukion tankkimiehestä voisi olla vain "mies kantaa muovikasseja ja seisoo panssarivaunujen edessä", mutta kyseinen kuvaus voisi myös kuvailla tilannetta, jossa perheenisä kantaa matkamuistoja panssarivaunumuseossa. (Poks, blogini hävisi Manner-Kiinasta.) Voisin kuvailla ottamaani kuvaa öisestä taivaasta sanoilla "puiden siluetit tunkeutuvat tummansiniselle kesäyön taivaalle, jossa on valaisevia yöpilviä, jotka näyttävät samalta kuin muissakin kuvissa valaisevista yöpilvistä", mutta kuvan oikea raison d'être on kertoa, että uijjuku siistii näin valaisevia yöpilviä!


Nyt on 23. elokuuta, noin kuukausi siitä, kun kirjoitin tämän postauksen. En ollut selkeästi ilmaissut ajatuksiani, enkä oikein edelleen­kään osaa. Muutamia uusia ranskalaisia viivoja:

Luulen... että summa summarum, ajatukseni datasta ovat: sitä on helppo tuottaa, ja tämä on kirous, sillä se muuttuu vastuuksi, ja mitä enemmän sitä on, sitä suurempi taakka sen kanssa on.

Paperinen päiväkirja on kiva. Mulla on niitä jo viisi tai kuusi, ne täyttyy. Ne ovat eri tavalla vastuu; vastuu täyttää niitä, vastuu pitää ne kuivana ja suojassa. Pelko, että niille käy jotain, koska niitä ei voi varmuus­kopioida kuten digitaalista dataa. Mutta tiedän sen, että ne itsessään ovat arvokkaita: ei tarvitse erikseen valikoida, minkä päivän merkinnät ovat säästämisen arvoisia, koska jo se, että se on fyysisenä jälkenä kirjaan sidotussa sivussa tekee siitä arvokkaan ja tavallaan helpomman säilöä. Jos pitäisi parissa päivässä evakuoida, niin ne on helppo päättää ottaa mukaan.

Joskus toivon, että kävisi jonkinasteinen digitaalinen katastrofi, jotta voin aloittaa oman datan säilömiseni alusta, ilman jo olemassa­olevien tiedostojen taakkaa. Yritän tavallaan rakentaa tätä blogiani, tätä sivustoa, sellaiseksi että kaikki täällä oleva, jokainen kuvatiedosto mukaan lukien, on ipso facto arvokasta. (Sen takia yritän myös pitää tiedostot pienenä: pieneksi skaalattu resoluutio, korkea pakkausaste, pitäen oleellisen vielä näkyvissä mutta antaen tarpeettoman kohinan hävitä pakkaus­virheisiin.)

Type: Folder (inode/directory). Contents: 405136 items, totalling 3.5 TB. Free space: 28.8 GB.

Yksi ongelmistani: älytön määrä tallennus­tilaa, ja se on lähes loppu. Miten siinä näin pääsi käymään?