Archiwa cyfrowe

Archiwizację przez długi czas uważano za proces pasywny, polegający na umieszczaniu przedmiotów w "suchym i chłodnym" miejscu i zapominaniu o nich do czasu, gdy będą znów potrzebne. Jednak w dobie cyfryzacji, gdy zdjęcia, filmy, dokumenty oraz inne treści przechowywane są na dyskach, pamięciach typu "flash", lub też na serwerach tworzących "chmury obliczeniowe", a nie w pudłach umieszczanych w piwnicach, archiwizacja wymaga znacznie bardziej aktywnego podejścia. Powyższemu wyzwaniu stawiają czoła naukowcy finansowani ze środków UE.

Każdy jest w pewnym sensie archwistą. Przedsiębiorstwa oraz instytucje publiczne muszą przechowywać dane gromadzone na przestrzeni wielu lat, domy mediowe muszą magazynować zdjęcia i filmy, z których następnie korzystają, muzea powinny archiwizować różnorakie treści, z myślą o kolejnych pokoleniach, natomiast praktycznie każdy z nas posiada duży, osobisty zbiór treści multimedialnych, zapisanych na dysku twardym komputera.

Uważa się, że treści cyfrowe są pod wieloma względami znacznie bardziej bezpieczne i trwałe, niż materiały zapisane w sposób analogowy: zdjęcie cyfrowe, zapisane na twardym dysku, nie ulega degradacji wraz z upływem czasu, jak ma to miejsce w przypadku odbitek przechowywanych na strychu. Nie oznacza to jednak, że materiały cyfrowe nie mogą ulec uszkodzeniu, zostać nieumyślnie zmodyfikowane, czy też utracone.

"Chociaż dobrze rozumiemy procesy chemiczne powodujące "starzenie się" materiałów analogowych, w przypadku materiałów cyfrowych sytuacja jest zgoła odmienna", zauważa Daniel Teruggi, kompozytor, badacz, oraz dyrektor naukowy w dyrektoriacie EXPERT, będącym częścią francuskiego, Narodowego Instytutu Audiowizualnego ('Institut National Audiovisuel'), który jest odpowiedzialny za kształcenie, szkolenia oraz prace badawcze w dziedzinie rozwiązań audiowizualnych i multimedialnych.

Ponieważ treści cyfrowe to tak naprawdę sekwencje liczb, nawet najmniejsza zmiana w obrębie pojedynczej cyfry może mieć drastyczny wpływ zarówno na jakość, jak i na dostępność danego materiału. Powyższe zmiany mogą nastąpić z różnych przyczyn: tak zwanego "przekłamania bitów" ('bit rot'), wynikającego z utraty niektórych właściwości magnetycznych dysku twardego, zmiany oprogramowania lub zmiany sprzętowej, czy też nieumyślnej modyfikacji dokonanej przez osobę korzystającą z danego materiału.

"Innym istotnym czynnikiem jest kompresja. Przykładowo, problemy podczas kompresji pliku o rozmiarze 20 megabajtów do 2 megabajtów, czy też podczas próby uzyskania dostępu do tego pliku lub podczas próby przemieszczenia go, mogą mieć bardzo poważne konsekwencje", twierdzi dr Teruggi. "Istniejące procesy archiwizacji cyfrowej są w dużym stopniu niedoskonałe".

Dr Teruggi, wraz z zespołem wywodzącym się z 14 organizacji zlokalizowanych w sześciu krajach, stawiał czoła powyższym wyzwaniom w kontekście projektu PRESTOPRIME . Ta czteroletnia inicjatywa została wsparta przez Komisję Europejską kwotą 8 milionów euro, a konsorcjum projektowe obejmuje pełną gamę użytkowników archiwów cyfrowych oraz osób zajmujących się pracą naukową w kontekście treści multimedialnych, w tym muzea, nadawców, przedsiębiorstwa technologiczne, instytuty badawczo-rozwojowe oraz uniwersytety.

Powyższe podmioty stworzyły wspólnymi siłami zestaw innowacyjnych narzędzi o otwartym kodzie źródłowym, pomagających archiwizatorom dowolnego rozmiaru zarządzać przetwarzanymi przez siebie treściami, monitorować je, analizować zagrożenia stojące na drodze do długoterminowej konserwacji, a także weryfikować i zapewniać integralność danych, umożliwiając jednocześnie archiwizatorom dokładniejsze szacowanie kosztów czasowych i finansowych.

"W dobie cyfrowej archiwizacja nie może być procesem pasywnym - wymaga aktywnego podejścia". Zarchiwizowane treści należy analizować, monitorować oraz regularnie sprawdzać, w celu zagwarantowania ich integralności i długoterminowej ochrony", tłumaczy dr Teruggi, koordynator projektu PRESTOPRIME.

Etykietowanie treści cyfrowych

Podejście obrane przez uczestników inicjatywy PRESTOPRIME przypomina nieco współczesne systemy rejestrowania i śledzenia, wykorzystywane do monitorowania żywności podczas jej magazynowania i transportu, zwanych niekiedy systemami śledzenia "od farmy do wózka widłowego" ('farm-to-fork'). Powyższe rozwiązanie pomaga archiwizatorom w sposób automatyczny uzyskiwać informacje na temat tego gdzie przechowywane są treści cyfrowe oraz w jakim są stanie.

"Chociaż nasze rozwiązanie z pewnością przypomina systemy monitorowania żywności, musimy stawiać czoła dodatkowej złożoności. Zepsuta żywność wydziela specyficzny zapach. W przypadku archiwów cyfrowych nie ma prostych sposób stwierdzenia, że coś poszło nie tak, często przez długi czas, niekiedy wręcz długo po tym, gdy można było odpowiednio zareagować", zauważa koordynator projektu PRESTOPRIME.

Narzędzia opracowane w ramach projektu umożliwiają automatyczne sprawdzanie zarchiwizowanych treści, pomagając jednocześnie archiwizatorom szacować zagrożenia związane z przenoszeniem lub modyfikowaniem materiałów, np. podczas modernizacji systemów komputerowych lub systemów magazynowania danych.

"W dobie cyfrowej nic nie jest statyczne. Systemy oraz urządzenia magazynujące zmieniają się co kilka lat, a każda zmiana stanowi zagrożenie dla integralności zarchiwizowanych treści", podkreśla dr Teruggi.

Zespół projektowy skupił się nie tylko na archiwizowanych treściach, ale także na powiązanych z nimi metadanych, które opisują na przykład czas i miejsce wykonania fotografii, jej autora oraz jej treść. Uczestnicy inicjatywy PRESTOPRIME stworzyli narzędzia ułatwiające dołączanie metadanych do treści, które nie zawierają tego rodzaju informacji, a także integrować różne zbiory metadanych dotyczące tego samego materiału - proces ten określa się jako "mapowanie metadanych".

"Metadane pełnią bardzo ważną role w kontekście archiwizowanych treści. Można je postrzegać przez analogię do pudeł pełnych zdjęć, przechowywanych na strychu. Chociaż my wiemy, kto znajduje się na zdjęciach oraz kiedy i gdzie zostały zrobione, to nasze wnuki, gdy odnajdą powyższe zbiory, prawdopodobnie nie będą posiadać tej wiedzy. Metadane opisujące treści cyfrowe pozwalają przechowywać tego rodzaju informacje, jednocześnie znacznie ułatwiając zarządzanie treściami oraz organizowanie ich", twierdzi dr Teruggi.

Większość narzędzi opracowanych przez uczestników inicjatywy PRESTOPRIME jest obecnie dostępna w formie oprogramowania o otwartym kodzie źródłowym - dowolna osoba może je pobrać i korzystać z nich. Narzędzia te stanowią ponadto kluczowy aspekt prac organizacji PrestoCentre, utworzonej przez partnerów projektu, a obecnie obejmującej szereg innych organizacji zaangażowanych w prace badawcze oraz w opracowywanie rozwiązań w dziedzinie archiwizacji cyfrowej. Członkowie stowarzyszenia PrestoCentre organizują konferencje oraz warsztaty, których celem wspieranie różnorakich organizacji, począwszy od niewielkich, lokalnych muzeów, aż po międzynarodowe domy mediowe, w zakresie usprawniania stosowanych przez nie procesów archiwizacji cyfrowej. Co więcej organizacja PrestoCentre wnosi znaczący wkład na rzecz międzynarodowych działań standaryzacyjnych.

"Informacje zwrotne na temat powyższych narzędzi, które uzyskaliśmy od członków konsorcjum PrestoCentre, były bardzo pozytywne. Co więcej, jeden z partnerów projektu, firma Ex Libris, pracujący zwykle z archiwami bibliotecznymi, zaczął korzystać z narzędzi w kontekście komercyjnym, planując poszerzenie swej oferty o rozwiązania z dziedziny audiowizualnej", zauważa koordynator projektu.

Od tego czasu partnerzy zaangażowani w inicjatywę PRESTOPRIME rozpoczęli prace nad projektem o nazwie "Europejskie technologie na rzecz ochrony cyfrowych treści audiowizualnych" ('European Technology for Digital Audiovisual Media Preservation', PRESTO4U), również wspieranej przez Komisję Europejską, której celem jest przeanalizowanie potrzeb różnorakich grup użytkowników.

"W przyszłości pragniemy stworzyć narzędzia przeznaczone dla pojedynczych osób, pozwalające odbiorcom domowym lepiej zarządzać zdjęciami, filmami i innymi treściami oraz chronić je", mówi dr Teruggi.

Projekt PRESTOPRIME uzyskał wsparcie finansowe w ramach Siódmego Programu Ramowego Unii Europejskiej (7PR).

Odnośniki do projektów na stronie CORDIS:

- informacje na temat 7PR w bazie danych CORDIS
- informacje na temat projektu PRESTOPRIME w bazie danych CORDIS
- informacje na temat projektu PRESTO4U w bazie danych CORDIS

Odnośnik do strony internetowej projektu:

- strona internetowa projektu PRESTOPRIME
- strona internetowa projektu PRESTO4U
- "PrestoCentre": europejskie centrum kompetencji w dziedzinie ochrony dziedzictwa audio-wizualnego - 'PrestoCentre': the European competence-centre for safeguarding audio-visual heritage)

Pozostałe odnośniki:

- strona internetowa Agendy Cyfrowej Komisji Europejskiej

opublikowano: 2015-01-20
Komentarze


Polityka Prywatności