"Zeznania z 1641
roku" ('1641 depositions'), przechowywane w bibliotece Trinity College
Dublin, stanowią zaledwie jeden z wielu przykładów cennych kolekcji
dziedzictwa kulturowego i historycznego, zgromadzonych przez
uniwersytety, muzea, archiwa oraz osoby prywatne w całej Europie. Bunt
irlandzkich katolików z 1641 roku znacząco wpłynął na koleje losu tego
kraju i doprowadził do powstania jednej z najbogatszych kolekcji wiedzy
historyczno-kulturowej w Europie, zwanej "zeznaniami z 1641 roku". Zbiór
ten obejmuje zeznania ponad 8 000 świadków, spisane na prawie 20 000
stron. Przez dziesięciolecia, a w niektórych przypadkach nawet przez
wieki, naukowcy, studenci oraz przedstawiciele ogółu społeczeństwa
przeczesywali tego rodzaju archiwa w poszukiwaniu informacji na temat
przeszłości, co było pracochłonnym i czasochłonnym procesem, pełnym
pułapek i ślepych zaułków. Niepełne i niespójne teksty, brakujące słowa,
błędne przedruki oraz literówki, ewoluujący język, a także ilość
materiałów to tylko niektóre wyzwania, którym trzeba było sprostać.
Jedno z rozwiązań powyższego problemu, opracowywane przez zespół
naukowców pochodzących z Austrii, Bułgarii, Irlandii, Izraela oraz
Włoch, bazuje na zastosowaniu technologii TIK, w celu wykonania
najcięższej pracy. Powyższe prace, realizowane w ramach projektu
"Ułatwianie zrozumienia oraz wspieranie prac badawczych poprzez
adaptacyjność" ('Cultivating understanding and research through
adaptivity' - CULTURA), wspartego kwotą 2,8 milionów euro przez Komisję
Europejską, mają ułatwić szybkie przeszukiwanie archiwów cyfrowych,
eliminowanie niespójności językowych, identyfikowanie powiązania
pomiędzy wydarzeniami historycznymi, osobami oraz przedmiotami, a także
zwiększyć dostępność bogatego, europejskiego dziedzictwa kulturowego i
historycznego dla wszystkich obywateli.
"Podczas przeglądania materiałów historycznych wiele informacji nie
jest natychmiast oczywistych - często pojawia się wieloznaczność i
niespójność, dlatego potrzebne są procesy, które pozwolą wydobywać
powyższe informacje oraz odkrywać te nieoczywiste powiązania", tłumaczy
dr Owen Conlan, docent pracujący w Grupie ds. Inżynierii Wiedzy i Danych
('Data Engineering Group'), będącej częścią Katedry Informatyki i
Statystyki ('School of Computer Science and Statistics') Trinity College
Dublin. "Powyższe informacje pozwolą następnie odkryć powiązania
pomiędzy materiałami źródłowymi, które wcześniej nie były oczywiste".
Dr Conlan, będący koordynatorem projektu CULTURA, jako przykład
podaje "Zeznania z 1641 roku". Wśród wielu osób wspomnianych w powyższym
tekście, często przewija się nazwisko Phelim O'Neil, który był
irlandzkim katolikiem i szlachcicem oraz przywódcą rebeliantów. Jednak
Phelim O'Neil określany jest także jako Sir Felim O'Neill of Kinard,
Phelim Mac Shane O'Neill, Féilim Ó Néill lub po prostu "buntownik".
Przykładowo:
"I powiedział, że w czasie, który spędził wśród buntowników,
zaobserwował i dobrze wiedział, że większość z tych, którzy pochodzili z
hrabstwa Armagh uczestniczyła w oblężeniu zamku Augher, które się nie
powiodło i w którego następstwie wielu podwładnych buntownika O'Neila
zostało zgładzonych; W odwecie wielki buntownik, Sir Phelim O'Neil
nakazał jednemu ze swoich, zwanemu Maolmurry McDonnell, znanemu z
okrucieństwa i bezwzględności, zabicie wszystkich Anglików i Szkotów..."
Historyczne sieci społecznościowe
By odnaleźć sens w tak złożonych tekstach źródłowych i
zidentyfikować powiązane materiały, uczestnicy projektu CULTURA
zastosowali najnowocześniejsze oprogramowanie służące do przetwarzania
języka naturalnego, w celu "znormalizowania" języka oraz nadania mu
znaczenia semantycznego, które będzie zrozumiałe zarówno dla komputerów,
jak i dla ludzi.
"Nie modyfikujemy tekstów źródłowych oraz dołożyliśmy wszelkich
starań, by zachować możliwie największą wierność w stosunku do
oryginałów, jednak nasz system tworzy dodatkową warstwę informacji, z
którego możliwe jest wydobywanie znaczenia", twierdzi dr Conlan.
Wydajne algorytmy pozwalają automatycznie wydobywać poszczególne
elementy oraz identyfikować powiązane z nimi treści, w celu odkrycia
kluczowych osób, zdarzeń, dat oraz innych elementów i zależności.
Następnie narzędzia stworzone przez zespół projektowy mogą dokonać
analizy powiązań pomiędzy poszczególnymi elementami, tworząc swego
rodzaju historyczną sieć społecznościową, która pomaga nadać odpowiednią
strukturę zdarzeniom historycznym oraz jednostkom, ułatwiając
zrozumienie i wizualizowanie ich znaczenia.
Powyższe podejście jest skuteczne nie tylko w przypadku materiałów
tekstowych, takich jak "Zeznania z 1641 roku", ale także w odniesieniu
do zdjęć. W powyższym przypadku metadane powiązane ze zdjęciami,
uzupełniane podczas cyfryzacji, pozwalają nadać obrazom znaczenie
semantyczne. Powyższy proces umożliwił uczestnikom projektu CULTURA
przeprowadzenie analizy zbiorów Imaginum Patavinae Scientiae Archivum
(IPSA), należących do Uniwersytetu w Padwie (Włochy). IPSA to archiwum
cyfrowe manuskryptów i grafik z annotacjami, opracowanych przez 14-go
wiecznych zielarzy w języku łacińskim.
"Zbiory IPSA obejmują głównie grafiki, które mogą zostać wzbogacone o
metadane. Powyższe metadane mają nie tylko charakter opisowy, ale także
wartość historyczną, gdyż dokumentują procesy, które były powszechnie
stosowane w okresie powstawania oryginalnej kolekcji", zauważa dr
Conlan. "Dzięki naszej analizie społecznościowej można np. sprawdzić,
kto rysował grafiki, kto finansował powyższe prace, a także jak
kształtowały się wzajemne wpływy".
Co istotne, system CULTURA zapewnia nie tylko adaptacyjność w
zależności od badanych treści, ale także dostosowuje się do potrzeb
poszczególnych użytkowników lub społeczności. Przykładowo, badacz
uniwersytecki, który posiada dogłębną wiedzę na temat danego zagadnienia
lub danego zbioru historycznego, może korzystać z systemu w celu
znalezienia konkretnego powiązania. Natomiast przedstawiciel ogółu
społeczeństwa, interesujący się się konkretnym okresem historycznym,
może poszukiwać znacznie bardziej ogólnych informacji.
"Zaobserwowaliśmy na przykład, że początkującym naukowcom system
pomaga bardziej dokładnie i szybciej zgłębiać badane przez nich
zagadnienie", zauważa dr Conlan.
Zwiększanie dostępności dziedzictwa historycznego i kulturowego
Platforma CULTURA jest w stanie sprostać potrzebom zarówno
powyższych, jak i innych typów użytkowników, dzięki innowacyjnemu
procesowi personalizacji, który uwzględnia profil użytkownika oraz
kontekst, w jakim wyszukują informacje lub uzyskują do nich dostęp.
"Widgety" wbudowane w platformę oferują rekomendacje dotyczące
powiązanych treści, które mogą zainteresować danego użytkownika, w
oparciu po części o to, co zainteresowało uprzednio użytkowników o
podobnym profilu. Dzięki temu system proponuje potencjalnie nowe ścieżki
eksploracji, pozwalając jednocześnie użytkownikom podejmować ostateczne
decyzje.
"Dobrą personalizację można porównać do gawędziarstwa. Dobry
gawędziarz zaintryguje słuchaczy, przeanalizuje ich reakcje, a następnie
odpowiednio dostosowuje swą narrację. Jednak w przypadku personalizacji
mówimy o gawędziarzu, który opowiada historię tylko jednemu
słuchaczowi", twierdzi dr Conlan.
System może nawet dostarczać dynamicznie generowaną narrację,
dotyczącą niektórych zdarzeń, dat, miejsc, czy też osób, która jest
dostosowywana do profilu użytkownika oraz do jego uprzednich działań.
"Zasoby historyczne powinny być dostępne nie tylko dla profesorów
uniwersytetów i badaczy, ale także dla wielu różnych ludzi, począwszy od
uczniów i studentów, aż po członków towarzystw historycznych, grup
interesujących się danym tematem oraz dla ogółu społeczeństwa",
podkreśla dr Conlan. "Jednymi z największych wyzwań, stojących przed
cyfrowymi archiwami historycznymi, są dostępność i świadomość. Projekt
CULTURA stanowi duży krok na drodze do sprostania tym wyzwaniom".
Oprócz "Zeznań z 1641 roku" oraz zbioru IPSA uczestnicy projektu
zaczęli stosować platformę CULTURA w odniesieniu do materiałów z 1916
roku, dotyczących Powstania Wielkanocnego oraz jego następstw, które
stanowiło kolejny element zwrotny w irlandzkiej historii, gdy irlandzcy
republikanie zbuntowali się przeciwko brytyjskiej władzy.
"Zbliża się setna rocznica wydarzeń z 1916 roku, dlatego obecny czas
jest dla Irlandii bardzo istotny. Planujemy ściśle współpracować ze
szkołami, po części dlatego, że powyższy materiał można określić jako
współczesny i bardziej dostępny", twierdzi koordynator projektu CULTURA.
"Skupiamy się zwłaszcza na identyfikowaniu powiązań pomiędzy
opowieściami a konkretnymi osobami, gdyż ludzie zwykle wzbudzają
największe zainteresowanie. Nasze podejście pomoże zwrócić uwagę
użytkowników na stosunkowo abstrakcyjne wydarzenia oraz ułatwi im
zrozumienie kontekstu".
Kilku partnerów inicjatywy planuje nadal rozwijać platformę CULTURA
po zakończeniu prac projektowych, z zamiarem poszerzenia jej
funkcjonalności o nowe zbiory. Jednocześnie pojedynczy partnerzy
zamierzają dokonać komercjalizacji poszczególnych elementów i
technologii tworzących system.
Projekt CULTURA uzyskał wsparcie finansowe w ramach Siódmego Programu Ramowego UE (7PR).
Hiperłącza do projektu w serwisie CORDIS:
- 7PR w serwisie CORDIS
- informacje na temat projektu CULTURA w serwisie CORDIS
Hiperłącze do strony internetowej projektu:
- strona internetowa projektu 'Cultivating understanding and research through adaptivity'
Inne hiperłącza:
- strona internetowa Komisji Europejskiej poświęcona agendzie cyfrowej