Duże zbiory danych to pojęcie odnoszące się do ogromnych ilości danych
tworzonych bardzo szybko przez dużą liczbę zróżnicowanych źródeł. Dane
mogą być tworzone przez ludzi lub generowane przez maszyny, takie jak
czujniki gromadzące informacje o klimacie, obrazy satelitarne, cyfrowe
zdjęcia i filmy wideo, dane transakcji zakupu, sygnały GPS itp. Obejmują
wiele sektorów, od opieki zdrowotnej po transport i energetykę.
Dane stały się kluczowym zasobem gospodarki i naszych społeczeństw,
na podobieństwo klasycznych kategorii zasobów ludzkich i finansowych.
Analitycy muszą obecnie stawić czoła ogromnemu napływowi danych, które
trzeba przefiltrować, aby zaleźć rozwiązania współczesnych problemów.
Niezależnie od tego czy są to informacje geograficzne, dane
statystyczne, dane o pogodzie, dane badawcze, dane o transporcie, dane
na temat zużycia energii czy stanu zdrowia, potrzeba ogarnięcia dużych
zbiorów danych prowadzi do innowacji w technologii, powstawania nowych
narzędzi i rozwoju nowych umiejętności. Jest to jedno z ważniejszych
wyzwań w części poświęconej ICT nowego programu UE w zakresie badań
naukowych i innowacji „Horyzont 2020”.
Jednak pomoc w ewaluacji dużych zbiorów danych i ich przetwarzaniu
może być w zasięgu ręki, choć z nieoczekiwanej strony... naszej
podświadomości. Z uwagi na fakt, że jesteśmy świadomi zaledwie 10%
aktywności naszego mózgu, naukowcy z projektu CEEDS poszukują sposobów
na odblokowanie pozostałych 90%, aby przekonać się, czy może nam to
pomóc w znalezieniu tego czego szukamy.
Narzędzia wirtualnej rzeczywistości kluczem do przeniknięcia wielkich zbiorów danych
CEEDS – Collective Experience
of Empathic Data Systems – to próba „uwidocznienia” podświadomości za
pomocą pomiaru reakcji sensorycznych i fizjologicznych na obserwowany
przepływ dużych zbiorów danych. Naukowcy pracujący nad projektem
zbudowali maszynę, która wykorzystuje narzędzia wirtualnej
rzeczywistości do przenikania do tych wielkich zbiorów danych.
Wykorzystując szereg systemów audio-wizualnych i taktylnych, monitoruje
także reakcje użytkowników na doświadczenie, aby dowiedzieć się, na czym
się koncentrują i jak to robią.
Maszyna XIM (eXperience Induction Machine), która powstała w toku
projektu CEEDS i znajduje się w Centrum Systemów Autonomicznych i
Neurobiotyki kierowanym przez profesora Paula Verschure z Universitat
Pompeu Fabra w Barcelonie, została zaprojektowana jako pomoc dla
analityków w lepszym przyswajaniu dużych zbiorów danych. Dzięki
monitorowaniu ich reakcji, dostarcza również informacji, które mogą być
użyteczne w projektowaniu prezentacji danych w przystępniejszy sposób w
przyszłości.
Neuronaukowcy to pierwsza grupa, na której twórcy CEEDs
przetestowali swoją maszynę. Typowe dla tej dyscypliny naukowej potężne
zbiory danych zostały animowane za pomocą bodźców wizualnych i
dźwiękowych.
W komorze immersyjnej 3D do analizy reakcji użytkowników na dane
znajduje się cała gama urządzeń. Czujniki ruchu śledzą zmiany postawy i
ruchy ciała. Okulograf podpowiada użytkownikowi na czym się skupić i
sprawdza rozszerzenie źrenic pod kątem objawów stresu. Rękawica
„wyczuwa” ruchy ręki, mierzy uścisk i reakcje skórne. Kamery analizują
wyraz twarzy. Sprzęt do analizy mowy wykrywa komponenty emocjonalne w
wypowiedziach użytkownika i wydawanych przez niego dźwiękach. Wreszcie
specjalnie zaprojektowana kurtka monitoruje puls i oddech.
Zmierzono reakcje neuronaukowców na dane. Maszyna, wysyłając im
podprogowe podpowiedzi w postaci migających strzałek, których nie byli
świadomi, kierowała ich do obszarów potencjalnie bardziej atrakcyjnych z
ich punktu widzenia. Było to pomocne również wtedy, kiedy stawali się
zmęczeni lub przeładowani informacjami, poprzez dostosowanie prezentacji
do ich nastroju. Koordynator projektu CEEDS, profesor Jonathan Freeman,
psycholog z Uniwersytetu Goldsmiths w Londynie, wyjaśnia: „Użytkownikom
pomaga uproszczenie wizualizacji danych, kiedy przyswajanie ich staje
się zbyt trudne lub stresujące oraz intensyfikacja prezentacji, kiedy
wydają się znudzeni”.
Przyspieszanie analizy danych ma ogromną wartość
Nowatorstwo podejścia CEEDS polega na tym, że mimo dostępności wielu
komponentów oddzielnie, nikt ich jak dotąd nie połączył w jednym celu:
zoptymalizowania rozumienia dużych zbiorów danych przez człowieka.
Możliwych
zastosowań CEEDS nie brakuje, od kontrolowania obrazowania
satelitarnego i poszukiwania ropy, po astronomię, ekonomię i badania
historyczne. „Potencjał tkwi wszędzie tam, gdzie bogactwo danych wymaga
sporego nakładu czasu albo niewiarygodnie dużego wysiłku” – dodaje prof.
Freeman. „Widzimy, że dla człowieka fizycznie niemożliwym jest
analizowanie wszystkich docierających danych, najzwyczajniej ze względu
na czas, jaki jest do tego potrzebny. Jakikolwiek system, który może
przyspieszyć i usprawnić analizę ma ogromną wartość”.
Przyszłe zastosowania CEEDS mogą również wiązać się nie tylko z
dużymi zbiorami danych. System może pomóc w gromadzeniu opinii
użytkowników w środowiskach fizycznych, takich jak sklepy, muzea czy
biblioteki. Artyści występujący przed publicznością czy didżeje także
zdają sobie teraz sprawę, że mogą pozyskiwać informacje o reakcjach
odbiorców noszących np. bransoletki, które mierzą intensywność tańca,
temperaturę ciała czy intensywność pocenia się. Nauka w klasie szkolnej
również mogłaby przebiegać efektywniej, gdyby uczniowie mogli podłączać
się do własnych podświadomych reakcji na powiedzmy wykresy. Innym
zagadnieniem, jakie naukowcy analizowali w kontekście CEEDs to
wprowadzanie doświadczeń archeologów w identyfikacji na przykład
liczących sobie 2 000 lat kawałków wyrobów garncarskich do baz danych,
aby przyspieszyć ich dopasowywanie w przyszłości.
Projekt CEEDS, który zgromadził 16 partnerów z dziewięciu krajów,
otrzymał 6,5 mln EUR z 7. programu ramowego UE jako projekt z dziedziny
przyszłych i powstających technologii.
Odnośnik do projektu na stronie CORDISOdnośnik do strony internetowej projektuTwitterFET: przyszłych i powstających technologii