Na Internet składa się obecnie około 50 miliardów stron, które łącznie
tworzą rozległy, wirtualny krajobraz. Nasza interakcja z nimi dostarcza
danych, które po rozbiciu i przeanalizowaniu, mogą pomóc zrozumieć
szerokie spektrum działalności człowieka, od kulturalnej po gospodarczą.
Dofinansowany z budżetu
„Przyszłe i powstające technologie” 7PR projekt
NADINE
(New tools and Algorithms for DIrected NEtwork analysis) wnosi wkład w
opracowywanie nowych typów wyszukiwarek internetowych, zapewniając
Europie czołową pozycję w tym jakże ważnym obszarze.
„Staramy się stworzyć mapę Internetu, aby pokazać, jak połączone są
strony i jak ludzie korzystają z linków w czasie surfowania po sieci” –
wyjaśnia Dima Shepelyansky, koordynator projektu NADINE i dyrektor ds.
badań w Laboratoire de Physique Théorique CNRS w Tuluzie.
Partnerzy projektu wykorzystują między innymi narzędzia dostarczone
przez firmę Google, aby pokazać, w jaki sposób strony są ze sobą
powiązane. To umożliwia na przykład ustalenie stopnia prawdopodobieństwa
odwiedzin na pewnych stronach, podejmowania wyborów, zakupu przedmiotów
czy głosowania w określony sposób.
Doskonalenie sposobów śledzenia interakcji online
Aby opracować i przetestować swoje metodologie, naukowcy
przestudiowali noty biograficzne w Wikipedii z zamiarem sprawdzenia, czy
będą w stanie uszeregować ludzi, do których się odnoszą, według ich
siły oddziaływania. Analiza objęła 24 główne języki, biorąc pod uwagę
liczbę artykułów powiązanych z tymi osobami za pomocą metody
PageRank firmy Google, według której dana strona jest ważna, jeżeli powołują się na nią inne ważne strony.
Takie podejście postawiło przez partnerami projektu interesującą
kwestię do rozstrzygnięcia – badacz Linneusz okazał się najbardziej
wpływową osobą. Zważywszy na fakt, że jest autorem systemu klasyfikacji
organizmów, linki do jego noty biograficznej zostały zamieszczone na
każdej stronie Wikipedii, która dotyczy roślin i zwierząt, co z kolei
wypaczyło wyniki.
Naukowcy postanowili zatem wprowadzić
CheiRank, metodę opisującą wagę strony proporcjonalnie do liczby linków wychodzących. Łącząc obydwie te metody udało im się ustalić
wiarygodny sposób określania wagi strony. Opracowane metody umożliwiają też wykrycie samoorganizujących się i wzajemnie połączonych społeczności internetowych.
Przepływy informacji online przypominające wymianę handlową
Mając na względzie to, że linki prowadzące do strony i wychodzące z
niej mogą zobrazować sposób, w jaki zachodzi wymiana informacji,
partnerzy projektu zastosowali swoje ustalenia do analizy przepływów
handlowych. W toku prac nad projektem NADINE korzystano z
bazy danych ONZ nt. handlu światowego,
która zawiera dane z ostatnich 50 lat. „Opracowujemy nowy sposób
analizowania wymiany handlowej 61 produktów w państwach członkowskich
ONZ, ustalając wrażliwość równowagi handlowej na fluktuacje cenowe” –
wyjaśnia Shepelyansky.
W ramach NADINE
partnerstwo
zawiązali fizycy teoretyczni, matematycy i informatycy z Francji,
Holandii, Węgier i Włoch. „Transnarodowe dofinansowanie ze środków UE
było niezbędne do stworzenia zespołu naukowców reprezentujących tak
zróżnicowane dyscypliny” – dodaje Shepelyansky.
Prowadzone od trzech lat prace nad projektem mają się zakończyć w
kwietniu 2015 r. Wsparcie ze środków UE wyniosło niemal 1,22 mln EUR.
Dysponując teraz dopracowaną metodologią, naukowcy z konsorcjum NADINE
zamierzają kontynuować prace z różnymi partnerami, między innymi ze
Światową Organizacją Handlu.
Link do strony internetowej projektu
Inne linki
http://www.quantware.ups-tlse.fr/QWART/cheirank/cheirank.htmlhttp://www.quantware.ups-tlse.fr/QWLIB/topwikipeople/http://www.quantware.ups-tlse.fr/QWLIB/wtnmatrix/http://en.wikipedia.org/wiki/CheiRank