NADINE – linki internetowe uwidoczniają schematy interakcji

W jaki sposób możemy przewidywać działania ludzi w Internecie na podstawie linków? Czego możemy się dowiedzieć ze schematów korzystania z Internetu? W ramach unijnego projektu NADINE opracowywane są algorytmy i metody analizy aktywności online, które rzucą światło na powiązania między tematami, krajami, a nawet towarami handlowymi.

Na Internet składa się obecnie około 50 miliardów stron, które łącznie tworzą rozległy, wirtualny krajobraz. Nasza interakcja z nimi dostarcza danych, które po rozbiciu i przeanalizowaniu, mogą pomóc zrozumieć szerokie spektrum działalności człowieka, od kulturalnej po gospodarczą.

Dofinansowany z budżetu „Przyszłe i powstające technologie” 7PR projekt NADINE (New tools and Algorithms for DIrected NEtwork analysis) wnosi wkład w opracowywanie nowych typów wyszukiwarek internetowych, zapewniając Europie czołową pozycję w tym jakże ważnym obszarze.

„Staramy się stworzyć mapę Internetu, aby pokazać, jak połączone są strony i jak ludzie korzystają z linków w czasie surfowania po sieci” – wyjaśnia Dima Shepelyansky, koordynator projektu NADINE i dyrektor ds. badań w Laboratoire de Physique Théorique CNRS w Tuluzie.

Partnerzy projektu wykorzystują między innymi narzędzia dostarczone przez firmę Google, aby pokazać, w jaki sposób strony są ze sobą powiązane. To umożliwia na przykład ustalenie stopnia prawdopodobieństwa odwiedzin na pewnych stronach, podejmowania wyborów, zakupu przedmiotów czy głosowania w określony sposób.

Doskonalenie sposobów śledzenia interakcji online

Aby opracować i przetestować swoje metodologie, naukowcy przestudiowali noty biograficzne w Wikipedii z zamiarem sprawdzenia, czy będą w stanie uszeregować ludzi, do których się odnoszą, według ich siły oddziaływania. Analiza objęła 24 główne języki, biorąc pod uwagę liczbę artykułów powiązanych z tymi osobami za pomocą metody PageRank firmy Google, według której dana strona jest ważna, jeżeli powołują się na nią inne ważne strony.

Takie podejście postawiło przez partnerami projektu interesującą kwestię do rozstrzygnięcia – badacz Linneusz okazał się najbardziej wpływową osobą. Zważywszy na fakt, że jest autorem systemu klasyfikacji organizmów, linki do jego noty biograficznej zostały zamieszczone na każdej stronie Wikipedii, która dotyczy roślin i zwierząt, co z kolei wypaczyło wyniki.

Naukowcy postanowili zatem wprowadzić CheiRank, metodę opisującą wagę strony proporcjonalnie do liczby linków wychodzących. Łącząc obydwie te metody udało im się ustalić wiarygodny sposób określania wagi strony. Opracowane metody umożliwiają też wykrycie samoorganizujących się i wzajemnie połączonych społeczności internetowych.

Przepływy informacji online przypominające wymianę handlową

Mając na względzie to, że linki prowadzące do strony i wychodzące z niej mogą zobrazować sposób, w jaki zachodzi wymiana informacji, partnerzy projektu zastosowali swoje ustalenia do analizy przepływów handlowych. W toku prac nad projektem NADINE korzystano z bazy danych ONZ nt. handlu światowego, która zawiera dane z ostatnich 50 lat. „Opracowujemy nowy sposób analizowania wymiany handlowej 61 produktów w państwach członkowskich ONZ, ustalając wrażliwość równowagi handlowej na fluktuacje cenowe” – wyjaśnia Shepelyansky.

W ramach NADINE partnerstwo zawiązali fizycy teoretyczni, matematycy i informatycy z Francji, Holandii, Węgier i Włoch. „Transnarodowe dofinansowanie ze środków UE było niezbędne do stworzenia zespołu naukowców reprezentujących tak zróżnicowane dyscypliny” – dodaje Shepelyansky.

Prowadzone od trzech lat prace nad projektem mają się zakończyć w kwietniu 2015 r. Wsparcie ze środków UE wyniosło niemal 1,22 mln EUR. Dysponując teraz dopracowaną metodologią, naukowcy z konsorcjum NADINE zamierzają kontynuować prace z różnymi partnerami, między innymi ze Światową Organizacją Handlu.

Link do strony internetowej projektu

Inne linki
http://www.quantware.ups-tlse.fr/QWART/cheirank/cheirank.html
http://www.quantware.ups-tlse.fr/QWLIB/topwikipeople/
http://www.quantware.ups-tlse.fr/QWLIB/wtnmatrix/
http://en.wikipedia.org/wiki/CheiRank

opublikowano: 2015-02-09
Komentarze


Polityka Prywatności