lunedì 15 gennaio 2007

Dal PageRank alla Fitness

Vi siete mai chiesti come mai, su Internet, i siti web con tanti link (referrals) ne ottengono sempre di più mentre siti poco popolari tendono a non accrescere la propria visibilità nonostante il numero dei link aumenti esponenzialmente ogni anno nel numero di collegamenti e di dimensioni?

In sintesi, vi siete mai chiesti perché chi è ricco tende ad accumulare sempre più ricchezza?

Cosa accade, ad esempio, alla popolarità di un sito web quando in una rete come Internet fa ingresso una nuova pagina?

Per figurarci questo, proviamo a immaginare qualcosa di più vicino alla nostra esperienza quotidiana: immaginiamo di osservare alcune barche ormeggiate in un piccolo porto.

Ogni giorno arriva una nuova barca e noi abbiamo il compito di legarla con delle corde ad altre due barche, scelte a caso, già sul posto.
Introduciamo ora una piccola regola al modello proposto. Ci accorgiamo infatti che ad alcune barche sono legate 2-3 corde mentre ad altre barche sono legate 8, 9 o addirittura quindici corde!
Supponiamo di preferire quelle barche che possiedono un maggior numero di corde!
La barca con dieci corde avrà ora probabilità doppia rispetto a una barca con appena cinque corde di essere legata a una nuova barca appena arrivata.

Se immaginiamo gli elementi non come barche ma come pagine web, capiremo perché i siti più popolari siano maggiormente visibili di quelli meno popolari e possiedano dunque la peculiarità di acquisire sempre più link.

Aggiungiamo infine al nostro modello milioni di elementi, ad ognuno dei quali aumentiamo i collegamenti agli altri elementi del modello, e arriveremo a una inaspettata scoperta, la stessa cui arrivarono nel 1999 due fisici: Albert László Barabási e Réka Albert.

“E’ possibile dimostrare che quando una rete cresce di dimensioni, la sua struttura rimane invariante” (1)

Simulando al computer numerose reti e variando il numero dei nodi iniziali i due scienziati si accorsero che, anche conducendo l’esperimento migliaia di volte in modo sempre diverso, nessuna delle modifiche iniziali o delle scelte introdotte dal caso, diventava rilevante sulla topologia della rete a lungo termine.
Cioè, la rete mostrava sempre la stessa struttura base (scale free o a invarianza di scala), con i centri (hub) con un numero maggiore di collegamenti iniziali che non solo mantenevano, ma aumentavano il proprio grado di aggregazione con altri elementi della rete.

Accade anche nella letteratura scientifica: nelle pubblicazioni scientifiche un articolo nuovo tende a inserire nelle citazioni articoli già noti piuttosto che articoli ignoti, accrescendo ulteriormente la popolarità dei primi.

Proprio per questa caratteristica i modelli come quello proposto vengono definiti del tipo “rich get richer” (in Italia si direbbe “piove sempre sul bagnato”).

Nessun commento: