giovedì 11 gennaio 2007

La fitness premiata dal PageRank



Google è curioso, perché il suo comportamento smentisce il modello di rete a invarianza di scala [1].

Ricordo che, secondo il modello di rete a invarianza di scala, il primo che arriva ha un vantaggio competitivo rispetto agli altri: sul World Wide Web le pagine più connesse sono quelle aggiunte prima di altre che non hanno avuto il tempo di aggiudicarsi dei link e trasformarsi in hub (che sono i nodi principali, ricchi di collegamenti).

Eppure Google non segue questo modello. Il celebre motore di ricerca vide la luce appena nel 1997, quando altri motori di ricerca come Inktomi o Altavista già dominavano da alcuni anni il mercato.

Nonostante l'handicap di essere entrato in competizione in ritardo, Google in breve tempo divenne il nodo più importante della rete, e il motore di ricerca più conosciuto e utilizzato.

Questo offre ai “nuovi arrivati” nuove speranze. Google ci dimostra infatti che se la nostra azienda ha realizzato da poco un sito web, ebbene, essa potrà aggiudicarsi, utilizzando delle strategie di posizionamento adeguate, una buona visibiltà avvantaggiandosi rispetto alla concorrenza già presente in rete da anni.

L’eccezione di fenomeni come Google dimostrerebbe, dunque, come il modello di rete a invarianza di scala, da solo, non riesca a descrivere completamente l'estrema complessità di Internet.

Nelle reti a inviarianza di scala, come Internet o le reti di relazione sociali umane, esiste cioè una proprietà intrinseca che influenza la velocità con cui le pagine o gli attori dell’ambiente riescono ad annettersi nuovi link.

Alcuni nodi, pur comparendo molto tardi, riescono ad aggiudicarsi in breve tempo la maggior parte dei link della rete; altri, anche se apparsi per primi, non se ne aggiudicano nessuno e non diventano dunque nodi importanti.


I NODI NON SONO TUTTI UGUALI

In ogni ambiente dotato di una certa competizione ogni nodo è caratterizzato da quello che il fisico teorico Albert-László Barabási chiama fitness [2]. Possiamo immaginare la fitness in una rete sociale come quella capacità che abbiamo di stringere più amicizie e legami rispetto ai nostri vicini. Sappiamo che le persone più importanti hanno generalmente molti amici, contatti umani che possono tornare utili nel momento del bisogno. Pensiamo ad esempio a un uomo politico. Il suo potere è proporzionale alla quantità di contatti che sono presenti nella sua agenda. La sua candidatura avrà successo nella misura in cui riuscirà a farsi riconoscere dal maggior numero di potenziali votanti.
E’ lo stesso quanto accade su Internet: la popolarità di una pagina Web è la sua abilità di farci tornare quotidianamente sul suo contenuto, piuttosto che su quello di miliardi di pagine che si contendono la nostra attenzione.

In una rete possiamo assegnare una fitness a ogni pagina o nodo per indicare la sua capacità di competere per i link. Ad esempio la fitness di questo mio articolo può essere 0,000001 mentre quella della home page di Google 0,8.

Sul Web conta non il numero in sè ma il loro rapporto. Non è difficile immaginare che Google possieda una importanza 800.000 volte più alta di questa pagina che state leggendo.

L’introduzione di questa nuova grandezza non esclude i due meccanismi che abbiamo visto nei due articoli precedenti: la legge di potenza e il collegamento preferenziale. Quello che cambia è solo il criterio con il quale una pagina viene considerata più o meno attraente.

Quando ho parlato del modello a reti a invarianza di scala ho dato per scontato una cosa: che la capacità di attrarre link di un nodo è proporzionale al numero di link già presenti. Chi ha più link è maggiormente avvantaggiato.

Ora introduciamo un ulteriore tassello a questo mosaico: in un ambiente competitivo la fitness assume un ruolo decisivo!

Un modo semplice per utilizzare la fitness nel nostro modello è descrivere il collegamento preferenziale come il prodotto tra la fitness del nodo e il suo numero di link: ogni nuova pagina deciderà dove connettersi confrontando il prodotto tra fitness e connettività di ogni pagina disponibile.

Tra due pagine con lo stesso numero di link sarà quello con la fitness più alta ad ottenere link più velocemente dell’altra.


[1] Barabási, A-L., Albert, R., Jeong, H. "Mean-Field Theory for Scale-Free Random Networks
(http://www.nd.edu/~networks) ", Physica A 272, pp 173-187, 1999

[2] Barabási, A.-L., "Link - la scienza delle reti", Einaudi, 2004, ISBN 8806169149

Nessun commento: