Trustrank

Se ne parla come se fosse la nuova frontiera dei motori di ricerca. Vediamo di capire di cosa si tratta e che conseguenze ci sono per noi.
Tre eminenti scienziati - Zolt´an Gy¨ongyi, Hector Garcia-Molina, Jan Pedersen - due della standford university, uno di yahoo, hanno scritto questo documento: Combating Web Spam with TrustRank.
Sono una dozzina di pagine di formule, matrici, finte matrici inverse e trasposte per dire una cosa abbastanza semplice e che se volete era già tra le righe del documento scritto da Brin e Page nel lontano 1998.

Il trustrank è un attributo che qualifica in maniera positiva una pagina priva di web spam - che non usa tecniche per ingannare i motori di ricerca - dandole una priorità maggiore nelle SERP.

L’osservazione su cui si basa il trustrank è la seguente: se chiamiamo “buoni” quei siti che non usano tecniche di web spam, possiamo inferire che questi linkino a siti buoni. Essendo difficile determinare in maniera automatica cio’ che e’ spam e cio’ che non e’ spam, un seme di partenza di siti buoni viene valutato manualmente. Brin e Page nel loro documento, quando parlano di pagerank personalizzato non stanno parlando di una cosa particolarmente diversa.

Una domanda mi preoccupa: chi deciderà chi sono i buoni e i cattivi? Sembra una domanda banale, ma già i TRE emeriti hanno fatto valere il proprio sentimento americano nei loro test: il 4,3% dei siti è risultato non attendibile (non buono e non cattivo) perchè scritto in lingue asiatiche e privo della traduzione in inglese… “We were unable to properly evaluate 43 sites based on the available information. These sites were mainly East Asian ones, which represented a challenge because of the lack of English translation.”

Preoccupante.

0 commenti ↓

Non ci sono ancora commenti a questo articolo; inizia una discussione! Inserisci un commento usando il form qui sotto.

Lascia un Commento