martedì 18 gennaio 2011

Pagerank spiegato (2)

Pagerank e' l'algortimo utilizzato da Google per attribuire un valore ai contenuti su Internet.
Nello scorso articolo (http://dariocastagna.blogspot.com/2011/01/page-rank-spiegato-1.html) abbiamo sviscerato la formula di base utilizzata da Pagerank per calcolare il "valore intrinseco" (ranking) di una pagina.


r(A) = (y/N) + (1-y) (   (r(B1)/nB1) + (r(B2)/nB2) + (r(B3)/nB3) + (r(Bn)/nBn)  )


Riepiloghiamo una possibile interpretazione di questa formula (per altre interpretazioni leggete il precedente articolo), l'interpretazione statistica.


y e' la probabilità che un navigatore clicci su un link di una pagina a caso. Questa probabilità è stimata intorno al 10% (0.1) 


N è il numero di pagine presenti sul Web o comunque indicizzate dal motore di ricerca.


L'interpretazione probabilistica dice che 


il ranking di una pagina corrisponde alla probabilità che questa pagina ha di essere visitata. 

Come è composta questa probabilità? Da due termini.

Il primo termine (y/N) è null'altro che la probabilità che il navigatore arrivi sulla pagina in questione per caso. Il secondo termine (rappresentato dal resto della formula) è la probabilità che il navigatore ha di arrivare sulla pagina, non cliccando casualmente su un link, ma seguendo una sequenza di link ben precisa.

Nel precedente articolo ci siamo soffermati a lungo sulla formula e la sua costruzione. Questa volta invece intendo iniziare ad analizzarne i risvolti pratici.

Google stima y, cioè la probabilità che un navigatore faccia un click a caso su un link intorno al 10%. Questo significa che nel 90% (cioè 1-y, come indicato nella formula) dei casi i navigatori non cliccano a caso ma seguono un percorso ben definito guidato dal loro interesse. 

Questa spiega l'importanza fondamentale dei links. La probabilità di arrivare su una pagina, come ci dice la formula è proporzionale ad alcuni fattori:

  1. quanti links puntano alla pagina in questione (la sommatoria nella formula, in cui ogni link contribuisce per un termine)
  2. quanto importanti sono le pagine che contengono i links che puntano alla pagina di interesse, in gergo chiamati backlinks (il ranking r(Bn) di ogni pagina sorgente)
ed è invece inversamente proporzionale al

  1. numero di links presenti sulla pagina di origine (nBn)
Quindi, seguendo l'interpetazione probabilistica per posizionare ottimamente una pagina su Google bisogna fare 3 cose essenziali:

  1. Creare un gran numero di links da altre pagine verso la tua pagina
  2. Posizionare questi links su pagine a loro volta importanti
  3. Assicurarsi che non ci siamo troppi links sulle pagine che ti puntano in modo da non disperdere il traffico
Bisogna fare attenzione che questa formula tiene conto esclusivamente di un modello teorico del web. I motori di ricerca reali impongono condizioni non matematiche che sono molto importanti:

  1. I links all'interno dello stesso dominio hanno un peso molto ridotto
  2. I links da pagine "furbe", che sono cioè state identificate come pagine il cui solo scopo è quello di trarre in inganno il motore di ricerca sono penalizzati
  3. I links tra siti ospitati sullo stesso server hanno un peso inferiore in quanto potrebbero essere "pilotati" da uno stesso gestore a scopi di marketing (attenzione quindi ai providers che condividono macchine tra più siti!)
  4. I links identificati come appartenenti allo stesso autore hanno un peso minore
  5. solamente i links "visibili" contano. Ad esempio, links interni a pagine di Facebook che non vengono indicizzati in quanto contengono la meta direttiva "no follow" che impedisce ai motori di ricerca di leggerne il contenuto e di seguirne i links non contano nulla da un punto di vista del ranking anche se portano traffico.
L'interpretazione probabilistica apre una questione filosofica. In uno dei miei articoli ho spiegato l'importanza del "contenuto". Ho detto chiaramente che l'aspetto più importante per una pagina è il suo contenuto. Ma se guardiamo la formula risulta chiaro che il contenuto non conta assolutamente nulla per quanto riguarda il ranking.  Questo è infatti vero. Ma dobbiamo fare un passo avanti e capire due concetti prima di poter trarre una conclusione di questo genere che, come vedremo è sbagliata.

Il contenuto favorisce i links spontanei.

Abbiamo visto che la tua pagina acquisisce ranking se è linkata, in particolare da pagine importanti. Qual'è il metodo più semplice per ottenere backlinks in modo del tutto naturale e gratuito? Fornire ottimi contenuti in modo da farorire quel processo naturale che porta le altre persone a linkarti cioè a referenziarti. Come nel passaparola. Se lavori bene chi ti conosce consiglierà ad altri di lavorare con te. Allo stesso modo se la tua pagina ha dei contenuti interessanti molti tenderanno a citarla, a referenziarla e questo come abbiamo visto porterà il ranking della tua pagina in alto.

Il processo di ricerca si svolge in due fasi.

I motori di ricerca operano tipicamente in due fasi. Quando si digita una chiave di ricerca la prima fase di selezione dei risultati consiste nel selezionare il contenuto in base alla pertinenza delle parole chiave. E' il contenuto a determinare quali sono le parole chiave pertinenti per una pagina. Siccome però è possibile in qualche modo "forzare" il contenuto di una pagina per scopi di marketing il motore di ricerca dà più importanza al contenuto testuale dei backlinks che puntano alla pagina in questione. In altre parole, il motore di ricerca, ritiene più attenbibili le descrizioni che altri fanno della tua pagina. Ma queste descrizioni dipendono sempre dalla chiarezza dei contenuti esposti. Se i tuoi contenuti sono chiari, ad esempio "10 consigli per avere successo su internet" e la pagina contiene effettivamente questi 10 consigli, è probabile che venga linkata da terze parti con  questa descrizione che, come abbiamo visto, è molto importante per i motori di ricerca.
Solamente in una seconda fase  i risultati già selezionati dalla prima fase vengono ordinati in ordine inverso di ranking (le pagine con ranking più alto per prime). Questa seconda fase è quella effettivamente più "tecnica". La seconda fase è pilotata più dalla rete di referenze cioè di backlinks che non dal contenuto stesso della pagina, in quanto, come abbiamo visto, il ranking non è strettamente legato al contenuto.

Riepiloghiamo.
In ogni ricerca sui motori di ricerca esistono 2 fasi: la selezione e l'ordinamento.

Per la prima fase è fondamentale il testo descrittivo dei backlinks che puntano alla tua pagina e il contenuto della pagina stessa dal quale il motore di ricerca estrapola le parole chiave più pertinenti.
Per la seconda fase è fondamentale la rete di backlinks  che rimandano alla tua pagina (ricordo che il backlink, in gergo, è proprio il link che rimanda alla tua pagina).

Quindi, per posizionarsi ottimamente sui motori di ricerca bisogna fare essenzialmente 2 cose:

  1. Assicurarsi che i contenuti vengano interpretati correttamente dal motore di ricerca in modo che esso associ alla tua pagina le parole chiave effettivamente pertinenti con il contenuto della pagina.
  2. Assicurarsi di avere una rete estesa di backlinks che referenzia la pagina e che questi backlinks provengano da pagine importanti cioè con un ranking alto.
Se non si compie il primo passo, anche se si ha un ranking altissimo, non si viene comunque trovati perchè la pagina non viene selezionata nella prima fase in quando le parole chiave digitate dall'utente nel motore di ricerca non attivano la pagina come risposta candidata.

Se non si compie il secondo passo è possibile che la pagina venga effettivamente selezionata dal motore di ricerca come candidata ma non sarà visibile in quanto il basso ranking la posizionerà ultima tra le altre candidate.

Quindi: pertinenza del testo dei backlinks e dei contenuti e backlinks di qualità.

Come anticipato nel primo articolo questa discussione terminerà nel prossimo articolo nel quale andremo a dettagliare meglio come creare i backlinks e come fare sì che i contenuti attivino le parole chiave pertinenti


Nessun commento:

Posta un commento