Ogni disciplina possiede dei concetti fondamentali. Gli assiomi di una geometria dai quali è possibile derivare tutti i teoremi. Le leggi di Newton con le quali è possibile costruire tutta la meccanica classica. Noi siamo interessati al Web Marketing. Le fondamenta del Web Marketing sono costituite dalla visibilità che le nostre informazioni e proposte hanno sul Web. La fonte primaria di visibilità è data da un ottimo posizionamento sui motori di ricerca. Quindi per avere successo nella disciplina del Web Marketing è fondamentale capire i meccanismi di posizionamento sui motori di ricerca, sfatando i miti e smentendo le leggende metropolitane.
Quali sono gli assiomi del posizionamento sui motori di ricerca, posizionamento così essenziale per il successo nel Web Marketing?
Per riuscire a posizionarsi in modo ottimale sui motori di ricerca è fondamentale capire i meccanismi fondamentali del "ranking". Cos'è il ranking? Il ranking è un valore numerico che valuta l'importanza del contenuto di una pagina pubblicata sul Web. L'algoritmo principe nel ranking, che è anche l'algoritmo fondante di Google si chiama "Pagerank" (marchio Google). Quest'algoritmo ha rivoluzionato i meccanismi di indicizzazione dei motori di ricerca e ha creato una gerarchia sul Web. Pagerank è veramente la chiave di volta del Web degli ultimi 10 anni in quanto nelle sue derivazioni ed evoluzioni costituisce il metro di valutazione dei contenuti sul Web. Ogni nostro contenuto sarà valutato da Pagerank. E se il nostro contenuto sarà "promosso" dall'algoritmo avrà un ranking elevato che si traduce in un buon posizionamento sui motori di ricerca e quindi in visibilità che è il fondamento del Web Marketing.
Entriamo adesso nel vivo del discorso.
I motori di ricerca sono strumenti fondamentali per permettere ai navigatori di trovare le informazioni che stanno cercando. Compiere in modo attendibile questo mestiere è estremamente difficile. Questo perchè i contenuti sulla rete sono completamente "anarchici". Non rispettano alcuno standard. Sono scritti in stili e lingue diverse. Con tecnologie diverse. Ci sono contenuti importanti e contenuti fasulli. Ci sono pagine incomplete, abbandonate, duplicate. Immaginate di dover trovare un particolare articolo in una biblioteca di miliardi di libri non organizzati, scritti in lingue diverse ed epoche diverse e che cambiano continuamente. E' un lavoro a prima vista impossibile. Questo però è il lavoro dei motori di ricerca. Una prima idea potrebbe essere quella di indicizzare tutte le frasi contenute di tutti i documenti. Questo ha un limite enorme: è un lavoro enorme, non permette di distinguere i contenuti importanti da quelli non importanti e non permette di isolare i contenuti fasulli. Ad esempio, se un motore di ricerca usasse questo metodo, l'articolo che state leggendo uscirebbe inserendo la parola chiave "biblioteca" in quanto l'ho citata nell'analogia di prima. E' palese che sarebbe sbagliato. Perchè stavamo facendo un esempio. Non stavamo parlando delle biblioteche, stiamo parlando di Pagerank.
I primi motori di ricerca pensavano di risolvere il problema introducendo ricerche avanzate nelle quali fosse possibile aggiungere sempre più criteri di filtro, sempre più parole chiave. Questa era una strada sbagliata perchè ad ogni filtro che si aggiunge si rischia di eliminare per errore un risultato pertinente molto importante. Aggiungendo troppi filtri spesso non si trova più nulla.
In seguito si è cominciato ad analizzare il contenuto delle pagine e a pesare le parole. Ad esempio di potrebbe indicizzare un contenuto contando le ricorrenze delle parole piu usate. Le parole più usate, eliminando congiunzioni, aggettivi, verbi ecc... dovrebbero rendere conto in modo appropriato del contenuto descritto.
Questo è vero per contenuti scritti in modo corretto. Ma non è sempre vero. Potrei ad esempio pubblicare una pagina con l'ultimo frullatore sul mercato e poi scrivere 500 volte "Bosch" per far pensare al motore di ricerca che è un prodotto "Bosh" in modo da aumentare il traffico. Ovviamente tutto questo non funziona.
Non solo, ma una pagina potrebbe essere molto importante e non contenere contenuti testuali. Magari contiene fotografie o filmati o clip audio. Anche questa soluzione non è ideale. Inoltre questa soluzione non permette di capire, a parità di parole usate, qual'è la pagina più importante.
La rivoluzione arriva con Pagerank che applica alle pagine web un ragionamento proveniente dal mondo accademico. Come possiamo capire, ad esempio nella letteratura scientifica, l'importanza di un contenuto, l'importanza di un articolo? Il ragionamento di Lawrence Page è semplice: un articolo è tanto importante quanto più è citato da altri articoli. Non solo. Un articolo è tanto importante quanto più è citato da articoli a loro volta importanti. Questo meccanismo ha anche un ulteriori vantaggi. Il primo è che segue la tendenza degli esseri umani ad essere attratti da contenuti che attraggono altre persone. La seconda è che è possibile determinare il contenuto reale di un articolo in modo più veritiero andando a guardare quello che gli articoli che lo citano dicono di questo. Faccio un esempio. Se in questo Blog scrivo che sono presenti interessanti articoli di Web Marketing non significa necessariamente che questo sia vero. Se però 500 siti web dicono che questo Blog contiene interessanti articoli di Web Marketing è molto probabile che questo sia vero.
Consideriamo che la qualità dei contenuti sul web segue la classica gaussiana. Pertanto la stragrande maggioranza dei contenuti sono di scarsa qualità. Ma i contenuti di scarsa qualità sono molto più numerosi dei contenuti di alta qualità. Il meccanismo delle "citazioni" permette di individuare meglio i contenuti di alta qualità. E permette di farlo meglio di qualunque altro metodo oggi esistente. Se non si applicasse il metodo delle citazioni, essendo i contenuti di scarsa qualità molto numerosi, si otterrebbero nei risultati delle ricerche dei motori di ricerca articoli essenzialmente ininfluenti e utili a nessuno.
Molto bene, molti di voi diranno. Ma come è possibile applicare il meccanismo delle citazioni ai contenuti sul Web? In realtà è molto semplice! Perchè il Web è imbottito di citazione. Anzi, possiamo dire che è fondato sulle citazioni. Semplicemente non siamo abituati a vederle in questi termini. Le citazioni, sul web, sono i link che collegano una pagina all'altra. Quanto su una pagina è presente un link verso un altra pagina, possiamo considerare che la prima pagina sta "citando" la seconda.
Riproviamo allora a riformulare il ragionamento precedente sostituendo il concetto di citazione con il concetto di "link". Per l'algoritmo Pagerank
un contenuto sul Web è tanto più importante quanto più questo contenuto è linkato da altri contenuti importanti.
Se la pagina A è considerata importante e contiene un link verso la pagina B allora è probabile che anche la pagina B sia importante.
Matematicamente il ranking (l'importanza) della pagina A, indicato come r(A) è calcolato nel seguente modo:
r(A) = (y/N) + (1-y) ( (r(B1)/nB1) + (r(B2)/nB2) + (r(B3)/nB3) + (r(Bn)/nBn) )
dove:
r(A) è il ranking della pagina A
r(B1) è il ranking della pagina B1
r(Bn) è il ranking della pagina Bn
y è una costante che ha un valore compreso da 0 a 1
N è il numero totale delle pagine web esistenti
nB1 è il numero di links che dalla pagina B1 puntano ad altre pagine
nBn è il numero di links che dalla pagina Bn puntano as altre pagine.
Il ranking della pagina A è quindi uguale ad un fattore (y/N) che interpreteremo tra poco più la somma "normalizzata" dei ranking di tutte le pagine che puntano (linkano) A moltiplicata per (1-y)
Cosa significa somma "normalizzata"? Significa essenzialmente che ogni link non trasferisce tutta l'importanza della pagina di origine alla pagina di destinazione. Ma trasferisce un quantità di importanza proporzionale alla quantità di links esistenti sulla pagina di origine. Se la pagina B ha un importanza "4" e punta a 4 altre pagine, trasferirà ad ognuna delle pagine puntate un importanza di 1. E' come se l'importanza fosse "l'energia" di una pagina. Più sono le pagine alle quali trasferisco quest'energia, meno energia trasferisco ad ognuna di esse. In questo modo l'energia massima che posso trasferire corrisponde a quella della pagina di origine. Cioè, se una pagina ha importanza 4, la somma delle "importanze" che può trasferire a tutte le pagine alle quali punta è appunto 4. Se non fosse così, se non ci fosse quella divisione, quella "normalizzazione" il sistema non sarebbe stabile. Perchè una pagina di importanza 1 che punta ad un milione di altre pagine trasferirebbe un milione di volte la sua importanza. Si creerebbe energia. E l'algoritmo non convergerebbe.
Cos'è y? y è un fattore di smorzamento, anche questo necessario per stabilizzare il sistema. y evita i cosiddetti "riferimenti circolari". Altrimenti se la pagina A punta a B, B punta a C e C punta a A si trasferirebbe importanza (energia) all'infinito. E' importante che queste catene circolari di riferimenti vengano smorzate dopo un numero adeguato di nodi.
Adesso passiamo ad un ultima interpretazione prima di concludere questa prima parte.
Come saprete, ogni modello matematico ha numerose interpretazioni. Detto al rovescio, sistemi fisici diversi possono essere rappresentati dalla stessa matematica. Ad esempio, un pendolo ed un oscillatore elettronico hanno la stessa matematica.
La formula di prima è anch'essa un modello matematico E come tale ammette più interpretazioni.
Una di queste è l'interpretazione probabilistica.
Riportiamoci la formula per comodità e rispieghiamola in termini probabilistici:
r(A) = (y/N) + (1-y) ( (r(B1)/nB1) + (r(B2)/nB2) + (r(B3)/nB3) + (r(Bn)/nBn) )
La probabilità di finire sulla pagina A è composta da due fattori, cioè dalla somma di due probabilità. In questa interpretazione y è la probabilità che un navigatore prema per caso un link.
(y/N)
è la probabilità che un navigatore finisca per caso sulla pagina A. E' intuitivo. se y è la probabilità che un navigatore prema a caso un link e N è il numero di pagine sul Web. y/N è la probabilità che il navigatore arrivi per caso sulla pagina A
( (r(B1)/nB1) + (r(B2)/nB2) + (r(B3)/nB3) + (r(Bn)/nBn) )
è la probabilità che un navigatore arrivi sulla pagina A seguendo un gran numero di volte dei link partendo da una pagina B a caso.
Quindi, l'interpretazione probabilistica di Pagerank dice che il ranking (l'importanza) di una pagina è l'equivalente della probabilità che ha un navigatore di finirci sopra.
Questa probabilità è la somma della probabilità di finire sulla pagina per caso più la probabilità di finirci seguendo i link da altre pagine. Questo è intuitivo.
Questa visione probabilistica è molto interessante per il Web Marketing e avrà risvolti molto pratici in quanto dice che per i motori di ricerca che usano questo algoritmo o algoritmi da esso derivato, l'importanza di una pagina equivale alla sua probabilità di essere vista, cioè alla sua visibilità.
Alcune note importanti.
Il fattore y, cioè la probabilità che un navigatore clicchi un link a caso è valutata all'incirca a 0,10 cioè 10%.
Il ranking può variare enormemente. Alcune pagine possono avere ranking prossimo a zero e altre di milioni.
Pertanto il ranking che noi tutti siamo abituati a vedere attribuito alle nostre pagine (0,1,2,3,4,5,6,...) è in realtà in scala logaritmica (in base 10).
Ranking= log (r(A)/r(min))
Il ranking è cioè il logaritmo del ranking della pagina prima calcolato fratto per il ranking più basso esistente.
Questo significa che una pagina con ranking 1 è dieci volte più importante (o più visibile, a seconda dell'interpetazione) di una pagina con ranking 0. Una pagina con ranking 6 è 1.000.000 di volte più importante di una pagina con ranking 0!
questo spiega perchè è così difficile salire di ranking e perchè più il ranking è alto più è difficile salire al ranking successivo. Perchè ogni aumento di un unità nel ranking corrisponde a un aumento di 10 volte dell'importanza della pagina.
Una nota finale per questo primo articolo. Questa formula consente di calcolare il ranking di tutte le pagine con un numero bassissimo di iterazioni, di cicli. Questa è una fortuna altrimenti i ranking verrebbero aggiornati ogni qualche anno solamente!
Quest'articolo conteneva la teoria. Nei prossimi sviscereremo gli aspetti pratici che scaturiscono da questa teoria nell'intendo di fare un Web Marketing eccellente!
Nessun commento:
Posta un commento