Massimo Marchiori non ha inventato l'algoritmo di Google
Secondo alcuni giornalisti e blogger italiani l'algoritmo di Google sarebbe stato inventato dal matematico italiano Massimo Marchiori. Questo però non è vero.
Nel suo articolo del 1997 Massimo Marchiori introdusse la nozione di $\text{HYPERINFO}$, una misura della propagazione dell'informazione testuale di un documento attraverso i suoi link.
Supponiamo di poter misurare l'informazione testuale contenuta in una pagina $A$ con qualche algoritmo, e chiamiamo $\text{TEXTINFO}(A)$ l'informazione testuale contenuta in $A$. Supponiamo che $A$ stia linkando le pagine $B_1\dots B_k$, ognuna dotata della propria informazione testuale $\text{TEXTINFO}(B_i)$ e tali che $$\text{TEXTINFO}(B_1)\ge\dots\ge\text{TEXTINFO}(B_k)$$ Allora definiamo: $$\text{HYPERINFO}(A) = F \cdot \text{TEXTINFO}(B_1) + \dots + F^ {k} \cdot \text{TEXTINFO}(B_k)$$ dove $F$ e' un qualche fattore di attenuazione, compreso fra $0$ ed $1$, in modo che anche $\text{HYPERINFO}(A)$ sia compreso fra $0$ e $1$.
In altre parole secondo Marchiori una pagina è importante quando linka pagine dal contenuto ritenuto interessante.
L'articolo del 1998 di Lawrence Page e Sergey Brin (fondatori di Google) procede diversamente.
Il loro algoritmo PageRank non richiede il calcolo dell'informazione testuale di alcuna pagina, ma definisce ricorsivamente l'importanza di una pagina $u$ tramite la formula: $$R(u)=c\sum_{v\in B_u}\frac{R(v)}{N_v}+cE(u)$$ dove $B_u$ è l'insieme delle pagine $v$ che linkano $u$, $N_v$ è il numero totale di link uscenti dalla pagina $v$, $c$ un parametro da massimizzare e $E(u)$ un vettore di componenti tutte uguali e di somma totale $0.15$.
In altre parole secondo Brin e Page una pagina è importante quando è linkata da pagine importanti.
Basta confrontare i due grassetti per rendersi conto della differenza fra i due algoritmi.
L'approccio di Marchiori era ragionevole quando i motori di ricerca si basavano pesantemente sull'analisi dell'informazione testuale contenuta nei documenti. L'idea brillante di Page e Brin fu invece di ridurre l'importanza di tale analisi ed inferire la rilevanza di una pagina dalla struttura della rete.