Come funziona Google?

Tutti oggi siamo abituati a trovare tutto quello che ci serve su Internet. In un istante, miliardi di informazioni sono ad un solo click di distanza da noi. Ma come facciamo a districarci in questa enorme giungla di informazioni? Oggi è facile, ci sono i motori di ricerca, c’è Google!

Vado su Google, digito le parole che descrivono quello che voglio sapere e la risposta è lì, ad un clic di distanza.

Ma fermiamoci un attimo ad immaginare un mondo in cui ci sia Internet ma non esistano i motori di ricerca… Viene un po’ di panico, eh?

Vediamo insieme come funziona Google.

Quando cerchiamo qualcosa su Google, il motore di ricerca non va in quel preciso momento alla ricerca delle pagine che possono avere una qualche attinenza con la nostra ricerca (query).

Esistono miliardi di pagine sul web e ogni minuto ne vengono create centinaia di nuove.

Per questo motivo i motori di ricerca monitorizzano continuamente la rete alla ricerca di nuove pagine salvando le informazioni che possono essere utili per le nostre ricerche.

Il titolo della pagine, il contenuto, le foto, i tag, i link da e per la pagina vengono salvati in un database e vengono indicizzati al fine di permettere all’utente di reperire pagine pertinenti e rilevanti rispetto ad una specifica query.

In sintesi, quando facciamo una ricerca, Google non effettua una ricerca in tempo reale ma reperisce e restituisce informazioni già disponibili.

Ma come fa Google a indicizzare tutte le pagine presenti su Internet?

Segue i link. Ogni volta che Google indicizza una singola pagina e salva le informazioni fondamentali, quando trova un link ad un’altra pagina, lo segue indicizzando anche la pagina “linkata” e così via tutti i link che trova nelle pagine successive, raggiungendo così virtualmente tutte le pagine del web.

A questo punto, restano due i problemi fondamentali per il motore di ricerca: capire una richiesta in linguaggio compiuto e restituire pagine pertinenti in ordine di importanza, di modo che i primi risultati siano più attinenti alla specifica ricerca.

Per fare questo ogni motore di ricerca ha un suo algoritmo più o meno efficiente.

Ad esempio, fino a non poco tempo fa Google utilizzava un algoritmo chiamato PageRank, dove “page” non sta per “pagina” ma per il nome del suo creatore, Larry Page, uno dei padri fondatori di Google.

Il PageRank attribuiva una determinata importanza alle pagine sulla base di quante altre pagine linkavano ad essa. L’idea era che se tante pagine linkano alla stessa pagina in questa stessa pagina ci sarebbero informazioni rilevanti.

Il PageRank ha funzionato per un pò di tempo, finché una volta decifrato l’algoritmo gli sviluppatori di siti l’hanno sfruttato a proprio favore, creando delle piantagioni di siti che linkavano pagine poco autorevoli dando a queste ultime autorevolezza sul web.

Esempio di Google Bombing: inserendo in diversi blog link dal testo “miserabile fallimento” che puntavano alla biografia di George W. Bush alcuni blogger americani riuscivano a fare in modo che cercando “miserabile fallimento” su Google, la prima pagina di risposta fosse appunto tale biografia.

Oggi il PageRank ha ancora una certa valenza in Google, ma è inserito in un più complesso algoritmo che tiene conto delle problematiche evidenziate dall’originale algoritmo.

Un saluto, amici della rete!