URL per i comuni mortali

Ho acquistato qualche giorno fa una copia del settimanale tedesco Der Spiegel. In copertina si parla di internet. “Macht Das Internet Doof?” cioè “Internet rende stupidi?”, in riferimento all’articolo di Nicholas Carr “Is Google Making Us Stupid?” pubblicato da The Atlantic e di cui tanto si è discusso.

Non è stato il contenuto ad aver colpito la mia attenzione, ma il modo con cui, sia in copertina sia qualche pagina all’interno, il lettore è inviato a partecipare al forum online. Non qualche link anonimo, o in qualche forma incomprensibile come http://forum.spiegel.de/showthread.php?t=4813, ma un semplice, chiaro ed efficace www.macht-das-internet-doof.de. Nient’altro che un redirect di rimando a un thread del forum, ma che stampato sulla carta fa la sua bella figura, è sicuramente semplice da ricordare e probabilmente aiuta anche con i motori di ricerca.

Eppure in molti giornali e riviste, soprattutto italiani, siamo distanti anni luce. Il link, quando c’è, va a capo più volte, è incomprensibile, oppure è errato. E, immancabilmente, inizia con http://. Probabilmente presto attenzione a queste cose perché ho lavorato 6 anni per i periodici di una casa editrice, ma leggo che anche altri, come Tina Spacey sul blog di Internazionale, stanno combattendo la stessa microbattaglia.

Non si può (ancora) cliccare sulla carta, per cui gli URL stampati devono essere semplici da scrivere e da ricordare. URL per gli umani, e non per i computer. Se i DNS sono stati inventati per tradurre 123.123.123.123 in www.sito.it, un motivo ci dovrà pur essere.

Url statici meglio dei dinamici

Pensavo che, ormai, non facesse più alcuna differenza per un motore di ricerca trovarsi di fronte a un URL statico (http://www.sito.it/percorso/pagina.html) piuttosto che uno dinamico (http://www.sito.it/percorso/pagina?parametro1=valore&parametro2=valore).

Un intervento che ho trovato in Search Engine Watch sembrerebbe però smentire le mie certezze. Stando ai dati presentati, la conversione degli URL del sito PlumberSurplus.com da dinamici a statici ha quasi raddoppiato, in quattro mesi, le pageview provevienti dai motori di ricerca.

Fosse vero, si trattarebbe di una notizia su cui riflettere, visto che ancora oggi molti CMS aziendali producono URL in forma dinamica.

Leggendo l’intervento si capisce però che, contestualmente alla migrazione dei contenuti, per questo sito sono state introdotte altre attività di ottimizzazione a favore dei motori di ricerca.

Rimane quindi il dubbio: quanto, nell’aumento delle pageview, è dovuto alla conversione degli URL e quanto, invece, agli altri interventi?

Nell’intervento si tocca anche un altro aspetto importante da tenere in considerazione quando si compiono operazioni di conversione di URL, e cioè la necessità di mantenere in ogni caso funzionante anche la vecchia modalità di accsso. Ne ho parlato, ormai quasi due anni fa, nell’intervento Sito nuovo, Url vecchi qui su Fucinaweb.

Come farsi evitare dai motori di ricerca

Sono appena tornato da Roma dove, tra le altre cose, mi sono recato al Museo dell’Ara Pacis e alla Mostra di opere di Antonello da Messina.

Prima di partire mi ricordo di aver cercato informazioni sul museo e sulla mostra con Google, aspettandomi di trovare come prima cosa i siti ufficiali di riferimento.

Ma se cerco, anche oggi (23 Maggio 2006), termini quali ‘Museo ara pacis’, ‘Ara pacis’, oppure ‘Mostra Antonello da Messina’, i siti ufficiali del museo e della mostra non solo non compaiono al primo posto, ma neppure nella prima, seconda, terza… pagina dei risultati.

Per capire come questo sia possibile ho analizzato più da vicino pagina e codice sorgente. A vedere il sito del Museo dell’Ara Pacis non sembra che ci possano esserci problemi di indicizzazione: la pagina è semplice, ad alto contenuto di testo, nessuna animazione. Sembra quasi un sito search-engine-friendly. Ma se guardiamo con un po’ più di attenzione pagine e codice sorgente ci accorgiamo che:

  • La scritta “Museo dell’Ara Pacis” che fa da titolo non solo è un’immagine (quando avrebbe potuto benissimo essere del testo) ma, cosa ancora più grave, è priva dell’attributo per il testo alternativo
  • Gli autori del codice sorgente hanno cercato di usare il markup separando aspetto grafico da contenuto. Una ottima idea (la pagina è leggera), ma applicata molto male. Le intestazioni dell’Html (h1,h2…) che servono a distinguere titoli da normali sezioni di testo, per esempio, sono assolutamente prive di significato. Ad h1 è stato associato il testo “Musei in Comune”, mentre con h2 “Menu di accesso facilitato”.

Sembrano sciocchezze, ma partecipano a far sì che il motore di ricerca non riconosca il testo “Museo Ara Pacis” come qualcosa di veramente significativo nella pagina.

Per il sito della ho già detto, non comportano nessuno sforzo aggiuntivo per chi sviluppa la pagina.