
Quando si esegue un test di Ottimizzazione Motori di Ricerca si scopre che le pagine web sono duplicate nell'indice di Google. Un record è corretto ma l'altro include '?tmpl=component&type=raw' nella url.
Se si ha un sito Joomla! (personale o commerciale che sia) Il panico colpisce immediatamente dal momento che qualsiasi campagna pubblicitaria abbiamo in mente di applicare è a rischio da quando Google ha istituito la "duplicated content penalty" (penalizzazione contenuti duplicati).
Anche se di fatto i vertici Google hanno ufficialmente negato l'esistenza di una sanzione per un tali "duplicati", assicurando che questo è un falso allarme e sostenendo che loro effettuano penalizzazioni solo su pagine effettivamente duplicate e penalizzando il copycat, noi, per sicurezza, ma non per sfiducia, crediamo che il problema dei contenuti duplicati di Joomla! debba essere risolto.
http://joomlaitalia.com/?tmpl=component&type=raw
Come possiamo facilmente vedere, l'aggiunta di questi parametri al termine di un URL Joomla! ha l'effetto di restituire una copia della pagina web senza gli elementi delle pagine aggiuntive ma proprio esclusivamente l'area del contenuto principale.
Spieghiamo, a coloro che ancora non conoscono questa procedura, che questo è un modo per creare versioni della pagina adatta alla stampa, e-mail, la generazione di PDF e il funzionamento di alcune Ajax.
Quindi se a prima vista possiamo affermare che non c'è niente di male, anzi al contrario queste sono molto utili ad un webmaster per generare effetti interessanti, queste possono essere fonte del problema duplicati con indicizzazione Google.
Alcuni sviluppatori aggiungono "nofollow" a questi link, oppure utilizzano altre tattiche per impedire l'indicizzazione di questi pseudo-duplicati, ma molti altri utenti ignari del problema non si curano di bloccare sul nascere il problema stesso.
Proprio per questo e rivolto a gruppi di utenti che non hanno grandi conoscenze per agire sui codici sorgenti, oppure che non si fidano di installare estensioni ad hoc o peggio si lasciano vincere dalla pigrizia, ecco qua un paio di consigli su come farlo da soli con assoluta semplicità.
Questo è il contenuto del un file robot.txt nativo Joomla!
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Noi inseriremo ad esempio queste voci successive
Disallow: /?tmpl=component&type=raw
Disallow: /news/120-joomla-2-5-1/?tmpl=component&type=raw
e otterremo
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /?tmpl=component&type=raw
Disallow: /news/120-joomla-2-5-1/?tmpl=component&type=raw