Category Archives: SEO

Anche io instantempo

Ebbene sì, lo ammetto, da un paio di settimane anche io “instantempo“. No, non si tratta di un nuovo verbo introdotto nel dizionario della lingua italiana, ma dell’ultimo seo contest lanciato dalla Community GT.

Ero titubante prima di gettarmi in questa avventura, il tempo è sempre poco e le cose se si fanno, vanno fatte per bene. Comunque l’insistenza dell’amico appleofilo Emanuele Rosato, che sbavava all’idea di vincere il primo premio (un Ipad) mi ha convinto a prendere parte all’Instantempo.

Di cosa si tratta? Senza entrare nei dettagli del regolamento (che a dirla tutta non prevede alcun vincolo), bisogna piazzarsi per primi su Google per la ricerca secca [instantempo] e bisogna essere primi il 6 dicembre 2010.

Per chi volesse approfondire qui è disponibile il regolamento.

GT Study Day ad Oria (BR) il 10 aprile

Claudio Matarrelli e Giorgio TavernitiIl 10 aprile avrò il piacere di avere di nuovo ospite qui ad Oria, città salentina dove vivo, Giorgio Taverniti (meglio noto come Giorgiotave), in occasione del GT Study Day.

Un appuntamento imperdibile per tutti gli appassionati e i professionisti del web, dove verranno trattate tematiche attinenti i motori di ricerca e il web marketing.

Tutti coloro che vorranno raggiungerci ad Oria possono contare sul mio supporto logistico, per avere indicazioni di varia natura.

La sera prima dell’evento vi sarà certamente una cena tra amici in cui si sveleranno i più subdoli segreti del web :-), seguiranno le foto della serata.

Potete trovare maggiori informazioni qui o iscrivervi direttamente qui.

Isaac Newton e il logo animato di Google

Novità assoluta in casa Google grazie ad Isaac Newton. Almeno a memoria dello scrivente, è la prima volta che Big G inserisce un’animazione nella sua home per celebrare una ricorrenza.
Lo fa per lo scienziato che ha teorizzato la legge di Gravitazione grazie alla caduta di una mela. Che caduta sarebbe se la mela non si muovesse? Così il primo frutto sospeso su un ramo di melo si stacca e cade nel footer di Google.

Ma chi era Isaac Newton? Nato il 4 gennaio 1643 è stato un matematico, fisico e alchimista inglese. Noto anche come Isacco Newton, è considerato una delle più grandi menti di tutti i tempi.

E’ famoso soprattutto per il suo contributo alla meccanica classica. Celebre proprio la leggenda di Newton e la mela.
Nel Philosophiae Naturalis Principia Mathematica nel 1687 descrisse la Legge di Gravitazione Universale e gettò le basi della meccanica classica.

L.L. Zamenhof

Ludwik Lejzer Zamenhof (Bialystok, 15 dicembre 1859 – Varsavia, 14 aprile 1917) è stato un medico, linguista e glottoteta polacco

È universalmente noto per aver fondato le basi dell’esperanto, una lingua internazionale artificiale che fu promossa anche dalla figlia Lidia Zamenhof.

Il suo nome viene a volte italianizzato in Ludovico Lazzaro Zamenhof.

Oggi Google dedica la sua home page proprio a Zamenhof.

zamenhof-esperanto-09

Google regala le Briciole di Pane

Le Briciole di Pane o Breadcrumbs fanno il loro esordio nelle serp di Google.

Per alcuni risultati, di siti piuttosto rilevanti, l’url della pagina viene sostituito con dei link verso le sezioni gerarchicamente superiori al risultato.

Google Briciole di Pane

Quasi scontato domandarsi come funziona l’algoritmo che genera questi link.

Sicuramente ci sono due componenti:

  • monitoraggio del traffico sul sito;
  • forza delle pagine in termini di trustrank e pagerank;

Inoltre è ipotizzabile che alcune piattaforme ben note, ad esempio quelle per i forum, agevolino il lavoro.

Cos’altro?

Novità per la ricerca di pagine recenti su Google.it

Effettuando una ricerca avanzata e impostando l’intervallo temporale delle pagine da visualizzare, si presenterà davanti a noia una nuova (in inglese già c’era) interfaccia. Un passo avanti verso l’instant search da parte di Google.

Opzioni disponibili, alcune delle quali presenti già da tempo, sono:

  • Tipo di fonte: Video, Notizie, Blog, Forum (si perché Google distingue da tempo anche i Forum, contando persino il numero di post e di autori);
  • Date di creazione (forse sarebbe meglio dire prima indicizzazione) delle pagine: Ultima ora, Ultime 24 ore, Ultima settimana, Ultimo anno, Intervallo di date (quindi è possibile scegliere un intervallo personalizzato);
  • Ordinamento per pertinenza o per data, esattamente come in Google News;
  • Tipo di visualizzazione: Standard, Ricerche correlate, Sequenza temporale;
  • Tipo di Risultati: standard, Immagini della pagina (le immagini che avevano fatto il loro debutto in Google News qualche settimana fa), Altro testo;

Senza fornire screenshot ho preferito nel testo linkare alcune pagine di esempio.

Bloccare SideWiki di Google, ecco uno script

Il nuovo servizio Google SideWiki permette agli utenti di commentare qualsiasi pagina web in un box che si apre nel browser tramite la Google Toolbar.

sidewiki
Gli utenti possono scrivere liberamente e senza il controllo del webmaster qualsiasi cosa, condividendola con tutti gli altri navigatori.
Una novità sicuramente utile per gli utenti, ma in alcuni casi potrebbe esser dannosa per i proprietari dei siti.

Immaginiamo situazioni in cui dei concorrenti o dei semplici utenti si accaniscano ingiustificatamente contro un sito, oppure ad invasioni di commenti di spam. Difficile segnalarli uno ad uno in maniera manuale per poi attenderne la cancellazione.

Emerge dunque il bisogno per alcuni di poter disattivare la SideWiki, possibilità non offerta da Google.

In attesa di una sterzata da parte di Google, che secondo me dovrà necessariamente offrire un metodo di disattivazione, possiamo pensare ad un metodo fai da te.

La soluzione è abbastanza banale. SideWiki associa i commenti univocamente con gli url, dunque se l’url cambiasse di volta in volta i commenti andrebbero persi.

Come possiamo fare? Semplice, possiamo aggiungere dei parametri random agli url tramite javascript.

Ad esempio il browser di un utente che visita http://www.matarrelli.com/ viene al volo indirizatto su http://www.matarrelli.com/#CodiceCasuale e il successivo utente su http://www.matarrelli.com/#AltroCodiceCasuale e così via.
Così tutti i commenti saranno lasciati ma andranno persi, in quanto lasciati su url random che gli altri non vedranno.

La soluzione è abbastanza indolore e usando parametri passati con il cancelletto # non implica il ricaricamento della pagina.
L’unico difetto è forse che richiede javascript attivato, perciò eventuali malintenzionati  o spammer possono disattivare javascript e commentare gli url reali. Tuttavia anche in questo caso, finché lo script sarà attivo, gli utenti normali continueranno a non vedere i commenti, in quanto loro visualizzano sempre url differenti.

Sono stati già sviluppati alcuni script, il primo credo sia stato questo http://code.google.com/p/sidewiki-defeat/.
Tuttavia preferisco proporne una versione mia, simile ma sensibilmente alleggerita e italianizzata:

<script language=”javascript”>
<!–
/* script per bloccare SideWiki di Google prelevato da www.matarrelli.com */
function GeneraParametro() {
var data = new Date();
var parametro = data.getTime() +””+ Math.floor(Math.random()*1000);

return parametro;
}

var indirizzo = window.location.href;
if (indirizzo.indexOf(‘#’) == -1) {
window.location.href = indirizzo + ‘#’ + GeneraParametro();
}
–>
</script>

Praticamente aggiunge all’url reale un codice composto dall’ora Unix che varia costantemente e da 3 cifre random, aggiunte per evitare collisioni accidentali tra vari utenti che visitano la stessa pagina alla stessa ora.

Ho caricato una pagina demo dove testare lo script.

Galileo’s telescope – Il telescopio di Galielo Galilei

Oggi Google.it celebra Galielo Galilei e il 400esimo anniversario della sua invenzione più famosa, cioè il telescopio. Fu infatti nel 1609 che Galileo brevettò il suo cannocchiale.

Ci saremmo aspettati un link alla ricerca [Telescopio di Galileo] ma, stranamente, il logo celebrativo punta invece alla serp [Galileo’s telescope] e presenta anche title e testo alternativo in inglese: 400th Anniversary of Galileo’s Telescope.

Una svista o una scelta ben precisa? Non mi stupirei di una traduzione correttiva nel corso delle prossime ore.

Galileo's telescope

Un’ulteriore particolarità deriva dall’url linkato che evidenzia un uso più invasivo di javascript.
Niente di trascendetale, ma una curiosità, infatti il link html è a questo url
http://www.google.it/search?q=Galileo%27s+telescope&ct=galileo09&oi=ddle
invece l’indirizzo al quale si viene rimandati tramite sul click tramite javascript (sto testando con Firefox) è questo
http://www.google.it/#q=Galileo%27s+telescope&ct=galileo09&oi=ddle&fp=55c42ba9d4a49393

Problemi di attesa per la sitemap di Google

strumenti-webmaster-googleDiversi utenti degli Strumenti per Webmaster di Google stanno incontrando problemi da un mese a questa parte con la verifica dei siti e con l’invio (o reinvio) di sitemap.

Il problema si manifesta con la permanenza dello stato di “attesa” attesa per giorni e giorni.

Si tratta di un inconveniente noto ai tecnici di Google e per il quale non si può far altro che aspettare..

A differenza da quanto dichiarato da Google, mi sento di affermare che in diverse situazioni il problema può causare ritardi nell’indicizzazione.

Quali sono i formati standard degli annunci pubblicitari?

Box di annuncio di esempioEsistono vari formati per annunci pubblicitari per il web.

Vediamo di seguito quali sono le dimensioni standard in pixel più usate.

Consideriamo inoltre il peso massimo in KB suggerito per l’immagine o dell’animazione da visualizzare.

Chiaramente nella pratica sono possibili e diffuse eccezioni.

Per maggiori informazioni rimando al sito dello IAB e alla pagina relativa ai formati degli annunci Adsense.

Box e Pop-up

Formato e dimensioni in pixel Peso massimo del file da scaricare
300 x 250 – (Medium Rectangle) 40 KB
250 x 250 – (Square Pop-Up) 40 KB
240 x 400 – (Vertical Rectangle) 40 KB
336 x 280 – (Large Rectangle) 40 KB
180 x 150 – (Rectangle) 40 KB
300×100 – (3:1 Rectangle) 40 KB
720×300 – (Pop-Under) 40 KB

Banner orizzontali e pulsanti

468 x 60 – (Full Banner) 40 KB
234 x 60 – (Half Banner) 30 KB
88 x 31 – (Micro Bar) 10 KB
120 x 90 – (Button 1) 20 KB
120 x 60 – (Button 2) 20 KB
120 x 240 – (Vertical Banner) 30 KB
125 x 125 – (Square Button) 30 KB
728 x 90 – (Leaderboard) 40 KB

Banner Verticali – Skyscrapers

160 x 600 – (Wide Skyscraper) 40 KB
120 x 600 – (Skyscraper) 40 KB
300 x 600 – (Half Page Ad) 40 KB

Igor Stravinskij celebrato da Google

Igor Stravinsky

Oggi Google celebra il russo Igor Stravinskij.

Nato il 17 giugno 1882 a Lomonosov vicino San Pietroburgo, Stravinskij fu uno dei più apprezzati compositori del XX secolo, sia nel mondo occidentale che nel suo paese d’origine.

Molto famosa la sua opera Pulcinella.

Redirect 301, pagine cancellate recuperate con .htaccess e Php

Molto spesso, a seguito di un aggiornamento, ci si trova davanti alla necessità di recuperare vecchie pagine di un sito non più esistenti, cioè di inserire un redirect dagli indirizzi vecchi ai nuovi contenuti.

Inserire un buon redirect 301 non rappresenta un inutile sfizio, si tratta infatti di una pratica importantissima, per trasferire il Page Rank dei vecchi url ai nuovi e per evitare che gli utenti si trovino davanti ad un errore.

Avendo un sito su piattaforma Apache, il metodo che illustrerò in questo articolo è probabilmente il più semplice per compiere l’operazione su piccoli siti, senza doversi impelagare in complesse regole o espressioni regolari da inserire nel file .htaccess.
Sarà sufficiente un minimo di conoscenza di Php, faremo fare a lui tutto il lavoro di filtraggio e reindrizzamento.

Per prima cosa occorre individuare tutte le pagine che posseggono dei link referenti, ma che non esistono più. Per farlo ci viene incontro Google, con i suoi Strumenti Google per il webmaster.
Nella sezione:
Diagnostica->Errori di scansione->Web->Non trovato
possiamo visionare un elenco di tutte le pagine del nostro sito linkate da qualche parte, ma che attualmente restituiscono un errore.
Possiamo anche scoprire quanti e quali link puntano a questi indirizzi, cosicché, nel caso fosse possibile, potremmo porre rimedio semplicemente aggiornando i link obsoleti trasferendo il loro flusso di Page Rank sulle nuove pagine.
Per tutti gli altri casi, in cui purtroppo non sempre è possibile aggiornare i link, entra in gioco il redirect 301.

Quando un utente o uno spider di un motore di ricerca accede ad una pagina non più esistente, ottiene un codice di errore 404. Salvo diverse personalizzazioni, il server restituisce una pagina predefinita, il tipico 404 Not Found.
Tramite il file .htaccess, possiamo imporre di utilizzare in caso di errore un file creato da noi, che possiamo chiamare non-trovato.php o in qualsiasi altro modo.

#riga dell’.htaccess che impone in caso di errore l’uso del file da noi creato
ErrorDocument 404 non-trovato.php

Da questo momento in poi, qualsiasi visita ad una pagina non trovata mostrerà il contenuto della pagina non-trovato.php
Vediamo come costruire questa paginetta, che ci aiuterà ad ottenere il nostro scopo.
La pagina di errore di base sarà qualcosa di simile:

<!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Strict//EN” “http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd”>
<html xmlns=”http://www.w3.org/1999/xhtml”>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />
<title>Errore 404 – Pagina Non Trovata</title>
</head>
<body>
<h1>Pagina non trovata</h1>
<p>L’indirizzo richiesto <?php echo $_SERVER[‘REQUEST_URI’]; ?> non è stato trovato su questo server.</p>
<?php  echo $_SERVER[“HTTP_HOST”]; ?>
</i>
</body>
</html>

Così com’è, invierà un codice di errore http 404 e stamperà il messaggio di “Pagina non trovata” e l’indirizzo digitato.

Costruita questa struttura di base,  possiamo aggiungere dei controlli in testa alla pagina.

Mettiamo il caso di avere il sito www.example.com e di aver individuato una vecchia pagina, ora non più esistente, che si chiamava articolo-vecchio-sui-cani.html, magari avente 5 link su altri siti. Il contenuto ora è stato spostato al nuovo indirizzo cani.php.

In testa al file non-trovato.php, che si occupa della gestione dell’errore, possiamo inserire un controllo di questo genere:

<?php

if(strpos($_SERVER[‘REQUEST_URI’], “articolo-vecchio-sui-cani.html”)){
header (‘HTTP/1.1 301 Moved Permanently’);
header(“location: http://www.example.com/cani.php”);
}

?>

Il codice Php precedente verifica l’url richiesto dall’utente. Se contiene la stringa “articolo-vecchio-sui-cani.html”, corrispondente alla vecchia pagine, passa le due intestazioni http contenute nelle parentesi graffe.
Cioè anziché passare un errore 404, come farebbe per tutti gli altri indirizzi errati, passa un redirect permanente 301 e indica anche la nuova locazione.
L’utente perciò, senza accorgersi di nulla, si ritroverà trasferito al nuovo indirizzo funzionante. Lo stesso avverrà agli spider dei motori di ricerca.

La pagina di errore completa diventerà:

<?php

if(strpos($_SERVER[‘REQUEST_URI’], “articolo-vecchio-sui-cani.html”)){
header (‘HTTP/1.1 301 Moved Permanently’);
header(“location: http://www.example.com/cani.php”);
}

?>
<!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Strict//EN” “http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd”>
<html xmlns=”http://www.w3.org/1999/xhtml”>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />
<title>Errore 404 – Pagina Non Trovata</title>
</head>
<body>
<h1>Pagina non trovata</h1>
<p>L’indirizzo richiesto <?php echo $_SERVER[‘REQUEST_URI’]; ?> non è stato trovato su questo server.</p>
<?php echo $_SERVER[“HTTP_HOST”]; ?>
</i>
</body>
</html>

Ovviamente nel caso di più pagine da recuperare, si potrà ricopiare il blocco di codice che intercetta gli indirizzi e riadattarlo inserendo i dati del caso specifico. L’importante è inserire il tutto in testa alla pagina, senza lasciare neppure righi vuoti. Questo perché la funzione header() va richiamata prima che qualsiasi parte di pagina si stata stampata.

Non mi dilungo oltre con altri esempi, il concetto di base è piuttosto semplice.
Vi rimando ai commenti per eventuali dubbi.

Wolfram Alpha, il “nuovo motore di ricerca” è online

Wolfram Alpha - www.wolframalpha.com

Home Page di WolframAlpha.com

Annunciato da molti come l’ennesimo anti-Google, è online da qualche ora Wolfram Alpha.

Un motore di ricerca non in senso stretto, perché è nel web ma non cerca sul web.

Effettuando una richiesta, la query viene elaborata da Wolfram che, spulciando nel suo ricco database di informazioni, cerca di formulare una risposta strutturata contenenti dati e grafici.
Il risultato finale è molto simile agli specchietti riassuntivi presenti nel lato destro delle pagine di Wikipedia.
Il funzionamento invece richiama quello dei vari bot intelligenti (es. Doretta) che all’interno delle chat forniscono risposte e servizi in seguito ad una richiesta discorsiva.

Un funzionamento che ha dunque poco a che fare con la classica ricerca web di Google.

Dalle primissime impressioni, però, Wolfram lascia trasparire una certa impreparazione. C’è da tener conto che si tratta di un progetto in fase di test.

Google, consapevole dell’importanza che potrà avere in futuro l’elaborazione di dati strutturati, ha bruciato i tempi inserendo da qualche giorno nella propria ricerca web un elaboratore di dati pubblici.
Un servizio molto simile a quello offerto da Wolfram, per schiacciare qualsiasi rischio di concorrenza.

I cosiddetti motori anti-Google annunciati nel corso degli anni sono tanti, ma nessuno è riuscito davvero a scalfire l’egemonia di big G. Fatta eccezione per il predominio di Baidu in un mercato particolare come quello asiatico. Tra motori di ricerca fallimentari meritano la citazione Cuil scivolato nell’oblio e l’europeo Quaero.

Sarà ancora una volta un fallimento?
Tra un anno secondo voi si ricorderà nessuno di Wolfram Alpha?