I numeri del social web

Postato da regole-seo, in Il Web, l'Universo e tutto quanto, in data 08/03/2010

L’altro giorno gironzolando sul web mi sono imbattuto quasi casualmente nella simpatica applicazione flash che vedete qui sotto.
Si tratta di un simulatore dell’andamento del web in tempo reale e si basa sui dati raccolti alla fine del 2009.

Certo non è strettamente legato al SEO ma avere sotto gli occhi l’andamento del web in termini di cifre ha il suo fascino non credete? :)

Come precedentemente detto questo simulatore dell’andamento del web si basa sui dati raccolti alla fine del 2009. Ecco alcune delle fonti utilizzate:

  • 20 ore di video caricate ogni minuto su YouTube (fonte YouTube blog Agosto 2009)
  • 600.000 nuovi membri al giorno su Facebook (fonte Inside Facebook Febbraio 2009)
  • 700.000.000 nuove foto e 4.000.000 nuovi video su Facebook (fonte Inside Facebook Febbraio 2009)
  • 18.000.000 di nuovi utenti all’anno su Twitter (fonte TechCrunch Aprile 2009)
  • 50.000.000 di tweets inviati al giorno su Twitter (fonte eConsultancy Febbraio 2010)
  • 900.000 nuovi blog post on-line ogni giorno (fonte Technorati Stato della Blogosfera nel 2008)
  • 1.000.000.000 di video al giorno visualizzati su YouTube (fonte SMH Dicembre 2009)
  • 1.250 messaggi al secondo e 250.000 beni virtuali al giorno su Second Life (fonte Linden Lab release Settembre 2009)
  • 5.500.000.000 di dollari all’anno in beni virtuali, 70.000.000 di dollari in regali su Facebook (fonte Viximo Agosto 2009)
  • 73.000.000 milioni di visitatori al mese su Flickr e 700.000.000 di nuove foto (fonte Yahoo Marzo 2009)
  • 92.500.000 iscrizioni a mobile social network alla fine del 2008 (fonte Informa PDF)

SEO e web directory

Postato da regole-seo, in Approfondimenti SEO, in data 01/03/2010

web-directory

L’iscrizione del proprio sito alle web directory è una delle strategie SEO off-page usate per acquisire link in ingresso.

Partite dal presupposto che le web directory altro non sono che dei raccoglitori di link organizzati in categorie. Non possiamo aspettarci dunque che agli occhi dei motori di ricerca il valore del link esposto su una web directory sia equivalente a quello di un link situato in un sito che tratta un argomento molto vicino al nostro.
Inoltre, la percentuale di utenti che utilizza le web directory per trovare ciò che cerca è molto più bassa rispetto a quella delle persone che utilizzano i motori di ricerca.

Questo però non significa che l’utilizzo delle web directory per segnalare il proprio sito sia inutile. Vi sarà infatti già capitato che una query di ricerca in Google ritorni molti risultati di web directory a tema.
Inoltre anche se le persone che arriveranno sul nostro sito passando da una web directory saranno poche, saranno comunque utenti che potranno aprezzare i nostri contenuti per poi magari condividerli.

Le web directory, così come i motori di ricerca si propongono come obiettivo quello di aiutare l’utente ad identificare il sito giusto per soddisfare i suoi interessi. Per fare questo, diversamente dai motori di ricerca, sono organizzate in centinaia di categorie che dovrebbero facilitare l’utente nell’identificare le informazioni ricercate nel minor tempo possibile.

L’iscrizione di un sito ad una web directory generalmente richiede l’inserimento di un titolo, una url e una breve descrizione del sito associando una categoria tra quelle disponibili. In questo modo un utente potrà individuare la tematica del sito e decidere quale dei siti visitare.

Sul web si trovano centinaia di web directory ma non tutte sono di qualità e non tutte sono ben mantenute.
Quella che segue è un’ottima lista delle migliori web directory italiane publicata su seopoint nell’articolo www.seopoint.org/lista-migliori-directory-italiane.html e che con il loro permesso riporto qui sotto con una breve descrizione:

Prima di chiudere vi segnalo anche l’ottima seopoint directory che ha lo scopo di registrare solo siti di qualità. Anche in questo caso il link di ritorno è facoltativo.

Velocità e SEO

Postato da regole-seo, in Approfondimenti SEO, in data 21/02/2010

La velocità del sito inciderà sulla SERP di Google

velocita-seo

La velocità dei siti web: un nuovo fattore SEO on-page che Google utilizzerà per determinare il valore di un sito e che sta creando nuove preoccupazioni a molti webmaster.

Questo articolo vuole essere una breve introduzione a quello che la velocità andrà a rappresentare in ambito SEO in base alle dichiarazioni fatte da Matt Cutts, per capire quanto la velocità è importante e quanta attenzione è opportuno porre a questo parametro.
Ma non è tutto. Questa pagina diventerà anche un indice per gli articoli che seguiranno relativi alla velocità, alle tante tecniche per aumentare la velocità di un sito e le sue performance e ai vari tools per l’analisi della velocità e le performance di un sito.

Indice articoli
…tra poco on line nuovi articoli relativi alla velocità e il SEO

Matt Cutts tempo fa ha affermato che Google non ha mai considerato la velocità di un sito web. D’ora in avanti però, (per il nuovo algoritmo di Caffeine) diventerà un fattore da tenere in considerazione per il buon posizionamento.

Ecco qui sotto il filmato dell’intervista relativa a Google Caffeine dove appunto Matt Cutts ci dà importanti informazioni sulla considerazione della velocità dei siti da parte di Google.

Un sito veloce è un indicatore di una buona “user experience” relativamente alla navigazione e fruizione dei contenuti ed il compito di un motore di ricerca è fornire i migliori risultati ai propri utenti. Quindi se un sito è veloce otterrà un piccolo bonus nel posizionamneto rispetto ad un sito più lento.

A prescindere dal fatto che la velocità diventerà dunque un fattore SEO ogni webmaster che ha a cuore i propri utenti dovrebbe sempre stare attento anche alla velocità e alla pesantezza delle pagine web del proprio sito.

Google stesso cerca di venire incontro ai webmaster fornendo tools e consigli per aumentare la velocità che possono aiutare a raggiungere ottimi risultati.
Potete trovare questi strumenti al seguente indirizzo:
http://code.google.com/speed/

Va però considerato che anche se la velocità di un sito farà parte dei fattori che determineranno la sua qualità, certamente l’autorevolezza e la qualità dei contenuti saranno ancora gli aspetti principali su cui verrà stabilito il valore di un sito.
E’ sempre lo stesso Matt Cutts a sottolineare (nel filmato sottostante) questo concetto, ricordando anche che i fattori utilizzati per determinare il posizionamento sono più di 200.

Dunque attenzione d’ora in poi anche alla leggerezza e alla velocità, ma ricordiamoci che alla fine ciò che conta è appunto l’attenzione alla “user experience” degli utenti. Tutto ciò che può migliorarla non può che essere una buona mossa per essere meglio considerati dagli utenti e da Google.

Esistono diversi strumenti e tecniche che i webmaster possono utilizzare per migliorare i tempi di download dei propri contenuti e mi propongo di inserire a breve alcuni articoli (indicizzati in questa pagina) dedicati proprio a queste tecniche, a partire dalla compressione delle immagini, la compressione gzip dei contenuti, la staticizzazione dei contenuti, la compressione degli script e dei css e altro ancora.

Restate sintonizzati! :)

Lunghezza massima dei link: 8 parole per Google e non oltre

Postato da regole-seo, in Approfondimenti SEO, in data 15/02/2010

lunghezza-massima-link

Pochi giorni fa www.searchbrain.it ha pubblicato un ottimo articolo relativo a una nuova piccola scoperta riguardante la SEO on-page:

Google non indicizza oltre le prime otto parole presenti nell’anchor text di un link.

Nel loro articolo intitolato “Come ti smonto Google: una piccola scoperta SEO” troverete tutti i dettagli sui vari passaggi che hanno condotto a tale scoperta e sui vari esperimenti che hanno portato alla definitiva “regola” sopra citata.

Per condurre l’esperimento sono state effettuate ricerche su Google utilizzando l’operatore inanchor (che limita la ricerca all’interno degli anchor text dei link) e i doppi apici (utilizzati per l’identificazione di una specifica frase esatta).

Uno dei test effettuati è stato condotto sulla ricerca delle preposizioni semplici “di a da in con su per tra fra”.
Bene, la query
inanchor:"di a da in con su per tra"
che effettua la ricerca sulle prime 8 preposizioni ritorna come risultati link con anchor text che contengono tutte e 9 le proposizioni.
Invece la query
inanchor:"di a da in con su per tra fra"
che valuta tutte e 9 le preposizioni, non ritorna nemmeno un risultato.

Altri test condotti evidenziano che ad essere indicizzate sono sempre e solo le prime 8 parole e che non si tratta di un limite sul numero di lettere.

Alla luce di tutto ciò dovremo dunque porre più attenzione a tutti quei testi che rappresentano degli anchor text o che sono destinati a diventare dei link, come ad esempio i titoli degli articoli di un blog.
Nel caso in cui non si riesca a stare al di sotto di questo limite occorre cercare di concentrare all’inizio della frase le parole più importanti (keyword prominence) cercando di limitare il più possibile l’utilizzo delle stop-word.

Se qualcuno vuole lasciare un commento per portare le sue esperienze, fare qualche precisazione a riguardo o magari per evidenziare qualche eccezione alla regola, la cosa sarà come sempre molto gradita! :)

Contenuti duplicati – come difendersi

Postato da regole-seo, in Approfondimenti SEO, in data 08/02/2010

Identificare e difenderci dalla duplicazione dei contenuti volontaria e involontaria. [Parte 2 di 2]

Prima parte » Contenuti duplicati – identificazione

duplicazione-contenutiNella prima parte di questo articolo dedicato ai contenuti duplicati abbiamo visto cosa si intende con contenuto duplicato e in quali casi i motori di ricerca identificano un contenuto come duplicato.

Restano da chiarire ancora alcune cose molto interessanti: in quali casi di contenuto duplicato subiamo o rischiamo di subire una penalizzazione? Agli occhi di Google i casi visti nella prima parte dell’articolo hanno la stessa probabilità di causare un danno all’indicizzazione? Come si può evitare il contenuto duplicato?

Come premessa, basandoci su quanto si dice nel Centro Webmaster di Google (CWG), possiamo dire che non sempre il contenuto duplicato è dannoso.
Nel caso di due pagine contenenti lo stesso contenuto, dice il CWG, Google tenderà a visualizzarne una sola.
Ok, ma allora qualcosa non torna… …le due frasi precedenti non sono in contraddizione?
La risposta è “no” o meglio “non sempre”. Infatti in alcuni casi l’indicizzazione di una sola url delle due (o N) contenenti contenuto duplicato non ci reca alcun danno.

Vediamo allora nel dettaglio cosa ci dice il CWG.

GOOGLE COME TRATTA IL CONTENUTO DUPLICATO?

Sul CWG ci viene detto che molto spesso i contenuti duplicati non vengono creati a scopi ingannevoli.
Come abbiamo visto in “Quando i motori di ricerca rilevano un contenuto duplicato?” nella prima parte di questo articolo, spesso è così.
Viene citato anche qualche esempio di duplicazione non considerata dannosa:
duplicazione-non-dannosa
Nell’ottica di CWG questi casi di duplicazione non sono dannosi.
Google infatti indicizzerà soltanto una versione delle pagine contenenti i contenuti duplicati.

E’ proprio quest’ultima frase a mio giudizio la chiave di volta su cui concentrare la nostra attenzione.
E’ vero che in questi casi citati una versione della pagina viene comunque indicizzata, ma si tratta della versione che avremmo voluto vedere indicizzata?
E se Google trovando contenuti duplicati togliesse dall’indicizzazione la pagina che noi avremmo voluto indicizzare?

A mio avviso è sempre bene porre attenzione alla duplicazione dei contenuti usando le tecniche descritte tra poco, sia che Google ci dica che si tratta di un caso dannoso che di un caso non dannoso.
Solo in tal modo potremo essere certi di evitare cattive sorprese nell’indicizzazione e soprattutto di avere sempre la situazione sotto controllo.

Qualora Google invece, interpreti il contenuto duplicato come “caso dannoso”, ovvero una duplicazione creata al puro scopo di maggiore visibilità nei motori, allora l’indicizzazione dei nostri contenuti potrebbe subire repentine variazioni nella SERP.
A maggior ragione allora adottare le seguenti tecniche per aiutare Google a rilevare correttamente i contenuti duplicati è sicuramente un valido modo per evitarci cattive sorprese.

Concludendo ecco il consiglio di CWG:
consigli-google-duplicazione

COME SI PUO’ EVITARE IL CONTENUTO DUPLICATO?

Visto quali sono i casi di duplicazione del contenuto e come questi possono incidere negativamente sull’indicizzazione nei motori, non ci resta che capire quali sono le armi a nostra disposizione per poterci difendere nel modo corretto. Ecco dunque l’elenco delle tecniche utilizzabili:

  • Escludere i contenuti duplicati tramite robots.txt o metatag “robots”
    Tramilte l’utlizzo del file robots.txt possiamo essere noi stessi ad evitare che le pagine con contenuti duplicati vengano indicizzate. Tramite il campo “Disallow” possiamo infatti indicare che una determinata pagina o determinati indirizzi che iniziano con uno specifico percorso non devono essere indicizzati.
    Ad esempio il seguente codice
    robots-txt-disallow
    dice che nessuno spider deve indicizzare i contenuti il cui percorso inizia con “/articoli/mobile/” e la pagina “/articoli/miaPagina.html”
    Al seguente indirizzo http://www.robotstxt.org/orig.html è disponibile una breve ma completa guida all’esclusione degli spider tramite robots.txt.

    Nel caso non sia possibile modificare il file robots.txt possiamo ricorrere all’utilizzo del metatag “robots” all’interno delle pagine che non vogliamo vengano indicizzate.
    Ad esempio il seguente metatag:
    <meta name=”robots” content=”noindex”>
    dichiara che il contenuto della pagina non deve essere indicizzato da nessuno spider.

    All’indirizzo http://www.robotstxt.org/meta.html potrete trovare tutti i dettagli sull’utilizzo del metatag robots.

    L’uso del robots.txt è utile anche nel caso si faccia ricorso asiti miror. In questi casi infatti occorrerebbe inibire l’accesso dei motori ai siti mirror tramite una regola come la seguente:
    User-agent: *
    Disallow: /

    Inoltre, sarebbe opportuno inserire l’attributo rel=”nofollow” all’interno di eventuali link presenti sul sito principale diretti verso le pagine dei siti miror.

  • Coerenza nella creazione dei link
    Nel caso di più versioni di url a pagine contenenti lo stesso contenuto (o alla stessa pagina) è bene essere coerenti nella creazione dei link. Sarebbe bene inserire sempre la stessa url nei link che portano a tali contenuti.
    Ad esempio, evitare di creare link a
    http://www.example.com/articolo/miaPagina/
    http://www.example.com/ articolo/miaPagina
    http://www.example.com/ articolo/miaPagina/index.htm
    http://www.example.com/ articolo?titolo=miaPagina

    Il problema della creazione dei link si ha anche nel caso di possesso di più domini (ad esempio www.mioSitoe.com e http://mioSitoe.com) che si riferiscono allo stesso sito.
    Tramite gli Strumenti per i Webmaster di Google è possibile indicare il modo in cui si desidera indicizzare il proprio sito comunicando il “dominio preferito

  • Canonicalizzazione: utilizzo del tag “canonical”
    Il tag canonical permette di comunicare allo spider del motore di ricerca quale delle url che puntano ad un contenuto duplicato deve essere indicizzata.
    L’utilizzo del tag canonical è utilissimo in entrambi i seguenti casi:
    - definire quale delle diverse url che puntano a una pagina deve essere quella da indicizzare
    - definire quale delle diverse pagine contenenti lo stesso contenuto deve essere indicizzata.
    Per utilizzare il tag canonical basta inserire nelle pagine il seguente tag all’interno della <head>:
    <link rel=”canonical” href=”http://www.example.com/ articolo/miaPagina” />
    dove “http://www.example.com/ articolo/miaPagina” è la url “preferita” che vogliamo sia indicizzata per i nostri contenuti.
  • Prestare attenzione alla pubblicazione e diffusione dei propri articoli su altri siti (Article syndication)
    Poiché i motori potrebbero indicizzare l’articolo presente nella pagina non appartenente al sito dell’autore, innanzitutto è sempre opportuno accertarsi che chi pubblica un nostro articolo inserisca un link alla fonte originale.
    In secondo luogo è anche possibile fare richiesta a chi utilizza il nostro materiale di bloccare mediante robots.txt la versione presente sul loro sito.
  • Uso attento dei CMS (Content Management System) per la gestione dei contenuti
    I CMS in circolazione utilizzati soprattutto per la creazione e gestione di Blog creano spesso url differenti le cui pagine possono riportare gli stessi contenuti.
    Faccio un esempio per tutti: io sono un accanito fan di Wordpress. Reputo che sia un ottimo strumento e grazie agli innumerevoli plugin è davvero difficile avere esigenze che non possano essere accontentate.
    Bene, pensate a quando pubblicate un nuovo articolo con Wordpress (ma il discorso vale anche per altri CMS). Il contenuto sarà visibile attraverso più di una url:
    - l’url dell’articolo
    - l’url a un qualsiasi tag associato all’articolo
    - l’url alla categoria cui appartiene l’articolo
    - l’url dell’archivio degli articoli

    Per evitare che vengano rilevati contenuti duplicati dovremmo fare una buona analisi delle url create e procedere poi all’utilizzo degli opportuni metatag o del file robots.txt per avere controllo di ciò che deve e non deve essere indicizzato.

    Fortunatamente nel caso di Wordpress esiste più di un plugin che può risparmiarvi un sacco di lavoro.
    Personalmente utilizzo il plugin “All in one SEO pack“. Tra gli strumenti SEO che offre questo preziosissimo plugin, troviamo diverse funzionalità che se attivate inseriscono in automatico e in modo efficiente i tag di noindex e di canonicalizzazione in modo che non si abbiano problemi di duplicazione di contenuti a causa delle diverse url generate di cui sono stati riportati precedentemente alcuni esempi.

    La documentazione completa di All in one SEO pack è disponibile a questo indirizzo:
    http://semperfiwebdesign.com/portfolio/wordpress/wordpress-plugins/all-in-one-seo-pack/
  • Segnalare la violazione del Copyright a Google
    Come accennato nella prima parte dell’articolo, Google permette di segnalare eventuali violazioni di Copyright tramite il suo servizio di “Notifica di presunta violazione del copyright“. All’ indirizzo http://www.google.it/dmca.html trovate tutte le informazioni su come procedere.
    Sarà chiaramente Google a decidere se e quali provvedimenti prendere a riguardo.
  • Sfruttare la sitemap del sito
    Comunicare le pagine del sito che vanno indicizzate ai motori di ricerca per mezzo per mezzo della sitemap. In un precedente articolo abbiamo visto come invare la sitemap ai principali motori di ricerca:
    - inviare sitemap a Yahoo!
    - inviare sitemap a Bing
    - inviare sitemap ad Ask
    - inviare sitemap a MSN
    - inviare sitemap a Google
    - inviare sitemap a Windows Live
    - inviare sitemap a Moreover

Dopo aver visto come Google considera i contenuti duplicati e applicando le precedenti regole potremo dormire sonni tranquilli per quanto riguarda la duplicazione dei contenuti nella maggior parte dei casi visti nella prima parte di questo articolo.

Anche per questa volta è tutto!

Prima parte » Contenuti duplicati – identificazione

Contenuti duplicati – identificazione

Postato da regole-seo, in Approfondimenti SEO, in data 01/02/2010

Identificare e difenderci dalla duplicazione dei contenuti volontaria e involontaria. [Parte 1 di 2]

Seconda parte » Contenuti duplicati – come difendersi

duplicazione-contenutiIn questo articolo, diviso in due parti, parlerò della duplicazione dei contenuti sul web per cercare di capire meglio cosa si intende realmente quando si parla di “contenuto duplicato“, quali casi di contenuto duplicato (volontario e involontario) si possono avere e come possiamo difenderci dalla duplicazione dei contenuti.

La prima cosa che viene da pensare parlando di “duplicazione dei contenuti” è la violazione del copyright.
Come vedremo però in molti casi potremmo essere noi stessi la causa della duplicazione dei nostri stessi contenuti.

Prima di procedere ecco un breve elenco dei punti che verranno trattati:

CHE COS’ E’ UN CONTENUTO DUPLICATO?

Con contenuto duplicato si intende la fruibilità di porzioni di contenuto identico o molto simile attraverso due url differenti, siano esse all’interno dello stesso dominio o meno.

Detto questo la prima cosa che viene da pensare è:
Ok. Mi serve un modo per proteggermi da chi copia i contenuti dal mio sito per pubblicarli altrove“.
Certo, questo è importantissimo, ma quello che può sfuggire è che in parecchie circostanze a duplicare il nostro contenuto siamo noi stessi all’interno del nostro sito e la cosa ancora più bella è che ciò avviene anche se inseriamo il contenuto in una sola pagina.
La cosa interessa tutti i tipi di siti, grandi e piccoli e tutti i blog che nella maggior parte dei casi vengono creati tramite l’utilizzo di CMS.
Molto probabilmente tra i casi descritti di seguito troverete anche una situazione che vi sembrerà familiare :) .

QUANDO I MOTORI DI RICERCA RILEVANO UN CONTENUTO DUPLICATO?

In effetti i casi in cui un motore di ricerca può identificare del contenuto come duplicato (intenzionalmente o meno) sono davvero parecchi.
Tramite strumenti come Copyscape è possibile monitorare se una porzione di contenuto di una nostra pagina web è accessibile da più url differenti (interne o esterne al nostro dominio).
Vediamo allora i casi di duplicazione in cui potremmo imbatterci per poi descrivere, nella seconda parte dell’articolo, le tecniche per evitare la duplicazione dei contenuti.

  • Violazione del CopyRight:
    Il furto del nostro contenuto originale è il caso meno interessante, ma anche quello più difficile da combattere in quanto per risolverlo non ci basta sfruttare una tecnica “on-page“.
    Google, come vedremo nella seconda parte di questo articolo permette la “Notifica di presunta violazione del copyright” da parte degli utenti in modo da prendere i giusti provvedimenti.
  • Pagine che prelevano il contenuto di un feed rss tramite uno script server side per mostrarlo in pagina:
    Che si tratti di una violazione del copyright o meno, in tal caso avremo una duplicazione in quanto il contenuto prelevato da un feed esterno e mostrato in una pagina, molto probabilmente sarà mostrato anche sulle pagine del sito cui il feed originariamente appartiene.
    Tramite uno script server side che conduce un’operazione di questo tipo, il rischio di fare indicizzare contenuto duplicato è molto più alto rispetto a quello che si correrebbe tramite uno script client side (usando ad esempio javascript). In genere gli spider dei motori di ricerca non eseguono script client side pertanto in tal caso non vedrebbero il contenuto importato.
  • Pagine contenenti descrizioni di prodotti:
    Quando più di un sito vende lo stesso prodotto, spesso viene usato lo stesso testo, recuperato dal sito del produttore, per descriverlo.
  • Pagine per la stampa:
    Alcuni siti offrono lo stesso contenuto in una seconda pagina ottimizzata per la stampa. In questo caso i motori di ricerca indicizzerebbero anche la pagina ottimizzata per la stampa e ci ritroveremmo con due pagine con lo stesso contenuto indicizzate.
  • Contenuto unico accessibile da url differenti:
    Anche se spesso è normale, quando si parla di indicizzazione, porre poca attenzione al dire la parola “url” al posto della parola “pagina”, ricordatevi sempre questo: i motori di ricerca indicizzano url e non pagine.
    Detto questo è possibile che nel vostro sito/blog esistano url diverse che portano alla stessa pagina oppure url diverse che portano a pagine diverse costruite dinamicamente lato server e che in certi casi possono contenere lo stesso contenuto.
    Pensate ad esempio ad un articolo da poco pubblicato in un blog. Il suo contenuto potrebbe essere indicizzato per le seguenti url:
    http://www.mioBlog.it/nuovoArticolo (effettiva url della pagina dell’articolo)
    http://www.mioBlog.it/ultimiArticoli (url della pagina contenente gli ultimi articoli pubblicati)
    http://www.mioBlog.it/tag/mioTag (url della pagina contenente gli articoli taggati con “mioTag” )
    http://www.mioBlog.it/category/miaCategoria (pagina contenente tutti gli articoli della categoria “miaCategoria” )
    Anche la presenza di parametri in un’url può causare lo stesso problema:
    http://www.mioSito.it?category=cucina
    http://www.mioSito.it?category=pasta

    potrebbero essere due url contenenti articoli tra i quali “Come cucinare la pasta al forno”.
    Insomma di esempi se ne potrebbero fare davvero tantissimi, ma sostanzialmente ciò che interessa è che se due url diverse portano a pagine che contengono porzioni di contenuto uguali o molto simili allora rischiamo che i motori di ricerca indicizzino url differenti per lo stesso contenuto.
  • Tecniche di Behavioural Targeting attraverso session ID o altri parametri in “get”:
    Per molti siti è importante determinare il comportamento dell’utente (quali pagine visita, in quale ordine ecc…). In alcuni casi l’utente viene tracciato tramite id di sessione o tramite opportuni parametri che vengono appesi alla url effettiva della pagina.
    Se anche il crawler di un motore di ricerca viene trattato come un utente allora è possibile che vengano indicizzate url che differiscono solo per questi parametri e che puntano in realtà agli stessi contenuti.
  • Domini e sottodomini:
    Per molte aziende è importante possedere più di un dominio o più di un sottodominio per incrementare la propria popolarità.
    La presenza di contenuti duplicati nelle pagine di questi domini/sottodomini può comportare la non indicizzazione di alcune delle url interessate proprio a causa del rilevamento di contenuti duplicati da parte dei motori di ricerca.
  • Article syndication:
    Molte persone creano e pubblicano articoli e li offrono per la pubblicazione su altri siti a patto che venga inserito il link alla fonte ufficiale e che ne venga indicata l’attribuzione.
    Questa azione può essere sicuramente vantaggiosa in termini di link popularity ma va tenuto presente il rischio che i motori di ricerca eliminino dall’indicizzazione l’articolo originale e che mantengano l’indicizzazione di una copia.
  • Siti mirror:
    Spesso per siti molto visitati viene utilizzata la tecnica dei siti mirror. Questo senza le dovute precauzioni può portare all’ indicizzazione di contenuti duplicati.

Abbiamo dunque esaminato la casistica delle situazioni che possono portare alla duplicazione dei nostri preziosi contenuti. Nella seconda e ultima parte di questo articolo vedremo come Google tratta il contenuto duplicato e quali tecniche esistono per difenderci dalla duplicazione dei contenuti in molti dei casi sopra citati.

Seconda parte » Contenuti duplicati – come difendersi

Copyscape: individuare i contenuti duplicati

Postato da regole-seo, in seo-utility, in data 25/01/2010

Copyscape è un web utility gratuita in grado di identificare se il contenuto di una pagina web è presente anche in altri documenti in rete.

Mentre nel prossimo articolo ci occuperemo delle tecniche da utilizzare per tutearci dalla duplicazione dei contenuti, Copyscape è un ottimo strumenti che ci permette di identificarli.

La duplicazione di un contenuto può avvenire all’interno dello stesso dominio o tra domini differenti e può essere volontaria o involontaria.
Spesso la duplicazione involontaria si ha quando esistono url differenti che conducono alla stessa pagina del nostro sito. Ad esempio il contenuto di un articolo del nostro blog potrebbe essere visibile sia accedendo alla url vera e propria dell’articolo (http://mioSito/blog/MioArticolo) che accedendo alla pagina degli ultimi articoli pubblicati (http://mioSito/blog/Ultimi10Articoli).

Una cosa è certa, come spiegato anche in questo documento
http://www.google.com/support/webmasters/bin/answer.py?hl=it&answer=66359
i contenuti duplicati possono incidere negativamente sul posizionamento nei motori di ricerca.

Copyscape è un ottimo strumento che ci aiuta a non cadere nella trappola dei contenuti duplicati involontariamente ma ci permette anche di scoprire se qualcuno ha duplicato il contenuto di una nostra pagina sul proprio sito.

Accedendo alla home page di Copyscape, tutto quello che occorre fare è inserire la url della pagina di cui ci interessa identificare eventuali copie di contenuto e premere il pulsante “Go”.
Copyscape si collegherà alla pagina, ne leggerà il contenuto e verificherà se tale contenuto si ripete da qualche altra parte sul web.


copyscape

Sito: www.copyscape.com
Licenza: free
Lingua: Inglese
Tipologia: web

Rank Checker

Postato da regole-seo, in seo-software, in data 18/01/2010

rank-chackerRank Checker è un plugin gratuito per Firefox distribuito da tools.seobook.com (gli stessi di Seo For Firefox).
Tramite Rank Checker potremo visualizzare la nostra graduatoria nelle SERP di Google, Yahoo! e Microsoft Live Search.

Vediamo brevemente come si configura e come si usa (anche con l’aiuto del filmato che trovate in fondo all’articolo):

Impostazioni:

Dopo avere scaricato e installato Rank Checker in Firefox, la prima cosa da fare è occuparsi della configurazione.
Accedete al pannello di configurazione che trovate sotto “Strumenti”, “Rank Checker”, “Options…”.
Da qui potrete impostare la nazionalità dei tre motori di ricerca (Google, Yahoo! e Microsoft Live Search) dai quali verranno recuperati i risultati del SERP.

Se siete loggati nel vostro account Google, togliendo la spunta dalla voce “Don’t use Google personalized search results if any” potrete inoltre effettuare l’analisi basandovi sul ranking dei vostri risultati personalizzati (cosa che vi sconsiglio di fare se volete ottenere risultati attendibili).

Come ultima cosa, sul sito ufficiale di Rank Checker, consigliano di impostare il campo “Delay between queries” almeno a “2″ per evitare che i motori di ricerca blocchino le nostre richieste.

Analisi SERP:

Per accedere alle funzionalità di Rank Checker, selezionare “Strumenti”, “Rank Checker”, “Run” oppure cliccare sull’icona rankChecker-button nell’angolo in basso a destra di Firefox.
Da qui possiamo inserire le keyword una a una tramite l’apposita casella di testo e il pulsante “add” oppure inserire in una sola volta un elenco di keyword/keyphrase andando a capo dopo ognuna, utilizzando il pulsante “Add Multiple Keywords”.

A questo punto non vi resta che cliccare sul pulsante “start” per dare il via all’analisi che vi mostrerà, per i tre motori di ricerca, la posizione occupata per ogni keyword immessa, dicendovi anche quale è la pagina interessata.

Tramite i tasti “Open” e “Save” potrete rispettivamente aprire e salvare una lista di keyword, molto utile per potere condurre analisi su più siti in modo rapido.

Esportazione dati:

Tramite il tasto “Export Results to CSV” è possibile esportare i risultati ottenuti.
Tale funzionalità è molto comoda. Infatti una volta memorizzati in un file Excel i risultati potranno essere paragonati con quelli ottenuti in un periodo successivo in modo da fare le analisi necessarie, capire dove è opportuno intervenire e se gli eventuali interventi effettuati in passato hanno dato o meno buoni risultati.

Schedulazione task:

Rank Checker vi da anche la possibilità di schedulare un’analisi. Tramite la funzione che trovate sotto “Strumenti”, “Rank Checker”, “Scheduled Tasks” potrete far partire l’analisi di una lista di keyword precedentemente salvata, ogni tot giorni all’ora stabilita.

Il seguente filmato mostra Rank Checker in azione:

Sito: tools.seobook.com
Licenza: Free
Lingua: Inglese
Tipologia: Firefox add on
Sistema operativo: Linux mac-os Windows

Ping services: lista aggiornata

Postato da regole-seo, in Approfondimenti SEO, in data 10/01/2010

Tieni al passo la tua lista di servizi di aggiornamento di WordPress o del tuo sistema automatico di gestione dei ping. Ultimo aggiornamento: 27/01/2010


ping-servicesCarissimo lettore, se sei giunto a questa pagina, molto probabilmente è perché sei alla ricerca di una lista aggiornata di ping services per far conoscere i contenuti del tuo blog o perché stai cercando informazioni sui servizi di ping ancora attivi, magari per aggiornare la tua lista dei servizi di aggiornamento di Wordpress.

Quello che però prima di tutto mi sento di dover fare è di rassicurarti.
Si, perché tu hai bisogno di essere rassicurato, lo so. Hai bisogno di essere sicuro che la lista di ping services che troverai in questa pagina sia veramente aggiornata.

Probabilmente sei sull’orlo della schizofrenia visto che sicuramente sarai (anche tu come me) rimbalzato tra un blog e l’altro attirato dai titoli più eclatanti che si avviciano a cose del tipo “Lista aggiornata di servizi di ping” oppure “Lista definitiva di servizi di ping” o ancora “Lista aggiornata e sicuramente funzionante di servizi di ping“.
Certo tutti titoli d’effetto (oops, come quello usato per questo post :) ) ma magari di articoli che non riportano la data dell’ultimo aggiornamento, o addirittura con una data di tre anni fa.

Bene, caro lettore, ora rilassati, sei tra amici.
Bevi un bicchier d’acqua e mettiti comodo così ti spiego, con calma, perché questa lista è diversa dalle altre e perché di questa pagina ti puoi fidare.

Prima di procedere, visto che l’articolo è un po’ lungo eccoti un breve enelco dei punti trattati nella pagina:

PERCHE’ QUESTA LISTA DI PING SERVICES E’ VERAMENTE AGGIORNATA

  • Punto primo: in cima all’articolo puoi trovare la data dell’ultima modifica. Certo se la data non è recente potrebbe voler dire che la lista non è all’ultimo grido. Ecco perché oltre alla data ti dico come faccio a mantenere la lista dei ping services costantemente aggiornata. (NOTA: una data di ultima modifica non recente in questa pagina significa solamente una cosa: non ci sono state variazioni nella lista).
  • Punto secondo: come faccio io a conoscere la lista aggiornata dei ping services senza avere stretto un patto col diavolo?
    In effetti la storia è un po’ lunga: dopo avere stretto un patto col diavolo, ho scoperto che esistono dei plugin, come quello che utilizzo io per WordPress (MaxBlogPress Ping Optimizer) per la gesione dei servizi di aggiornamento. Questo plugin oltre agli innumerevoli vantaggi che puoi vedere sul sito ufficiale, stampa un file di log che mostra quali servizi di aggiornamento (ping services) hanno funzionato correttamente durante la pubblicazione del post.
  • Punto terzo: le eventuali segnalazioni di ping services inserite nei commenti a fondo pagina verranno prima testate da me e poi aggiunte (solo se funzionanti) alla lista aggiornata dei servizi di ping. Chi segnala un servizo non funzionante chiaramente vince una bambolina (e così anche sul lato “viral” sono a posto :) ).

Ok, in effetti ora noto che sei un po’ più rilassato…
Qui di seguito, giusto per completezza, ti mostro l’immagine di una piccola porzione di un log generato da MaxBlogPress Ping Optimizer che utilizzo per determinare i servizi non più funzionanti:

log-servizi-aggiornamento

Quelli in rosso sono i servizi rilevati come non funzionanti.

Bene, ora che le tue preoccupazioni sull’ottenere una lista aggiornata di servizi di ping sono soltanto un brutto ricordo, eccoti la lista.

LISTA AGGIORNATA DI PING SERVICES (txt)

In questo file: ping-services.txt
trovi la lista aggiornata di ping services attualmente in funzione e che vale la pena utilizzare.
Puoi copiarla e farne buon uso.
Cosa-cosa? Stai pensando che la lista è troppo corta?.
Ok, ma perché ti aspettavi una lista più lunga? Forse perché navigando per il web hai trovato elenchi più lunghi?
…mmm, pensavo di averti rassicurato abbastanza comunque senti qui: molti servizi di ping vengono già notificati da altri servizi di ping quando questi ultimi ricevono la notifica di aggiornamento dal tuo blog.

Inserendo le lunghissime liste che si trovano sul web molti servizi riceverebbero più notifiche per lo stesso aggiornamento: quelle direttamente rivolte a lui perché compare nella tua lista e quelle provenienti da altri servizi come Ping-o-matic presenti nella tua lista e che già si occupano di notificare il tuo aggiornamento allo stesso servizio.
Purtroppo non vi è nessuna garanzia che la ricezione di più notifiche non venga interpretata come spam dai servizi.
Ecco perché una lista breve ma mirata è migliore di una semplice raccolta di servizi di ping.

Ho ottenuto la lista in questo modo:

  • Ho accumulato una serie di servizi di ping partendo proprio da quelle lunghissime liste che si trovano un po’ ovunuque sul web e in molti blog, dove vengono spacciate per liste “definitive” e aggiornate.
  • Ho eliminato da questa lista tutti i servizi già notificati da Ping-o-matic
  • Ho eliminato tutti quei ping services non più funzionanti.

Nel seguente file Excel puoi vedere la lista dei servizi da cui sono partito e capire perchè sono stati eliminati ad uno ad uno fino ad arrivare ad una lista così poco numerosa: stato-ping-services.xls

COSA SUCCEDE AI SERVIZI DI PING

L’idea di scrivere questo articolo è nata da una banalissima questione: entrando nel mio account di FeedBurner avevo notato che per la funzionalità PingShot non era più possibile inserire a quali ping services notificare i propri aggiornamenti.
Un po’ contrariato ho posto subito la questione sul forum di GiorgioTave (http://www.giorgiotave.it/forum/google/127122-pingshot-feedburner.html).

Il fulcro del discorso è questo (ed è la cosa su cui mi piacerebbe avere il parere di chi legge):
Technorati , il famoso motore di ricerca per blog, dal 14 ottobre 2009 non utilizza più i ping.
Il motivo è semplice: dicono che dei ping ricevuti il 90% era spam.
Eccovi qui la pagina di Technorati che informa gli utenti: http://technorati.com/ping/
Insomma direi che il 90% è un buon pretesto per cambiare sistema.

E allora cosa succede? La risposta è semplice e naturale. Invece di essere noi ad avvisare Technorati, ora sarà Technorati a venire a cercare le novità sul nostro blog.
D’altronde grazie all’esistenza dei feed non poteva esserci idea migliore.

Considerate anche che tra quel 90% di spam potrebbe esserci una grossa fetta di “non spam” e di seguito trovate solo un esempio del perchè.

WORDPRESS BANNING

Come spiegato in questo articolo dal titolo “WARNING: Using WordPress Can Ban Your Blog From Ping Services” (che vi consiglio di leggere anche se non siete interessati al plugin) WordPress invia segnalazioni ai servizi di aggiornamento ogni volta che facciamo una modifica ad un post (e questo non è l’unico problema). Quindi senza i dovuti accorgimenti (o plugin) i ping services potrebbero bannare il vostro blog a causa delle eccessive richieste sugli stessi contenuti, interpretandole come spam.

Alla luce di tutte le precedenti considerazioni, sorgono alcune domande:

  • Tutti gli altri servizi di ping ancora attivi reputano ancora valido il loro sistema basato su una politica di “push” della notifica di aggiornamenti da parte degli utenti?
  • In che percentuale raccolgono segnalazioni di spam? Ne hanno una percezione?
  • Alla luce di tutto ciò quanto dureranno acnora i servizi di ping basati sulla segnalazione di un aggiornamento da parte dell’utente?

Se qualcuno vuole provare a dare qualche risposta… :)

SEO for Firefox

Postato da regole-seo, in seo-software, in data 04/01/2010

seo-for-firefoxSeo for Firefox è una fantastica estensione gratuita per Firefox, aggiornata regolarmente.
Da la possibilità di avere un quadro abbastanza dettagliato relativamente al settore del vostro sito web o blog semplicemente aggiungendo dati interessanti ai risultati delle ricerche effettuate su Google o su Yahoo.

Abilitando Seo for Firefox infatti, avrete a disposizione direttaemnte nella pagina di ricerca di Google o Yahoo! numerosissimi dati SEO/marketing che permettono di farsi istantaneamente un’idea del sito.

Ecco solo alcuni dei dati messi a disposizione:

  • PR: Google PageRank
  • Age: età del sito estratta da Archive.org. Mostra la prima volta che la pagina è stata indicizzata dallo spider di Archive.org
  • Y! Links: una stima del numero totale di link che puntano al dominio
  • Y! .edu Link: una stima del numero totale di link che puntano al dominio provenienti da domini .edu
  • Y! .gov Link: una stima del numero totale di link che puntano al dominio provenienti da domini .gov
  • del.icio.us: numero di volte che la url è stata aggiunta ai preferiti di Del.icio.us
  • Technorati: una stima del numero totale di link provenienti da Technorati
  • Alexa: alexa ranking
  • Cached: mostra quante pagine del sito sono indicizzate in Google
  • dmoz: mostra il numero totale di pagine del sito indicizzate in DMOZ
  • Bloglines: mostra quante persone sono iscritte ad un blog tramite Bloglines
  • dir.yahoo.com: indica se il sito è o meno presente nella directory di Yahoo!
  • WhoIs: recupera i dati whois del sito.

Dopo l’installazione, per abilitare Seo for Firefox vi basterà cliccare sull’iconcina seo-for-firefox-opzioni che compare nell’angolo destro della barra inferiore di Firefox.

E’ possibile che per poter scaricare Seo for Firefox sia necessario iscriversi gratuitamente al sito.
Io ritengo che ne sia valsa la pena ;) .

Sito: tools.seobook.com
Licenza: Free
Lingua: Inglese
Tipologia: Firefox add on
Sistema operativo: Linux mac-os Windows