Àmbit
Informàtic

Com saber si la vostra pàgina està indexada als cercadors

Entitat redactora
Associació per a Joves TEB - Informàtic
Autor/a
Xavi Aranda - Associació per a Joves TEB

Les pàgines de les entitats, associacions i ONGs ha d'estar indexades per tal d'aparèixer als resultats dels cercadors. Mitjançant aquestes recomanacions podreu saber si la pàgina de la vostra entitat està indexada.  

Imagineu-vos que una persona vol fer un voluntariat en una entitat social, però no en coneix cap. El primer que farà és posar-se davant d'un ordinador, connectar-se a Internet i cercar en un cercador «voluntariat entitat social». Si la vostra entitat està cercant persones per fer voluntariat i té una pàgina web on surti aquesta informació, és possible que aquesta persona acabi trobant aquesta informació. I de retruc, que contacti amb vosaltres.

La pàgina web de la vostra entitat és una porta d'accés de molta informació i oportunitats. Aquesta pàgina ha de ser visible per tothom i sobretot per la gent que no us coneix. Però per sortir als resultats dels cercadors, aquesta pàgina web ha d'estar indexada. Totes les pàgines web són rastrejades per diferents robots, que van viatjant per tot Internet. Aquests robots agafen informació de les pàgines i les porten als cercadors. Mitjançant aquestes informacions dels robots, els cercadors mostren una referència de la vostra pàgina depenent de la cerca efectuada. Però a vegades aquests robots tenen problemes per visitar les pàgines webs o per agafar la informació que hi ha dins les pàgines. I tornen a casa dels cercadors amb les mans totalment buides.

Per això és molt important que comproveu si la vostra pàgina web està indexada o no, perquè els robots puguin trobar correctamnet la vostra pàgina web. A continuació us explicarem com podeu saber si s'ha indexat la pàgina per poder treballar bé el posicionament SEO.  

Índex

Com podeu saber si la vostra pàgina està indexada a Google

Per comprovar si la vostra pàgina està indexada a Google, el primer que heu de fer és visitar el mateix cercador. A la caixa de text, heu d'introduir el següent:

site:nom_del_vostre_domini.extensió_del_vostre_domini

En el cas del portal Xarxanet ho escriuríem així:

site:xarxanet.org

indexació google

Fixeu-vos amb els nombre i els resultats. En aquest cas Google comenta que hi ha 103.000 resultats i tots són pàgines que pengen del domini xarxanet.org. Això ja està indicant que el global de la pàgina ha estat indexada correctament.

El resultat de la cerca informa que la pàgina ha estat indexada.

Com podeu saber quina ha estat l'última vegada que Google ha indexat la vostra pàgina

En els mateixos resultats que Google us ha donat, fixeu-vos que al costat de l'adreça, hi ha un triangle de color verd. Cliqueu-lo i seleccioneu la opció «en caché».

Fixeu-vos en el triangle verd que us dona els resultats.

Automàticament us sortirà una captura de pantalla de la pàgina en qüestió i un missatge a dalt que us indica quin ha estat l'últim dia que el robot de Google va visitar la vostra pàgina web. Si teniu la pàgina ben indexada, el més probable es que sigui qüestió de dies.

Si la data és de fa més d'un mes, senyal que hi ha alguna cosa que està fallant. Més endavant coneixereu com comprovar aquests errors.

Com podeu saber si la vostra pàgina web està indexada a Bing

El procediment per saber si la vostra pàgina web està indexada a Bing és exactament el mateix que el de Google. El primer que heu de fer és visitar la pàgina de Bing. A la caixa de text, heu d'introduir el següent text:

site:nom_del_vostre_domini.extensió_del_vostre_domini

En el cas del portal Xarxanet ho escriuríem així:

site:xarxanet.org

Fixeu-vos amb els nombre i els resultats. En aquest cas Bing comenta que hi ha 11,100 resultats i tots són pàgines que pengen del domini xarxanet.org. Això ja està indicant que el global de la pàgina ha estat indexada correctament a Bing.

Com podeu saber quina ha estat l'última vegada que Bing ha indexat la vostra pàgina?

Doncs de la mateixa manera que Google. Als resultats que ha donat l'anterior cerca, hi ha un desplegable verd. Si cliqueu allà, us ha de sortir la opció «en caché».

Indexació Bing

Aleshores us mostrarà una captura de pantalla de la pàgina i una capçalera amb la informació de l'última vegada que el robot de Bing va visitar la vostra pàgina i va agafar totes les dades.

Indexació bing

Igual que Google, si la data és de fa 1 mes, senyal que algun procediment està anant malament.

Com saber si el vostre lloc web té un «sitemap» i com crear aquest «sitemap».

Primer de tot heu d'assegurar-vos que dins de la vostra pàgina web hi hagi un mapa de la mateixa pàgina. Aquest mapa és anomenat «sitemap» i és com una guia pels robots dels cercadors. Mitjançant aquests mapes, els robots dels cercadors poden trobar totes les pàgines que componen la vostra pàgina web.

Normalment, per defecte, el «sitemap» de la vostra pàgina web ha d'estar accessible i en format xml. Normalment el «sitemap» es guarda a l'arrel de la pàgina i hauria de ser accessible mitjançant aquesta ruta:

nom_del_domini/sitemap.xml

En el cas que la vostra pàgina estigui desenvolupada amb Wordpress o Drupal, és molt recomenable utilitzar una extensió que el generi automàticament. Podeu provar aquestes:

Google XML Sitemaps per a Wordpress. (també funciona per Bing).

XML Sitemap per a Drupal.

Aquests dos mòduls, generaràn automàticament un «sitemap» i el deixaràn accessible per als robots dels cercadors. Si teniu dubtes sobre com instal·lar i configurar aquests dos mòduls, contacteu amb el servei d'assessorament de Xarxanet.

Com notificar a Google i Bing que ja teniu el vostre «sitemap»

L'eina Google Search Console

Google té una eina molt útil per als desenvolupadors de les pàgines web, anomenada Google Search Console. Abans coneguda com Google Webmaster Tools. Mitjançant aquesta eina podreu supervisar si la vostra pàgina està present al cercador Google. Per utilitzar l'eina necessiteu un compte de Google o Gmail i tenir accés al servidor FTP de la vostra pàgina web. Per enllaçar la pàgina web amb Google Search Console, consulteu aquest petit manual de Google.

Google Search Console té una secció per els sitemaps

Dins de Google Search Console podreu trobar una secció anomenada «Rastreo» i «Sitemaps». En cas que Google Search Console no disposi del vostre «sitemap» el podreu afegir clicant el botó que us mostra aquesta secció.

Afegir sitemap a Google Search Console

Només haureu d'afegir l'enllaç al vostre "sitemap" i Google començarà a indexar la vostra pàgina.

 

L'eina Bing administrador de web

El cercador Bing també té una eina per facilitar el rastreig i indexació de la vostra pàgina web. Aquesta eina és Bing Webmaster Tools. És molt probable que la vostra web no estigui indexada i per tant haureu de crear el vostre compte, associat a una adreça de correu Outlook o Hotmail. Mitjançant el registre a Webmaster Tools, podreu afegir el "sitemap" de la vostra pàgina web. Un cop afegit, Bing començarà a indexar les vostres pàgines.  

Com podeu saber si l'arxiu robots.txt impedeix la indexació del vostre lloc web

Si afegint els «sitemaps» a la vostra pàgina web, i notificant a Google i Bing de la seva existència, encara teniu problemes amb la indexació, és molt probable que tingueu una directiva a l'arxiu robots.txt que impedeix als cercadors indexar correctament la vostra pàgina web.

L'arxiu robots.txt és un arxiu que està resident a l'arrel de la vostra pàgina web. Si la vostra pàgina està feta amb Drupal o Wordpress, és molt probable que l'arxiu estigui creat automàticament. Si està fet amb HTML, s'ha de crear manualment mitjançant un editor de text.

En cas que el vostre fitxer robots.txt contingui el següent contingut


User-agent: *

Disallow: /
 

senyal que aquest fitxer està impedint que tots els robots indexin la vostra pàgina web. Per tant haureu d'editar aquest fitxer robots.txt. Consulteu el manual de Robotstxt.org per saber el que s'ha d'escriure. En cas que tingueu la pàgina feta amb Wordpress o Drupal, mireu si teniu alguna casella que restringeixi l'accés als robots dels cercadors.

Eiens com wordpress tenen una opció per evitar que tots els cercadors rastregin la vostra web

Comparteix i difon