Webmarketing - SEO
Now Reading
Le référencement naturel : récupérer les URLs indexées
0

Avoir de bonnes bases en SEO est important, mais pour pouvoir user de tous les attraits de cette pratique, maitriser des techniques avancées s’impose. A cela, il y a le fait de récupérer les URLs indexées en full automatique. Avec cette démarche, la vision même du référencement naturel sera beaucoup plus élargie puisqu’il permettra de s’approcher d’autant plus de la manière de Google d’évaluer chaque page d’un site.

Le fonctionnement de l’indexation

Pour rappel, il faut obligatoirement user de la récupération des URLs afin d’améliorer la visibilité d’un site sur google. Afin de pouvoir indexer les pages d’un site, Googlebot doit passer sans aucune contrainte sur ces pages en question. Pour vérifier, par la suite si le travail a été fait, il suffira de voir si Googlebot a crawlé une URL. Quant au choix de l’URL à instaurer dans l’index, c’est pendant la phase « post-crawl » que ça se passe. Il va sans dire qu’une URL qui n’a pas été crawlée n’apparaitra pas dans les SERPs.

Il est aussi important de bien différencier les deux types d’indexation à savoir l’indexation primaire et l’indexation secondaire. La différence entre les deux c’est que le type primaire est celui qui demande le plus de temps puisque c’est lui qui gère directement les résultats dans les moteurs de recherche. Le deuxième type, quant à lui, regroupe juste les pages que Google juge sans intérêt et dupliquées. Etant la corbeille de Google, les URLs qui s’y trouvent sont non indexées.




Aussi, récupérer les URLs indexées c’est prendre en compte les caches. Avec ces derniers, il sera possible de consulter les pages même quand elles ne répondent pas. On peut alors affirmer que les pages présentes en cache de Google sont indexées. Bien sûr, l’inverse n’est pas véridique non plus puisque Google ne stocke pas les pages en cache avec les mêmes critères.

Les techniques à utiliser

Pour pouvoir bien récupérer les URLs indexées, il sera nécessaire d’user de techniques basiques. Tout d’abord, il y a la technique dite élémentaire et elle se base sur la recherche d’URL dans Google comme dans la démarche avec une requête. Afin de pouvoir y arriver, il faudra aller sur Google.fr et éviter l’usage d’omnibox de la page puisqu’il transfère automatiquement les informations tapées sur le champ URL. Si l’URL apparait, c’est qu’elle est indexée.

L’une des techniques les plus répandues est l’usage de l’opérateur de commande site. C’est à l’aide d’un outil comme un bookmarklet ou encore un scraper que la liste des URLs est récupérée. Le seul souci avec cette technique est qu’elle est peu fiable, car Google bloque et brouille la récupération dans la majorité des cas.




La technique suivante est l’opérateur info qui utilise « Google approved » afin de vérifier si les pages sont indexées. Cette commande a pour particularité de renvoyer l’URL canonique une fois le rel canonical implanté. Malheureusement, cette technique ne fait pas de réelle différence entre l’index primaire et l’index secondaire et c’est le souci.

Pour récupérer les URLs indexées, il est aussi possible d’utiliser l’opérateur cache. Cette technique se focalise majoritairement sur le fait qu’une page en cache est obligatoirement indexée. Sinon, il y a aussi la search console comme bonne alternative de choix.

Enregistrer

Enregistrer

About The Author
Nathalie Rambolamanana

Leave a Response