Comment collecter des infos pertinentes sur un site web avec les commandes Google

Que vous soyez développeur, chef de projet ou simple internaute, voici quelques petites commandes qui peuvent vous aider à collecter un bon nombre d’informations sur un site telles que :

  • si un site s’indexe pas ou trop bien,
  • si le robot vient bien sur le site,
  • trouver une URL plus rapidement ❤️,
  • si les médias sont protégés ou non,
  • si on a laissé des contenus tests en prod et que tout s’indexe,
  • etc etc.

Du premier coup on ne peut pas voir l’intérêt d’une commande mais par exemple en une seule requête on peut voir si :

  • un site est spammé,
  • identifier des pages zombies,
  • l’index est bourré,
  • etc etc.

Et tout ça sans avoir accès à la Search Console du site.

site:https://www.whodunit.fr/

Listera toutes les URLs indexées dans Google du site. (Aucune distinction entre HTTP et HTTPS faite, fonctionne uniquement sur le domaine).

Nombre de pages indexées trop élevé

Si il y a une énorme différence d’URLs indexées et qui ne devrait pas y être

  • foncez dans Yoast pour éditer les meta robots des contenus
  • renvoyer les sitemaps en Search Console pour que le traitement soit plus rapide.

Site non indéxé

  •  on regarde rapidement l’option de blocage des robots en back-office (la fameuse option « Demander aux robots de ne pas indexer ce site »).
  • On regarde en robots.txt si rien n’est bloqué avec l’outil Google ici : https://support.google.com/webmasters/answer/6062598?hl=fr (un accès à la Search Console est nécessaire).
  • Et on file dans la search console pour envoyer les sitemaps.

cache:https://www.whodunit.fr/

Affichera la version de la page en cache de Google.

Cela aide à avoir une idée de quand le robot est passé pour la dernière fois sur le site, même si Google conseille de ne pas prendre cette information à la lettre.

site:https://www.whodunit.fr/ filetype:pdf

Liste tout les PDFs d’un site.

Cela fonctionne aussi avec les .docs etc, (mais pas les images).

site:https://www.whodunit.fr/ « lorem ipsum »

Chaque expression entre guillemets listera toutes les URLs qui contiennent ‘lorem ipsum’.

Si l’article ou la page d’exemple de WordPress sont passés dans l’index, on supprime mais avant tout : on redirige !

Cette commande sauve la vie des pioupious lorsque l’on a une capture d’écran mais qu’il manque l’URL précise, on prend le nom du site et la première phrase, une URL sortira toujours. Gain de temps considérable !

Elle permet aussi rapidement d’identifier les pages zombies d’un site (des pages sans intérêt d’indexation qui sont pauvres en terme de contenu éditorial et de trafic).

related:https://www.whodunit.fr/

Cette commande permet de lister tout les sites que Google identifie comme similaires (donc concurrents).

Elle est très utile pour des audits ou juste stalker les optimisations SEO des clients sur les méta titles ou description.

Vous avez aimé ? Partagez !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *