Scraping : Définition

Le Scraping consiste à prendre du contenu sur d’autres sites Web et à le réutiliser dans un but précis (publication sur un site, récupérer facilement des informations etc). En SEO, cette pratique est considérée comme Black Hat.

Le Scraping se fait généralement avec un logiciel qui simule la navigation Web humaine pour collecter des informations spécifiques à partir de différents sites Web. Ceux qui utilisent des programmes de scraping peuvent chercher à collecter certaines données, soit pour les vendre à d’autres utilisateurs, soit pour les utiliser à des fins promotionnelles sur un site Web.

La pratique controversée du Scraping

Le Scraping de contenu consiste à prendre du contenu provenant d’autres sites Web et à le publier sur votre propre site.

La pratique du scraping sur le Web a suscité de nombreuses controverses, car les conditions d’utilisation de certains sites Web ne permettent pas certains types d’exploration de données. Malgré les défis juridiques, le scraping peut devenir un moyen populaire de collecter des informations.

De nombreux sites Web contiennent uniquement des éléments d’autres sites Web ou du contenu volé. De nombreux sites prennent des articles provenant d’autres sites Web et les publient comme s’ils étaient les leurs, ou copient des sites Web entiers.

Ce comportement est contraire aux directives de Google et aux lois sur les droits d’auteur.

Existe-t-il une limite au Scraping ?

Google n’indique nulle part la réponse exacte à cette question. Toutefois, il est logique que le contenu provenant d’autres sources ne dépasse pas 10% de votre page Web.

Si vous rédigez un article de blog très court, les informations contenues dans vos flux d’actualités pourraient facilement contenir plus de contenu que votre blog. Il convient de considérer comment un moteur de recherche verrait cette page.

Il verra que la plus grande partie de la page est du contenu non original ou du contenu répété tel que votre logo et votre pied de page. Cela signifie que, globalement, la page Web peut ne pas être considérée comme une excellente ressource pour le sujet du post.

Exemples de Scraping

Google a fourni des exemples de ce qu’ils envisagent comme Scraping :

  • Les sites qui copient et republient le contenu d’autres sites sans ajouter de contenu ou de valeur d’origine
  • Les sites qui copient le contenu d’autres sites, le modifient légèrement (par exemple, en substituant des synonymes ou en utilisant des techniques automatisées) et le republient
  • Les sites qui reproduisent des flux de contenu provenant d’autres sites sans fournir un type d’organisation unique ou un avantage pour l’utilisateur
  • Les sites dédiés à l’intégration de contenus tels que des vidéos, des images ou d’autres médias à partir d’autres sites sans valeur ajoutée substantielle pour l’utilisateur.

Classement

L’utilisation de contenu provenant d’autres sites Web nuira à votre classement Google plutôt que de l’aider.

Le Scraping de contenu n’est pas du tout bon et c’est une des pires techniques de SEO (Black Hat) qui nuira sûrement à votre site Web. Google pénalise les sites Web qui suivent une technique de Scraping de contenu.

Une photo de Louis Maitreau

Bonjour, Je suis Louis Maîtreau, Consultant SEO.

J’accompagne celles et ceux qui souhaitent améliorer leur référencement naturel pour arriver dans les premières pages de résultats sur Google.

Le but ? Augmenter le trafic sur le site et  par conséquent augmenter le chiffre d’affaires.

Pour cela, je vous propose un accompagnement personnel via des prestations de consulting ou alors je vous propose de vous former directement sur mon site à l’aide des formations en ligne avec un espace privé ainsi que des guides sur le référencement naturel mis en ligne sur le site.

Bon courage dans cette course au référencement.

Abonnez-vous !

Cliquez sur le bouton pour vous abonner à ma chaîne YouTube et recevoir mes derniers conseils :

Icone Youtube pour s'abonner à la chaine

Share This