Google veut lutter contre les scrapeurs/racleurs

Google a récemment annoncé une solution anti-bot pour l’entreprise appelée reCAPTCHA Enterprise. Il fait actuellement l’objet d’une version bêta gratuite. Le service promet de mettre fin aux attaques par racleurs, Formation referencement naturel Lille pirates informatiques et autres attaques informatiques. Le service peut être mis en œuvre sur un site Web ou une application mobile. reCAPTCHA Enterprise Ce service est axé sur l’arrêt des attaques automatisées. Mais il peut également être ajusté pour donner des niveaux croissants de défis afin de déterminer si un visiteur est un bot ou un utilisateur. À partir de la présentation officielle de Google reCAPTCHA Enterprise: “ReCAPTCHA se concentre sur la détection des attaques automatisées. Ces attaques pourraient provenir de scripts, d’émulateurs, de robots ou même d’êtres humains. En tant que propriétaire de site, SEO Lille vous intégrez un extrait de code JavaScript sur vos pages qui permet la collecte de signaux entre les serveurs reCAPTCHA Enterprise et la machine de l’utilisateur final.  » ReCAPTCHA Enterprise vs Racleurs Une des plus grandes nuisances sur le web sont les scrapers. Un racleur est un robot automatisé qui télécharge le contenu d’un site Web. En règle générale, le but est de republier le contenu sur un site de spam.

L’effet négatif du plagiat lui-même est discutable. Cependant, la charge sur un serveur de milliers de robots de raclage frappant un site peut être importante. Le téléchargement de contenu par des robots agressifs peut ralentir le fonctionnement du serveur et avoir un impact négatif sur la capacité de Google d’indexer correctement votre site Web. Si votre serveur s’efforce de fournir du contenu à cause de bogues non fiables, il est possible que votre site ne dispose pas de suffisamment de ressources serveur pour fournir du contenu à Google. Voici comment la page reCAPTCHA Enterprise de Google décrit sa solution: «Avec reCAPTCHA Enterprise, vous pouvez défendre votre site Web contre les activités frauduleuses telles que le raclage, le bourrage de données d’identification et la création automatisée de comptes, et vous aidez à prévenir les exploitations coûteuses des robots automatisés. Comment fonctionne reCAPTCHA Enterprise? Le service utilise un modèle de formation qui s’adapte spécifiquement au trafic atteignant votre site Web. Le système est conçu pour ne pas affecter les visiteurs légitimes du site. Parmi les fonctionnalités, il permet à un administrateur pour afficher les différents scores, pour définir des actions en fonction de seuils basés sur ces scores. Par exemple, les visiteurs avec un certain score peuvent être tenus de fournir une authentification à facteur ou une vérification de courrier électronique. Le système peut également apprendre des faux positifs afin de mieux discerner le comportement des robots et le comportement normal. Selon l’annonce: « Adaptez le service aux besoins de votre site Web Vous pouvez ajuster le modèle spécifique de votre site en renvoyant à Google les ID reCAPTCHA étiquetés comme des faux positifs ou des faux négatifs.

Et le moteur d’analyse de risque adaptatif reCAPTCHAs adaptera les scores futurs à votre site.  » Configuration requise pour reCAPTCHA Enterprise Google n’a pas décrit les critères utilisés pour choisir qui participera au programme bêta gratuit. Selon la page d’inscription gratuite à l’essai, les éditeurs Web auront au minimum besoin d’une adresse électronique. Il existe également un espace pour fournir un numéro de projet Google Cloud et une clé reCAPTCHA v3, mais ils ne sont pas obligatoires. Formulaire d’inscription reCAPTCHA Enterprise de Google. Google doit-il publier ceci pour tous? Ceci est un outil utile. Google appelle cela un outil d’entreprise. Cela signifie qu’il est destiné à un grand site Web avec sans doute une énorme quantité de trafic. Mais cela pourrait être utile pour tous les sites, quelle que soit leur taille. Comment te sens-tu à propos de ça? Google doit-il créer une version pour tous les sites Web?