Maison
Cloudflare accuse Perplexity d'utiliser des robots d'intelligence artificielle pour explorer en secret des sites web bloqués

Une entreprise d'IA accusée de contourner les restrictions imposées aux sites web
Selon une enquête récente de Cloudflare, la société Perplexity, spécialisée dans la recherche d'IA, aurait employé des tactiques pour contourner les restrictions d'exploration mises en place par les propriétaires de sites web. Le fournisseur d'infrastructure internet rapporte avoir observé des tentatives systématiques de dissimuler les robots d'exploration de Perplexity lorsqu'ils se heurtent à des barrières d'accès.
Les tactiques de contournement
Selon les constatations de Cloudflare, les robots d'exploration de Perplexity présentent initialement une identification standard ("PerplexityBot" ou "Perplexity-User"). Cependant, lorsqu'ils sont bloqués par des directives :
- directives robots.txt
- des règles du pare-feu des applications web
- d'autres restrictions d'accès.
Le système masquerait son identité en tant qu'utilisateur normal du navigateur Chrome sur macOS, en utilisant :
- la rotation d'adresses IP non répertoriées officiellement
- Changement des identifiants de réseau du système autonome
- des modèles d'agents utilisateurs non documentés.
Ampleur de l'activité
Cloudflare documente ce comportement à travers :
- Des dizaines de milliers de domaines
- Des millions de requêtes quotidiennes
- Diverses configurations de réseau
Réponses de l'entreprise
La déclaration officielle de Perplexity conteste la caractérisation de Cloudflare, la décrivant comme :
- un "coup de publicité"
- contenant "de nombreux malentendus"
- une confusion potentielle entre le trafic légitime des utilisateurs et l'activité de scraping.
La startup attribue une partie de l'activité détectée à
- Des utilisateurs réels effectuant des requêtes spécifiques
- Service tiers BrowserBase
- Nécessités techniques occasionnelles
Contexte de l'industrie
Cet incident fait suite :
- Des rapports antérieurs sur le contournement des paywalls par Perplexity
- Les attributions passées de l'entreprise à des robots d'indexation tiers
- Les préoccupations croissantes de l'industrie concernant le grattage de contenu par l'IA
Cloudflare a pris des mesures en
- Supprimant le statut de bot vérifié de Perplexity
- Mise en œuvre de nouvelles mesures de blocage
- élargissant les restrictions par défaut concernant les robots d'exploration de l'IA.
La situation reflète des tensions plus larges entre :
- les besoins en données des entreprises d'IA
- les droits et protections des éditeurs
- l'évolution des réponses de l'infrastructure de l'internet
Article connexe
Barry Diller : la confiance en Sam Altman n'a plus d'importance à l'approche de l'IA générale
Barry Diller, le magnat milliardaire des médias, ne considère pas que Sam Altman, PDG d’OpenAI, soit indigne de confiance, malgré des informations récentes suggérant le contraire. S’exprimant cette se
YouTube étend sa détection des deepfakes par IA aux personnalités politiques, aux responsables gouvernementaux et aux journalistes
Mardi, YouTube a annoncé qu’il étendait sa technologie de détection des deepfakes à un groupe restreint de responsables gouvernementaux, de candidats politiques et de journalistes. Cet outil identifie
La vraie différence : ce n'est pas une chose, mais une autre
Parfois, les choses ne sont pas seulement une chose, mais aussi une autre. L'expression « Ce n'est pas seulement ceci, c'est aussi cela » est devenue si courante dans les textes générés par l'IA qu'el
Recommandations de sujets spéciaux liés
commentaires (3)
Alors, cette nouvelle me fait vraiment réfléchir aux limites entre innovation et éthique dans l'IA. Perplexity ferait ça en cachette ? Si c'est vrai, c'est pas joli joli. On dirait un peu un jeu du chat et de la souris où les startups bousculent les règles. 😬 Mais bon, Cloudflare n'est pas parfait non plus, ils ont leur propre agenda. Un peu de transparence ne ferait de mal à personne ! C'est ce manque de clarté qui mine la confiance du public envers toute cette industrie.
¿Está Perplexity realmente raspando sitios web bloqueados a escondidas? 🤔 Si es verdad, es bastante preocupante. Muchas empresas de IA prometen ser 'éticas', pero a veces parece que sus acciones contradicen sus palabras. Espero que haya más transparencia en la industria y que respeten los archivos robots.txt de los sitios. Este caso podría suponer un precedente importante.
¿Es esto lo que llaman 'innovación'? Primero nos venden la IA como una herramienta mágica, y luego descubrimos que hacen trampas para robar datos. Si Perplexity realmente evita bloqueos a propósito, es un problema serio de ética y legal. ¡Qué hipocresía! 🙄 ¿Hasta dónde llegarán algunas startups para ganar la carrera de la IA?

Une entreprise d'IA accusée de contourner les restrictions imposées aux sites web
Selon une enquête récente de Cloudflare, la société Perplexity, spécialisée dans la recherche d'IA, aurait employé des tactiques pour contourner les restrictions d'exploration mises en place par les propriétaires de sites web. Le fournisseur d'infrastructure internet rapporte avoir observé des tentatives systématiques de dissimuler les robots d'exploration de Perplexity lorsqu'ils se heurtent à des barrières d'accès.
Les tactiques de contournement
Selon les constatations de Cloudflare, les robots d'exploration de Perplexity présentent initialement une identification standard ("PerplexityBot" ou "Perplexity-User"). Cependant, lorsqu'ils sont bloqués par des directives :
- directives robots.txt
- des règles du pare-feu des applications web
- d'autres restrictions d'accès.
Le système masquerait son identité en tant qu'utilisateur normal du navigateur Chrome sur macOS, en utilisant :
- la rotation d'adresses IP non répertoriées officiellement
- Changement des identifiants de réseau du système autonome
- des modèles d'agents utilisateurs non documentés.
Ampleur de l'activité
Cloudflare documente ce comportement à travers :
- Des dizaines de milliers de domaines
- Des millions de requêtes quotidiennes
- Diverses configurations de réseau
Réponses de l'entreprise
La déclaration officielle de Perplexity conteste la caractérisation de Cloudflare, la décrivant comme :
- un "coup de publicité"
- contenant "de nombreux malentendus"
- une confusion potentielle entre le trafic légitime des utilisateurs et l'activité de scraping.
La startup attribue une partie de l'activité détectée à
- Des utilisateurs réels effectuant des requêtes spécifiques
- Service tiers BrowserBase
- Nécessités techniques occasionnelles
Contexte de l'industrie
Cet incident fait suite :
- Des rapports antérieurs sur le contournement des paywalls par Perplexity
- Les attributions passées de l'entreprise à des robots d'indexation tiers
- Les préoccupations croissantes de l'industrie concernant le grattage de contenu par l'IA
Cloudflare a pris des mesures en
- Supprimant le statut de bot vérifié de Perplexity
- Mise en œuvre de nouvelles mesures de blocage
- élargissant les restrictions par défaut concernant les robots d'exploration de l'IA.
La situation reflète des tensions plus larges entre :
- les besoins en données des entreprises d'IA
- les droits et protections des éditeurs
- l'évolution des réponses de l'infrastructure de l'internet
Barry Diller : la confiance en Sam Altman n'a plus d'importance à l'approche de l'IA générale
Barry Diller, le magnat milliardaire des médias, ne considère pas que Sam Altman, PDG d’OpenAI, soit indigne de confiance, malgré des informations récentes suggérant le contraire. S’exprimant cette se
YouTube étend sa détection des deepfakes par IA aux personnalités politiques, aux responsables gouvernementaux et aux journalistes
Mardi, YouTube a annoncé qu’il étendait sa technologie de détection des deepfakes à un groupe restreint de responsables gouvernementaux, de candidats politiques et de journalistes. Cet outil identifie
La vraie différence : ce n'est pas une chose, mais une autre
Parfois, les choses ne sont pas seulement une chose, mais aussi une autre. L'expression « Ce n'est pas seulement ceci, c'est aussi cela » est devenue si courante dans les textes générés par l'IA qu'el
Alors, cette nouvelle me fait vraiment réfléchir aux limites entre innovation et éthique dans l'IA. Perplexity ferait ça en cachette ? Si c'est vrai, c'est pas joli joli. On dirait un peu un jeu du chat et de la souris où les startups bousculent les règles. 😬 Mais bon, Cloudflare n'est pas parfait non plus, ils ont leur propre agenda. Un peu de transparence ne ferait de mal à personne ! C'est ce manque de clarté qui mine la confiance du public envers toute cette industrie.
¿Está Perplexity realmente raspando sitios web bloqueados a escondidas? 🤔 Si es verdad, es bastante preocupante. Muchas empresas de IA prometen ser 'éticas', pero a veces parece que sus acciones contradicen sus palabras. Espero que haya más transparencia en la industria y que respeten los archivos robots.txt de los sitios. Este caso podría suponer un precedente importante.
¿Es esto lo que llaman 'innovación'? Primero nos venden la IA como una herramienta mágica, y luego descubrimos que hacen trampas para robar datos. Si Perplexity realmente evita bloqueos a propósito, es un problema serio de ética y legal. ¡Qué hipocresía! 🙄 ¿Hasta dónde llegarán algunas startups para ganar la carrera de la IA?











