Lar
A Cloudflare acusa a Perplexity de usar bots de IA para rastrear sites bloqueados em segredo

Startup de IA é acusada de contornar restrições de sites
Uma investigação recente da Cloudflare alega que a empresa de pesquisa de IA Perplexity vem empregando táticas para contornar restrições de rastreamento implementadas por proprietários de sites. O provedor de infraestrutura de Internet relata ter observado tentativas sistemáticas de disfarçar os rastreadores da Web da Perplexity ao encontrar barreiras de acesso.
As táticas de evasão
De acordo com as descobertas da Cloudflare, os rastreadores da Perplexity apresentam inicialmente uma identificação padrão ("PerplexityBot" ou "Perplexity-User"). No entanto, quando bloqueados por meio de:
- diretivas robots.txt
- Regras de firewall de aplicativos da Web
- Outras restrições de acesso
O sistema supostamente passa a mascarar sua identidade como um usuário regular do navegador Chrome no macOS, utilizando:
- Rotação de endereços IP não listados oficialmente
- Alteração dos identificadores de rede do sistema autônomo
- Padrões de agente de usuário não documentados
Escala de atividade
A Cloudflare documenta esse comportamento em:
- Dezenas de milhares de domínios
- Milhões de solicitações diárias
- Várias configurações de rede
Respostas da empresa
A declaração oficial da Perplexity contesta a caracterização da Cloudflare, descrevendo-a como:
- Um "golpe publicitário"
- Contendo "muitos mal-entendidos"
- Potencialmente confundindo tráfego legítimo de usuários com atividade de raspagem
A startup atribui algumas atividades detectadas a:
- Usuários reais fazendo solicitações específicas
- Serviço de terceiros BrowserBase
- Necessidades técnicas ocasionais
Contexto do setor
Este incidente ocorre após:
- Relatórios anteriores da Perplexity contornando paywalls
- Atribuições anteriores da empresa a rastreadores de terceiros
- Preocupações crescentes do setor sobre raspagem de conteúdo de IA
A Cloudflare tomou medidas:
- Removendo o status de bot verificado da Perplexity
- Implementação de novas medidas de bloqueio
- Expansão das restrições padrão de rastreadores de IA
A situação reflete tensões mais amplas entre:
- Necessidades de dados das empresas de IA
- Direitos e proteções dos editores
- Evolução das respostas da infraestrutura da Internet
Artigo relacionado
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima
Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
O YouTube amplia a detecção de deepfakes por IA para políticos, autoridades governamentais e jornalistas
Na terça-feira, o YouTube anunciou que está expandindo sua tecnologia de detecção de deepfakes para um grupo seleto de autoridades governamentais, candidatos políticos e jornalistas. A ferramenta iden
A verdadeira diferença: não é uma coisa, mas outra
Às vezes, as coisas não são apenas uma coisa, mas também outra. A frase “Não é só isso — é aquilo” tornou-se tão comum em textos gerados por IA que agora serve como mais do que uma indicação de conteú
Recomendações de tópicos especiais relacionados
Comentários (3)
Alors, cette nouvelle me fait vraiment réfléchir aux limites entre innovation et éthique dans l'IA. Perplexity ferait ça en cachette ? Si c'est vrai, c'est pas joli joli. On dirait un peu un jeu du chat et de la souris où les startups bousculent les règles. 😬 Mais bon, Cloudflare n'est pas parfait non plus, ils ont leur propre agenda. Un peu de transparence ne ferait de mal à personne ! C'est ce manque de clarté qui mine la confiance du public envers toute cette industrie.
¿Está Perplexity realmente raspando sitios web bloqueados a escondidas? 🤔 Si es verdad, es bastante preocupante. Muchas empresas de IA prometen ser 'éticas', pero a veces parece que sus acciones contradicen sus palabras. Espero que haya más transparencia en la industria y que respeten los archivos robots.txt de los sitios. Este caso podría suponer un precedente importante.
¿Es esto lo que llaman 'innovación'? Primero nos venden la IA como una herramienta mágica, y luego descubrimos que hacen trampas para robar datos. Si Perplexity realmente evita bloqueos a propósito, es un problema serio de ética y legal. ¡Qué hipocresía! 🙄 ¿Hasta dónde llegarán algunas startups para ganar la carrera de la IA?

Startup de IA é acusada de contornar restrições de sites
Uma investigação recente da Cloudflare alega que a empresa de pesquisa de IA Perplexity vem empregando táticas para contornar restrições de rastreamento implementadas por proprietários de sites. O provedor de infraestrutura de Internet relata ter observado tentativas sistemáticas de disfarçar os rastreadores da Web da Perplexity ao encontrar barreiras de acesso.
As táticas de evasão
De acordo com as descobertas da Cloudflare, os rastreadores da Perplexity apresentam inicialmente uma identificação padrão ("PerplexityBot" ou "Perplexity-User"). No entanto, quando bloqueados por meio de:
- diretivas robots.txt
- Regras de firewall de aplicativos da Web
- Outras restrições de acesso
O sistema supostamente passa a mascarar sua identidade como um usuário regular do navegador Chrome no macOS, utilizando:
- Rotação de endereços IP não listados oficialmente
- Alteração dos identificadores de rede do sistema autônomo
- Padrões de agente de usuário não documentados
Escala de atividade
A Cloudflare documenta esse comportamento em:
- Dezenas de milhares de domínios
- Milhões de solicitações diárias
- Várias configurações de rede
Respostas da empresa
A declaração oficial da Perplexity contesta a caracterização da Cloudflare, descrevendo-a como:
- Um "golpe publicitário"
- Contendo "muitos mal-entendidos"
- Potencialmente confundindo tráfego legítimo de usuários com atividade de raspagem
A startup atribui algumas atividades detectadas a:
- Usuários reais fazendo solicitações específicas
- Serviço de terceiros BrowserBase
- Necessidades técnicas ocasionais
Contexto do setor
Este incidente ocorre após:
- Relatórios anteriores da Perplexity contornando paywalls
- Atribuições anteriores da empresa a rastreadores de terceiros
- Preocupações crescentes do setor sobre raspagem de conteúdo de IA
A Cloudflare tomou medidas:
- Removendo o status de bot verificado da Perplexity
- Implementação de novas medidas de bloqueio
- Expansão das restrições padrão de rastreadores de IA
A situação reflete tensões mais amplas entre:
- Necessidades de dados das empresas de IA
- Direitos e proteções dos editores
- Evolução das respostas da infraestrutura da Internet
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima
Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
O YouTube amplia a detecção de deepfakes por IA para políticos, autoridades governamentais e jornalistas
Na terça-feira, o YouTube anunciou que está expandindo sua tecnologia de detecção de deepfakes para um grupo seleto de autoridades governamentais, candidatos políticos e jornalistas. A ferramenta iden
A verdadeira diferença: não é uma coisa, mas outra
Às vezes, as coisas não são apenas uma coisa, mas também outra. A frase “Não é só isso — é aquilo” tornou-se tão comum em textos gerados por IA que agora serve como mais do que uma indicação de conteú
Alors, cette nouvelle me fait vraiment réfléchir aux limites entre innovation et éthique dans l'IA. Perplexity ferait ça en cachette ? Si c'est vrai, c'est pas joli joli. On dirait un peu un jeu du chat et de la souris où les startups bousculent les règles. 😬 Mais bon, Cloudflare n'est pas parfait non plus, ils ont leur propre agenda. Un peu de transparence ne ferait de mal à personne ! C'est ce manque de clarté qui mine la confiance du public envers toute cette industrie.
¿Está Perplexity realmente raspando sitios web bloqueados a escondidas? 🤔 Si es verdad, es bastante preocupante. Muchas empresas de IA prometen ser 'éticas', pero a veces parece que sus acciones contradicen sus palabras. Espero que haya más transparencia en la industria y que respeten los archivos robots.txt de los sitios. Este caso podría suponer un precedente importante.
¿Es esto lo que llaman 'innovación'? Primero nos venden la IA como una herramienta mágica, y luego descubrimos que hacen trampas para robar datos. Si Perplexity realmente evita bloqueos a propósito, es un problema serio de ética y legal. ¡Qué hipocresía! 🙄 ¿Hasta dónde llegarán algunas startups para ganar la carrera de la IA?











