Hogar
Cloudflare acusa a Perplexity de utilizar robots de inteligencia artificial para rastrear en secreto sitios web bloqueados

Startup de IA acusada de eludir restricciones de sitios web
La reciente investigación de Cloudflare alega que la empresa de búsqueda de IA Perplexity ha estado empleando tácticas para eludir las restricciones de rastreo implementadas por los propietarios de sitios web. El proveedor de infraestructuras de Internet informa de que ha observado intentos sistemáticos de camuflar los rastreadores web de Perplexity cuando se encuentran con barreras de acceso.
Las tácticas de elusión
Según los hallazgos de Cloudflare, los rastreadores de Perplexity presentan inicialmente una identificación estándar ("PerplexityBot" o "Perplexity-User"). Sin embargo, cuando se bloquean mediante
- directivas robots.txt
- reglas del cortafuegos de aplicaciones web
- Otras restricciones de acceso
El sistema supuestamente pasa a enmascarar su identidad como un usuario normal del navegador Chrome en macOS, utilizando:
- Rotación de direcciones IP no listadas oficialmente
- Cambio de identificadores de red del sistema autónomo
- Patrones de agente de usuario no documentados
Escala de actividad
Cloudflare documenta este comportamiento en:
- Decenas de miles de dominios
- Millones de solicitudes diarias
- Varias configuraciones de red
Respuestas de la empresa
La declaración oficial de Perplexity refuta la caracterización de Cloudflare, describiéndola como:
- Un "truco publicitario"
- Contiene "muchos malentendidos".
- Confundir potencialmente tráfico legítimo de usuarios con actividad de scraping
La startup atribuye parte de la actividad detectada a:
- Usuarios reales que realizan solicitudes específicas
- Servicio de terceros BrowserBase
- Necesidades técnicas ocasionales
Contexto de la industria
Este incidente se produce después de:
- Informes anteriores de Perplexity eludiendo paywalls
- Atribuciones anteriores de la empresa a rastreadores de terceros
- La creciente preocupación del sector por el scraping de contenidos de IA
Cloudflare ha tomado medidas:
- Eliminando el estatus de bot verificado de Perplexity
- Implementar nuevas medidas de bloqueo
- Ampliar las restricciones de rastreo de IA por defecto
La situación refleja tensiones más amplias entre:
- Las necesidades de datos de las empresas de IA
- los derechos y la protección de los editores
- La evolución de las respuestas de la infraestructura de Internet
Artículo relacionado
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Kakao Mobility presenta su hoja de ruta para la conducción autónoma de nivel 4 basada en la IA física
Kakao Mobility tiene previsto desarrollar internamente tecnologías de conducción autónoma de nivel 4 como parte de su estrategia de IA física.En la conferencia World IT Show 2026, celebrada en el COE
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Recomendaciones de temas especiales relacionados
comentario (3)
0/500
Alors, cette nouvelle me fait vraiment réfléchir aux limites entre innovation et éthique dans l'IA. Perplexity ferait ça en cachette ? Si c'est vrai, c'est pas joli joli. On dirait un peu un jeu du chat et de la souris où les startups bousculent les règles. 😬 Mais bon, Cloudflare n'est pas parfait non plus, ils ont leur propre agenda. Un peu de transparence ne ferait de mal à personne ! C'est ce manque de clarté qui mine la confiance du public envers toute cette industrie.
¿Está Perplexity realmente raspando sitios web bloqueados a escondidas? 🤔 Si es verdad, es bastante preocupante. Muchas empresas de IA prometen ser 'éticas', pero a veces parece que sus acciones contradicen sus palabras. Espero que haya más transparencia en la industria y que respeten los archivos robots.txt de los sitios. Este caso podría suponer un precedente importante.
¿Es esto lo que llaman 'innovación'? Primero nos venden la IA como una herramienta mágica, y luego descubrimos que hacen trampas para robar datos. Si Perplexity realmente evita bloqueos a propósito, es un problema serio de ética y legal. ¡Qué hipocresía! 🙄 ¿Hasta dónde llegarán algunas startups para ganar la carrera de la IA?

Startup de IA acusada de eludir restricciones de sitios web
La reciente investigación de Cloudflare alega que la empresa de búsqueda de IA Perplexity ha estado empleando tácticas para eludir las restricciones de rastreo implementadas por los propietarios de sitios web. El proveedor de infraestructuras de Internet informa de que ha observado intentos sistemáticos de camuflar los rastreadores web de Perplexity cuando se encuentran con barreras de acceso.
Las tácticas de elusión
Según los hallazgos de Cloudflare, los rastreadores de Perplexity presentan inicialmente una identificación estándar ("PerplexityBot" o "Perplexity-User"). Sin embargo, cuando se bloquean mediante
- directivas robots.txt
- reglas del cortafuegos de aplicaciones web
- Otras restricciones de acceso
El sistema supuestamente pasa a enmascarar su identidad como un usuario normal del navegador Chrome en macOS, utilizando:
- Rotación de direcciones IP no listadas oficialmente
- Cambio de identificadores de red del sistema autónomo
- Patrones de agente de usuario no documentados
Escala de actividad
Cloudflare documenta este comportamiento en:
- Decenas de miles de dominios
- Millones de solicitudes diarias
- Varias configuraciones de red
Respuestas de la empresa
La declaración oficial de Perplexity refuta la caracterización de Cloudflare, describiéndola como:
- Un "truco publicitario"
- Contiene "muchos malentendidos".
- Confundir potencialmente tráfico legítimo de usuarios con actividad de scraping
La startup atribuye parte de la actividad detectada a:
- Usuarios reales que realizan solicitudes específicas
- Servicio de terceros BrowserBase
- Necesidades técnicas ocasionales
Contexto de la industria
Este incidente se produce después de:
- Informes anteriores de Perplexity eludiendo paywalls
- Atribuciones anteriores de la empresa a rastreadores de terceros
- La creciente preocupación del sector por el scraping de contenidos de IA
Cloudflare ha tomado medidas:
- Eliminando el estatus de bot verificado de Perplexity
- Implementar nuevas medidas de bloqueo
- Ampliar las restricciones de rastreo de IA por defecto
La situación refleja tensiones más amplias entre:
- Las necesidades de datos de las empresas de IA
- los derechos y la protección de los editores
- La evolución de las respuestas de la infraestructura de Internet
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Barry Diller: La confianza en Sam Altman es irrelevante a medida que se acerca la IA general
Barry Diller, el multimillonario magnate de los medios de comunicación, no cree que Sam Altman, director ejecutivo de OpenAI, sea poco digno de confianza, a pesar de los recientes informes que sugiere
Alors, cette nouvelle me fait vraiment réfléchir aux limites entre innovation et éthique dans l'IA. Perplexity ferait ça en cachette ? Si c'est vrai, c'est pas joli joli. On dirait un peu un jeu du chat et de la souris où les startups bousculent les règles. 😬 Mais bon, Cloudflare n'est pas parfait non plus, ils ont leur propre agenda. Un peu de transparence ne ferait de mal à personne ! C'est ce manque de clarté qui mine la confiance du public envers toute cette industrie.
¿Está Perplexity realmente raspando sitios web bloqueados a escondidas? 🤔 Si es verdad, es bastante preocupante. Muchas empresas de IA prometen ser 'éticas', pero a veces parece que sus acciones contradicen sus palabras. Espero que haya más transparencia en la industria y que respeten los archivos robots.txt de los sitios. Este caso podría suponer un precedente importante.
¿Es esto lo que llaman 'innovación'? Primero nos venden la IA como una herramienta mágica, y luego descubrimos que hacen trampas para robar datos. Si Perplexity realmente evita bloqueos a propósito, es un problema serio de ética y legal. ¡Qué hipocresía! 🙄 ¿Hasta dónde llegarán algunas startups para ganar la carrera de la IA?











