AI机器人刮擦您的数据?这种免费工具使那些讨厌的爬行者逐步划定

人工智能生成内容的兴起,通常被称为合成媒体,带来了若干挑战,包括虚假信息的传播、艺术家作品的未经授权使用以及在线内容信任度的下降。然而,Cloudflare 可能找到了一种人工智能的有益应用,旨在保护原创内容免受人工智能公司的利用。
周三,Cloudflare 推出了 AI Labyrinth,这是一款旨在使用人工智能生成内容来“减缓、迷惑和浪费未经授权的人工智能爬虫资源”的工具。
近期研究显示,人工智能聊天机器人,如 ChatGPT 和 Perplexity,仍然会访问那些已阻止其爬虫的网站内容。Cloudflare 在其公告中指出,这些爬虫每天对其网络产生超过 500 亿次请求,占其观察到的所有网络请求的不到 1%。阻止这些爬虫的方法至关重要。
Cloudflare 解释说,虽然他们拥有多种工具来识别和阻止未经授权的人工智能爬取,但简单地阻止这些机器人可能会警告攻击者,导致持续的规避策略循环。他们希望设计一种新方法来威慑这些不受欢迎的机器人,而不让它们察觉已被检测到。
当 Cloudflare 检测到未经授权的爬取请求时,AI Labyrinth 不会直接阻止爬虫;相反,它会链接到多个人工智能生成的网页,这些网页看似真实,足以欺骗爬虫认为它们是合法的。这样,爬虫会错误地认为它成功抓取了所需内容,而网站的真实数据仍然受到保护。此外,这种方法会消耗爬虫的计算资源,Cloudflare 认为这是一个优势。
Cloudflare 的公告详细说明,该工具在检测到不当机器人活动时会自动部署一组人工智能生成的链接页面,无需客户设置自定义规则。
为了创建这些页面,Cloudflare 利用 Workers AI 和一个开源模型,预先生成关于各种主题的独特、类人合成页面。此预生成流程不仅对内容进行净化以防止 XSS 漏洞,还将其存储在 R2 中以便更快访问。
AI Labyrinth 仅向人工智能爬虫显示这些链接,确保内容对人类访问者不可见,且不会影响网站结构、外观或 SEO。
Cloudflare 强调其致力于不助长虚假信息的传播,确保生成的内容是基于事实且与科学主题相关,但与被爬取的网站无关。
此外,Cloudflare 将 AI Labyrinth 视为一个潜在的诱捕器,用于识别新的非法爬虫。他们指出,真正的人类访问者不太可能浏览“人工智能生成的无意义迷宫”,从而使该工具能够根据点击模式检测新机器人。这一洞察将帮助 AI Labyrinth 更有效地识别恶意行为者。
由于机器人已变得擅长检测传统诱捕技术,Cloudflare 计划让 AI Labyrinth 不断进化,创建更真实的链接 URL 网络,使自动化程序更难识别。
对于担心其内容被用于训练人工智能或被聊天机器人误传的出版商或个人,AI Labyrinth 可能是一个有价值的工具。
所有 Cloudflare 客户,包括免费套餐用户,今天即可通过访问 Cloudflare 仪表板,导航到机器人管理部分,并开启 AI Labyrinth 选项来启用该工具。
[ttpp]
[yyxx]
相关文章
美国将因社交媒体法规制裁外国官员
美国站出来反对全球数字内容法规美国国务院本周针对欧洲的数字治理政策发出了尖锐的外交斥责,表明在网络平台控制权问题上的紧张局势正在升级。国务卿马可-卢比奥(Marco Rubio)公布了一项新的签证限制政策,该政策针对的是参与美国认为影响美国数字空间的过度审查的外国官员。新签证限制解释根据周三宣布的政策,美国将拒绝被认定正在执行影响美国受保护言论的海外内容法规的外国公民入境。卢比奥强调了两
人工智能驱动的 YouTube 视频摘要器终极指南
在我们信息丰富的数字环境中,人工智能驱动的 YouTube 视频摘要器已成为高效内容消费不可或缺的工具。本深度指南探讨了如何利用最先进的 NLP 技术(特别是来自 Hugging Face 的 BART 模型与 YouTube 的 Transcript API 相结合)构建复杂的摘要工具。无论您是要开发生产力工具、增强可访问性解决方案,还是要创建教育资源,本指南都能为您提供实现专业级摘要所需的一切
Atlassian 斥资 6.1 亿美元收购浏览器公司,加强开发人员工具
企业生产力软件领导者 Atlassian 宣布,计划以 6.1 亿美元的全现金交易收购创新型浏览器开发商 The Browser Company。这一战略举措旨在通过整合为现代知识工作者量身定制的人工智能功能,彻底改变工作场所的浏览方式。"Atlassian首席执行官兼联合创始人迈克-坎农-布鲁克斯(Mike Cannon-Brookes)表示:"传统浏览器是为休闲网上冲浪而设计的,而不是为当
评论 (24)
0/200
FrankKing
2025-08-20 09:01:15
This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!
0
JoseJackson
2025-08-05 19:00:59
This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎
0
WillieRoberts
2025-08-04 19:00:59
This tool sounds like a game-changer! I’m tired of AI bots snooping around my data—hope Cloudflare’s solution keeps those crawlers at bay. 🛡️ Anyone tried it yet?
0
PaulThomas
2025-07-28 09:19:05
This tool sounds like a game-changer! I’m tired of AI bots snooping around my data. Cloudflare’s solution feels like a digital ninja dodging those creepy crawlers. Anyone tried it yet? 🕵️♂️
0
WillGarcía
2025-04-21 08:29:00
Cloudflareのこのツール、命の恩人です!AIボットがデータをスクレイプしようとするのを本当に混乱させます。コントロールを取り戻した感じがいいです。使いやすいけど、もっとユーザーフレンドリーになればいいのに。でも、厄介なクローラーを遠ざけるには素晴らしいツールです!🔒👍
0
RogerRoberts
2025-04-20 01:52:42
¡Esta herramienta de Cloudflare es un salvavidas! Realmente desconcierta a esos bots de IA que intentan robar mis datos. Se siente bien recuperar algo de control. Es fácil de usar, pero podría ser más amigable para el usuario. Aún así, una gran herramienta para mantener a raya a esos molestos rastreadores. 🔒👍
0
人工智能生成内容的兴起,通常被称为合成媒体,带来了若干挑战,包括虚假信息的传播、艺术家作品的未经授权使用以及在线内容信任度的下降。然而,Cloudflare 可能找到了一种人工智能的有益应用,旨在保护原创内容免受人工智能公司的利用。
周三,Cloudflare 推出了 AI Labyrinth,这是一款旨在使用人工智能生成内容来“减缓、迷惑和浪费未经授权的人工智能爬虫资源”的工具。
近期研究显示,人工智能聊天机器人,如 ChatGPT 和 Perplexity,仍然会访问那些已阻止其爬虫的网站内容。Cloudflare 在其公告中指出,这些爬虫每天对其网络产生超过 500 亿次请求,占其观察到的所有网络请求的不到 1%。阻止这些爬虫的方法至关重要。
Cloudflare 解释说,虽然他们拥有多种工具来识别和阻止未经授权的人工智能爬取,但简单地阻止这些机器人可能会警告攻击者,导致持续的规避策略循环。他们希望设计一种新方法来威慑这些不受欢迎的机器人,而不让它们察觉已被检测到。
当 Cloudflare 检测到未经授权的爬取请求时,AI Labyrinth 不会直接阻止爬虫;相反,它会链接到多个人工智能生成的网页,这些网页看似真实,足以欺骗爬虫认为它们是合法的。这样,爬虫会错误地认为它成功抓取了所需内容,而网站的真实数据仍然受到保护。此外,这种方法会消耗爬虫的计算资源,Cloudflare 认为这是一个优势。
Cloudflare 的公告详细说明,该工具在检测到不当机器人活动时会自动部署一组人工智能生成的链接页面,无需客户设置自定义规则。
为了创建这些页面,Cloudflare 利用 Workers AI 和一个开源模型,预先生成关于各种主题的独特、类人合成页面。此预生成流程不仅对内容进行净化以防止 XSS 漏洞,还将其存储在 R2 中以便更快访问。
AI Labyrinth 仅向人工智能爬虫显示这些链接,确保内容对人类访问者不可见,且不会影响网站结构、外观或 SEO。
Cloudflare 强调其致力于不助长虚假信息的传播,确保生成的内容是基于事实且与科学主题相关,但与被爬取的网站无关。
此外,Cloudflare 将 AI Labyrinth 视为一个潜在的诱捕器,用于识别新的非法爬虫。他们指出,真正的人类访问者不太可能浏览“人工智能生成的无意义迷宫”,从而使该工具能够根据点击模式检测新机器人。这一洞察将帮助 AI Labyrinth 更有效地识别恶意行为者。
由于机器人已变得擅长检测传统诱捕技术,Cloudflare 计划让 AI Labyrinth 不断进化,创建更真实的链接 URL 网络,使自动化程序更难识别。
对于担心其内容被用于训练人工智能或被聊天机器人误传的出版商或个人,AI Labyrinth 可能是一个有价值的工具。
所有 Cloudflare 客户,包括免费套餐用户,今天即可通过访问 Cloudflare 仪表板,导航到机器人管理部分,并开启 AI Labyrinth 选项来启用该工具。
[ttpp]
[yyxx]



This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!




This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎




This tool sounds like a game-changer! I’m tired of AI bots snooping around my data—hope Cloudflare’s solution keeps those crawlers at bay. 🛡️ Anyone tried it yet?




This tool sounds like a game-changer! I’m tired of AI bots snooping around my data. Cloudflare’s solution feels like a digital ninja dodging those creepy crawlers. Anyone tried it yet? 🕵️♂️




Cloudflareのこのツール、命の恩人です!AIボットがデータをスクレイプしようとするのを本当に混乱させます。コントロールを取り戻した感じがいいです。使いやすいけど、もっとユーザーフレンドリーになればいいのに。でも、厄介なクローラーを遠ざけるには素晴らしいツールです!🔒👍




¡Esta herramienta de Cloudflare es un salvavidas! Realmente desconcierta a esos bots de IA que intentan robar mis datos. Se siente bien recuperar algo de control. Es fácil de usar, pero podría ser más amigable para el usuario. Aún así, una gran herramienta para mantener a raya a esos molestos rastreadores. 🔒👍












