选项
首页
新闻
AI机器人刮擦您的数据?这种免费工具使那些讨厌的爬行者逐步划定

AI机器人刮擦您的数据?这种免费工具使那些讨厌的爬行者逐步划定

2025-04-15
251

AI机器人刮擦您的数据?这种免费工具使那些讨厌的爬行者逐步划定

人工智能生成内容的兴起,通常被称为合成媒体,带来了若干挑战,包括虚假信息的传播、艺术家作品的未经授权使用以及在线内容信任度的下降。然而,Cloudflare 可能找到了一种人工智能的有益应用,旨在保护原创内容免受人工智能公司的利用。

周三,Cloudflare 推出了 AI Labyrinth,这是一款旨在使用人工智能生成内容来“减缓、迷惑和浪费未经授权的人工智能爬虫资源”的工具。

近期研究显示,人工智能聊天机器人,如 ChatGPT 和 Perplexity,仍然会访问那些已阻止其爬虫的网站内容。Cloudflare 在其公告中指出,这些爬虫每天对其网络产生超过 500 亿次请求,占其观察到的所有网络请求的不到 1%。阻止这些爬虫的方法至关重要。

Cloudflare 解释说,虽然他们拥有多种工具来识别和阻止未经授权的人工智能爬取,但简单地阻止这些机器人可能会警告攻击者,导致持续的规避策略循环。他们希望设计一种新方法来威慑这些不受欢迎的机器人,而不让它们察觉已被检测到。

当 Cloudflare 检测到未经授权的爬取请求时,AI Labyrinth 不会直接阻止爬虫;相反,它会链接到多个人工智能生成的网页,这些网页看似真实,足以欺骗爬虫认为它们是合法的。这样,爬虫会错误地认为它成功抓取了所需内容,而网站的真实数据仍然受到保护。此外,这种方法会消耗爬虫的计算资源,Cloudflare 认为这是一个优势。

Cloudflare 的公告详细说明,该工具在检测到不当机器人活动时会自动部署一组人工智能生成的链接页面,无需客户设置自定义规则。

为了创建这些页面,Cloudflare 利用 Workers AI 和一个开源模型,预先生成关于各种主题的独特、类人合成页面。此预生成流程不仅对内容进行净化以防止 XSS 漏洞,还将其存储在 R2 中以便更快访问。

AI Labyrinth 仅向人工智能爬虫显示这些链接,确保内容对人类访问者不可见,且不会影响网站结构、外观或 SEO。

Cloudflare 强调其致力于不助长虚假信息的传播,确保生成的内容是基于事实且与科学主题相关,但与被爬取的网站无关。

此外,Cloudflare 将 AI Labyrinth 视为一个潜在的诱捕器,用于识别新的非法爬虫。他们指出,真正的人类访问者不太可能浏览“人工智能生成的无意义迷宫”,从而使该工具能够根据点击模式检测新机器人。这一洞察将帮助 AI Labyrinth 更有效地识别恶意行为者。

由于机器人已变得擅长检测传统诱捕技术,Cloudflare 计划让 AI Labyrinth 不断进化,创建更真实的链接 URL 网络,使自动化程序更难识别。

对于担心其内容被用于训练人工智能或被聊天机器人误传的出版商或个人,AI Labyrinth 可能是一个有价值的工具。

所有 Cloudflare 客户,包括免费套餐用户,今天即可通过访问 Cloudflare 仪表板,导航到机器人管理部分,并开启 AI Labyrinth 选项来启用该工具。

[ttpp]

[yyxx]
相关文章
Claude 被用于创建恶意 npm 包:逾 670 个包遭入侵,威胁开源生态 Claude 被用于创建恶意 npm 包:逾 670 个包遭入侵,威胁开源生态 最近一起网络安全事件揭示了大型语言模型(LLMs)如何被用于开发恶意软件。安全研究员Sibi Moosa发现,一名化名为“mousie-5212-super-formatter”的攻击者利用Anthropic公司的Claude AI生成有害代码,并污染了npm包生态系统。 在短时间内,超过670个恶意包被上传至npm注册表,此类攻击的速度与自动化程度引发了广泛警觉。此次攻击的核心在于利用人工智能大
随着印度加快科技发展步伐,信实集团公布了1100亿美元的人工智能投资计划 随着印度加快科技发展步伐,信实集团公布了1100亿美元的人工智能投资计划 印度信实集团(Reliance)亿万富翁董事长穆凯什·安巴尼(Mukesh Ambani)周四宣布了一项投资10万亿卢比(约合1100亿美元)的计划,将在未来七年内在印度各地建设人工智能计算基础设施。安巴尼周四在新德里举行的“印度人工智能影响力峰会”上表示,这笔投资将用于建设吉瓦级数据中心、全国性的边缘计算网络,以及与信实集团旗下Jio电信平台集成的新人工智能服务。安巴尼指出,信实集团已在古吉拉特
智源WITA通过首次合规申报,结束了“裸机”机器人交互 智源WITA通过首次合规申报,结束了“裸机”机器人交互 具身智能领域已达成一个重要里程碑。据上海市网络信息办公室最新公告,智源研发的WITA大模型已成功完成备案,成为国内首个合规部署的具身智能交互大模型。这一成就远不止于获得许可证。WITA的核心目标是让类人机器人能够真正进行对话、感知情感并发展出鲜明的个性。该模型专为机器人交互场景设计,通过自然且富有情感表达的沟通,将冰冷的机械躯体转变为拥有连续记忆和个性特征的“硅基伙伴”。 作为交互智能部署的核心引
相关专题推荐
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
写作 顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷
顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷

探索2026年最优秀的AI人物设定生成工具,助您塑造鲜活立体的角色。XIX.AI精心筛选的这份清单汇集了广受好评、颠覆传统的工具,能够生成具有内在逻辑的动机和致命缺陷。通过实际测试对比免费与付费选项。立即释放您的叙事潜能。

10 个工具
xix.ai
商业 顶级 AI 定价优化软件:追踪竞争对手并自动调整店铺价格
顶级 AI 定价优化软件:追踪竞争对手并自动调整店铺价格

在 XIX.AI 上探索 2026 年最佳 AI 定价优化软件。我们精心挑选的清单汇集了备受好评、具有颠覆性意义的工具,这些工具不仅能追踪竞争对手,还能自动调整您的店铺价格,从而实现利润最大化。通过实际测试对比免费与付费选项。立即掌握您的定价优势。

10 个工具
xix.ai
代码 最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件
最佳 AI 代码审查工具:自动确保代码符合规范,并重构遗留代码库文件

在 XIX.AI 上探索 2026 年最佳 AI 代码审查工具。我们的精选列表汇集了备受好评、具有颠覆性的工具,可自动确保代码规范并重构遗留代码库文件。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即开启您的 AI 优势。

10 个工具
xix.ai
文字转语音 专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率
专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成(TTS)应用,专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具,重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案,释放学生的潜能。立即访问XIX.AI,开启您的探索之旅。

10 个工具
xix.ai
评论 (27)
0/500
BruceBrown
BruceBrown 2026-04-08 14:00:57

Wait, so we're giving AI bots a taste of their own medicine? That's pretty ironic and kind of satisfying, not gonna lie! Cloudflare stepping in like this is a clever idea, but I wonder how effective it really is long-term. 🤔 Makes me think we're just entering a new arms race between data protection and data scraping. The web feels like a wild west again!

JasonAnderson
JasonAnderson 2026-04-08 00:01:11

Nützlich, aber ich frage mich, ob solche Tools Privatanwender auch einfach nutzen können, oder ob das eher für Unternehmen gedacht ist. Die Balance zwischen Datenschutz und Zugänglichkeit ist oft schwierig. Auf jeden Fall ein interessanter Ansatz von Cloudflare! 🤔

WillieAnderson
WillieAnderson 2025-12-09 02:30:41

이 내용 너무 유용해요! 특히 크롤러를 미끼로 빙빙 돌게 만드는 아이디어 정말 기발하네요 🤩 AI가 데이터를 수집하는 게 걱정될 때 이런 무료 도구가 있다는 건 정말 다행이에요. Cloudflare, 잘 해내고 있는 것 같아요!

FrankKing
FrankKing 2025-08-20 09:01:15

This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!

JoseJackson
JoseJackson 2025-08-05 19:00:59

This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎

WillieRoberts
WillieRoberts 2025-08-04 19:00:59

This tool sounds like a game-changer! I’m tired of AI bots snooping around my data—hope Cloudflare’s solution keeps those crawlers at bay. 🛡️ Anyone tried it yet?

OR