AI 봇이 데이터를 긁어? 이 무료 도구는 성가신 크롤러에게 달리기를 제공합니다

AI 생성 콘텐츠의 부상, 흔히 합성 미디어로 불리는 것은 잘못된 정보의 확산, 예술가 작품의 무단 사용, 온라인 콘텐츠에 대한 신뢰 저하 등 여러 가지 도전을 가져왔다. 그러나 Cloudflare는 AI를 위한 유익한 응용 프로그램을 잠재적으로 찾아내어 AI 회사들에 의해 원본 콘텐츠가 악용되는 것을 보호하려고 한다.
수요일에 Cloudflare는 AI Labyrinth라는 도구를 소개했으며, 이 도구는 AI 생성 콘텐츠를 사용하여 무단 AI 크롤러의 자원을 "느리게 하고, 혼란스럽게 하며, 낭비하게" 만들도록 설계되었다.
최근 연구에 따르면 ChatGPT와 Perplexity 같은 AI 챗봇은 크롤러가 차단된 웹사이트의 콘텐츠에 계속 접근하고 있다. Cloudflare는 그들의 발표에서 이러한 크롤러가 매일 그들의 네트워크에 500억 개 이상의 요청을 생성하며, 이는 그들이 관찰하는 전체 웹 요청의 1% 미만에 해당한다고 강조했다. 이러한 크롤러를 차단하는 방법이 중요하다.
Cloudflare는 무단 AI 크롤링을 식별하고 차단하는 여러 도구를 보유하고 있지만, 단순히 이러한 봇을 차단하는 것은 공격자에게 경고를 주어 회피 전술의 연속적인 사이클로 이어질 수 있다고 설명했다. 그들은 탐지되었다는 신호 없이 이러한 원치 않는 봇을 억제할 새로운 방법을 고안하고자 했다.
Cloudflare가 무단 크롤링 요청을 감지하면, AI Labyrinth는 크롤러를 단순히 차단하지 않고, 크롤러가 정당하다고 믿을 만큼 충분히 진짜처럼 보이는 여러 AI 생성 웹 페이지로 연결한다. 이로 인해 크롤러는 원하는 콘텐츠를 성공적으로 스크랩했다고 잘못 믿지만, 사이트의 실제 데이터는 보호된다. 또한, 이 접근법은 크롤러의 컴퓨팅 자원을 소모하며, 이는 Cloudflare가 장점으로 보고 있다.
Cloudflare의 발표는 이 도구가 부적절한 봇 활동을 감지하면 자동으로 AI 생성 링크 페이지 세트를 배포하여 고객이 맞춤 규칙을 설정할 필요를 없앤다고 자세히 설명했다.
이러한 페이지를 생성하기 위해 Cloudflare는 Workers AI와 오픈 소스 모델을 활용하여 다양한 주제에 대한 독특하고 인간과 유사한 합성 페이지를 미리 생성했다. 이 사전 생성 파이프라인은 XSS 취약점을 방지하기 위해 콘텐츠를 정화할 뿐만 아니라 R2에 저장하여 더 빠른 접근을 가능하게 한다.
AI Labyrinth는 이러한 링크를 AI 스크레이퍼에게만 표시하여 콘텐츠가 인간 방문자에게 숨겨지고 사이트의 구조, 외관 또는 SEO에 영향을 미치지 않도록 보장한다.
Cloudflare는 잘못된 정보 확산에 기여하지 않겠다는 약속을 강조하며, 생성된 콘텐츠가 사실에 기반하고 과학 주제와 관련이 있지만 크롤링되는 사이트와는 무관하도록 보장했다.
또한, Cloudflare는 AI Labyrinth를 새로운 불법 크롤러를 식별하는 잠재적 허니팟으로 보고 있다. 그들은 진짜 인간 방문자는 "AI 생성된 터무니없는 미로"를 탐색할 가능성이 낮다고 언급하며, 클릭 패턴을 기반으로 새로운 봇을 탐지할 수 있다고 했다. 이 통찰력은 AI Labyrinth가 악의적인 행위자를 더 효과적으로 식별하는 데 도움이 될 것이다.
봇이 전통적인 허니팟 기술을 탐지하는 데 능숙해짐에 따라, Cloudflare는 AI Labyrinth를 진화시켜 자동화된 프로그램이 식별하기 더 어려운 더 현실적인 링크 URL 네트워크를 만들 계획이다.
콘텐츠가 AI 훈련에 사용되거나 챗봇에 의해 잘못 표현되는 것에 대해 우려하는 출판사나 개인에게 AI Labyrinth는 가치 있는 도구가 될 수 있다.
무료 티어를 포함한 모든 Cloudflare 고객은 오늘 Cloudflare 대시보드에 접속하여 봇 관리 섹션으로 이동한 후 AI Labyrinth 옵션을 켜서 이를 활성화할 수 있다.
[ttpp]
[yyxx]
관련 기사
미국, 소셜 미디어 규제로 외국 공무원을 제재하다
미국, 글로벌 디지털 콘텐츠 규제에 반대 입장 표명이번 주 국무부는 유럽의 디지털 거버넌스 정책을 겨냥해 날카로운 외교적 비난을 발표하며 온라인 플랫폼 통제에 대한 긴장이 고조되고 있음을 알렸습니다. 마르코 루비오 장관은 미국의 디지털 공간에 영향을 미치는 과도한 검열에 관여하는 외국 공무원을 대상으로 하는 새로운 비자 제한 정책을 발표했습니다.새로
AI 기반 YouTube 동영상 요약기를 위한 최종 가이드
정보가 풍부한 디지털 환경에서 AI 기반 YouTube 동영상 요약 도구는 효율적인 콘텐츠 소비에 없어서는 안 될 필수 요소가 되었습니다. 이 심층 가이드에서는 최첨단 자연어 처리 기술, 특히 YouTube의 트랜스크립트 API와 결합된 Hugging Face의 BART 모델을 사용하여 정교한 요약 도구를 구축하는 방법을 살펴봅니다. 생산성 도구를 개발하든
개발자 도구 강화를 위해 6억 1,000만 달러에 브라우저 회사를 인수한 Atlassian
엔터프라이즈 생산성 소프트웨어의 선두주자인 Atlassian은 혁신적인 브라우저 개발사인 The Browser Company를 6억 1,000만 달러에 전액 현금으로 인수할 계획을 발표했습니다. 이 전략적 움직임은 현대 지식 근로자를 위해 맞춤화된 AI 기반 기능을 통합하여 업무 공간의 브라우징을 혁신하는 것을 목표로 합니다."기존 브라우저는 캐주얼한
의견 (24)
0/200
FrankKing
2025년 8월 20일 오전 10시 1분 15초 GMT+09:00
This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!
0
JoseJackson
2025년 8월 5일 오후 8시 0분 59초 GMT+09:00
This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎
0
WillieRoberts
2025년 8월 4일 오후 8시 0분 59초 GMT+09:00
This tool sounds like a game-changer! I’m tired of AI bots snooping around my data—hope Cloudflare’s solution keeps those crawlers at bay. 🛡️ Anyone tried it yet?
0
PaulThomas
2025년 7월 28일 오전 10시 19분 5초 GMT+09:00
This tool sounds like a game-changer! I’m tired of AI bots snooping around my data. Cloudflare’s solution feels like a digital ninja dodging those creepy crawlers. Anyone tried it yet? 🕵️♂️
0
WillGarcía
2025년 4월 21일 오전 9시 29분 0초 GMT+09:00
Cloudflareのこのツール、命の恩人です!AIボットがデータをスクレイプしようとするのを本当に混乱させます。コントロールを取り戻した感じがいいです。使いやすいけど、もっとユーザーフレンドリーになればいいのに。でも、厄介なクローラーを遠ざけるには素晴らしいツールです!🔒👍
0
RogerRoberts
2025년 4월 20일 오전 2시 52분 42초 GMT+09:00
¡Esta herramienta de Cloudflare es un salvavidas! Realmente desconcierta a esos bots de IA que intentan robar mis datos. Se siente bien recuperar algo de control. Es fácil de usar, pero podría ser más amigable para el usuario. Aún así, una gran herramienta para mantener a raya a esos molestos rastreadores. 🔒👍
0
AI 생성 콘텐츠의 부상, 흔히 합성 미디어로 불리는 것은 잘못된 정보의 확산, 예술가 작품의 무단 사용, 온라인 콘텐츠에 대한 신뢰 저하 등 여러 가지 도전을 가져왔다. 그러나 Cloudflare는 AI를 위한 유익한 응용 프로그램을 잠재적으로 찾아내어 AI 회사들에 의해 원본 콘텐츠가 악용되는 것을 보호하려고 한다.
수요일에 Cloudflare는 AI Labyrinth라는 도구를 소개했으며, 이 도구는 AI 생성 콘텐츠를 사용하여 무단 AI 크롤러의 자원을 "느리게 하고, 혼란스럽게 하며, 낭비하게" 만들도록 설계되었다.
최근 연구에 따르면 ChatGPT와 Perplexity 같은 AI 챗봇은 크롤러가 차단된 웹사이트의 콘텐츠에 계속 접근하고 있다. Cloudflare는 그들의 발표에서 이러한 크롤러가 매일 그들의 네트워크에 500억 개 이상의 요청을 생성하며, 이는 그들이 관찰하는 전체 웹 요청의 1% 미만에 해당한다고 강조했다. 이러한 크롤러를 차단하는 방법이 중요하다.
Cloudflare는 무단 AI 크롤링을 식별하고 차단하는 여러 도구를 보유하고 있지만, 단순히 이러한 봇을 차단하는 것은 공격자에게 경고를 주어 회피 전술의 연속적인 사이클로 이어질 수 있다고 설명했다. 그들은 탐지되었다는 신호 없이 이러한 원치 않는 봇을 억제할 새로운 방법을 고안하고자 했다.
Cloudflare가 무단 크롤링 요청을 감지하면, AI Labyrinth는 크롤러를 단순히 차단하지 않고, 크롤러가 정당하다고 믿을 만큼 충분히 진짜처럼 보이는 여러 AI 생성 웹 페이지로 연결한다. 이로 인해 크롤러는 원하는 콘텐츠를 성공적으로 스크랩했다고 잘못 믿지만, 사이트의 실제 데이터는 보호된다. 또한, 이 접근법은 크롤러의 컴퓨팅 자원을 소모하며, 이는 Cloudflare가 장점으로 보고 있다.
Cloudflare의 발표는 이 도구가 부적절한 봇 활동을 감지하면 자동으로 AI 생성 링크 페이지 세트를 배포하여 고객이 맞춤 규칙을 설정할 필요를 없앤다고 자세히 설명했다.
이러한 페이지를 생성하기 위해 Cloudflare는 Workers AI와 오픈 소스 모델을 활용하여 다양한 주제에 대한 독특하고 인간과 유사한 합성 페이지를 미리 생성했다. 이 사전 생성 파이프라인은 XSS 취약점을 방지하기 위해 콘텐츠를 정화할 뿐만 아니라 R2에 저장하여 더 빠른 접근을 가능하게 한다.
AI Labyrinth는 이러한 링크를 AI 스크레이퍼에게만 표시하여 콘텐츠가 인간 방문자에게 숨겨지고 사이트의 구조, 외관 또는 SEO에 영향을 미치지 않도록 보장한다.
Cloudflare는 잘못된 정보 확산에 기여하지 않겠다는 약속을 강조하며, 생성된 콘텐츠가 사실에 기반하고 과학 주제와 관련이 있지만 크롤링되는 사이트와는 무관하도록 보장했다.
또한, Cloudflare는 AI Labyrinth를 새로운 불법 크롤러를 식별하는 잠재적 허니팟으로 보고 있다. 그들은 진짜 인간 방문자는 "AI 생성된 터무니없는 미로"를 탐색할 가능성이 낮다고 언급하며, 클릭 패턴을 기반으로 새로운 봇을 탐지할 수 있다고 했다. 이 통찰력은 AI Labyrinth가 악의적인 행위자를 더 효과적으로 식별하는 데 도움이 될 것이다.
봇이 전통적인 허니팟 기술을 탐지하는 데 능숙해짐에 따라, Cloudflare는 AI Labyrinth를 진화시켜 자동화된 프로그램이 식별하기 더 어려운 더 현실적인 링크 URL 네트워크를 만들 계획이다.
콘텐츠가 AI 훈련에 사용되거나 챗봇에 의해 잘못 표현되는 것에 대해 우려하는 출판사나 개인에게 AI Labyrinth는 가치 있는 도구가 될 수 있다.
무료 티어를 포함한 모든 Cloudflare 고객은 오늘 Cloudflare 대시보드에 접속하여 봇 관리 섹션으로 이동한 후 AI Labyrinth 옵션을 켜서 이를 활성화할 수 있다.
[ttpp]
[yyxx]



This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!




This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎




This tool sounds like a game-changer! I’m tired of AI bots snooping around my data—hope Cloudflare’s solution keeps those crawlers at bay. 🛡️ Anyone tried it yet?




This tool sounds like a game-changer! I’m tired of AI bots snooping around my data. Cloudflare’s solution feels like a digital ninja dodging those creepy crawlers. Anyone tried it yet? 🕵️♂️




Cloudflareのこのツール、命の恩人です!AIボットがデータをスクレイプしようとするのを本当に混乱させます。コントロールを取り戻した感じがいいです。使いやすいけど、もっとユーザーフレンドリーになればいいのに。でも、厄介なクローラーを遠ざけるには素晴らしいツールです!🔒👍




¡Esta herramienta de Cloudflare es un salvavidas! Realmente desconcierta a esos bots de IA que intentan robar mis datos. Se siente bien recuperar algo de control. Es fácil de usar, pero podría ser más amigable para el usuario. Aún así, una gran herramienta para mantener a raya a esos molestos rastreadores. 🔒👍












