AI 봇이 데이터를 긁어? 이 무료 도구는 성가신 크롤러에게 달리기를 제공합니다

AI 생성 콘텐츠의 부상, 흔히 합성 미디어로 불리는 것은 잘못된 정보의 확산, 예술가 작품의 무단 사용, 온라인 콘텐츠에 대한 신뢰 저하 등 여러 가지 도전을 가져왔다. 그러나 Cloudflare는 AI를 위한 유익한 응용 프로그램을 잠재적으로 찾아내어 AI 회사들에 의해 원본 콘텐츠가 악용되는 것을 보호하려고 한다.
수요일에 Cloudflare는 AI Labyrinth라는 도구를 소개했으며, 이 도구는 AI 생성 콘텐츠를 사용하여 무단 AI 크롤러의 자원을 "느리게 하고, 혼란스럽게 하며, 낭비하게" 만들도록 설계되었다.
최근 연구에 따르면 ChatGPT와 Perplexity 같은 AI 챗봇은 크롤러가 차단된 웹사이트의 콘텐츠에 계속 접근하고 있다. Cloudflare는 그들의 발표에서 이러한 크롤러가 매일 그들의 네트워크에 500억 개 이상의 요청을 생성하며, 이는 그들이 관찰하는 전체 웹 요청의 1% 미만에 해당한다고 강조했다. 이러한 크롤러를 차단하는 방법이 중요하다.
Cloudflare는 무단 AI 크롤링을 식별하고 차단하는 여러 도구를 보유하고 있지만, 단순히 이러한 봇을 차단하는 것은 공격자에게 경고를 주어 회피 전술의 연속적인 사이클로 이어질 수 있다고 설명했다. 그들은 탐지되었다는 신호 없이 이러한 원치 않는 봇을 억제할 새로운 방법을 고안하고자 했다.
Cloudflare가 무단 크롤링 요청을 감지하면, AI Labyrinth는 크롤러를 단순히 차단하지 않고, 크롤러가 정당하다고 믿을 만큼 충분히 진짜처럼 보이는 여러 AI 생성 웹 페이지로 연결한다. 이로 인해 크롤러는 원하는 콘텐츠를 성공적으로 스크랩했다고 잘못 믿지만, 사이트의 실제 데이터는 보호된다. 또한, 이 접근법은 크롤러의 컴퓨팅 자원을 소모하며, 이는 Cloudflare가 장점으로 보고 있다.
Cloudflare의 발표는 이 도구가 부적절한 봇 활동을 감지하면 자동으로 AI 생성 링크 페이지 세트를 배포하여 고객이 맞춤 규칙을 설정할 필요를 없앤다고 자세히 설명했다.
이러한 페이지를 생성하기 위해 Cloudflare는 Workers AI와 오픈 소스 모델을 활용하여 다양한 주제에 대한 독특하고 인간과 유사한 합성 페이지를 미리 생성했다. 이 사전 생성 파이프라인은 XSS 취약점을 방지하기 위해 콘텐츠를 정화할 뿐만 아니라 R2에 저장하여 더 빠른 접근을 가능하게 한다.
AI Labyrinth는 이러한 링크를 AI 스크레이퍼에게만 표시하여 콘텐츠가 인간 방문자에게 숨겨지고 사이트의 구조, 외관 또는 SEO에 영향을 미치지 않도록 보장한다.
Cloudflare는 잘못된 정보 확산에 기여하지 않겠다는 약속을 강조하며, 생성된 콘텐츠가 사실에 기반하고 과학 주제와 관련이 있지만 크롤링되는 사이트와는 무관하도록 보장했다.
또한, Cloudflare는 AI Labyrinth를 새로운 불법 크롤러를 식별하는 잠재적 허니팟으로 보고 있다. 그들은 진짜 인간 방문자는 "AI 생성된 터무니없는 미로"를 탐색할 가능성이 낮다고 언급하며, 클릭 패턴을 기반으로 새로운 봇을 탐지할 수 있다고 했다. 이 통찰력은 AI Labyrinth가 악의적인 행위자를 더 효과적으로 식별하는 데 도움이 될 것이다.
봇이 전통적인 허니팟 기술을 탐지하는 데 능숙해짐에 따라, Cloudflare는 AI Labyrinth를 진화시켜 자동화된 프로그램이 식별하기 더 어려운 더 현실적인 링크 URL 네트워크를 만들 계획이다.
콘텐츠가 AI 훈련에 사용되거나 챗봇에 의해 잘못 표현되는 것에 대해 우려하는 출판사나 개인에게 AI Labyrinth는 가치 있는 도구가 될 수 있다.
무료 티어를 포함한 모든 Cloudflare 고객은 오늘 Cloudflare 대시보드에 접속하여 봇 관리 섹션으로 이동한 후 AI Labyrinth 옵션을 켜서 이를 활성화할 수 있다.
[ttpp]
[yyxx]
관련 기사
탈라트의 AI 회의록은 클라우드가 아닌 사용자의 기기에 저장됩니다
2억 5천만 달러의 가치를 인정받은 AI 기반 필기 앱 ‘그라놀라(Granola)’는 기술 창업자들과 벤처 투자자들 사이에서 큰 주목을 받고 있다. 하지만 한 개발자는 구독료 없이 일회성 결제만으로 이용할 수 있는, 더 높은 프라이버시를 보장하는 완전한 로컬형 대안에 대한 수요가 있다고 판단했다. 이러한 비전이 새로운 맥 앱 ‘탈라트(Talat)’의 탄생으
신형 로웨 i6, 65만 9천 위안 가격으로 출시… 스냅드래곤 8155 및 두바오 대형 모델 탑재
SAIC Roewe는 오늘 Roewe D7의 디자인 언어를 전면적으로 반영한 소형 세단인 신형 Roewe i6를 출시했다. 전면부를 가로지르는 독특한 대형 수직 그릴과 수평형 헤일로 라이트 바는 강력한 기술적 감각과 시각적 폭감을 선사한다. 후면부에는 위로 솟은 덕테일 스포일러가 전면 폭을 가득 채우는 테일라이트와 조화를 이루어 차량 전체에 더욱 젊은 느낌
자산, 건물, 그리고 건강을 어떻게 보호할 수 있을까요?
예측할 수 없는 세상에서 ‘보호’는 단순한 선택지가 아닌 전략적 필수 요소가 되었습니다. 재정을 지키든, 건물을 보강하든, 아니면 개인의 건강에 신경 쓰든, 장기적인 안정은 선제적인 계획에 달려 있습니다. 진정한 안전은 다층적으로 구축되며, 재정 관리, 구조적 복원력, 그리고 정보에 입각한 건강 관리가 서로 조화를 이루어야 비로소 실현됩니다.가장 소중한 것
관련 특별 주제 추천
의견 (27)
0/500
Wait, so we're giving AI bots a taste of their own medicine? That's pretty ironic and kind of satisfying, not gonna lie! Cloudflare stepping in like this is a clever idea, but I wonder how effective it really is long-term. 🤔 Makes me think we're just entering a new arms race between data protection and data scraping. The web feels like a wild west again!
Nützlich, aber ich frage mich, ob solche Tools Privatanwender auch einfach nutzen können, oder ob das eher für Unternehmen gedacht ist. Die Balance zwischen Datenschutz und Zugänglichkeit ist oft schwierig. Auf jeden Fall ein interessanter Ansatz von Cloudflare! 🤔
이 내용 너무 유용해요! 특히 크롤러를 미끼로 빙빙 돌게 만드는 아이디어 정말 기발하네요 🤩 AI가 데이터를 수집하는 게 걱정될 때 이런 무료 도구가 있다는 건 정말 다행이에요. Cloudflare, 잘 해내고 있는 것 같아요!
This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!
This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎

AI 생성 콘텐츠의 부상, 흔히 합성 미디어로 불리는 것은 잘못된 정보의 확산, 예술가 작품의 무단 사용, 온라인 콘텐츠에 대한 신뢰 저하 등 여러 가지 도전을 가져왔다. 그러나 Cloudflare는 AI를 위한 유익한 응용 프로그램을 잠재적으로 찾아내어 AI 회사들에 의해 원본 콘텐츠가 악용되는 것을 보호하려고 한다.
수요일에 Cloudflare는 AI Labyrinth라는 도구를 소개했으며, 이 도구는 AI 생성 콘텐츠를 사용하여 무단 AI 크롤러의 자원을 "느리게 하고, 혼란스럽게 하며, 낭비하게" 만들도록 설계되었다.
최근 연구에 따르면 ChatGPT와 Perplexity 같은 AI 챗봇은 크롤러가 차단된 웹사이트의 콘텐츠에 계속 접근하고 있다. Cloudflare는 그들의 발표에서 이러한 크롤러가 매일 그들의 네트워크에 500억 개 이상의 요청을 생성하며, 이는 그들이 관찰하는 전체 웹 요청의 1% 미만에 해당한다고 강조했다. 이러한 크롤러를 차단하는 방법이 중요하다.
Cloudflare는 무단 AI 크롤링을 식별하고 차단하는 여러 도구를 보유하고 있지만, 단순히 이러한 봇을 차단하는 것은 공격자에게 경고를 주어 회피 전술의 연속적인 사이클로 이어질 수 있다고 설명했다. 그들은 탐지되었다는 신호 없이 이러한 원치 않는 봇을 억제할 새로운 방법을 고안하고자 했다.
Cloudflare가 무단 크롤링 요청을 감지하면, AI Labyrinth는 크롤러를 단순히 차단하지 않고, 크롤러가 정당하다고 믿을 만큼 충분히 진짜처럼 보이는 여러 AI 생성 웹 페이지로 연결한다. 이로 인해 크롤러는 원하는 콘텐츠를 성공적으로 스크랩했다고 잘못 믿지만, 사이트의 실제 데이터는 보호된다. 또한, 이 접근법은 크롤러의 컴퓨팅 자원을 소모하며, 이는 Cloudflare가 장점으로 보고 있다.
Cloudflare의 발표는 이 도구가 부적절한 봇 활동을 감지하면 자동으로 AI 생성 링크 페이지 세트를 배포하여 고객이 맞춤 규칙을 설정할 필요를 없앤다고 자세히 설명했다.
이러한 페이지를 생성하기 위해 Cloudflare는 Workers AI와 오픈 소스 모델을 활용하여 다양한 주제에 대한 독특하고 인간과 유사한 합성 페이지를 미리 생성했다. 이 사전 생성 파이프라인은 XSS 취약점을 방지하기 위해 콘텐츠를 정화할 뿐만 아니라 R2에 저장하여 더 빠른 접근을 가능하게 한다.
AI Labyrinth는 이러한 링크를 AI 스크레이퍼에게만 표시하여 콘텐츠가 인간 방문자에게 숨겨지고 사이트의 구조, 외관 또는 SEO에 영향을 미치지 않도록 보장한다.
Cloudflare는 잘못된 정보 확산에 기여하지 않겠다는 약속을 강조하며, 생성된 콘텐츠가 사실에 기반하고 과학 주제와 관련이 있지만 크롤링되는 사이트와는 무관하도록 보장했다.
또한, Cloudflare는 AI Labyrinth를 새로운 불법 크롤러를 식별하는 잠재적 허니팟으로 보고 있다. 그들은 진짜 인간 방문자는 "AI 생성된 터무니없는 미로"를 탐색할 가능성이 낮다고 언급하며, 클릭 패턴을 기반으로 새로운 봇을 탐지할 수 있다고 했다. 이 통찰력은 AI Labyrinth가 악의적인 행위자를 더 효과적으로 식별하는 데 도움이 될 것이다.
봇이 전통적인 허니팟 기술을 탐지하는 데 능숙해짐에 따라, Cloudflare는 AI Labyrinth를 진화시켜 자동화된 프로그램이 식별하기 더 어려운 더 현실적인 링크 URL 네트워크를 만들 계획이다.
콘텐츠가 AI 훈련에 사용되거나 챗봇에 의해 잘못 표현되는 것에 대해 우려하는 출판사나 개인에게 AI Labyrinth는 가치 있는 도구가 될 수 있다.
무료 티어를 포함한 모든 Cloudflare 고객은 오늘 Cloudflare 대시보드에 접속하여 봇 관리 섹션으로 이동한 후 AI Labyrinth 옵션을 켜서 이를 활성화할 수 있다.
[ttpp]
[yyxx]
탈라트의 AI 회의록은 클라우드가 아닌 사용자의 기기에 저장됩니다
2억 5천만 달러의 가치를 인정받은 AI 기반 필기 앱 ‘그라놀라(Granola)’는 기술 창업자들과 벤처 투자자들 사이에서 큰 주목을 받고 있다. 하지만 한 개발자는 구독료 없이 일회성 결제만으로 이용할 수 있는, 더 높은 프라이버시를 보장하는 완전한 로컬형 대안에 대한 수요가 있다고 판단했다. 이러한 비전이 새로운 맥 앱 ‘탈라트(Talat)’의 탄생으
신형 로웨 i6, 65만 9천 위안 가격으로 출시… 스냅드래곤 8155 및 두바오 대형 모델 탑재
SAIC Roewe는 오늘 Roewe D7의 디자인 언어를 전면적으로 반영한 소형 세단인 신형 Roewe i6를 출시했다. 전면부를 가로지르는 독특한 대형 수직 그릴과 수평형 헤일로 라이트 바는 강력한 기술적 감각과 시각적 폭감을 선사한다. 후면부에는 위로 솟은 덕테일 스포일러가 전면 폭을 가득 채우는 테일라이트와 조화를 이루어 차량 전체에 더욱 젊은 느낌
자산, 건물, 그리고 건강을 어떻게 보호할 수 있을까요?
예측할 수 없는 세상에서 ‘보호’는 단순한 선택지가 아닌 전략적 필수 요소가 되었습니다. 재정을 지키든, 건물을 보강하든, 아니면 개인의 건강에 신경 쓰든, 장기적인 안정은 선제적인 계획에 달려 있습니다. 진정한 안전은 다층적으로 구축되며, 재정 관리, 구조적 복원력, 그리고 정보에 입각한 건강 관리가 서로 조화를 이루어야 비로소 실현됩니다.가장 소중한 것
Wait, so we're giving AI bots a taste of their own medicine? That's pretty ironic and kind of satisfying, not gonna lie! Cloudflare stepping in like this is a clever idea, but I wonder how effective it really is long-term. 🤔 Makes me think we're just entering a new arms race between data protection and data scraping. The web feels like a wild west again!
Nützlich, aber ich frage mich, ob solche Tools Privatanwender auch einfach nutzen können, oder ob das eher für Unternehmen gedacht ist. Die Balance zwischen Datenschutz und Zugänglichkeit ist oft schwierig. Auf jeden Fall ein interessanter Ansatz von Cloudflare! 🤔
이 내용 너무 유용해요! 특히 크롤러를 미끼로 빙빙 돌게 만드는 아이디어 정말 기발하네요 🤩 AI가 데이터를 수집하는 게 걱정될 때 이런 무료 도구가 있다는 건 정말 다행이에요. Cloudflare, 잘 해내고 있는 것 같아요!
This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!
This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎





집






