Cloudflare 指責 Perplexity 使用人工智能機器人秘密抓取被封鎖的網站

AI 創業公司被指控繞過網站限制
Cloudflare 最近的調查指出,AI 搜尋公司 Perplexity 一直在使用繞過網站擁有者實施的爬行限制的策略。互聯網基礎設施供應商報告說,他們觀察到 Perplexity 的網路爬行器在遇到存取障礙時,有系統地試圖進行偽裝。
規避策略
根據 Cloudflare 的發現,Perplexity 的爬蟲最初會顯示標準識別("PerplexityBot 「或 」Perplexity-User")。但是,當通過
- robots.txt 指令
- Web 應用程式防火牆規則
- 其他存取限制
系統據稱會改為在 macOS 上將其身份掩飾為一般 Chrome 瀏覽器使用者,利用
- 輪流使用未正式列出的 IP 位址
- 變更自治系統網路識別碼
- 未記錄的使用者代理模式
活動規模
Cloudflare 記錄此行為跨越
- 數以萬計的網域
- 數百萬的每日請求
- 各種網路配置
公司回應
Perplexity 的官方聲明反駁 Cloudflare 的定性,將其描述為
- 一個 "宣傳噱頭
- 包含 "許多誤解
- 有可能混淆合法的用戶流量和刮擦活動
該初創公司將某些偵測到的活動歸咎於
- 提出特定請求的實際使用者
- 第三方服務 BrowserBase
- 偶爾的技術需要
行業背景
此事件發生在
- 先前有關 Perplexity 繞過付費牆的報告
- 該公司過去對第三方爬蟲的歸咎
- 業界對 AI 內容搜刮的日益關注
Cloudflare 已採取以下行動
- 刪除 Perplexity 的驗證機器人身份
- 實施新的封鎖措施
- 擴大預設的 AI 爬蟲限制
這種情況反映了以下兩者之間更廣泛的緊張關係
- AI 公司的資料需求
- 發行者的權利和保護
- 不斷演進的網際網路基礎建設回應
相關文章
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖
Kakao Mobility 計畫內部開發第 4 級自動駕駛技術,作為其實體人工智慧策略的一環。在首爾COEX舉行的2026年世界資訊科技展(World IT Show)會議上,Kakao Mobility副總裁兼實體AI部門負責人金鎮奎(Kim Jin-kyu)發表了該發展藍圖。他的演講聚焦於實體AI時代以移動平台為核心的自動駕駛服務。據韓聯社報導,這場名為「超越構想,付諸行動:AI 推動現
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
相關專題推薦
評論 (3)
0/500
Alors, cette nouvelle me fait vraiment réfléchir aux limites entre innovation et éthique dans l'IA. Perplexity ferait ça en cachette ? Si c'est vrai, c'est pas joli joli. On dirait un peu un jeu du chat et de la souris où les startups bousculent les règles. 😬 Mais bon, Cloudflare n'est pas parfait non plus, ils ont leur propre agenda. Un peu de transparence ne ferait de mal à personne ! C'est ce manque de clarté qui mine la confiance du public envers toute cette industrie.
¿Está Perplexity realmente raspando sitios web bloqueados a escondidas? 🤔 Si es verdad, es bastante preocupante. Muchas empresas de IA prometen ser 'éticas', pero a veces parece que sus acciones contradicen sus palabras. Espero que haya más transparencia en la industria y que respeten los archivos robots.txt de los sitios. Este caso podría suponer un precedente importante.
¿Es esto lo que llaman 'innovación'? Primero nos venden la IA como una herramienta mágica, y luego descubrimos que hacen trampas para robar datos. Si Perplexity realmente evita bloqueos a propósito, es un problema serio de ética y legal. ¡Qué hipocresía! 🙄 ¿Hasta dónde llegarán algunas startups para ganar la carrera de la IA?

AI 創業公司被指控繞過網站限制
Cloudflare 最近的調查指出,AI 搜尋公司 Perplexity 一直在使用繞過網站擁有者實施的爬行限制的策略。互聯網基礎設施供應商報告說,他們觀察到 Perplexity 的網路爬行器在遇到存取障礙時,有系統地試圖進行偽裝。
規避策略
根據 Cloudflare 的發現,Perplexity 的爬蟲最初會顯示標準識別("PerplexityBot 「或 」Perplexity-User")。但是,當通過
- robots.txt 指令
- Web 應用程式防火牆規則
- 其他存取限制
系統據稱會改為在 macOS 上將其身份掩飾為一般 Chrome 瀏覽器使用者,利用
- 輪流使用未正式列出的 IP 位址
- 變更自治系統網路識別碼
- 未記錄的使用者代理模式
活動規模
Cloudflare 記錄此行為跨越
- 數以萬計的網域
- 數百萬的每日請求
- 各種網路配置
公司回應
Perplexity 的官方聲明反駁 Cloudflare 的定性,將其描述為
- 一個 "宣傳噱頭
- 包含 "許多誤解
- 有可能混淆合法的用戶流量和刮擦活動
該初創公司將某些偵測到的活動歸咎於
- 提出特定請求的實際使用者
- 第三方服務 BrowserBase
- 偶爾的技術需要
行業背景
此事件發生在
- 先前有關 Perplexity 繞過付費牆的報告
- 該公司過去對第三方爬蟲的歸咎
- 業界對 AI 內容搜刮的日益關注
Cloudflare 已採取以下行動
- 刪除 Perplexity 的驗證機器人身份
- 實施新的封鎖措施
- 擴大預設的 AI 爬蟲限制
這種情況反映了以下兩者之間更廣泛的緊張關係
- AI 公司的資料需求
- 發行者的權利和保護
- 不斷演進的網際網路基礎建設回應
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
Alors, cette nouvelle me fait vraiment réfléchir aux limites entre innovation et éthique dans l'IA. Perplexity ferait ça en cachette ? Si c'est vrai, c'est pas joli joli. On dirait un peu un jeu du chat et de la souris où les startups bousculent les règles. 😬 Mais bon, Cloudflare n'est pas parfait non plus, ils ont leur propre agenda. Un peu de transparence ne ferait de mal à personne ! C'est ce manque de clarté qui mine la confiance du public envers toute cette industrie.
¿Está Perplexity realmente raspando sitios web bloqueados a escondidas? 🤔 Si es verdad, es bastante preocupante. Muchas empresas de IA prometen ser 'éticas', pero a veces parece que sus acciones contradicen sus palabras. Espero que haya más transparencia en la industria y que respeten los archivos robots.txt de los sitios. Este caso podría suponer un precedente importante.
¿Es esto lo que llaman 'innovación'? Primero nos venden la IA como una herramienta mágica, y luego descubrimos que hacen trampas para robar datos. Si Perplexity realmente evita bloqueos a propósito, es un problema serio de ética y legal. ¡Qué hipocresía! 🙄 ¿Hasta dónde llegarán algunas startups para ganar la carrera de la IA?





首頁






