聊天機器人扭曲新聞,甚至影響付費用戶

為什麼這很重要?如果聊天機器人連新聞檢索都無法與Google媲美,就很難信任它們能準確解釋並引用這些新聞。這使得它們的回應內容,即使有連結,也變得遠不可靠。
自信地給出錯誤答案
研究人員指出,聊天機器人以「令人震驚的自信」回覆錯誤答案,幾乎不對其結果加以限定或承認知識缺口。例如,ChatGPT「從未拒絕提供答案」,儘管其200個回應中有134個是錯誤的。在所有八個工具中,Copilot是唯一拒絕回答的次數多於回應次數的工具。
報告澄清:「所有工具一致地更傾向於提供錯誤答案,而不是承認自身的局限性。」
付費層級並不更可靠
即使是像Grok-3 Search和Perplexity Pro這樣的付費高級模型,雖然比免費版本更準確,但仍自信地給出錯誤答案。這讓人們對其高昂的訂閱費用價值產生質疑。
報告解釋:「這種矛盾主要源於[機器人]傾向於提供明確但錯誤的答案,而不是直接拒絕回答問題。」「根本問題不僅在於聊天機器人的事實錯誤,還在於它們權威的對話語氣,這使得用戶難以區分準確與不準確的資訊。」
報告補充:「這種不實的自信為用戶呈現了一種潛在危險的可靠性和準確性假象。」
捏造連結
AI模型因產生幻覺而臭名昭著,但Tow研究發現,Gemini和Grok 3的幻覺頻率最高——超過一半的時間。「即使Grok正確識別了一篇文章,它也常常連接到一個捏造的URL,」報告指出,這意味著Grok可能找到正確的標題和出版商,但隨後製造出實際的文章連結。
西北大學的「新聞室中的生成式AI」計畫通過分析Comscore流量數據,證實了這種模式。他們在2024年7月至11月的研究顯示,ChatGPT在其回應中生成了205個無效URL。雖然出版物偶爾會移除報導,導致404錯誤,但研究人員指出,缺乏存檔數據表明「該模型在回應用戶查詢時,捏造了看似可信的權威新聞網站連結。」
鑑於AI搜尋引擎的採用率不斷上升——Google在2024年第四季的市場份額首次在10年內跌破90%——這些發現令人不安。該公司上週還為某些用戶推出了AI Mode,儘管其AI Overviews廣受批評,仍用聊天機器人取代了常規搜尋。
隨著每週約4億用戶湧向ChatGPT,其引用的不可靠性和扭曲使它和其他熱門AI工具成為潛在的錯誤資訊引擎,即便它們從嚴格事實查核的新聞網站提取內容。
Tow報告得出結論,AI工具錯誤引用來源或不正確呈現其工作,可能會對出版商的聲譽造成反效果。
無視被阻擋的爬蟲
對出版商來說,情況更加惡化,因為Tow報告發現,幾個聊天機器人仍能從使用機器人排除協議(REP)或robots.txt阻止其爬蟲的出版商那裡檢索文章。然而,矛盾的是,聊天機器人無法正確回答關於允許它們訪問內容的網站的查詢。
報告指出:「Perplexity Pro在這方面是最嚴重的違規者,正確識別了近三分之一的九十篇它不應有權訪問的文章摘錄。」
這表明,AI公司不僅仍在無視REP——正如Perplexity和其他公司去年被發現的那樣——而且與它們簽訂任何許可協議的出版商也無法保證被正確引用。
哥倫比亞的報告只是更大問題的一個症狀。「新聞室中的生成式AI」報告還發現,聊天機器人很少將流量導向它們提取資訊的新聞網站,其他報告也證實了這一點。從2024年7月至11月,Perplexity僅將7%的轉介流量傳遞給新聞網站,而ChatGPT僅傳遞3%。相比之下,AI工具傾向於偏好像Scribd.com、Coursera和與大學相關的教育資源,將多達30%的流量導向這些資源。
底線:原始報導仍然是比AI工具反芻的內容更可靠的新聞來源。在接受它們提供的事實之前,務必驗證連結,並運用你的批判性思維和媒體素養技能來評估回應。
相關文章
在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工
人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫,預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業,正積極將其核心技術推向國際市場。目前,Cursor 已在新加坡設立辦公室,由資深技術高管 Simon Green 領軍,招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的
Claude 被用於製作惡意 npm 套件:逾 670 個套件遭入侵,威脅開源社群
一則近期發生的網路安全事件揭露了大型語言模型(LLMs)如何被用作開發惡意軟體的工具。資安研究員 Sibi Moosa 發現一名化名為「mousie-5212-super-formatter」的攻擊者,利用 Anthropic 的 Claude AI 生成有害程式碼,並污染 npm 套件生態系統。 在短時間內,超過 670 個惡意套件被上傳至 npm 套件庫,此類攻擊的速度與自動化程度引發了高度警
隨著印度加速推動科技發展,信實集團公布了1,100億美元的人工智慧投資計畫
印度信實集團(Reliance)的億萬富豪主席穆克什·安巴尼(Mukesh Ambani)於週四宣布,將斥資10兆盧比(約合1,100億美元),在未來七年間於印度各地建設人工智慧運算基礎設施。安巴尼週四在新德里舉行的「印度人工智慧影響力峰會」上表示,這筆投資將用於支持吉瓦級數據中心、全國性的邊緣運算網路,以及與信實集團旗下Jio電信平台整合的新人工智慧服務。安巴尼指出,信實集團已開始在古吉拉特邦的
相關專題推薦
評論 (52)
0/500
Paying for premium AI news and still getting misinformation? That's like buying a fancy umbrella that leaks in the rain. 🤦♂️ This study just confirms my biggest fear about AI in journalism—it's not just about errors, it's about the confidence with which it spreads them. Makes you wonder if we're outsourcing our critical thinking to machines that can't even get basic facts straight.
Paying for premium AI chatbots and still getting fake news? That's a rip-off! 😡 This study just proves we can't trust these bots to get the facts straight.
프리미엄 버전을 구입했는데 뉴스 정확도가 형편없네요. confidently 잘못된 정보를 내뱉는 모습을 보면서 웃음이 나왔어요. 😂 돈 아깝네요. 사람 손으로 쓴 뉴스가 더 나을 것 같아요.
Paguei pela versão premium achando que teria notícias precisas, mas que erro! Ele dá informações erradas com tanta confiança que parece um pastor pregando. 😅 Não vale o dinheiro. Talvez seja melhor ficar com notícias escritas por humanos.

為什麼這很重要?如果聊天機器人連新聞檢索都無法與Google媲美,就很難信任它們能準確解釋並引用這些新聞。這使得它們的回應內容,即使有連結,也變得遠不可靠。
自信地給出錯誤答案
研究人員指出,聊天機器人以「令人震驚的自信」回覆錯誤答案,幾乎不對其結果加以限定或承認知識缺口。例如,ChatGPT「從未拒絕提供答案」,儘管其200個回應中有134個是錯誤的。在所有八個工具中,Copilot是唯一拒絕回答的次數多於回應次數的工具。
報告澄清:「所有工具一致地更傾向於提供錯誤答案,而不是承認自身的局限性。」
付費層級並不更可靠
即使是像Grok-3 Search和Perplexity Pro這樣的付費高級模型,雖然比免費版本更準確,但仍自信地給出錯誤答案。這讓人們對其高昂的訂閱費用價值產生質疑。
報告解釋:「這種矛盾主要源於[機器人]傾向於提供明確但錯誤的答案,而不是直接拒絕回答問題。」「根本問題不僅在於聊天機器人的事實錯誤,還在於它們權威的對話語氣,這使得用戶難以區分準確與不準確的資訊。」
報告補充:「這種不實的自信為用戶呈現了一種潛在危險的可靠性和準確性假象。」
捏造連結
AI模型因產生幻覺而臭名昭著,但Tow研究發現,Gemini和Grok 3的幻覺頻率最高——超過一半的時間。「即使Grok正確識別了一篇文章,它也常常連接到一個捏造的URL,」報告指出,這意味著Grok可能找到正確的標題和出版商,但隨後製造出實際的文章連結。
西北大學的「新聞室中的生成式AI」計畫通過分析Comscore流量數據,證實了這種模式。他們在2024年7月至11月的研究顯示,ChatGPT在其回應中生成了205個無效URL。雖然出版物偶爾會移除報導,導致404錯誤,但研究人員指出,缺乏存檔數據表明「該模型在回應用戶查詢時,捏造了看似可信的權威新聞網站連結。」
鑑於AI搜尋引擎的採用率不斷上升——Google在2024年第四季的市場份額首次在10年內跌破90%——這些發現令人不安。該公司上週還為某些用戶推出了AI Mode,儘管其AI Overviews廣受批評,仍用聊天機器人取代了常規搜尋。
隨著每週約4億用戶湧向ChatGPT,其引用的不可靠性和扭曲使它和其他熱門AI工具成為潛在的錯誤資訊引擎,即便它們從嚴格事實查核的新聞網站提取內容。
Tow報告得出結論,AI工具錯誤引用來源或不正確呈現其工作,可能會對出版商的聲譽造成反效果。
無視被阻擋的爬蟲
對出版商來說,情況更加惡化,因為Tow報告發現,幾個聊天機器人仍能從使用機器人排除協議(REP)或robots.txt阻止其爬蟲的出版商那裡檢索文章。然而,矛盾的是,聊天機器人無法正確回答關於允許它們訪問內容的網站的查詢。
報告指出:「Perplexity Pro在這方面是最嚴重的違規者,正確識別了近三分之一的九十篇它不應有權訪問的文章摘錄。」
這表明,AI公司不僅仍在無視REP——正如Perplexity和其他公司去年被發現的那樣——而且與它們簽訂任何許可協議的出版商也無法保證被正確引用。
哥倫比亞的報告只是更大問題的一個症狀。「新聞室中的生成式AI」報告還發現,聊天機器人很少將流量導向它們提取資訊的新聞網站,其他報告也證實了這一點。從2024年7月至11月,Perplexity僅將7%的轉介流量傳遞給新聞網站,而ChatGPT僅傳遞3%。相比之下,AI工具傾向於偏好像Scribd.com、Coursera和與大學相關的教育資源,將多達30%的流量導向這些資源。
底線:原始報導仍然是比AI工具反芻的內容更可靠的新聞來源。在接受它們提供的事實之前,務必驗證連結,並運用你的批判性思維和媒體素養技能來評估回應。
在獲得 SpaceX 的大筆投資後,人工智慧編程新創公司 Cursor 將在亞太地區招聘 200 名員工
人工智慧編碼新創公司 Cursor 宣布了一項重大的全球擴張計畫,預計在未來六個月內於亞太地區招聘 200 名員工。主要職位包括行銷工程師、現場工程師及人工智慧部署工程師。此舉彰顯了這家總部位於舊金山的獨角獸企業,正積極將其核心技術推向國際市場。目前,Cursor 已在新加坡設立辦公室,由資深技術高管 Simon Green 領軍,招聘範圍將涵蓋日本、雪梨、墨爾本及印度等關鍵市場。除了亞太地區的
Claude 被用於製作惡意 npm 套件:逾 670 個套件遭入侵,威脅開源社群
一則近期發生的網路安全事件揭露了大型語言模型(LLMs)如何被用作開發惡意軟體的工具。資安研究員 Sibi Moosa 發現一名化名為「mousie-5212-super-formatter」的攻擊者,利用 Anthropic 的 Claude AI 生成有害程式碼,並污染 npm 套件生態系統。 在短時間內,超過 670 個惡意套件被上傳至 npm 套件庫,此類攻擊的速度與自動化程度引發了高度警
隨著印度加速推動科技發展,信實集團公布了1,100億美元的人工智慧投資計畫
印度信實集團(Reliance)的億萬富豪主席穆克什·安巴尼(Mukesh Ambani)於週四宣布,將斥資10兆盧比(約合1,100億美元),在未來七年間於印度各地建設人工智慧運算基礎設施。安巴尼週四在新德里舉行的「印度人工智慧影響力峰會」上表示,這筆投資將用於支持吉瓦級數據中心、全國性的邊緣運算網路,以及與信實集團旗下Jio電信平台整合的新人工智慧服務。安巴尼指出,信實集團已開始在古吉拉特邦的
Paying for premium AI news and still getting misinformation? That's like buying a fancy umbrella that leaks in the rain. 🤦♂️ This study just confirms my biggest fear about AI in journalism—it's not just about errors, it's about the confidence with which it spreads them. Makes you wonder if we're outsourcing our critical thinking to machines that can't even get basic facts straight.
Paying for premium AI chatbots and still getting fake news? That's a rip-off! 😡 This study just proves we can't trust these bots to get the facts straight.
프리미엄 버전을 구입했는데 뉴스 정확도가 형편없네요. confidently 잘못된 정보를 내뱉는 모습을 보면서 웃음이 나왔어요. 😂 돈 아깝네요. 사람 손으로 쓴 뉴스가 더 나을 것 같아요.
Paguei pela versão premium achando que teria notícias precisas, mas que erro! Ele dá informações erradas com tanta confiança que parece um pastor pregando. 😅 Não vale o dinheiro. Talvez seja melhor ficar com notícias escritas por humanos.





首頁






