聊天机器人扭曲新闻,甚至影响付费用户

为什么这很重要?如果聊天机器人甚至无法像Google那样准确检索新闻,就很难相信它们能够准确解读和引用这些新闻。这使得它们的回答内容,即使附有链接,也远不可靠。
自信地给出错误答案
研究人员指出,聊天机器人以“令人担忧的自信”给出了错误答案,极少对结果进行限定或承认知识盲区。例如,ChatGPT“从不拒绝回答问题”,尽管其200个回答中有134个是错误的。在所有八款工具中,Copilot是唯一拒绝回答问题多于回答问题的工具。
报告明确指出:“所有工具都始终更倾向于提供错误答案,而不是承认自身局限性。”
付费版本并不可靠
即使是像Grok-3 Search和Perplexity Pro这样的高级模型,虽然比免费版本更准确,但仍然自信地给出了错误答案。这让人质疑它们高昂订阅费用的价值。
报告解释说:“这种矛盾主要源于(这些机器人)倾向于提供明确但错误的答案,而不是直接拒绝回答问题。根本问题不仅在于聊天机器人的事实错误,还在于它们权威的对话语气,这使得用户难以区分准确和不准确的信息。”
报告补充道:“这种未经证实的自信给用户带来了可靠性和准确性的潜在危险幻觉。”
捏造链接
AI模型因幻觉问题而臭名昭著,但Tow研究发现,Gemini和Grok 3的幻觉最为频繁——超过一半时间如此。报告指出:“即使Grok正确识别了一篇文章,它也常常链接到捏造的URL。”这意味着Grok可能找到正确的标题和出版商,但随后制造出实际的文章链接。
西北大学的一项名为Generative AI in the Newsroom的倡议分析了Comscore流量数据,证实了这一模式。他们在2024年7月至11月的研究显示,ChatGPT在其回答中生成了205个失效URL。虽然出版物偶尔会删除文章,导致404错误,但研究人员指出,缺乏存档数据表明“该模型在回应用户查询时,幻觉出看似可信的权威新闻网站链接。”
鉴于AI搜索引擎的日益普及——Google在2024年第四季度市场份额首次跌破90%——这些发现令人担忧。该公司上周还为部分用户推出了AI Mode,用聊天机器人取代了常规搜索,尽管其AI Overviews广受批评。
每周约有4亿用户涌向ChatGPT,其引用的不可靠性和扭曲使它和其他流行AI工具可能成为虚假信息的引擎,即便它们从严格事实核查的新闻网站提取内容。
Tow报告得出结论,AI工具错误引用来源或错误呈现其内容可能会对出版商的声誉造成反噬。
无视被阻止的爬虫
Tow报告发现,情况对出版商而言更加恶化,几个聊天机器人仍然能够从使用Robots Exclusion Protocol(REP)或robots.txt阻止其爬虫的出版商那里检索文章。然而,矛盾的是,聊天机器人无法正确回答关于允许它们访问内容的网站的问题。
报告称:“Perplexity Pro在这方面表现最差,正确识别了近三分之一的九十篇它本不应访问的文章摘录。”
这表明,不仅AI公司仍在无视REP——正如Perplexity和其他公司去年被发现的那样——而且与它们有任何许可协议的出版商也无法保证被正确引用。
哥伦比亚的报告只是更大问题的一个症状。Generative AI in the Newsroom报告还发现,聊天机器人很少将流量引导到它们提取信息的新闻网站,其他报告也证实了这一点。从2024年7月至11月,Perplexity仅将7%的引流传递给新闻网站,而ChatGPT仅为3%。相比之下,AI工具倾向于偏好Scribd.com、Coursera和大学相关的教育资源,将高达30%的流量导向这些网站。
底线:原始报道仍然是比AI工具复述的更可靠的新闻来源。在接受它们提供的信息为事实之前,始终验证链接,并运用你的批判性思维和媒体素养技能来评估回答。
相关文章
中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注
中国国家互联网信息办公室出台了一项全面计划,旨在规范短视频内容标注,要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题,监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上,现已将内容标注作为短视频发布流程中的强制性环节。 发布者必须从六种选项中选择其一:“虚构演绎”、“AI生成”、“含营销信息”
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech
Talat 的 AI 会议记录存储在您的设备上,而非云端
估值达2.5亿美元的AI笔记应用Granola在科技创业者和风险投资家群体中备受追捧。但一位开发者认为,市场需要一款更注重隐私、完全本地化、只需一次性付费且无需订阅的替代方案。这一构想催生了一款名为Talat的新Mac应用。来自英国约克郡的尼克·佩恩(Nick Payne)自称是位计算机极客,他表示开发本地化AI笔记应用的灵感,很大程度上源于一系列幸运的偶然。“我认为Granola非常出色;它充分
相关专题推荐
评论 (52)
0/500
Paying for premium AI news and still getting misinformation? That's like buying a fancy umbrella that leaks in the rain. 🤦♂️ This study just confirms my biggest fear about AI in journalism—it's not just about errors, it's about the confidence with which it spreads them. Makes you wonder if we're outsourcing our critical thinking to machines that can't even get basic facts straight.
Paying for premium AI chatbots and still getting fake news? That's a rip-off! 😡 This study just proves we can't trust these bots to get the facts straight.
프리미엄 버전을 구입했는데 뉴스 정확도가 형편없네요. confidently 잘못된 정보를 내뱉는 모습을 보면서 웃음이 나왔어요. 😂 돈 아깝네요. 사람 손으로 쓴 뉴스가 더 나을 것 같아요.
Paguei pela versão premium achando que teria notícias precisas, mas que erro! Ele dá informações erradas com tanta confiança que parece um pastor pregando. 😅 Não vale o dinheiro. Talvez seja melhor ficar com notícias escritas por humanos.

为什么这很重要?如果聊天机器人甚至无法像Google那样准确检索新闻,就很难相信它们能够准确解读和引用这些新闻。这使得它们的回答内容,即使附有链接,也远不可靠。
自信地给出错误答案
研究人员指出,聊天机器人以“令人担忧的自信”给出了错误答案,极少对结果进行限定或承认知识盲区。例如,ChatGPT“从不拒绝回答问题”,尽管其200个回答中有134个是错误的。在所有八款工具中,Copilot是唯一拒绝回答问题多于回答问题的工具。
报告明确指出:“所有工具都始终更倾向于提供错误答案,而不是承认自身局限性。”
付费版本并不可靠
即使是像Grok-3 Search和Perplexity Pro这样的高级模型,虽然比免费版本更准确,但仍然自信地给出了错误答案。这让人质疑它们高昂订阅费用的价值。
报告解释说:“这种矛盾主要源于(这些机器人)倾向于提供明确但错误的答案,而不是直接拒绝回答问题。根本问题不仅在于聊天机器人的事实错误,还在于它们权威的对话语气,这使得用户难以区分准确和不准确的信息。”
报告补充道:“这种未经证实的自信给用户带来了可靠性和准确性的潜在危险幻觉。”
捏造链接
AI模型因幻觉问题而臭名昭著,但Tow研究发现,Gemini和Grok 3的幻觉最为频繁——超过一半时间如此。报告指出:“即使Grok正确识别了一篇文章,它也常常链接到捏造的URL。”这意味着Grok可能找到正确的标题和出版商,但随后制造出实际的文章链接。
西北大学的一项名为Generative AI in the Newsroom的倡议分析了Comscore流量数据,证实了这一模式。他们在2024年7月至11月的研究显示,ChatGPT在其回答中生成了205个失效URL。虽然出版物偶尔会删除文章,导致404错误,但研究人员指出,缺乏存档数据表明“该模型在回应用户查询时,幻觉出看似可信的权威新闻网站链接。”
鉴于AI搜索引擎的日益普及——Google在2024年第四季度市场份额首次跌破90%——这些发现令人担忧。该公司上周还为部分用户推出了AI Mode,用聊天机器人取代了常规搜索,尽管其AI Overviews广受批评。
每周约有4亿用户涌向ChatGPT,其引用的不可靠性和扭曲使它和其他流行AI工具可能成为虚假信息的引擎,即便它们从严格事实核查的新闻网站提取内容。
Tow报告得出结论,AI工具错误引用来源或错误呈现其内容可能会对出版商的声誉造成反噬。
无视被阻止的爬虫
Tow报告发现,情况对出版商而言更加恶化,几个聊天机器人仍然能够从使用Robots Exclusion Protocol(REP)或robots.txt阻止其爬虫的出版商那里检索文章。然而,矛盾的是,聊天机器人无法正确回答关于允许它们访问内容的网站的问题。
报告称:“Perplexity Pro在这方面表现最差,正确识别了近三分之一的九十篇它本不应访问的文章摘录。”
这表明,不仅AI公司仍在无视REP——正如Perplexity和其他公司去年被发现的那样——而且与它们有任何许可协议的出版商也无法保证被正确引用。
哥伦比亚的报告只是更大问题的一个症状。Generative AI in the Newsroom报告还发现,聊天机器人很少将流量引导到它们提取信息的新闻网站,其他报告也证实了这一点。从2024年7月至11月,Perplexity仅将7%的引流传递给新闻网站,而ChatGPT仅为3%。相比之下,AI工具倾向于偏好Scribd.com、Coursera和大学相关的教育资源,将高达30%的流量导向这些网站。
底线:原始报道仍然是比AI工具复述的更可靠的新闻来源。在接受它们提供的信息为事实之前,始终验证链接,并运用你的批判性思维和媒体素养技能来评估回答。
中国网络空间管理局要求对人工智能生成和虚构的短视频进行标注
中国国家互联网信息办公室出台了一项全面计划,旨在规范短视频内容标注,要求各平台提供六项必备标签——包括“AI生成内容”——这标志着短视频治理进入了一个强制透明化的新时代。为解决内容来源不明、难以区分真伪等问题,监管部门在此前与抖音、快手、腾讯、百度等主要平台开展试点的基础上,现已将内容标注作为短视频发布流程中的强制性环节。 发布者必须从六种选项中选择其一:“虚构演绎”、“AI生成”、“含营销信息”
以文本翻译著称的DeepL,如今将目光投向了语音翻译
以文本翻译工具闻名的翻译公司DeepL今日推出了一套语音到语音翻译解决方案,通过定制应用程序,为一线工作人员在会议、移动端和网页对话以及小组讨论等场景中提供支持。 该公司还推出了一款API,允许外部开发者和企业基于DeepL的技术构建定制化解决方案,例如呼叫中心应用。“在专注于文本翻译多年后,语音翻译对我们来说是水到渠成的下一步,”DeepL首席执行官Jarek Kutylowski在接受Tech
Talat 的 AI 会议记录存储在您的设备上,而非云端
估值达2.5亿美元的AI笔记应用Granola在科技创业者和风险投资家群体中备受追捧。但一位开发者认为,市场需要一款更注重隐私、完全本地化、只需一次性付费且无需订阅的替代方案。这一构想催生了一款名为Talat的新Mac应用。来自英国约克郡的尼克·佩恩(Nick Payne)自称是位计算机极客,他表示开发本地化AI笔记应用的灵感,很大程度上源于一系列幸运的偶然。“我认为Granola非常出色;它充分
Paying for premium AI news and still getting misinformation? That's like buying a fancy umbrella that leaks in the rain. 🤦♂️ This study just confirms my biggest fear about AI in journalism—it's not just about errors, it's about the confidence with which it spreads them. Makes you wonder if we're outsourcing our critical thinking to machines that can't even get basic facts straight.
Paying for premium AI chatbots and still getting fake news? That's a rip-off! 😡 This study just proves we can't trust these bots to get the facts straight.
프리미엄 버전을 구입했는데 뉴스 정확도가 형편없네요. confidently 잘못된 정보를 내뱉는 모습을 보면서 웃음이 나왔어요. 😂 돈 아깝네요. 사람 손으로 쓴 뉴스가 더 나을 것 같아요.
Paguei pela versão premium achando que teria notícias precisas, mas que erro! Ele dá informações erradas com tanta confiança que parece um pastor pregando. 😅 Não vale o dinheiro. Talvez seja melhor ficar com notícias escritas por humanos.





首页






