麻省理工学院初创公司通过教会系统承认不确定性来解决人工智能幻觉问题

首页

新闻

2025-11-23

JustinAnderson

103

# ai # ethics # Society # bias # mit

随着人们越来越依赖人工智能模型来揭示关键信息和做出重大决策，与人工智能幻觉相关的风险也在不断升级。

我们都认识一些人，他们表现得像个万事通，拒绝承认自己的无知，或者根据网上浏览到的信息提供可疑的建议。人工智能幻觉就像这样的朋友--但在这种情况下，这个朋友可能是为你设计癌症治疗方案的人。

这就是 Themis AI 的优势所在。该公司从麻省理工学院分离出来，实现了一些概念上听起来简单但技术上极具挑战性的目标：教会人工智能系统识别并承认不确定性。

人工智能模型往往过于自信。Themis 的 Capsa 平台提供了现实检查，帮助模型识别它们何时是在推测，而不是在确定地运行。

Themis AI公司由麻省理工学院教授丹妮拉-鲁斯（Daniela Rus）和前研究员亚历山大-阿米尼（Alexander Amini）和伊拉赫-阿马迪（Elaheh Ahmadi）于2021年创立，该公司建立的平台几乎可以与任何人工智能系统集成，在不确定因素导致错误之前就将其标记出来。

利用 Capsa，人工智能学会识别自身数据处理中的模式，这些模式表明信息中存在混乱、偏差或空白--这些情况往往会导致幻觉。

自推出以来，Themis 已帮助电信公司避免了代价高昂的网络规划错误，帮助石油和天然气公司解读复杂的地震数据，并发表了关于构建聊天机器人的研究报告，以避免自信地捏造事实。

许多人仍然没有意识到，人工智能系统在本质上经常是在进行有根据的猜测。随着这些系统发挥越来越重要的作用，这种猜测可能会带来严重后果。Themis AI 引入了一个缺失元素：自我意识。

Themis AI 解决人工智能幻觉的路径

多年前，在麻省理工学院鲁斯教授的实验室里，研究人员开始了通往 Themis AI 的旅程，探索一个核心问题：机器如何才能意识到自身的局限性？

2018 年，丰田公司资助了他们为自动驾驶汽车开发可靠人工智能的工作--在这个行业中，错误可能会危及生命。当自动驾驶汽车必须精确探测行人和道路危险时，这一挑战尤为严峻。

他们的突破来自于一种能够识别面部识别系统中种族和性别偏见的算法。他们的系统不仅能检测出偏见，还能通过重新平衡训练数据来纠正偏见，从而有效地教会人工智能克服自身的偏见。

到 2021 年，该团队展示了这种方法如何改变药物发现。人工智能系统可以对潜在药物进行评估，同时强调预测是以可靠数据为基础，还是以猜测或完全的幻觉为基础。制药公司看到了只追求人工智能有信心的候选药物的价值，从而节省了时间和资源。

另一个好处适用于计算能力有限的设备。边缘设备通常依赖于较小的模型，其准确性无法与基于服务器的系统相提并论。Themis 的技术可以帮助这些本地模型独立处理大部分任务，只有在遇到困难时才会寻求服务器支持。

人工智能为改善我们的生活提供了巨大的潜力，但也伴随着真正的风险。随着人工智能在关键基础设施和决策中的嵌入，识别不确定性和避免幻觉的能力可能被证明是其最人性化和最有价值的特质。Themis AI 正在帮助模型学习这一基本技能。

另请参见：糖尿病管理：IBM 和罗氏利用人工智能预测血糖水平

想从行业领导者那里了解更多有关人工智能和大数据的信息？请参加在阿姆斯特丹、加利福尼亚和伦敦举行的人工智能与大数据博览会。这项综合性活动将与智能自动化大会（Intelligent Automation Conference）、BlockX、数字化转型周（Digital Transformation Week）和网络安全与云博览会（Cyber Security & Cloud Expo）等其他领先活动同期举行。

点击此处了解 TechForge 即将举办的其他企业技术活动和网络研讨会。

WordPress.com 现已支持 AI 助手撰写和发布文章，还有更多功能广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布，将允许人工智能助手在用户网站上起草、编辑和发布内容，同时还能管理评论、更新和修正元数据，并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制，网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能，网站几乎可以完全由人工指导的AI代理来创建和运

Kakao Mobility 概述了面向物理人工智能的 L4 级自动驾驶路线图 Kakao Mobility 计划内部自主研发 L4 级自动驾驶技术，作为其物理人工智能战略的一部分。在首尔COEX举行的2026世界IT展上，Kakao Mobility副总裁兼物理AI部门负责人金镇奎（Kim Jin-kyu）介绍了该路线图。他的演讲聚焦于物理AI时代基于出行平台构建的自动驾驶服务。据韩联社报道，这场题为“超越构想，付诸行动：AI驱动现实”的活动汇聚了来自17个国家的460

巴里·迪勒：随着通用人工智能的临近，对萨姆·阿尔特曼的信任已无关紧要尽管近期有报道暗示相反的情况，但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周，迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时，为阿尔特曼进行了辩护。此前，阿尔特曼曾遭到一些前同事和董事会成员的指责，称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友，迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言，提问

相关专题推荐

代码

最佳 AI 代码审查工具：自动确保代码符合规范，并重构遗留代码库文件

在 XIX.AI 上探索 2026 年最佳 AI 代码审查工具。我们的精选列表汇集了备受好评、具有颠覆性的工具，可自动确保代码规范并重构遗留代码库文件。通过实际测试和每周更新的排行榜，对比免费与付费选项。立即开启您的 AI 优势。

10 个工具

xix.ai

文字转语音

专为阅读障碍设计的顶级AI语音合成应用：助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成（TTS）应用，专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具，重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案，释放学生的潜能。立即访问XIX.AI，开启您的探索之旅。

10 个工具

xix.ai

漫画创作

少年漫画顶级AI生成器：打造高能动作场面与特效

在 XIX.AI 探索 2026 年最优秀的少年漫画 AI 生成工具。我们精心筛选的这份高评分清单汇集了强大的工具，助您创作充满张力的动作场面和动态能量特效。通过实际测试对比免费与付费选项。释放您的创作潜能，立即开始创作史诗级漫画吧！

15 个工具

xix.ai

商业

最佳 AI 费用追踪工具：扫描收据并自动分类企业开支

2026年最新最佳AI报销管理工具：广受好评的解决方案，可自动扫描收据并分类企业支出。探索这些功能强大、颠覆传统的解决方案，助您轻松管理报销、精准追踪财务并简化合规流程。我们精心整理并每周更新的免费与付费选项对比指南，助您找到最适合的工具。通过XIX.AI的专家精选，释放您的AI优势。

10 个工具

xix.ai

商业

最佳人工智能招聘工具：筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案，可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名，对比免费与付费选项。立即找到最适合您的招聘助手，优化您的招聘流程！

10 个工具

xix.ai

生产率

AI个人健康与专注力教练：缓解倦怠，提升精神能量

立即访问 XIX.AI，探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具，助您缓解倦怠、提升精神能量。通过真实案例分析，对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具

xix.ai

0/500

请登录后再操作

RichardHarris

2026-03-17 12:01:11

Just read this and wow, the 'know-it-all' analogy hits home. We've all been there where the system is confidently wrong. Teaching AI to say 'I don't know' could be a game-changer for trust in medical or legal advice. Curious about the scalability—is there a performance trade-off? Hope they can make it work at a large scale 🧐.

WillGarcía

2026-01-17 10:31:25

AIが「分からない」と言えるようになるって、逆に人間らしい進歩かも？🤔 実際、私も職場で『多分』って言える上司の方が信用できるし。でもMITのスタートアップがこれをビジネスにできるって面白い。AIの過信防止って医療や裁判で本当に必要だよね。個人的には、この技術がSNSのデマ拡散防止に使われないか心配だけど…

AlbertEvans

2025-12-19 22:30:45

Diese Startup-Idee aus MIT scheint sehr vielversprechend zu sein. Modelle müssen lernen, Unsicherheiten zuzugeben - genau wie ein vernünftiger Mensch es tun würde 😂. Besonders im Bereich Medizin oder autonomes Fahren, wo fehlerhafte Antworten katastrophal sein können, wird das 'Ich weiß es nicht'-Eingeständnis zu einer lebenswichtigen Funktion. Hoffentlich setzt sich dieser Ansatz bald durch!

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 DeepSeek V4 作为多模态人工智能变革者横空出世 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长

精选