Meta 通往通用人工智能助理之路
在过去的十年中,我们为现代人工智能时代奠定了许多基础要素。这包括开创了如今支撑所有主要语言模型的 Transformer 架构,以及开发了能够学习和制定战略的复杂代理系统,AlphaGo 和 AlphaZero 就是其中的典范。
我们利用这些先进技术推动了量子计算、数学、生命科学和算法发现领域的重大进展。我们致力于继续深化基础研究的范围和强度,努力发明实现人工智能(AGI)所必需的下一波突破。
这一雄心壮志推动着我们努力将我们最重要的多模态模型--双子座 2.5 Pro--发展成为一个 "世界模型"。这种先进的系统将能够通过理解和模拟现实世界的动态来制定计划和设想新的情景,从而反映出大脑自身的过程。
我们一直在朝着这个方向努力。从训练代理擅长围棋和星际争霸等复杂游戏的早期突破,到精灵 2 的诞生--该系统可通过单张图像提示生成交互式三维环境。
我们已经看到了这些能力的出现。例如,"双子座 "利用世界知识和推理来表现和模拟自然环境,"Veo "展示了对物理学的直观把握,而 "双子座机器人 "能让机器学习抓取、服从命令并实时调整。
将 "双子座 "转化为世界模型,是迈向新型人工智能的关键一步--新型人工智能将更具通用性和实用性。我们设想了一个通用的人工智能助手:一个智能实体,它能理解你的语境,并能在你的所有设备上无缝地为你计划和执行行动。
将 Project Astra 的实时功能集成到我们的产品中
我们的最终目标是将 Gemini 应用程序改造成一个通用的人工智能助手,它能处理日常琐事、管理日常行政事务并提供吸引人的建议--最终提高我们的工作效率,改善我们的日常生活。
第一步是整合我们在去年的研究原型项目 Astra 中初步展示的功能,包括视频理解、屏幕共享和记忆。
去年,我们已将类似功能集成到 Gemini Live 中,供更多人使用。我们不断追求技术创新。增强功能包括通过本机音频实现更自然的语音输出、改进记忆功能以及增加计算机控制功能。
目前,我们正在收集部分测试人员对这些功能的反馈意见,并准备将其引入 Gemini Live、新的搜索体验、面向开发人员的 Live API 以及智能眼镜等新型硬件。
在开发的每个阶段,安全和责任都是我们的首要任务。我们最近完成了一项广泛的研究计划,对高级人工智能助手的道德考虑因素进行了研究,这些见解将继续指导我们的研究、开发和部署战略。
开发可为您处理多项任务的人工智能
通过 "水手项目",我们还在研究基于代理的系统如何协助完成多任务。该研究原型从网页浏览器入手,探索人类与代理协作的未来。
自去年 12 月首次推出 "水手项目 "以来,我们与一批值得信赖的测试人员密切合作,不断完善其实验功能。
更新后的 "水手计划 "现在拥有一个协调的代理团队,能够同时执行多达十项不同的任务。这些代理可以同时协助进行信息检索、预约、网上购物、研究等。
美国的谷歌人工智能超级用户现在可以使用增强版 Project Mariner。我们正在将其计算机交互功能纳入双子座应用程序接口,并计划在全年内在谷歌的产品生态系统中引入更多的功能。了解我们在搜索和 Gemini 应用程序中的代理功能的更多信息。
通过这项计划和我们所有的开拓性工作,我们正在创造越来越个性化、主动和强大的人工智能。这项技术旨在丰富我们的生活,加快科学进步的速度,并预示着一个新的发现和创新时代的到来。





相关文章
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
Kakao Mobility 概述了面向物理人工智能的 L4 级自动驾驶路线图
Kakao Mobility 计划内部自主研发 L4 级自动驾驶技术,作为其物理人工智能战略的一部分。在首尔COEX举行的2026世界IT展上,Kakao Mobility副总裁兼物理AI部门负责人金镇奎(Kim Jin-kyu)介绍了该路线图。他的演讲聚焦于物理AI时代基于出行平台构建的自动驾驶服务。据韩联社报道,这场题为“超越构想,付诸行动:AI驱动现实”的活动汇聚了来自17个国家的460
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
相关专题推荐
评论 (3)
0/500
Also langsam geht's los, oder? 😅 Meta hat mit der Transformer-Architektur echt den Grundstein für die aktuelle KI-Welle gelegt. Spannend zu sehen, ob sie jetzt mit ihrem universellen Assistenten auch bei den Endnutzern punkten können – oder ob das wieder nur ein Wettrennen um die größte Parameterzahl wird. Die Agentensysteme haben ja Potenzial, aber hoffentlich bleibt die Ethik dabei nicht auf der Strecke.
在过去的十年中,我们为现代人工智能时代奠定了许多基础要素。这包括开创了如今支撑所有主要语言模型的 Transformer 架构,以及开发了能够学习和制定战略的复杂代理系统,AlphaGo 和 AlphaZero 就是其中的典范。
我们利用这些先进技术推动了量子计算、数学、生命科学和算法发现领域的重大进展。我们致力于继续深化基础研究的范围和强度,努力发明实现人工智能(AGI)所必需的下一波突破。
这一雄心壮志推动着我们努力将我们最重要的多模态模型--双子座 2.5 Pro--发展成为一个 "世界模型"。这种先进的系统将能够通过理解和模拟现实世界的动态来制定计划和设想新的情景,从而反映出大脑自身的过程。
我们一直在朝着这个方向努力。从训练代理擅长围棋和星际争霸等复杂游戏的早期突破,到精灵 2 的诞生--该系统可通过单张图像提示生成交互式三维环境。
我们已经看到了这些能力的出现。例如,"双子座 "利用世界知识和推理来表现和模拟自然环境,"Veo "展示了对物理学的直观把握,而 "双子座机器人 "能让机器学习抓取、服从命令并实时调整。
将 "双子座 "转化为世界模型,是迈向新型人工智能的关键一步--新型人工智能将更具通用性和实用性。我们设想了一个通用的人工智能助手:一个智能实体,它能理解你的语境,并能在你的所有设备上无缝地为你计划和执行行动。
将 Project Astra 的实时功能集成到我们的产品中
我们的最终目标是将 Gemini 应用程序改造成一个通用的人工智能助手,它能处理日常琐事、管理日常行政事务并提供吸引人的建议--最终提高我们的工作效率,改善我们的日常生活。
第一步是整合我们在去年的研究原型项目 Astra 中初步展示的功能,包括视频理解、屏幕共享和记忆。
去年,我们已将类似功能集成到 Gemini Live 中,供更多人使用。我们不断追求技术创新。增强功能包括通过本机音频实现更自然的语音输出、改进记忆功能以及增加计算机控制功能。
目前,我们正在收集部分测试人员对这些功能的反馈意见,并准备将其引入 Gemini Live、新的搜索体验、面向开发人员的 Live API 以及智能眼镜等新型硬件。
在开发的每个阶段,安全和责任都是我们的首要任务。我们最近完成了一项广泛的研究计划,对高级人工智能助手的道德考虑因素进行了研究,这些见解将继续指导我们的研究、开发和部署战略。
开发可为您处理多项任务的人工智能
通过 "水手项目",我们还在研究基于代理的系统如何协助完成多任务。该研究原型从网页浏览器入手,探索人类与代理协作的未来。
自去年 12 月首次推出 "水手项目 "以来,我们与一批值得信赖的测试人员密切合作,不断完善其实验功能。
更新后的 "水手计划 "现在拥有一个协调的代理团队,能够同时执行多达十项不同的任务。这些代理可以同时协助进行信息检索、预约、网上购物、研究等。
美国的谷歌人工智能超级用户现在可以使用增强版 Project Mariner。我们正在将其计算机交互功能纳入双子座应用程序接口,并计划在全年内在谷歌的产品生态系统中引入更多的功能。了解我们在搜索和 Gemini 应用程序中的代理功能的更多信息。
通过这项计划和我们所有的开拓性工作,我们正在创造越来越个性化、主动和强大的人工智能。这项技术旨在丰富我们的生活,加快科学进步的速度,并预示着一个新的发现和创新时代的到来。

WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
巴里·迪勒:随着通用人工智能的临近,对萨姆·阿尔特曼的信任已无关紧要
尽管近期有报道暗示相反的情况,但亿万富翁、媒体大亨巴里·迪勒并不认为OpenAI首席执行官山姆·阿尔特曼不可信。本周,迪勒在《华尔街日报》举办的“万物未来”峰会上发表演讲时,为阿尔特曼进行了辩护。此前,阿尔特曼曾遭到一些前同事和董事会成员的指责,称其有时会采取操纵和欺骗手段。作为阿尔特曼的朋友,迪勒是在回答一个关于人们是否应该信任阿尔特曼以确保人工智能造福人类的问题时作出上述表态的。具体而言,提问
Also langsam geht's los, oder? 😅 Meta hat mit der Transformer-Architektur echt den Grundstein für die aktuelle KI-Welle gelegt. Spannend zu sehen, ob sie jetzt mit ihrem universellen Assistenten auch bei den Endnutzern punkten können – oder ob das wieder nur ein Wettrennen um die größte Parameterzahl wird. Die Agentensysteme haben ja Potenzial, aber hoffentlich bleibt die Ethik dabei nicht auf der Strecke.





首页






