DeepMind 最新人工智能巧妙解决复杂的数学和科学问题
谷歌著名的人工智能研究部门 DeepMind 推出了 AlphaEvolve,这是一个创新系统,旨在通过可验证的解决方案解决复杂的计算问题。早期测试表明,该系统在优化谷歌人工智能训练基础设施方面的应用前景广阔,目前正在计划开发用户界面,并在可能广泛发布之前启动学术预览计划。
人工智能系统通常要应对幻觉挑战,在这种情况下,概率架构会产生可信但不准确的输出。值得注意的是,一些现代模型与其前身相比,表现出更强的幻觉倾向。AlphaEvolve 引入了一个新颖的验证框架,通过自动评估来缓解这一问题--生成多个候选解决方案,对它们进行严格评估,并为响应的准确性打分。
虽然 AlphaEvolve 并非第一个采用这种方法的系统,但它通过与 Gemini 模型的集成脱颖而出,从而实现了 DeepMind 所称的卓越性能。操作工作流程要求用户在输入问题的同时输入可选的上下文元素,如技术规范、代码示例或参考资料,以及解决方案评分的评估机制。

据DeepMind研究人员称,AlphaEvolve的目标用户是领域专家。
目前的功能主要集中在计算机科学和优化领域的算法求解挑战上,对于非数值问题存在固有的局限性。跨数学学科的性能基准显示,重新发现最优解的成功率为 75%,现有答案的改进率为 20%。
实际应用证明了资源优化的潜力,包括恢复谷歌基础设施的大量计算能力和缩短模型训练时间。虽然没有取得根本性突破,但该系统证明了其在提高运营效率方面的价值--自动化例行优化,使人类专家能够专注于更高价值的研究。
TechCrunch 人工智能大会
领先的行业会议,来自主要人工智能组织的演讲者将以 292 美元的价格全面介绍演讲、研讨会和交流机会。
提供展览空间,向 1200 多名技术决策者展示创新成果。
加利福尼亚州伯克利 6 月 5 日
初步评估表明,AlphaEvolve 最强大的价值主张在于增强而非取代人类的专业知识,将人工智能的计算优势与专业领域知识相结合,加速目标技术领域的解决方案开发。
相关文章
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
YouTube 测试基于人工智能的搜索功能,提供引导式答案
许多用户在搜索食谱或旅行计划时会转向YouTube,寻找相关视频。如今,该平台推出了一款由人工智能驱动的交互式搜索工具,能够提供融合文字和视频内容的分步搜索结果。借助全新的“Ask YouTube”功能,用户可以提出诸如“规划从旧金山到圣巴巴拉的3天自驾游”之类的问题,并获得结合了文字、短视频片段和长视频的分步结果——而非仅显示视频结果。YouTube表示,该功能将展示视频及相关片段,同时提供标题
相关专题推荐
评论 (1)
0/500
谷歌著名的人工智能研究部门 DeepMind 推出了 AlphaEvolve,这是一个创新系统,旨在通过可验证的解决方案解决复杂的计算问题。早期测试表明,该系统在优化谷歌人工智能训练基础设施方面的应用前景广阔,目前正在计划开发用户界面,并在可能广泛发布之前启动学术预览计划。
人工智能系统通常要应对幻觉挑战,在这种情况下,概率架构会产生可信但不准确的输出。值得注意的是,一些现代模型与其前身相比,表现出更强的幻觉倾向。AlphaEvolve 引入了一个新颖的验证框架,通过自动评估来缓解这一问题--生成多个候选解决方案,对它们进行严格评估,并为响应的准确性打分。
虽然 AlphaEvolve 并非第一个采用这种方法的系统,但它通过与 Gemini 模型的集成脱颖而出,从而实现了 DeepMind 所称的卓越性能。操作工作流程要求用户在输入问题的同时输入可选的上下文元素,如技术规范、代码示例或参考资料,以及解决方案评分的评估机制。

目前的功能主要集中在计算机科学和优化领域的算法求解挑战上,对于非数值问题存在固有的局限性。跨数学学科的性能基准显示,重新发现最优解的成功率为 75%,现有答案的改进率为 20%。
实际应用证明了资源优化的潜力,包括恢复谷歌基础设施的大量计算能力和缩短模型训练时间。虽然没有取得根本性突破,但该系统证明了其在提高运营效率方面的价值--自动化例行优化,使人类专家能够专注于更高价值的研究。
TechCrunch 人工智能大会
领先的行业会议,来自主要人工智能组织的演讲者将以 292 美元的价格全面介绍演讲、研讨会和交流机会。
提供展览空间,向 1200 多名技术决策者展示创新成果。
加利福尼亚州伯克利 6 月 5 日
初步评估表明,AlphaEvolve 最强大的价值主张在于增强而非取代人类的专业知识,将人工智能的计算优势与专业领域知识相结合,加速目标技术领域的解决方案开发。
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
YouTube将AI深度伪造检测功能扩展至政界人士、政府官员和记者
周二,YouTube宣布将把其深度伪造(deepfake)检测技术推广至部分政府官员、政治候选人和记者。该工具可识别由人工智能生成的肖像,并允许试点参与者申请删除其认为违反YouTube政策的未经授权内容。该检测系统在经过前期测试阶段后,于去年首次向约400万名YouTube合作伙伴计划的创作者推出。与YouTube现有的用于保护版权内容的Content ID系统类似,该肖像检测功能可识别AI模拟
YouTube 测试基于人工智能的搜索功能,提供引导式答案
许多用户在搜索食谱或旅行计划时会转向YouTube,寻找相关视频。如今,该平台推出了一款由人工智能驱动的交互式搜索工具,能够提供融合文字和视频内容的分步搜索结果。借助全新的“Ask YouTube”功能,用户可以提出诸如“规划从旧金山到圣巴巴拉的3天自驾游”之类的问题,并获得结合了文字、短视频片段和长视频的分步结果——而非仅显示视频结果。YouTube表示,该功能将展示视频及相关片段,同时提供标题





首页






