选项

发现高质量的人工智能工具

将全球领先的人工智能工具聚集在一起,以帮助提高工作效率

作者 BruceSmith

由BruceSmith发布的文章

共4篇文章
2026-06-08

腾讯混元与多家顶尖研究机构共同推出了MMAE,这是首个针对指令驱动式音频编辑的大规模基准测试工具。测试结果显示,当前的人工智能模型在精确匹配音频内容方面的准确率低于5%,这一数据凸显了现有技术在精准音频处理领域存在的显著缺陷。MMAE采用了2000个真实音频样本以及17,741项评估指标,来全面衡量声音、音乐和语音编辑任务的准确性。

腾讯混元与多家顶尖研究机构共同推出了MMAE,这是首个针对指令驱动式音频编辑的大规模基准测试工具。测试结果显示,当前的人工智能模型在精确匹配音频内容方面的准确率低于5%,这一数据凸显了现有技术在精准音频处理领域存在的显著缺陷。MMAE采用了2000个真实音频样本以及17,741项评估指标,来全面衡量声音、音乐和语音编辑任务的准确性。

腾讯混元与多家顶尖研究机构共同推出了MMAE,这是首个针对指令驱动式音频编辑的大规模基准测试工具。测试结果显示,当前的人工智能模型在精确匹配音频内容方面的准确率低于5%,这一数据凸显了现有技术在精准音频处理领域存在的显著缺陷。MMAE采用了2000个真实音频样本以及17,741项评估指标,来全面衡量声音、音乐和语音编辑任务的准确性。
2026-06-08

谷歌Chrome 149版本新增了一键禁用设备端人工智能功能的选项,这样可以避免自动下载占用大量磁盘空间的4GB模型文件,而这些文件此前需要用户手动删除。禁用该功能后,系统将不再重新下载这些模型,并清除已缓存的模型数据,从而为使用多个版本的Chrome用户带来便利。

谷歌Chrome 149版本新增了一键禁用设备端人工智能功能的选项,这样可以避免自动下载占用大量磁盘空间的4GB模型文件,而这些文件此前需要用户手动删除。禁用该功能后,系统将不再重新下载这些模型,并清除已缓存的模型数据,从而为使用多个版本的Chrome用户带来便利。

谷歌Chrome 149版本新增了一键禁用设备端人工智能功能的选项,这样可以避免自动下载占用大量磁盘空间的4GB模型文件,而这些文件此前需要用户手动删除。禁用该功能后,系统将不再重新下载这些模型,并清除已缓存的模型数据,从而为使用多个版本的Chrome用户带来便利。
2026-05-21

SpaceX已向纳斯达克提交首次公开募股(IPO)申请,并披露了其财务数据。其Starlink卫星通信业务现已成为核心利润来源,拥有1030万用户,2026年第一季度营收达32.6亿美元,营业利润达11.9亿美元。随着公司计划建设集成式太空数据中心,传统航空航天业务和新成立的人工智能业务分别录得6.62亿美元和24.7亿美元的巨额亏损。

SpaceX已向纳斯达克提交首次公开募股(IPO)申请,并披露了其财务数据。其Starlink卫星通信业务现已成为核心利润来源,拥有1030万用户,2026年第一季度营收达32.6亿美元,营业利润达11.9亿美元。随着公司计划建设集成式太空数据中心,传统航空航天业务和新成立的人工智能业务分别录得6.62亿美元和24.7亿美元的巨额亏损。

SpaceX已向纳斯达克提交首次公开募股(IPO)申请,并披露了其财务数据。其Starlink卫星通信业务现已成为核心利润来源,拥有1030万用户,2026年第一季度营收达32.6亿美元,营业利润达11.9亿美元。随着公司计划建设集成式太空数据中心,传统航空航天业务和新成立的人工智能业务分别录得6.62亿美元和24.7亿美元的巨额亏损。
2026-03-24

阿里巴巴发布了PrismAudio,这是一个全新的视频转音频框架,能够为视频生成同步且高质量的环境音效。该框架已被ICLR 2026录用,采用“思维链”分析流程和多教师评分系统。这个拥有5.18亿参数的轻量级模型,仅需0.63秒即可为一段9秒的视频生成音频。

阿里巴巴发布了PrismAudio,这是一个全新的视频转音频框架,能够为视频生成同步且高质量的环境音效。该框架已被ICLR 2026录用,采用“思维链”分析流程和多教师评分系统。这个拥有5.18亿参数的轻量级模型,仅需0.63秒即可为一段9秒的视频生成音频。

阿里巴巴发布了PrismAudio,这是一个全新的视频转音频框架,能够为视频生成同步且高质量的环境音效。该框架已被ICLR 2026录用,采用“思维链”分析流程和多教师评分系统。这个拥有5.18亿参数的轻量级模型,仅需0.63秒即可为一段9秒的视频生成音频。
OR