蚂蚁集团开源了其多模态人工智能模型明闪全能2.0。据报道，该模型在视觉语言理解、图像编辑和音频生成等基准测试中超越了Ge - xix.ai

工具

模型

大语言模型

多模态模型

提示词

图片提示词

新闻

提交收录

English 日本語 한국어 Português español Deutsch Русский Français 繁體中文简体中文

登录注册

工具

模型

大语言模型

多模态模型

提示词

图片提示词

新闻

提交收录

创建账号登录

简体中文

设置

English EN 日本語 JA 한국어 KO Português PT español ES Deutsch DE Русский RU Français FR 繁體中文 ZH-TW 简体中文 ZH-CN

首页

快讯

内容

MarkSanchez

MarkSanchez

2026-02-11

蚂蚁集团开源了其多模态人工智能模型明闪全能2.0。据报道，该模型在视觉语言理解、图像编辑和音频生成等基准测试中超越了Gemini 2.5 Pro等模型。其关键特性在于统一音频生成能力，可通过自然语言提示在单音轨上生成语音、音效及音乐。该模型基于MoE架构的Ling 2.0构建，旨在为开发者提供可复用的基础框架，从而简化多模态应用开发流程。

蚂蚁集团开源了其多模态人工智能模型明闪全能2.0。据报道，该模型在视觉语言理解、图像编辑和音频生成等基准测试中超越了Gemini 2.5 Pro等模型。其关键特性在于统一音频生成能力，可通过自然语言提示在单音轨上生成语音、音效及音乐。该模型基于MoE架构的Ling 2.0构建，旨在为开发者提供可复用的基础框架，从而简化多模态应用开发流程。

分享点击复制链接

评论 (0)

0/300

提交

作者 BillyMartinez

BillyMartinez 2026-06-08

阿里巴巴对其AI业务进行了重组，将通义大模型团队和未来生活实验室合并到了由吴永明CEO领导的新Token Foundry团队中。周景仁被任命为首席科学家，负责领导AI未来研究院的工作。Qwen-3.7模型在编码能力方面在全球范围内排名前三。目前，阿里巴巴的AI业务已经进入了商业化回报阶段。

/zh/live/5034

作者 BruceSmith

BruceSmith 2026-06-08

腾讯混元与多家顶尖研究机构共同推出了MMAE，这是首个针对指令驱动式音频编辑的大规模基准测试工具。测试结果显示，当前的人工智能模型在精确匹配音频内容方面的准确率低于5%，这一数据凸显了现有技术在精准音频处理领域存在的显著缺陷。MMAE采用了2000个真实音频样本以及17,741项评估指标，来全面衡量声音、音乐和语音编辑任务的准确性。

作者 EricYoung

EricYoung 2026-06-08

盛书科技与华策影视建立了战略合作伙伴关系，共同推出了一个由盛书的Vidu视频生成模型支持的AI视听创作中心。他们的目标是将AI虚拟制作技术与传统拍摄方式相结合，开发AI电影和电视制作课程，并通过现场拍摄与AI技术的结合来提升效率、降低成本，从而推动电影制作的智能化和工业化进程。

作者 MarkSanchez

MarkSanchez 2026-06-08

快看漫画宣布推出了由创始人陈安妮主导开发的AI数字生活产品Livo，该产品的目标是利用AIGC技术将13000个漫画IP转化为一个自给自足的数字世界。目前Livo正处于测试阶段，它具备感知能力、实时交互功能以及情感响应机制，通过改变付费模式，从按章节付费转变为按体验和互动关系付费，从而有效提升用户的平均收入。

作者 RogerMartinez

RogerMartinez 2026-06-08

小米在17T系列发布会上推出了这款人形机器人，展示了它自主抓取手机以及通过音量键控制缩放的功能。该机器人的研发工作始于2017年，此前已经推出了“铁蛋”和“铁大”两个型号，同时还在2023年成立了一家机器人公司。今年3月，这种机器人在一家汽车工厂进行了连续3小时的测试，成功率达到90.2%。经过升级的CyberOne仿生手能够将音量降低60%，同时显著提升操作灵活性。这一进展表明，小米的人形机器人技术正在从工业应用领域向日常服务场景快速拓展，有望加速机器人的产业化进程。

/zh/live/5030

登录注册

OR

记住我忘记密码?

登录

请输入图形验证码

注册