微軟的 MAI-Image-2 人工智慧模型在全球文字轉圖像領域中名列前三
微軟人工智慧總監穆斯塔法·蘇萊曼(Mustafa Suleiman)宣布推出第二代影像生成模型 MAI-Image-2。這款新模型在權威的 LMArena 基準測試中表現亮眼,一舉躍居全球第三名。

在常被稱為人工智慧圖像生成「終極試金石」的 LMArena 排行榜上,MAI-Image-2 迅速引起了廣泛關注。目前其排名僅次於 Google 的 Gemini-3.1-flash-image-preview 以及 OpenAI 的 GPT-image-1.5-high-fidelity。 相較於2025年10月推出的第一代模型(最初排名第九),此第二代版本在整體輸出品質上實現了根本性的飛躍。

技術突破:解決「文字混亂」問題
MAI-Image-2 在視覺表現上取得顯著提升,同時解決了業界長期面臨的挑戰:在 AI 生成的圖像中精準呈現文字。
精準文字渲染:該模型在處理資訊圖表、簡報投影片及含文字的複雜邏輯圖表方面展現重大升級,能生成清晰可讀且無損的文字。
超寫實細節:它能精準重現自然光線、逼真的肌膚紋理,並建構遵循物理定律的栩栩如生環境。
電影級構圖:支援生成具備超現實概念、精緻構圖及宏大視覺敘事的超高解析度影像。

微軟正迅速將這項頂尖功能提供給使用者:
立即體驗:使用者現可登入 MAI Playground 平台進行免費試用。
廣泛整合:MAI-Image-2 正逐步整合至 Copilot 和 Bing Image Creator,這將使數百萬一般用戶很快就能直接透過這些工具,將其應用於工作與創意專案中。
此次發布鞏固了微軟在多模態 AI 領域的頂尖地位。透過解決文字渲染的核心難題,它顯著擴展了 AI 圖像生成在專業及辦公應用場景中的應用範圍。
相關文章
首個山東百度AI漫畫劇集創作基地在淄博正式啟動
4月27日,山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」,標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章,旨在透過AI技術與文化創作教育的深度融合,探索培育數位文化創作人才的創新模式。在揭牌儀式上,校方代表強調,該基地將作為創新人才培育及深化政校企合作的重要平台。 展望未來,該校計劃將真實的專案案例引入課堂,擺脫傳統教學方法,建立一個完整的專案式教學循
桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元
隨著市場對能大規模提供 AI 運算能力的資料中心需求激增,由 Nvidia 支持的英國 AI 基礎設施公司 Nscale 估值已達 146 億美元。這使該公司與 Helsing 及 Mistral AI 並列,成為歐洲最新的「獨角獸」企業之一。Nscale 的策略核心在於垂直整合,涵蓋能源、資料中心、運算及調度軟體等領域。 此次估值是基於一輪20億美元的C輪融資,該公司稱此為「歐洲史上最大規模」,
Runway 53 億美元估值挑戰 Google,其影片 AI 技術已超越語言 AI
儘管多數人工智慧巨頭已投入數十億美元於語言模型,生成式人工智慧影片新創公司 Runway 卻正沿著截然不同的道路勇往直前。根據 TechCrunch 報導,這家由藝術學院畢業生創立的年輕公司,目前估值已達 53 億美元。近期財務數據顯示,Runway 在 2026 年第二季新增了 4,000 萬美元的年度經常性收入(ARR)。憑藉其新推出的 Gen-4.5 影片生成模型,該公司不僅鞏固了在好萊塢電
相關專題推薦
評論 (1)
0/500
Just read about Microsoft's MAI-Image-2 hitting top 3 on LMArena. As a hobbyist who dabbles with DALL-E and Midjourney, this direct benchmark climb is wild! 😲 Makes me wonder how this shakes up the 'Big Model' race... are we heading for a costly quality war, or will this push open-source models further behind? The compute costs alone must be staggering.
微軟人工智慧總監穆斯塔法·蘇萊曼(Mustafa Suleiman)宣布推出第二代影像生成模型 MAI-Image-2。這款新模型在權威的 LMArena 基準測試中表現亮眼,一舉躍居全球第三名。

在常被稱為人工智慧圖像生成「終極試金石」的 LMArena 排行榜上,MAI-Image-2 迅速引起了廣泛關注。目前其排名僅次於 Google 的 Gemini-3.1-flash-image-preview 以及 OpenAI 的 GPT-image-1.5-high-fidelity。 相較於2025年10月推出的第一代模型(最初排名第九),此第二代版本在整體輸出品質上實現了根本性的飛躍。

技術突破:解決「文字混亂」問題
MAI-Image-2 在視覺表現上取得顯著提升,同時解決了業界長期面臨的挑戰:在 AI 生成的圖像中精準呈現文字。
精準文字渲染:該模型在處理資訊圖表、簡報投影片及含文字的複雜邏輯圖表方面展現重大升級,能生成清晰可讀且無損的文字。
超寫實細節:它能精準重現自然光線、逼真的肌膚紋理,並建構遵循物理定律的栩栩如生環境。
電影級構圖:支援生成具備超現實概念、精緻構圖及宏大視覺敘事的超高解析度影像。

微軟正迅速將這項頂尖功能提供給使用者:
立即體驗:使用者現可登入 MAI Playground 平台進行免費試用。
廣泛整合:MAI-Image-2 正逐步整合至 Copilot 和 Bing Image Creator,這將使數百萬一般用戶很快就能直接透過這些工具,將其應用於工作與創意專案中。
此次發布鞏固了微軟在多模態 AI 領域的頂尖地位。透過解決文字渲染的核心難題,它顯著擴展了 AI 圖像生成在專業及辦公應用場景中的應用範圍。
首個山東百度AI漫畫劇集創作基地在淄博正式啟動
4月27日,山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」,標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章,旨在透過AI技術與文化創作教育的深度融合,探索培育數位文化創作人才的創新模式。在揭牌儀式上,校方代表強調,該基地將作為創新人才培育及深化政校企合作的重要平台。 展望未來,該校計劃將真實的專案案例引入課堂,擺脫傳統教學方法,建立一個完整的專案式教學循
桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元
隨著市場對能大規模提供 AI 運算能力的資料中心需求激增,由 Nvidia 支持的英國 AI 基礎設施公司 Nscale 估值已達 146 億美元。這使該公司與 Helsing 及 Mistral AI 並列,成為歐洲最新的「獨角獸」企業之一。Nscale 的策略核心在於垂直整合,涵蓋能源、資料中心、運算及調度軟體等領域。 此次估值是基於一輪20億美元的C輪融資,該公司稱此為「歐洲史上最大規模」,
Runway 53 億美元估值挑戰 Google,其影片 AI 技術已超越語言 AI
儘管多數人工智慧巨頭已投入數十億美元於語言模型,生成式人工智慧影片新創公司 Runway 卻正沿著截然不同的道路勇往直前。根據 TechCrunch 報導,這家由藝術學院畢業生創立的年輕公司,目前估值已達 53 億美元。近期財務數據顯示,Runway 在 2026 年第二季新增了 4,000 萬美元的年度經常性收入(ARR)。憑藉其新推出的 Gen-4.5 影片生成模型,該公司不僅鞏固了在好萊塢電
Just read about Microsoft's MAI-Image-2 hitting top 3 on LMArena. As a hobbyist who dabbles with DALL-E and Midjourney, this direct benchmark climb is wild! 😲 Makes me wonder how this shakes up the 'Big Model' race... are we heading for a costly quality war, or will this push open-source models further behind? The compute costs alone must be staggering.





首頁






