Meta 通往通用 AI 助理之路
過去十年來,我們為現代人工智能時代建立了許多基礎元素。這包括首創 Transformer 架構 (如今已支援所有主要語言模型),以及開發能夠學習和制定策略的精密代理系統 (以 AlphaGo 和 AlphaZero 為例)。
我們利用這些先進的技術,推動量子運算、數學、生命科學和演算法發現的重大進展。我們將繼續深化基礎研究的範圍和力度,努力發明對實現人工智能 (AGI) 必不可少的下一波突破。
這一雄心壯志驅使我們努力將我們最重要的多模態模型 Gemini 2.5 Pro 演變成「世界模型」。這個先進的系統將能夠透過理解和模擬真實世界的動態,創造計劃和構想新的情境,並反映大腦本身的過程。
我們一直朝著這個方向邁進。從早期訓練代理程式擅長圍棋和星海爭霸等複雜遊戲的突破,到 Genie 2 系統的創造 - 從單一影像提示產生互動式 3D 環境。
我們已經見證了這些能力的出現。例如,Gemini 利用世界知識和推理來表示和模擬自然環境,Veo 展示了對物理學的直觀掌握,而 Gemini Robotics 則讓機器學習抓取、遵從指令並即時適應。
將 Gemini 轉換成一個世界模型,是邁向新人工智慧的關鍵一步 - 一個更通用、更實用的人工智慧。我們憧憬一個通用的人工智慧助理:一個能夠了解您的情境,並能夠為您規劃與執行行動的智慧實體,無縫跨越您所有的裝置。
將 Project Astra 的即時功能整合到我們的產品中
我們的最終目標是將 Gemini 應用程式重塑為通用的 AI 助理,可處理日常雜務、管理例行管理,並提供吸引人的建議,最終提高我們的生產力,改善我們的日常生活。
第一步是整合我們在去年的研究原型 Project Astra 上初步展示的功能,包括視訊理解、螢幕分享和記憶。
在過去的一年中,我們已將類似的功能整合到 Gemini Live 中,讓更多人可以在今天使用。我們對創新的追求持續走在科技的最前端。增強功能包括透過原生音訊提供更自然的語音輸出、精緻的記憶功能,以及新增電腦控制功能。
我們目前正從一群精選的測試者中收集這些功能的回饋意見,並準備將其引進 Gemini Live、新的搜尋體驗、開發人員的 Live API,以及智慧型眼鏡等新穎硬體。
在開發的每個階段,安全與責任仍是我們的首要任務。我們最近完成了一項廣泛的研究計畫,檢視先進人工智慧助理的道德考量,這些洞察力將持續指導我們的研究、開發與部署策略。
開發可為您處理多項任務的 AI
透過 Project Mariner,我們也在研究以代理為基礎的系統如何協助處理多重任務。這個研究原型從網頁瀏覽器開始,探索人類與代理合作的未來。
自從 Project Mariner 於去年 12 月首次推出以來,我們一直與一群值得信賴的測試人員密切合作,以精進其實驗功能。
更新後的 Project Mariner 現在擁有一個協調的代理團隊,能夠同時執行多達十項不同的任務。這些代理可協助進行資訊檢索、預約、線上購物、進行研究等,所有這些工作都可同時進行。
美國的 Google AI Ultra 訂閱者現在可以使用增強版的 Project Mariner。我們正將其電腦互動功能整合至 Gemini API,並計畫在今年內將更多功能引進 Google 的產品生態系統。進一步了解我們在 Search 和 Gemini 應用程式中的代理功能。
透過這項計畫以及我們所有的開創性工作,我們正在創造越來越個人化、主動化且功能強大的人工智慧。這項技術旨在豐富我們的生活,加快科學進步的速度,並預示一個探索與創新的新時代。





相關文章
Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖
Kakao Mobility 計畫內部開發第 4 級自動駕駛技術,作為其實體人工智慧策略的一環。在首爾COEX舉行的2026年世界資訊科技展(World IT Show)會議上,Kakao Mobility副總裁兼實體AI部門負責人金鎮奎(Kim Jin-kyu)發表了該發展藍圖。他的演講聚焦於實體AI時代以移動平台為核心的自動駕駛服務。據韓聯社報導,這場名為「超越構想,付諸行動:AI 推動現
巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
相關專題推薦
評論 (3)
0/500
Also langsam geht's los, oder? 😅 Meta hat mit der Transformer-Architektur echt den Grundstein für die aktuelle KI-Welle gelegt. Spannend zu sehen, ob sie jetzt mit ihrem universellen Assistenten auch bei den Endnutzern punkten können – oder ob das wieder nur ein Wettrennen um die größte Parameterzahl wird. Die Agentensysteme haben ja Potenzial, aber hoffentlich bleibt die Ethik dabei nicht auf der Strecke.
過去十年來,我們為現代人工智能時代建立了許多基礎元素。這包括首創 Transformer 架構 (如今已支援所有主要語言模型),以及開發能夠學習和制定策略的精密代理系統 (以 AlphaGo 和 AlphaZero 為例)。
我們利用這些先進的技術,推動量子運算、數學、生命科學和演算法發現的重大進展。我們將繼續深化基礎研究的範圍和力度,努力發明對實現人工智能 (AGI) 必不可少的下一波突破。
這一雄心壯志驅使我們努力將我們最重要的多模態模型 Gemini 2.5 Pro 演變成「世界模型」。這個先進的系統將能夠透過理解和模擬真實世界的動態,創造計劃和構想新的情境,並反映大腦本身的過程。
我們一直朝著這個方向邁進。從早期訓練代理程式擅長圍棋和星海爭霸等複雜遊戲的突破,到 Genie 2 系統的創造 - 從單一影像提示產生互動式 3D 環境。
我們已經見證了這些能力的出現。例如,Gemini 利用世界知識和推理來表示和模擬自然環境,Veo 展示了對物理學的直觀掌握,而 Gemini Robotics 則讓機器學習抓取、遵從指令並即時適應。
將 Gemini 轉換成一個世界模型,是邁向新人工智慧的關鍵一步 - 一個更通用、更實用的人工智慧。我們憧憬一個通用的人工智慧助理:一個能夠了解您的情境,並能夠為您規劃與執行行動的智慧實體,無縫跨越您所有的裝置。
將 Project Astra 的即時功能整合到我們的產品中
我們的最終目標是將 Gemini 應用程式重塑為通用的 AI 助理,可處理日常雜務、管理例行管理,並提供吸引人的建議,最終提高我們的生產力,改善我們的日常生活。
第一步是整合我們在去年的研究原型 Project Astra 上初步展示的功能,包括視訊理解、螢幕分享和記憶。
在過去的一年中,我們已將類似的功能整合到 Gemini Live 中,讓更多人可以在今天使用。我們對創新的追求持續走在科技的最前端。增強功能包括透過原生音訊提供更自然的語音輸出、精緻的記憶功能,以及新增電腦控制功能。
我們目前正從一群精選的測試者中收集這些功能的回饋意見,並準備將其引進 Gemini Live、新的搜尋體驗、開發人員的 Live API,以及智慧型眼鏡等新穎硬體。
在開發的每個階段,安全與責任仍是我們的首要任務。我們最近完成了一項廣泛的研究計畫,檢視先進人工智慧助理的道德考量,這些洞察力將持續指導我們的研究、開發與部署策略。
開發可為您處理多項任務的 AI
透過 Project Mariner,我們也在研究以代理為基礎的系統如何協助處理多重任務。這個研究原型從網頁瀏覽器開始,探索人類與代理合作的未來。
自從 Project Mariner 於去年 12 月首次推出以來,我們一直與一群值得信賴的測試人員密切合作,以精進其實驗功能。
更新後的 Project Mariner 現在擁有一個協調的代理團隊,能夠同時執行多達十項不同的任務。這些代理可協助進行資訊檢索、預約、線上購物、進行研究等,所有這些工作都可同時進行。
美國的 Google AI Ultra 訂閱者現在可以使用增強版的 Project Mariner。我們正將其電腦互動功能整合至 Gemini API,並計畫在今年內將更多功能引進 Google 的產品生態系統。進一步了解我們在 Search 和 Gemini 應用程式中的代理功能。
透過這項計畫以及我們所有的開創性工作,我們正在創造越來越個人化、主動化且功能強大的人工智慧。這項技術旨在豐富我們的生活,加快科學進步的速度,並預示一個探索與創新的新時代。

巴里·迪勒:隨著通用人工智慧(AGI)日益臨近,對山姆·奧特曼的信任已無關緊要
儘管近期有報導指出相反的看法,但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時,為奧特曼辯護;奧特曼此前曾遭到部分前同事和董事會成員指控,指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒,當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言,提問者探討了被稱為「通用人工智慧」(AGI)的理
YouTube 將 AI 深度偽造偵測功能擴展至政治人物、政府官員及記者
週二,YouTube 宣布將其深度偽造(deepfake)偵測技術擴展至特定群體,包括政府官員、政治候選人及記者。該工具能識別由人工智慧生成的肖像,並允許試點計畫的參與者要求移除其認為違反 YouTube 政策且未經授權的內容。該偵測系統在經過前期測試階段後,去年首度向約 400 萬名 YouTube 合作夥伴計畫的創作者推出。與 YouTube 現有的版權內容識別系統(Content ID)類似
Also langsam geht's los, oder? 😅 Meta hat mit der Transformer-Architektur echt den Grundstein für die aktuelle KI-Welle gelegt. Spannend zu sehen, ob sie jetzt mit ihrem universellen Assistenten auch bei den Endnutzern punkten können – oder ob das wieder nur ein Wettrennen um die größte Parameterzahl wird. Die Agentensysteme haben ja Potenzial, aber hoffentlich bleibt die Ethik dabei nicht auf der Strecke.





首頁






