誰決定人工智慧向你傳達什麼訊息?前 Meta 新聞總監坎貝爾·布朗就此發表看法。

在整個職業生涯中,坎貝爾·布朗始終致力於追求準確的資訊——起初身為備受讚譽的電視記者,後來則擔任 Facebook 首位且唯一專職的新聞主管。如今,隨著人工智慧重塑人們獲取資訊的方式,她發現歷史似乎正威脅著重演。這次,她不再坐等他人來解決問題。
她創辦的公司 Forum AI——她最近在舊金山的 StrictlyVC 晚會上與 TechCrunch 的 Tim Fernholz 討論了這家公司——專門評估基礎模型在所謂「高風險議題」上的表現:地緣政治、心理健康、金融以及招聘。這些都是「沒有明確是非對錯答案、充滿模糊性、細微差異且極其複雜」的領域。
其方法是網羅全球頂尖專家,請他們設計基準測試,然後訓練人工智慧評審員來大規模評估模型。 針對 Forum AI 的地緣政治研究,布朗(Brown)已招募尼爾·弗格森(Niall Ferguson)、法里德·扎卡里亞(Fareed Zakaria)、前國務卿托尼·布林肯(Tony Blinken)、前眾議院議長凱文·麥卡錫(Kevin McCarthy),以及曾於歐巴馬政府時期負責網路安全事務的安妮·紐伯格(Anne Neuberger)。目標是讓 AI 評審與這些人類專家之間達成約 90% 的共識——她表示 Forum AI 已達到此門檻。
布朗將17個月前在紐約成立的Forum AI的起源,追溯到一個特定的時刻。「ChatGPT首次公開發布時,我正在Meta工作,」她回憶道,「我記得不久後就意識到,這將成為所有資訊流動的漩渦。而它的表現並不理想。」這對她自己孩子可能造成的影響,讓那一刻感覺幾乎關乎生存。 「如果我們找不到解決辦法,我的孩子們將變得非常愚蠢,」她記得當時是這麼想的。
最令她感到沮喪的是,似乎沒有人將準確性視為優先考量。她表示,基礎模型公司「極度專注於程式設計和數學」,而新聞與資訊的處理則更具挑戰性。但她強調,難度高並不代表可以忽略。
事實上,當 Forum AI 開始評估主流模型時,研究結果並不如預期樂觀。她舉例指出,Gemini 會從中國共產黨網站擷取內容「來生成與中國毫無關聯的新聞」,並發現幾乎所有模型都存在左傾的政治偏見。她表示,更微妙的失誤也比比皆是,包括缺乏上下文、缺乏多元視角,以及在未經說明的情況下對論點進行「稻草人謬誤」。 「還有很長的路要走,」她說。「但我認為也有一些非常簡單的修正措施,能大幅改善結果。」
布朗曾在 Facebook 工作多年,親眼目睹當平台以錯誤的指標進行優化時會發生什麼。「我們嘗試過許多事情,但都失敗了,」她告訴費恩霍爾茲。她建立的事實查核計畫如今已不復存在。這堂教訓——即使社群媒體對此視而不見——就是以互動率為優化目標,不僅對社會造成損害,也讓許多人變得更不了解真相。
她希望人工智慧能打破這個惡性循環。「目前情況尚難預料,」她表示;企業既可能給用戶他們想要的內容,也可能「提供真實、誠實且符合事實的資訊」。她承認,這種理想化的版本——人工智慧以真相為優化目標——聽起來或許有些天真。但她認為,企業在此事上或許會成為意想不到的盟友。 那些將人工智慧應用於信用評估、貸款、保險及招聘的企業,十分重視法律責任,因此「他們會希望你以確保準確性為優化目標。」
Forum AI 正是押注於這項企業需求來經營業務,儘管將合規需求轉化為穩定收入仍是一大挑戰,特別是當前市場大多仍滿足於勾選式審計和標準化基準——而布朗認為這些做法遠遠不夠。
她表示,目前的合規環境簡直是「一場笑話」。當紐約市通過首部要求進行AI審計的招聘偏見法時,州審計長發現超過半數的企業存在未被察覺的違規行為。她指出,真正的評估需要領域專業知識,不僅要處理已知的場景,還得應對那些「可能讓你陷入人們未曾預料到的麻煩」的邊界案例。 而這項工作需要時間。「聰明的通才是不夠的。」
布朗——其公司去年秋季由 Lerer Hippeau 領投籌得 300 萬美元——處於獨特的位置,能夠描述 AI 產業的自我形象與大多數用戶現實之間的脫節。「你會聽到大型科技公司領導人的說法:『這項技術將改變世界』、『它會讓你失業』、『它將治癒癌症』,」她說。 「但對只是用聊天機器人提問的普通人來說,他們得到的依然是大量雜亂無章且錯誤的答案。」
大眾對人工智慧的信任度處於極低的水準,而她認為這種懷疑態度在許多情況下是合理的。「矽谷的討論圍繞著某個主題展開,但消費者間的討論卻截然不同。」
相關文章
StrictlyVC 舊金山站將於下週重返
StrictlyVC 今年在舊金山的首場活動即將登場,距離報名截止僅剩一週。4月30日,風險投資界與創業家社群將齊聚 Sentro Filipino 文化中心,共度一個充滿 StrictlyVC 招牌特色的夜晚:與頂尖講者進行發人深省的討論,以及能帶來實際成果的寶貴交流機會。我們非常興奮地宣布,Eclipse 創辦人暨執行長 Lior Susan 將加入我們的講者陣容。他近期剛籌得 13 億美元資
Anthropic的收入大幅增長,其市值接近萬億美元大關
有報告顯示,Anthropic在短短几個月內就實現了顯著的收入增長。該公司的年化收入現已超過300億美元,這一數字是去年底時的三倍多。這種增長可能會讓Anthropic在競爭中略佔優勢,不過直接進行比較並不容易。其主要推動力在於Claude Code和Cowork產品,以及其推理模型的代幣銷售量增加。更值得注意的是,Anthropic的利潤率也有了顯著提升。該公司的毛利率從2024年的-94%上升到了2025年的+40%,而年化收入也從不到10億美元增長到了90億美元。正是這種發展勢頭,使得A
蘋果移除了Cal AI應用程式,原因是該應用存在未經授權的店內購買行為以及欺詐性計費問題。
蘋果最近移除了MyFitnessPal中頗受歡迎的人工智慧食物追蹤應用Cal AI,這一舉動凸顯了其對App Store關於外部支付和訂閱政策的嚴格執行。該應用每年能帶來5000萬美元的重複收入,曾因違反多項開發者指南而被暫時下架,但在解決了相關問題後已重新上線。有報道稱,儘管Epic Games訴蘋果的案件允許美國開發者連結到外部支付系統,但蘋果指出Cal AI存在嚴重的合規問題。其主要違規行為在於:該應用試圖透過嵌入Stripe等第三方支付流程來繞過蘋果的應用內購買機制以解鎖數字內容,卻未
相關專題推薦
評論 (0)
0/500

在整個職業生涯中,坎貝爾·布朗始終致力於追求準確的資訊——起初身為備受讚譽的電視記者,後來則擔任 Facebook 首位且唯一專職的新聞主管。如今,隨著人工智慧重塑人們獲取資訊的方式,她發現歷史似乎正威脅著重演。這次,她不再坐等他人來解決問題。
她創辦的公司 Forum AI——她最近在舊金山的 StrictlyVC 晚會上與 TechCrunch 的 Tim Fernholz 討論了這家公司——專門評估基礎模型在所謂「高風險議題」上的表現:地緣政治、心理健康、金融以及招聘。這些都是「沒有明確是非對錯答案、充滿模糊性、細微差異且極其複雜」的領域。
其方法是網羅全球頂尖專家,請他們設計基準測試,然後訓練人工智慧評審員來大規模評估模型。 針對 Forum AI 的地緣政治研究,布朗(Brown)已招募尼爾·弗格森(Niall Ferguson)、法里德·扎卡里亞(Fareed Zakaria)、前國務卿托尼·布林肯(Tony Blinken)、前眾議院議長凱文·麥卡錫(Kevin McCarthy),以及曾於歐巴馬政府時期負責網路安全事務的安妮·紐伯格(Anne Neuberger)。目標是讓 AI 評審與這些人類專家之間達成約 90% 的共識——她表示 Forum AI 已達到此門檻。
布朗將17個月前在紐約成立的Forum AI的起源,追溯到一個特定的時刻。「ChatGPT首次公開發布時,我正在Meta工作,」她回憶道,「我記得不久後就意識到,這將成為所有資訊流動的漩渦。而它的表現並不理想。」這對她自己孩子可能造成的影響,讓那一刻感覺幾乎關乎生存。 「如果我們找不到解決辦法,我的孩子們將變得非常愚蠢,」她記得當時是這麼想的。
最令她感到沮喪的是,似乎沒有人將準確性視為優先考量。她表示,基礎模型公司「極度專注於程式設計和數學」,而新聞與資訊的處理則更具挑戰性。但她強調,難度高並不代表可以忽略。
事實上,當 Forum AI 開始評估主流模型時,研究結果並不如預期樂觀。她舉例指出,Gemini 會從中國共產黨網站擷取內容「來生成與中國毫無關聯的新聞」,並發現幾乎所有模型都存在左傾的政治偏見。她表示,更微妙的失誤也比比皆是,包括缺乏上下文、缺乏多元視角,以及在未經說明的情況下對論點進行「稻草人謬誤」。 「還有很長的路要走,」她說。「但我認為也有一些非常簡單的修正措施,能大幅改善結果。」
布朗曾在 Facebook 工作多年,親眼目睹當平台以錯誤的指標進行優化時會發生什麼。「我們嘗試過許多事情,但都失敗了,」她告訴費恩霍爾茲。她建立的事實查核計畫如今已不復存在。這堂教訓——即使社群媒體對此視而不見——就是以互動率為優化目標,不僅對社會造成損害,也讓許多人變得更不了解真相。
她希望人工智慧能打破這個惡性循環。「目前情況尚難預料,」她表示;企業既可能給用戶他們想要的內容,也可能「提供真實、誠實且符合事實的資訊」。她承認,這種理想化的版本——人工智慧以真相為優化目標——聽起來或許有些天真。但她認為,企業在此事上或許會成為意想不到的盟友。 那些將人工智慧應用於信用評估、貸款、保險及招聘的企業,十分重視法律責任,因此「他們會希望你以確保準確性為優化目標。」
Forum AI 正是押注於這項企業需求來經營業務,儘管將合規需求轉化為穩定收入仍是一大挑戰,特別是當前市場大多仍滿足於勾選式審計和標準化基準——而布朗認為這些做法遠遠不夠。
她表示,目前的合規環境簡直是「一場笑話」。當紐約市通過首部要求進行AI審計的招聘偏見法時,州審計長發現超過半數的企業存在未被察覺的違規行為。她指出,真正的評估需要領域專業知識,不僅要處理已知的場景,還得應對那些「可能讓你陷入人們未曾預料到的麻煩」的邊界案例。 而這項工作需要時間。「聰明的通才是不夠的。」
布朗——其公司去年秋季由 Lerer Hippeau 領投籌得 300 萬美元——處於獨特的位置,能夠描述 AI 產業的自我形象與大多數用戶現實之間的脫節。「你會聽到大型科技公司領導人的說法:『這項技術將改變世界』、『它會讓你失業』、『它將治癒癌症』,」她說。 「但對只是用聊天機器人提問的普通人來說,他們得到的依然是大量雜亂無章且錯誤的答案。」
大眾對人工智慧的信任度處於極低的水準,而她認為這種懷疑態度在許多情況下是合理的。「矽谷的討論圍繞著某個主題展開,但消費者間的討論卻截然不同。」
StrictlyVC 舊金山站將於下週重返
StrictlyVC 今年在舊金山的首場活動即將登場,距離報名截止僅剩一週。4月30日,風險投資界與創業家社群將齊聚 Sentro Filipino 文化中心,共度一個充滿 StrictlyVC 招牌特色的夜晚:與頂尖講者進行發人深省的討論,以及能帶來實際成果的寶貴交流機會。我們非常興奮地宣布,Eclipse 創辦人暨執行長 Lior Susan 將加入我們的講者陣容。他近期剛籌得 13 億美元資
Anthropic的收入大幅增長,其市值接近萬億美元大關
有報告顯示,Anthropic在短短几個月內就實現了顯著的收入增長。該公司的年化收入現已超過300億美元,這一數字是去年底時的三倍多。這種增長可能會讓Anthropic在競爭中略佔優勢,不過直接進行比較並不容易。其主要推動力在於Claude Code和Cowork產品,以及其推理模型的代幣銷售量增加。更值得注意的是,Anthropic的利潤率也有了顯著提升。該公司的毛利率從2024年的-94%上升到了2025年的+40%,而年化收入也從不到10億美元增長到了90億美元。正是這種發展勢頭,使得A
蘋果移除了Cal AI應用程式,原因是該應用存在未經授權的店內購買行為以及欺詐性計費問題。
蘋果最近移除了MyFitnessPal中頗受歡迎的人工智慧食物追蹤應用Cal AI,這一舉動凸顯了其對App Store關於外部支付和訂閱政策的嚴格執行。該應用每年能帶來5000萬美元的重複收入,曾因違反多項開發者指南而被暫時下架,但在解決了相關問題後已重新上線。有報道稱,儘管Epic Games訴蘋果的案件允許美國開發者連結到外部支付系統,但蘋果指出Cal AI存在嚴重的合規問題。其主要違規行為在於:該應用試圖透過嵌入Stripe等第三方支付流程來繞過蘋果的應用內購買機制以解鎖數字內容,卻未





首頁






