8B
模型參數數量
Meta
附屬組織
開源
許可證類型
2024-04-18
發佈時間
模型簡介
Llama3 是 Meta 的最新開源大型語言模型,基於 15T 的語料庫訓練,支援 8K 的上下文長度,並針對有效性與安全性進行了最佳化。
向左向右滑動以查看更多
語言理解能力
通常會做出語義錯誤的判斷,從而導致響應中明顯的邏輯斷開連接。
4.3
知識覆蓋範圍
具有重要的知識盲點,經常顯示事實錯誤並重複過時的信息。
4.7
推理能力
無法維持連貫的推理鏈,通常會導致因果關係或錯誤估計。
2.4
模型比較
相關模型
Llama4-Maverick-17B-128E-Instruct
Llama 4 模型是使用專家混合 (MoE) 架構的自動累積語言模型,並結合了原生多模態的早期融合。
Llama4-Maverick-17B-128E-Instruct
Llama 4 模型是自回歸語言模型,採用專家混合(MoE)架構,並融入早期融合技術以實現原生多模態能力。
Llama3.1-8B-Instruct
Llama3.1 是多語言模型,具有顯著更長的上下文長度 128K,最先進的工具使用能力以及整體更強的推理能力。
Llama3.1-405B-Instruct-FP8
Llama 3.1 405B 是第一個在普通知識、可控性、數學、工具使用和多語言翻譯等尖端能力方面可與頂級 AI 模型相匹敵的開源模型。
Llama3.2-3B-Instruct
Llama 3.2 3B 模型支援長達 128K 個標記的上下文長度,並且在其設備端應用場景(如摘要、指令跟隨和重寫任務在邊緣本地運行)方面處於同類產品的領先地位。
相關文件
薩提亞·納德拉準備利用與OpenAI的新合作關係
週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能
廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Anthropic 的實驗性 AI「Claude」在電子商務測試中完成了談判與交易
隨著人工智慧的快速發展,Anthropic 上週五悄悄推出了一項名為「Project Deal」的內部實驗,展現了人工智慧在電子商務領域的潛力。該實驗讓其人工智慧模型 Claude 在封閉的市場環境中自主處理買賣及價格協商,並涉及真實的金融交易。實驗的核心是一個建構於 Slack 平台上的內部市場,Claude 在其中同時擔任買方與賣方的談判代表。它首先訪談了 69 名員工,以收集他們的買賣意圖及
DeepSeek Code 即將推出
隨著人工智慧技術的加速發展,DeepSeek 正處於一個令人振奮的轉捩點。這家人工智慧公司最近透露,已獲得超過 700 億元的資金。管理層強調,公司致力於突破性的人工智慧研究,而非追求眼前的商業利益。這一戰略轉向表明 DeepSeek 將全力投入新產品的開發,尤其是眾人矚目的 DeepSeek Code。DeepSeek Code 的規劃已逐漸成形,該公司職缺頁面已發布數個相關職位,例如「Agen
馬斯克的 Grok:1.5 兆個參數與游標程式碼吸收——是遊戲規則的改變者,還是虛張聲勢?
伊隆·馬斯克終於有所行動。在人工智慧程式設計的競賽中,OpenAI 和 Anthropic 正加速前進,而 xAI 似乎落後了。馬斯克曾多次表示其目標是與 Claude 抗衡,然而儘管 Grok4.X 系列已進行多次更新,成果在理論上看似不錯,但在實際應用中卻未能達標,兩者之間的差距幾乎未見縮小。不過,這次他握有一張新王牌。馬斯克在 X 平台上證實,Grok 的新版本即將問世。 這款基礎模型第九版





首頁
