Anthropisch enthüllt noch sein intelligentestes hybrides Argumentieren -KI -Modell
Anthropic hat gerade Claude 3.7 Sonnet vorgestellt, das Debüt seines ersten „Hybrid-Reasoning-Modells“. Dieses bahnbrechende Modell ist darauf ausgelegt, komplexere Herausforderungen zu bewältigen und übertrifft frühere Versionen bei Aufgaben wie Mathematik und Programmierung.
Ergänzend dazu startet Anthropic eine „eingeschränkte Forschungsvorschau“ von Claude Code, einem agentischen Programmierwerkzeug. Während Anthropic bereits KI-Programmierlösungen wie Cursor unterstützt, wird Claude Code als interaktiver Partner vermarktet, der Code suchen und lesen, Dateien bearbeiten, Tests schreiben und ausführen, Code auf GitHub hochladen und Befehlszeilenwerkzeuge nutzen kann.
Claude 3.7 Sonnet wird ab Montag in der Claude-App und über Anthropics API, Amazon Bedrock und Google Clouds Vertex AI verfügbar sein. Die Preise bleiben mit denen des Vorgängers, 3.5 Sonnet, gleich: 3 $ pro Million Eingabetoken und 15 $ pro Million Ausgabetoken.
Im Gegensatz zu Konkurrenten wie OpenAI, die separate Reasoning-Modelle anbieten, legt Anthropic Wert darauf, Reasoning-Fähigkeiten direkt in das Modell zu integrieren. Wie Dianne Penn, Anthropics Leiterin der Produktforschung, The Verge erklärte: „Wir glauben grundsätzlich, dass Reasoning eine Eigenschaft der KI ist und nicht etwas völlig Getrenntes.“ Claude sollte bei einfachen Anfragen wie „Wie spät ist es?“ kaum Probleme haben, glänzt jedoch bei komplexen Aufgaben wie der Planung einer zweiwöchigen Italienreise unter Berücksichtigung der Wetterbedingungen.
Anthropic
Anthropic
Penn betonte, dass Claude 3.7 Sonnet deutliche Verbesserungen im agentischen Programmieren, Finanzwesen und rechtlichen Angelegenheiten zeigt. Obwohl Claude noch keine Echtzeit-Websuchen unterstützt – eine Fähigkeit, die andere Modelle bieten – verfügt es über ein Wissensstand-Datum von Oktober 2024, was es aktueller macht. Entwickler können über die Scratchpad-Funktion beeinflussen, wie das Modell arbeitet, und exakte Antwortzeiten festlegen. „Manchmal“, sagte Anthropics Vizepräsident für Produkte, Michael Gerstenhaber, „muss der Entwickler nur angeben, dass die Antwort nicht länger als 200 Millisekunden dauern darf“, was eine strategische Produktentscheidung unterstreicht.
Intern hat das Anthropic-Personal das neue Modell genutzt, um Front-End-Websites zu entwerfen, interaktive Spiele zu erstellen und bis zu 45 Minuten Programmieraktivitäten durchzuführen, wie das Erstellen von Testsets und die iterative Verfeinerung von Testfällen, so Penn.

Claude Code. Anthropic
Penn erwähnte, dass Anthropic die Fähigkeiten seiner Modelle testet, indem es sie ein altes Pokémon-Videospiel spielen lässt und die API des Modells mit einer Controller-Schnittstelle verknüpft. Während Claude 3.5 Sonnet zunächst Mühe hatte, Pallet Town zu verlassen, besiegte Claude 3.7 mehrere Arenaleiter.
Elon Musks kürzliche Vorstellung von Grok-3 letzte Woche verdeutlichte das schnelle Tempo des KI-Modell-Wettbewerbs. Vorerst liegt Anthropic dank der beeindruckenden Leistung von Claude 3.7 Sonnet vorn. Die Veröffentlichung deutet auf eine Zukunft hin, in der ein einziges Modell alle Aufgaben bewältigt, anstatt spezialisierte Werkzeuge für verschiedene Funktionen zu benötigen.
Verwandter Artikel
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr
WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr
Kakao Mobility stellt einen Fahrplan für autonomes Fahren der Stufe 4 im Bereich der physischen KI vor
Kakao Mobility plant, im Rahmen seiner Strategie für physische KI Technologien für autonomes Fahren der Stufe 4 intern zu entwickeln.Auf der Konferenz „World IT Show 2026“ im COEX in Seoul stellte Ki
Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt
Barry Diller, der milliardenschwere Medienmogul, hält OpenAI-CEO Sam Altman nicht für unglaubwürdig, obwohl jüngste Berichte das Gegenteil nahelegen. Bei seiner Rede auf der „Future of Everything“-Kon
Empfehlungen zu verwandten Spezialthemen
Kommentare (4)
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。
Anthropic hat gerade Claude 3.7 Sonnet vorgestellt, das Debüt seines ersten „Hybrid-Reasoning-Modells“. Dieses bahnbrechende Modell ist darauf ausgelegt, komplexere Herausforderungen zu bewältigen und übertrifft frühere Versionen bei Aufgaben wie Mathematik und Programmierung.
Ergänzend dazu startet Anthropic eine „eingeschränkte Forschungsvorschau“ von Claude Code, einem agentischen Programmierwerkzeug. Während Anthropic bereits KI-Programmierlösungen wie Cursor unterstützt, wird Claude Code als interaktiver Partner vermarktet, der Code suchen und lesen, Dateien bearbeiten, Tests schreiben und ausführen, Code auf GitHub hochladen und Befehlszeilenwerkzeuge nutzen kann.
Claude 3.7 Sonnet wird ab Montag in der Claude-App und über Anthropics API, Amazon Bedrock und Google Clouds Vertex AI verfügbar sein. Die Preise bleiben mit denen des Vorgängers, 3.5 Sonnet, gleich: 3 $ pro Million Eingabetoken und 15 $ pro Million Ausgabetoken.
Im Gegensatz zu Konkurrenten wie OpenAI, die separate Reasoning-Modelle anbieten, legt Anthropic Wert darauf, Reasoning-Fähigkeiten direkt in das Modell zu integrieren. Wie Dianne Penn, Anthropics Leiterin der Produktforschung, The Verge erklärte: „Wir glauben grundsätzlich, dass Reasoning eine Eigenschaft der KI ist und nicht etwas völlig Getrenntes.“ Claude sollte bei einfachen Anfragen wie „Wie spät ist es?“ kaum Probleme haben, glänzt jedoch bei komplexen Aufgaben wie der Planung einer zweiwöchigen Italienreise unter Berücksichtigung der Wetterbedingungen.
Anthropic
Anthropic
Penn betonte, dass Claude 3.7 Sonnet deutliche Verbesserungen im agentischen Programmieren, Finanzwesen und rechtlichen Angelegenheiten zeigt. Obwohl Claude noch keine Echtzeit-Websuchen unterstützt – eine Fähigkeit, die andere Modelle bieten – verfügt es über ein Wissensstand-Datum von Oktober 2024, was es aktueller macht. Entwickler können über die Scratchpad-Funktion beeinflussen, wie das Modell arbeitet, und exakte Antwortzeiten festlegen. „Manchmal“, sagte Anthropics Vizepräsident für Produkte, Michael Gerstenhaber, „muss der Entwickler nur angeben, dass die Antwort nicht länger als 200 Millisekunden dauern darf“, was eine strategische Produktentscheidung unterstreicht.
Intern hat das Anthropic-Personal das neue Modell genutzt, um Front-End-Websites zu entwerfen, interaktive Spiele zu erstellen und bis zu 45 Minuten Programmieraktivitäten durchzuführen, wie das Erstellen von Testsets und die iterative Verfeinerung von Testfällen, so Penn.

Claude Code. Anthropic
Penn erwähnte, dass Anthropic die Fähigkeiten seiner Modelle testet, indem es sie ein altes Pokémon-Videospiel spielen lässt und die API des Modells mit einer Controller-Schnittstelle verknüpft. Während Claude 3.5 Sonnet zunächst Mühe hatte, Pallet Town zu verlassen, besiegte Claude 3.7 mehrere Arenaleiter.
Elon Musks kürzliche Vorstellung von Grok-3 letzte Woche verdeutlichte das schnelle Tempo des KI-Modell-Wettbewerbs. Vorerst liegt Anthropic dank der beeindruckenden Leistung von Claude 3.7 Sonnet vorn. Die Veröffentlichung deutet auf eine Zukunft hin, in der ein einziges Modell alle Aufgaben bewältigt, anstatt spezialisierte Werkzeuge für verschiedene Funktionen zu benötigen.
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr
WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr
Barry Diller: Das Vertrauen in Sam Altman spielt keine Rolle, da die allgemeine künstliche Intelligenz (AGI) immer näher rückt
Barry Diller, der milliardenschwere Medienmogul, hält OpenAI-CEO Sam Altman nicht für unglaubwürdig, obwohl jüngste Berichte das Gegenteil nahelegen. Bei seiner Rede auf der „Future of Everything“-Kon
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。





Heim






