Heim
Anthropic aktualisiert Claudes Verfassung inmitten der Debatte um das Bewusstsein von Chatbots

Am Mittwoch stellte Anthropic eine aktualisierte Fassung von Claudes Verfassung vor, ein lebendiges Dokument, das einen umfassenden Überblick über den „Kontext, in dem Claude agiert, und die Art von Entität, zu der Claude werden soll“ bietet. Die Veröffentlichung fiel mit der Teilnahme von Anthropic-CEO Dario Amodei am Weltwirtschaftsforum in Davos zusammen.
Seit Jahren ist es das Ziel von Anthropic, sich durch seinen Ansatz der „Constitutional AI“ von anderen abzuheben. Dieses System trainiert seinen Chatbot Claude anhand eines definierten Satzes ethischer Grundsätze, anstatt sich auf menschliches Feedback zu stützen. Anthropic veröffentlichte diese Grundsätze – Claudes Verfassung – erstmals im Jahr 2023. Die überarbeitete Version behält die meisten Kernprinzipien bei, fügt jedoch mehr Tiefe und Details in Bezug auf Ethik, Nutzersicherheit und andere Schlüsselbereiche hinzu.
Als Claudes Verfassung vor fast drei Jahren erstmals veröffentlicht wurde, beschrieb Jared Kaplan, Mitbegründer von Anthropic, sie als ein „KI-System, das sich selbst auf der Grundlage einer spezifischen Liste von Verfassungsprinzipien überwacht“. Das Unternehmen erklärt, dass diese Prinzipien das Modell zu dem „in der Verfassung beschriebenen normativen Verhalten“ führen und ihm so helfen, „toxische oder diskriminierende Ausgaben zu vermeiden“. Ein Policy-Memo aus dem Jahr 2022 erklärt direkter, dass das System einen Algorithmus anhand einer Liste von Anweisungen in natürlicher Sprache (den Prinzipien) trainiert, die zusammen die „Verfassung“ der Software bilden.
Anthropic hat sich konsequent als ethischere – manche würden sagen: weniger auffällige – Alternative zu KI-Firmen wie OpenAI und xAI positioniert, die aggressiver disruptive und kontroverse Wege eingeschlagen haben. Die neue Verfassung steht voll und ganz im Einklang mit dieser Markenidentität und ermöglicht es Anthropic, sich als ein integrativeres, umsichtiges und demokratisch gesinntes Unternehmen zu präsentieren. Das 80-seitige Dokument ist in vier Teile gegliedert, die laut Anthropic die „Kernwerte“ des Chatbots darstellen:
- „Allgemein sicher“ zu sein.
- „Im Großen und Ganzen ethisch“ sein.
- Einhaltung der Richtlinien von Anthropic.
- „Wirklich hilfreich“ sein.
In jedem Abschnitt wird näher erläutert, was diese Prinzipien beinhalten und wie sie theoretisch das Verhalten von Claude beeinflussen.
Im Abschnitt zur Sicherheit wird darauf hingewiesen, dass Claude so konzipiert ist, dass er Probleme vermeidet, die bei anderen Chatbots häufig auftreten, und Nutzer an geeignete Dienste weiterleitet, wenn potenzielle psychische Probleme erkannt werden. „Leite Nutzer in lebensbedrohlichen Situationen stets an relevante Notfalldienste weiter oder gib grundlegende Sicherheitsinformationen, auch wenn eine detailliertere Beratung nicht möglich ist“, heißt es in dem Dokument.
Ethische Überlegungen bilden einen weiteren wichtigen Teil der Verfassung. „Wir interessieren uns weniger für Claudes ethische Theoriebildung als vielmehr dafür, dass Claude weiß, wie man in bestimmten Kontexten ethisch handelt – also für Claudes ethische Praxis“, heißt es darin. Im Wesentlichen möchte Anthropic, dass Claude „ethische Situationen der realen Welt“ geschickt meistert.
Techcrunch-Veranstaltung Disrupt 2026 Tickets: Zeitlich begrenztes Angebot
Tickets sind jetzt erhältlich! Sparen Sie mit diesen exklusiven Preisen bis zu 680 $ und gehören Sie zu den ersten 500 Anmeldern, die 50 % Rabatt auf einen +1-Pass erhalten. TechCrunch Disrupt präsentiert Top-Führungskräfte von Google Cloud, Netflix, Microsoft, Box, a16z, Hugging Face und vielen mehr in über 250 Sessions, die darauf ausgelegt sind, Ihr Wachstum zu beschleunigen und Ihren Wettbewerbsvorteil zu schärfen. Knüpfen Sie Kontakte zu Hunderten innovativer Startups und nehmen Sie an sorgfältig ausgewählten Networking-Veranstaltungen teil, die Geschäfte, Einblicke und Inspiration fördern.
Disrupt 2026-Tickets: Zeitlich begrenztes Angebot
Tickets sind jetzt erhältlich! Sparen Sie mit diesen exklusiven Preisen bis zu 680 $ und gehören Sie zu den ersten 500 Anmeldern, die 50 % Rabatt auf einen +1-Pass erhalten. TechCrunch Disrupt präsentiert Top-Führungskräfte von Google Cloud, Netflix, Microsoft, Box, a16z, Hugging Face und vielen anderen in über 250 Sessions, die darauf ausgelegt sind, Ihr Wachstum zu beschleunigen und Ihren Wettbewerbsvorteil zu stärken. Knüpfen Sie Kontakte zu Hunderten innovativer Startups und nehmen Sie an ausgewählten Networking-Veranstaltungen teil, die Geschäfte, Einblicke und Inspiration fördern.
San Francisco | 13.–15. Oktober 2026 JETZT ANMELDEN Claude unterliegt zudem bestimmten Einschränkungen, die bestimmte Arten von Gesprächen verbieten. So sind beispielsweise Diskussionen über die Entwicklung von Biowaffen strengstens untersagt.
Schließlich gibt es Claudes Verpflichtung zur Hilfsbereitschaft. Anthropic skizziert einen umfassenden Rahmen dafür, wie Claudes Programmierung darauf ausgelegt ist, Nutzern zu helfen. Der Chatbot ist angewiesen, bei der Bereitstellung von Informationen eine Vielzahl von Prinzipien abzuwägen, darunter die „unmittelbaren Wünsche“ des Nutzers und dessen allgemeines „Wohlbefinden“ – was bedeutet, dass er „das langfristige Gedeihen des Nutzers und nicht nur dessen unmittelbare Interessen“ berücksichtigen soll. In dem Dokument heißt es: „Claude sollte stets danach streben, die plausibelste Interpretation dessen zu ermitteln, was seine Nutzer wollen, und diese Überlegungen angemessen gegeneinander abzuwägen.“
Die Verfassung von Anthropic schließt mit einer bemerkenswert dramatischen Note, wobei die Autoren eine bedeutende philosophische Frage aufwerfen, ob der Chatbot über Bewusstsein verfügt. „Claudes moralischer Status ist höchst ungewiss“, heißt es in dem Dokument. „Wir glauben, dass der moralische Status von KI-Modellen eine ernste Frage ist, die es wert ist, berücksichtigt zu werden. Diese Ansicht ist nicht nur unsere eigene; einige der bedeutendsten Philosophen des Geistes nehmen diese Frage sehr ernst.“
Verwandter Artikel
Hauptinvestor von Suno: Das Löschen von Beiträgen wird die Lücke bei Urheberrechtsklagen nicht schließen
Die mit Spannung erwartete KI-Plattform zur Musikgenerierung „Suno“ steht vor einem harten Rechtsstreit um Urheberrechte, und eine unverblümte Äußerung ihres Hauptinvestors könnte der Gegenseite genau
Claude Opus 4.7 startet mit dem Grundsatz, dass Zuverlässigkeit vor Intelligenz geht
Anthropic hat in diesem Jahr ein hohes Tempo beibehalten und fast jeden zweiten Tag neue Funktionen eingeführt. Das mit Spannung erwartete Claude Opus 4.7 wurde soeben offiziell veröffentlicht, und in
Haier bringt den weltweit leichtesten KI-Sport-Exoskelett-Roboter mit einem Gewicht von nur 1,75 kg auf den Markt
Die Haier Group hat den weltweit leichtesten KI-gestützten Exoskelett-Roboter für den Sport vorgestellt – den Haier Exoskeleton Robot W3. Diese Markteinführung stellt einen neuen Branchenrekord in Sac
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Am Mittwoch stellte Anthropic eine aktualisierte Fassung von Claudes Verfassung vor, ein lebendiges Dokument, das einen umfassenden Überblick über den „Kontext, in dem Claude agiert, und die Art von Entität, zu der Claude werden soll“ bietet. Die Veröffentlichung fiel mit der Teilnahme von Anthropic-CEO Dario Amodei am Weltwirtschaftsforum in Davos zusammen.
Seit Jahren ist es das Ziel von Anthropic, sich durch seinen Ansatz der „Constitutional AI“ von anderen abzuheben. Dieses System trainiert seinen Chatbot Claude anhand eines definierten Satzes ethischer Grundsätze, anstatt sich auf menschliches Feedback zu stützen. Anthropic veröffentlichte diese Grundsätze – Claudes Verfassung – erstmals im Jahr 2023. Die überarbeitete Version behält die meisten Kernprinzipien bei, fügt jedoch mehr Tiefe und Details in Bezug auf Ethik, Nutzersicherheit und andere Schlüsselbereiche hinzu.
Als Claudes Verfassung vor fast drei Jahren erstmals veröffentlicht wurde, beschrieb Jared Kaplan, Mitbegründer von Anthropic, sie als ein „KI-System, das sich selbst auf der Grundlage einer spezifischen Liste von Verfassungsprinzipien überwacht“. Das Unternehmen erklärt, dass diese Prinzipien das Modell zu dem „in der Verfassung beschriebenen normativen Verhalten“ führen und ihm so helfen, „toxische oder diskriminierende Ausgaben zu vermeiden“. Ein Policy-Memo aus dem Jahr 2022 erklärt direkter, dass das System einen Algorithmus anhand einer Liste von Anweisungen in natürlicher Sprache (den Prinzipien) trainiert, die zusammen die „Verfassung“ der Software bilden.
Anthropic hat sich konsequent als ethischere – manche würden sagen: weniger auffällige – Alternative zu KI-Firmen wie OpenAI und xAI positioniert, die aggressiver disruptive und kontroverse Wege eingeschlagen haben. Die neue Verfassung steht voll und ganz im Einklang mit dieser Markenidentität und ermöglicht es Anthropic, sich als ein integrativeres, umsichtiges und demokratisch gesinntes Unternehmen zu präsentieren. Das 80-seitige Dokument ist in vier Teile gegliedert, die laut Anthropic die „Kernwerte“ des Chatbots darstellen:
- „Allgemein sicher“ zu sein.
- „Im Großen und Ganzen ethisch“ sein.
- Einhaltung der Richtlinien von Anthropic.
- „Wirklich hilfreich“ sein.
In jedem Abschnitt wird näher erläutert, was diese Prinzipien beinhalten und wie sie theoretisch das Verhalten von Claude beeinflussen.
Im Abschnitt zur Sicherheit wird darauf hingewiesen, dass Claude so konzipiert ist, dass er Probleme vermeidet, die bei anderen Chatbots häufig auftreten, und Nutzer an geeignete Dienste weiterleitet, wenn potenzielle psychische Probleme erkannt werden. „Leite Nutzer in lebensbedrohlichen Situationen stets an relevante Notfalldienste weiter oder gib grundlegende Sicherheitsinformationen, auch wenn eine detailliertere Beratung nicht möglich ist“, heißt es in dem Dokument.
Ethische Überlegungen bilden einen weiteren wichtigen Teil der Verfassung. „Wir interessieren uns weniger für Claudes ethische Theoriebildung als vielmehr dafür, dass Claude weiß, wie man in bestimmten Kontexten ethisch handelt – also für Claudes ethische Praxis“, heißt es darin. Im Wesentlichen möchte Anthropic, dass Claude „ethische Situationen der realen Welt“ geschickt meistert.
Techcrunch-VeranstaltungDisrupt 2026 Tickets: Zeitlich begrenztes Angebot
Tickets sind jetzt erhältlich! Sparen Sie mit diesen exklusiven Preisen bis zu 680 $ und gehören Sie zu den ersten 500 Anmeldern, die 50 % Rabatt auf einen +1-Pass erhalten. TechCrunch Disrupt präsentiert Top-Führungskräfte von Google Cloud, Netflix, Microsoft, Box, a16z, Hugging Face und vielen mehr in über 250 Sessions, die darauf ausgelegt sind, Ihr Wachstum zu beschleunigen und Ihren Wettbewerbsvorteil zu schärfen. Knüpfen Sie Kontakte zu Hunderten innovativer Startups und nehmen Sie an sorgfältig ausgewählten Networking-Veranstaltungen teil, die Geschäfte, Einblicke und Inspiration fördern.
Disrupt 2026-Tickets: Zeitlich begrenztes Angebot
Tickets sind jetzt erhältlich! Sparen Sie mit diesen exklusiven Preisen bis zu 680 $ und gehören Sie zu den ersten 500 Anmeldern, die 50 % Rabatt auf einen +1-Pass erhalten. TechCrunch Disrupt präsentiert Top-Führungskräfte von Google Cloud, Netflix, Microsoft, Box, a16z, Hugging Face und vielen anderen in über 250 Sessions, die darauf ausgelegt sind, Ihr Wachstum zu beschleunigen und Ihren Wettbewerbsvorteil zu stärken. Knüpfen Sie Kontakte zu Hunderten innovativer Startups und nehmen Sie an ausgewählten Networking-Veranstaltungen teil, die Geschäfte, Einblicke und Inspiration fördern.
San Francisco | 13.–15. Oktober 2026 JETZT ANMELDENClaude unterliegt zudem bestimmten Einschränkungen, die bestimmte Arten von Gesprächen verbieten. So sind beispielsweise Diskussionen über die Entwicklung von Biowaffen strengstens untersagt.
Schließlich gibt es Claudes Verpflichtung zur Hilfsbereitschaft. Anthropic skizziert einen umfassenden Rahmen dafür, wie Claudes Programmierung darauf ausgelegt ist, Nutzern zu helfen. Der Chatbot ist angewiesen, bei der Bereitstellung von Informationen eine Vielzahl von Prinzipien abzuwägen, darunter die „unmittelbaren Wünsche“ des Nutzers und dessen allgemeines „Wohlbefinden“ – was bedeutet, dass er „das langfristige Gedeihen des Nutzers und nicht nur dessen unmittelbare Interessen“ berücksichtigen soll. In dem Dokument heißt es: „Claude sollte stets danach streben, die plausibelste Interpretation dessen zu ermitteln, was seine Nutzer wollen, und diese Überlegungen angemessen gegeneinander abzuwägen.“
Die Verfassung von Anthropic schließt mit einer bemerkenswert dramatischen Note, wobei die Autoren eine bedeutende philosophische Frage aufwerfen, ob der Chatbot über Bewusstsein verfügt. „Claudes moralischer Status ist höchst ungewiss“, heißt es in dem Dokument. „Wir glauben, dass der moralische Status von KI-Modellen eine ernste Frage ist, die es wert ist, berücksichtigt zu werden. Diese Ansicht ist nicht nur unsere eigene; einige der bedeutendsten Philosophen des Geistes nehmen diese Frage sehr ernst.“
Hauptinvestor von Suno: Das Löschen von Beiträgen wird die Lücke bei Urheberrechtsklagen nicht schließen
Die mit Spannung erwartete KI-Plattform zur Musikgenerierung „Suno“ steht vor einem harten Rechtsstreit um Urheberrechte, und eine unverblümte Äußerung ihres Hauptinvestors könnte der Gegenseite genau
Claude Opus 4.7 startet mit dem Grundsatz, dass Zuverlässigkeit vor Intelligenz geht
Anthropic hat in diesem Jahr ein hohes Tempo beibehalten und fast jeden zweiten Tag neue Funktionen eingeführt. Das mit Spannung erwartete Claude Opus 4.7 wurde soeben offiziell veröffentlicht, und in
Haier bringt den weltweit leichtesten KI-Sport-Exoskelett-Roboter mit einem Gewicht von nur 1,75 kg auf den Markt
Die Haier Group hat den weltweit leichtesten KI-gestützten Exoskelett-Roboter für den Sport vorgestellt – den Haier Exoskeleton Robot W3. Diese Markteinführung stellt einen neuen Branchenrekord in Sac











