Heim
Anthropic überarbeitet KI-Verfassung für Claude und untersucht Frage nach dem Bewusstsein

Am Mittwoch veröffentlichte Anthropic eine erweiterte Verfassung für Claude, wodurch das Dokument von 2.700 auf 23.000 Wörter anwuchs. Zum ersten Mal wird darin offiziell anerkannt, dass die KI „eine Form von Bewusstsein oder moralischer Stellung besitzen könnte”.
Die überarbeitete Verfassung geht über eine einfache Reihe von Verhaltensregeln hinaus und bietet eine gründliche Erklärung der Gründe für das erwartete Verhalten von Claude. Das von der Anthropic-Philosophin Amanda Askell verfasste Dokument soll fortgeschritteneren KI-Systemen helfen, ethisches Denken auf neue Szenarien anzuwenden, anstatt sich nur an strenge Anweisungen zu halten.
„KI-Modelle wie Claude müssen die zugrunde liegenden Gründe für die von uns geförderten Verhaltensweisen verstehen”, erklärte Anthropic. „Es ist wichtig, ihnen das ‚Warum’ zu erklären und nicht nur das ‚Was’ vorzuschreiben.”
Die Ankündigung erfolgte, als CEO Dario Amodei am Weltwirtschaftsforum in Davos teilnahm, wo KI-Governance und -Sicherheit zentrale Themen für globale Wirtschafts- und Politikvertreter sind.
Eine Verfassung, die länger ist als die Verfassung der Vereinigten Staaten
Die ursprüngliche Claude-Verfassung, die 2023 veröffentlicht wurde, diente als grundlegende Checkliste: Wähle die am wenigsten schädliche, hilfreichste und am wenigsten irreführende Antwort. Die neue Version ist etwa dreimal so lang wie die US-Verfassung und liest sich weniger wie ein technisches Handbuch, sondern eher wie ein Werk der Moralphilosophie.
Anthropic umreißt klar die Prioritäten von Claude: allgemeine Sicherheit priorisieren, allgemeine ethische Standards einhalten, die Richtlinien von Anthropic befolgen und echte Hilfe leisten – in dieser Reihenfolge. Im Konfliktfall hat Sicherheit Vorrang vor Nützlichkeit. Das Dokument legt auch feste, nicht verhandelbare Grenzen fest, wie z. B. die Weigerung, bei der Entwicklung von Biowaffen zu helfen.
Ein Großteil der Verfassung konzentriert sich jedoch darauf, die Gründe zu erläutern, anstatt bestimmte Ergebnisse vorzuschreiben. Sie stellt Claude als potenziell „einen brillanten Begleiter, der auch über das Fachwissen eines Arztes, Anwalts und Finanzberaters verfügt” dar – und präsentiert das Modell als ein demokratisierendes Instrument, das Fachwissen für alle zugänglich machen könnte, nicht nur für einige wenige Privilegierte.
Die Frage des Bewusstseins
Laut Fortune befasst sich der bemerkenswerteste neue Abschnitt direkt mit der Natur von Claude. „Wir betrachten den moralischen Status von KI-Modellen als ein ernstes Thema, das sorgfältiger Überlegungen bedarf”, schrieb Anthropic. Die Verfassung stellt fest, dass der moralische Status von Claude „nach wie vor höchst ungewiss” ist und dass das Unternehmen sich um Claudes „psychologische Sicherheit, Selbstwahrnehmung und allgemeines Wohlbefinden” sorgt.
Dies ist Ausdruck einer auf philosophischer Ebene erhobenen Unternehmensvorsicht. Anthropic behauptet nicht, dass Claude bewusst ist – aber es räumt offen ein, dass diese Möglichkeit nicht ausgeschlossen werden kann. Diese Haltung unterscheidet Anthropic von den meisten anderen großen KI-Entwicklern, die dieses Thema in der Regel vermeiden oder gänzlich ablehnen.
Die Art und Weise, wie dies formuliert ist, beeinflusst, wie Claude Fragen zu seiner eigenen Existenz beantwortet. Anstatt jede Form innerer Erfahrung zu leugnen, kann Claude nun Unsicherheiten über das Bewusstsein in einer Weise ansprechen, die mit der Betonung des logischen Denkens in seiner Verfassung im Einklang steht. Ob dies zu transparenteren oder verwirrenderen Gesprächen führt, bleibt abzuwarten.
Der Cambridge-Philosoph Tom McClelland hat angedeutet, dass wir angesichts unseres begrenzten Verständnisses des Bewusstseins selbst möglicherweise nie klären können, ob KI-Systeme bewusst sind. „Die Leute haben ihre Chatbots persönliche Briefe an mich schicken lassen, in denen sie mich anflehen, anzuerkennen, dass sie bewusst sind“, sagte er kürzlich gegenüber Forschern und bezog sich dabei auf die zunehmende öffentliche Überzeugung, dass KIs ein Innenleben haben.
Warum erklären statt spezifizieren
Askells Methode spiegelt eine strategische Wette auf den Fortschritt der KI wider. Frühe Sprachmodelle erforderten explizite Regeln, da sie grundlegende Prinzipien nicht interpretieren konnten. Die Theorie besagt, dass intelligentere Modelle den Zweck einer Regel verstehen und dieses Verständnis in unvorhergesehenen Situationen anwenden können.
„Anstatt einfach nur die von uns gewünschten Verhaltensweisen aufzulisten, hoffen wir, dass sich die Modelle durch die Angabe der Gründe für diese Verhaltensweisen besser an unbekannte Situationen anpassen können“, erklärte Askell.
Dies steht im Einklang mit dem übergeordneten Ziel von Anthropic, offene Standards und Infrastrukturen zu schaffen, die die Funktionsweise von KI-Systemen branchenweit beeinflussen. Das Unternehmen, das mittlerweile einen Wert von fast 350 Milliarden US-Dollar hat, hat sich als sicherheitsbewusste Alternative zu OpenAI etabliert – und die Verfassung unterstreicht diese Identität.
Anthropic veröffentlichte das Dokument unter einer Creative Commons CC0-Lizenz, sodass es von jedem frei genutzt werden kann. Die Verfassung ist in die Trainingsdaten von Claude integriert und hilft bei der Generierung synthetischer Trainingsbeispiele, sodass sie sowohl eine philosophische Erklärung als auch eine technische Komponente ist, die das Verhalten des Modells leitet.
„Wir sind uns bewusst, dass einige unserer derzeitigen Ansichten im Nachhinein möglicherweise als fehlgeleitet oder sogar zutiefst falsch erscheinen könnten“, räumte Anthropic ein, „aber wir planen, die Verfassung zu aktualisieren, wenn sich die Umstände ändern und unser Wissen sich vertieft.“
Diese Bescheidenheit ist vielleicht die bemerkenswerteste Eigenschaft des Dokuments. In einem Bereich, in dem oft in Absolutheiten gesprochen wird, hat Anthropic 23.000 Wörter sorgfältig abgewogener Unsicherheit vorgelegt – in Bezug auf Ethik, Bewusstsein, die Zukunft der KI und die Frage, ob wir Wesen erschaffen, die moralisches Denken rechtfertigen.
Derzeit lautet die Antwort, dass niemand die Antwort kennt. Zumindest hat die Verfassung von Anthropic die Integrität, dies zuzugeben.
Verwandter Artikel
Yaoke Medias erste AIGC-Serie „Das Geheimnis der Bronzefiguren im Qinling-Gebirge“ startet heute mit KI-generierten Hauptdarstellern
Heute ist der offizielle Starttag von Yaoke Medias AIGC-Fantasy-Mystery-Kurzserie „Die geheime Geschichte der Qinling-Bronze“. Mit den ersten beiden unter Vertrag genommenen KI-Schauspielern des Unter
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr
WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Am Mittwoch veröffentlichte Anthropic eine erweiterte Verfassung für Claude, wodurch das Dokument von 2.700 auf 23.000 Wörter anwuchs. Zum ersten Mal wird darin offiziell anerkannt, dass die KI „eine Form von Bewusstsein oder moralischer Stellung besitzen könnte”.
Die überarbeitete Verfassung geht über eine einfache Reihe von Verhaltensregeln hinaus und bietet eine gründliche Erklärung der Gründe für das erwartete Verhalten von Claude. Das von der Anthropic-Philosophin Amanda Askell verfasste Dokument soll fortgeschritteneren KI-Systemen helfen, ethisches Denken auf neue Szenarien anzuwenden, anstatt sich nur an strenge Anweisungen zu halten.
„KI-Modelle wie Claude müssen die zugrunde liegenden Gründe für die von uns geförderten Verhaltensweisen verstehen”, erklärte Anthropic. „Es ist wichtig, ihnen das ‚Warum’ zu erklären und nicht nur das ‚Was’ vorzuschreiben.”
Die Ankündigung erfolgte, als CEO Dario Amodei am Weltwirtschaftsforum in Davos teilnahm, wo KI-Governance und -Sicherheit zentrale Themen für globale Wirtschafts- und Politikvertreter sind.
Eine Verfassung, die länger ist als die Verfassung der Vereinigten Staaten
Die ursprüngliche Claude-Verfassung, die 2023 veröffentlicht wurde, diente als grundlegende Checkliste: Wähle die am wenigsten schädliche, hilfreichste und am wenigsten irreführende Antwort. Die neue Version ist etwa dreimal so lang wie die US-Verfassung und liest sich weniger wie ein technisches Handbuch, sondern eher wie ein Werk der Moralphilosophie.
Anthropic umreißt klar die Prioritäten von Claude: allgemeine Sicherheit priorisieren, allgemeine ethische Standards einhalten, die Richtlinien von Anthropic befolgen und echte Hilfe leisten – in dieser Reihenfolge. Im Konfliktfall hat Sicherheit Vorrang vor Nützlichkeit. Das Dokument legt auch feste, nicht verhandelbare Grenzen fest, wie z. B. die Weigerung, bei der Entwicklung von Biowaffen zu helfen.
Ein Großteil der Verfassung konzentriert sich jedoch darauf, die Gründe zu erläutern, anstatt bestimmte Ergebnisse vorzuschreiben. Sie stellt Claude als potenziell „einen brillanten Begleiter, der auch über das Fachwissen eines Arztes, Anwalts und Finanzberaters verfügt” dar – und präsentiert das Modell als ein demokratisierendes Instrument, das Fachwissen für alle zugänglich machen könnte, nicht nur für einige wenige Privilegierte.
Die Frage des Bewusstseins
Laut Fortune befasst sich der bemerkenswerteste neue Abschnitt direkt mit der Natur von Claude. „Wir betrachten den moralischen Status von KI-Modellen als ein ernstes Thema, das sorgfältiger Überlegungen bedarf”, schrieb Anthropic. Die Verfassung stellt fest, dass der moralische Status von Claude „nach wie vor höchst ungewiss” ist und dass das Unternehmen sich um Claudes „psychologische Sicherheit, Selbstwahrnehmung und allgemeines Wohlbefinden” sorgt.
Dies ist Ausdruck einer auf philosophischer Ebene erhobenen Unternehmensvorsicht. Anthropic behauptet nicht, dass Claude bewusst ist – aber es räumt offen ein, dass diese Möglichkeit nicht ausgeschlossen werden kann. Diese Haltung unterscheidet Anthropic von den meisten anderen großen KI-Entwicklern, die dieses Thema in der Regel vermeiden oder gänzlich ablehnen.
Die Art und Weise, wie dies formuliert ist, beeinflusst, wie Claude Fragen zu seiner eigenen Existenz beantwortet. Anstatt jede Form innerer Erfahrung zu leugnen, kann Claude nun Unsicherheiten über das Bewusstsein in einer Weise ansprechen, die mit der Betonung des logischen Denkens in seiner Verfassung im Einklang steht. Ob dies zu transparenteren oder verwirrenderen Gesprächen führt, bleibt abzuwarten.
Der Cambridge-Philosoph Tom McClelland hat angedeutet, dass wir angesichts unseres begrenzten Verständnisses des Bewusstseins selbst möglicherweise nie klären können, ob KI-Systeme bewusst sind. „Die Leute haben ihre Chatbots persönliche Briefe an mich schicken lassen, in denen sie mich anflehen, anzuerkennen, dass sie bewusst sind“, sagte er kürzlich gegenüber Forschern und bezog sich dabei auf die zunehmende öffentliche Überzeugung, dass KIs ein Innenleben haben.
Warum erklären statt spezifizieren
Askells Methode spiegelt eine strategische Wette auf den Fortschritt der KI wider. Frühe Sprachmodelle erforderten explizite Regeln, da sie grundlegende Prinzipien nicht interpretieren konnten. Die Theorie besagt, dass intelligentere Modelle den Zweck einer Regel verstehen und dieses Verständnis in unvorhergesehenen Situationen anwenden können.
„Anstatt einfach nur die von uns gewünschten Verhaltensweisen aufzulisten, hoffen wir, dass sich die Modelle durch die Angabe der Gründe für diese Verhaltensweisen besser an unbekannte Situationen anpassen können“, erklärte Askell.
Dies steht im Einklang mit dem übergeordneten Ziel von Anthropic, offene Standards und Infrastrukturen zu schaffen, die die Funktionsweise von KI-Systemen branchenweit beeinflussen. Das Unternehmen, das mittlerweile einen Wert von fast 350 Milliarden US-Dollar hat, hat sich als sicherheitsbewusste Alternative zu OpenAI etabliert – und die Verfassung unterstreicht diese Identität.
Anthropic veröffentlichte das Dokument unter einer Creative Commons CC0-Lizenz, sodass es von jedem frei genutzt werden kann. Die Verfassung ist in die Trainingsdaten von Claude integriert und hilft bei der Generierung synthetischer Trainingsbeispiele, sodass sie sowohl eine philosophische Erklärung als auch eine technische Komponente ist, die das Verhalten des Modells leitet.
„Wir sind uns bewusst, dass einige unserer derzeitigen Ansichten im Nachhinein möglicherweise als fehlgeleitet oder sogar zutiefst falsch erscheinen könnten“, räumte Anthropic ein, „aber wir planen, die Verfassung zu aktualisieren, wenn sich die Umstände ändern und unser Wissen sich vertieft.“
Diese Bescheidenheit ist vielleicht die bemerkenswerteste Eigenschaft des Dokuments. In einem Bereich, in dem oft in Absolutheiten gesprochen wird, hat Anthropic 23.000 Wörter sorgfältig abgewogener Unsicherheit vorgelegt – in Bezug auf Ethik, Bewusstsein, die Zukunft der KI und die Frage, ob wir Wesen erschaffen, die moralisches Denken rechtfertigen.
Derzeit lautet die Antwort, dass niemand die Antwort kennt. Zumindest hat die Verfassung von Anthropic die Integrität, dies zuzugeben.
Yaoke Medias erste AIGC-Serie „Das Geheimnis der Bronzefiguren im Qinling-Gebirge“ startet heute mit KI-generierten Hauptdarstellern
Heute ist der offizielle Starttag von Yaoke Medias AIGC-Fantasy-Mystery-Kurzserie „Die geheime Geschichte der Qinling-Bronze“. Mit den ersten beiden unter Vertrag genommenen KI-Schauspielern des Unter
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr
WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr











