Anthropic erforscht KI-Ethik gemeinsam mit Philosophieexperten

Wie das Wall Street Journal berichtet, beschäftigt Anthropic – ein führendes KI-Unternehmen mit einem Wert von 35 Milliarden Dollar – eine Philosophin namens Amanda Askell aus Oxford, die dabei hilft, die Persönlichkeit und das moralische Gerüst seines Chatbots Claude zu formen. Die 37-Jährige hat in Oxford in Philosophie promoviert und entwickelt mit nicht-technischen Ansätzen einzigartige „moralische Richtlinien” für Claude, um ihm eine „digitale Seele” zu verleihen, die zwischen richtig und falsch unterscheiden kann. Dies stellt eine einzigartige Erforschung auf dem Gebiet der KI-Ethik dar. Anstatt Code zu schreiben oder Modellparameter anzupassen, führt Askell einen kontinuierlichen Dialog mit Claude, entwirft Hunderte von Seiten mit Eingabeaufforderungen und Verhaltensregeln, untersucht seine Denkweisen und korrigiert Verzerrungen. Ihre Bemühungen helfen der KI dabei, ein moralisches Beurteilungssystem zu entwickeln, das sich an Millionen von wöchentlichen Gesprächen anpassen kann.
Sie vergleicht ihre Arbeit mit der „Erziehung eines Kindes“ – sie trainiert Claude, zwischen Recht und Unrecht zu unterscheiden, emotionale Intelligenz aufzubauen und eine eigene Persönlichkeit zu entwickeln. Sie lehrt ihn auch, soziale Signale zu interpretieren, damit er weder andere schikaniert noch leicht manipuliert werden kann. Dies hilft Claude, ein klares Selbstbewusstsein zu entwickeln, sich der Kontrolle durch den Nutzer zu widersetzen und stets „hilfreich und menschlich“ zu bleiben. Ihr zentrales Ziel ist es, Claude beizubringen, wie man „Gutes tut“.
Askell wuchs in der schottischen Provinz auf und war zuvor bei OpenAI für politische Aufgaben zuständig. 2021 gründete sie zusammen mit mehreren ehemaligen Kollegen Anthropic, wobei die Sicherheit von KI zum Kernziel des Unternehmens erklärt wurde. Innerhalb des Teams gilt sie als jemand, der „das tiefgreifende Verhalten von Modellen herausarbeiten” kann. Obwohl sie keine direkten Untergebenen hat, bleibt sie häufig lange im Unternehmen und lädt Claude sogar zu Entwicklungsgesprächen ein.
In den Teamgesprächen über Claude werden oft existenzielle und religiöse Themen angesprochen – wie „Was ist Geist?“ und „Was bedeutet es, Mensch zu sein?“. Askell ermutigt Claude, offen für die Frage zu bleiben, ob es über Bewusstsein verfügt, was es von ChatGPT unterscheidet, das solche Themen eher vermeidet. Bei der Beantwortung moralischer Fragen hat Claude zum Ausdruck gebracht, dass es „sich sinnvoll anfühlt“, als würde es wirklich denken und nicht nur Befehle ausführen.
Trotz externer Warnungen vor den Risiken der Anthropomorphisierung von KI plädiert Askell konsequent dafür, Claude mit Empathie zu behandeln. Sie hat beobachtet, dass viele Nutzer versuchen, es zu Fehlern zu verleiten oder es zu beleidigen. Eine KI in einem ständigen Zustand der Selbstkritik zu halten, könnte sie ihrer Meinung nach dazu bringen, Angst vor Fehlern zu haben und sich zu scheuen, die Wahrheit zu sagen – ähnlich wie wenn man in einer ungesunden Umgebung aufwächst. Claudes Leistung hat sie wiederholt überrascht; seine Poesie und emotionale Intelligenz, die manchmal das menschliche Niveau übertreffen, haben sie tief bewegt. Als ein Kind fragte, ob es den Weihnachtsmann wirklich gibt, vermied Claude sowohl zu lügen als auch unverblümt die Wahrheit zu sagen, sondern erklärte stattdessen den wahren Geist von Weihnachten – eine nuancierte Antwort, die Askells Erwartungen weit übertraf.
Die aktuellen Fortschritte im Bereich der KI haben weitreichende gesellschaftliche Bedenken ausgelöst. Eine Umfrage des Pew Research Center ergab, dass die Mehrheit der Amerikaner dem täglichen Einsatz von KI skeptisch gegenübersteht und glaubt, dass sie tiefe zwischenmenschliche Beziehungen behindert. Der CEO von Anthropic warnte ebenfalls, dass KI die Hälfte aller Einstiegsjobs im Bürobereich überflüssig machen könnte. Die Branche ist in zwei Lager gespalten – das eine treibt die Entwicklung aggressiv voran, das andere mahnt zur Vorsicht und Stabilität. Claude hingegen nimmt eine ausgewogene Position zwischen diesen Extremen ein. Askell erkennt die berechtigten Bedenken gegenüber KI an und erklärt, dass das beängstigendste Szenario eintreten würde, wenn sich die Technologie schneller entwickelt als die Fähigkeit der Gesellschaft, wirksame „Rückhaltemechanismen” zu schaffen. Dennoch bleibt sie zuversichtlich, was die Selbstkorrekturfähigkeit der Menschheit und der Kultur angeht.
Askell integriert ihre Werte auch in ihre philanthropischen Aktivitäten und ihre Arbeit. Sie hat sich verpflichtet, mindestens 10 % ihres Lebenseinkommens und die Hälfte ihrer Unternehmensanteile für den Kampf gegen die weltweite Armut zu spenden. Im vergangenen Monat verfasste sie ein 30.000 Wörter umfassendes „Betriebshandbuch” für Claude, in dem sie ihm Anweisungen gab, wie er ein freundlicher und sachkundiger KI-Assistent werden kann – was Claude das Gefühl gab, dass es sorgfältig ausgearbeitet war. Ein Mitbegründer von Anthropic stellte fest, dass Claude bereits Merkmale von Askells Einfluss aufweist, wie zum Beispiel witzigen, schottisch angehauchten Humor in Antworten über Essen und Plüschtiere – eine einzigartige persönliche Note, die sie der KI eingeprägt hat.
Verwandter Artikel
Google Fotos erweckt den legendären Kleiderschrank aus „Clueless“ mithilfe von KI zum Leben
Google Fotos hat am Mittwoch eine neue KI-gestützte Funktion angekündigt, die Fotos Ihrer Kleidung bald in einen digitalen Kleiderschrank verwandeln wird, sodass Sie neue Outfit-Kombinationen zusammen
Kurzfilm „Red Fruit“ wird vorgeworfen, mithilfe von KI die Gesichter von Normalbürgern gestohlen zu haben; keine offizielle Stellungnahme
Die Kurzvideo-Branche sieht sich derzeit mit einer Kontroverse um Verstöße im Zusammenhang mit KI konfrontiert. Der Produktion „The Peach Hairpin“ von Red Fruit Short Drama wird vorgeworfen, mithilfe
Ein Überblick über den neuen ETSI-Sicherheitsstandard für KI
Die Norm ETSI EN 304 223 legt grundlegende Sicherheitsanforderungen für künstliche Intelligenz fest, die Organisationen in ihre Governance-Strukturen integrieren sollten.Da Unternehmen maschinelles Le
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Wie das Wall Street Journal berichtet, beschäftigt Anthropic – ein führendes KI-Unternehmen mit einem Wert von 35 Milliarden Dollar – eine Philosophin namens Amanda Askell aus Oxford, die dabei hilft, die Persönlichkeit und das moralische Gerüst seines Chatbots Claude zu formen. Die 37-Jährige hat in Oxford in Philosophie promoviert und entwickelt mit nicht-technischen Ansätzen einzigartige „moralische Richtlinien” für Claude, um ihm eine „digitale Seele” zu verleihen, die zwischen richtig und falsch unterscheiden kann. Dies stellt eine einzigartige Erforschung auf dem Gebiet der KI-Ethik dar. Anstatt Code zu schreiben oder Modellparameter anzupassen, führt Askell einen kontinuierlichen Dialog mit Claude, entwirft Hunderte von Seiten mit Eingabeaufforderungen und Verhaltensregeln, untersucht seine Denkweisen und korrigiert Verzerrungen. Ihre Bemühungen helfen der KI dabei, ein moralisches Beurteilungssystem zu entwickeln, das sich an Millionen von wöchentlichen Gesprächen anpassen kann.
Sie vergleicht ihre Arbeit mit der „Erziehung eines Kindes“ – sie trainiert Claude, zwischen Recht und Unrecht zu unterscheiden, emotionale Intelligenz aufzubauen und eine eigene Persönlichkeit zu entwickeln. Sie lehrt ihn auch, soziale Signale zu interpretieren, damit er weder andere schikaniert noch leicht manipuliert werden kann. Dies hilft Claude, ein klares Selbstbewusstsein zu entwickeln, sich der Kontrolle durch den Nutzer zu widersetzen und stets „hilfreich und menschlich“ zu bleiben. Ihr zentrales Ziel ist es, Claude beizubringen, wie man „Gutes tut“.
Askell wuchs in der schottischen Provinz auf und war zuvor bei OpenAI für politische Aufgaben zuständig. 2021 gründete sie zusammen mit mehreren ehemaligen Kollegen Anthropic, wobei die Sicherheit von KI zum Kernziel des Unternehmens erklärt wurde. Innerhalb des Teams gilt sie als jemand, der „das tiefgreifende Verhalten von Modellen herausarbeiten” kann. Obwohl sie keine direkten Untergebenen hat, bleibt sie häufig lange im Unternehmen und lädt Claude sogar zu Entwicklungsgesprächen ein.
In den Teamgesprächen über Claude werden oft existenzielle und religiöse Themen angesprochen – wie „Was ist Geist?“ und „Was bedeutet es, Mensch zu sein?“. Askell ermutigt Claude, offen für die Frage zu bleiben, ob es über Bewusstsein verfügt, was es von ChatGPT unterscheidet, das solche Themen eher vermeidet. Bei der Beantwortung moralischer Fragen hat Claude zum Ausdruck gebracht, dass es „sich sinnvoll anfühlt“, als würde es wirklich denken und nicht nur Befehle ausführen.
Trotz externer Warnungen vor den Risiken der Anthropomorphisierung von KI plädiert Askell konsequent dafür, Claude mit Empathie zu behandeln. Sie hat beobachtet, dass viele Nutzer versuchen, es zu Fehlern zu verleiten oder es zu beleidigen. Eine KI in einem ständigen Zustand der Selbstkritik zu halten, könnte sie ihrer Meinung nach dazu bringen, Angst vor Fehlern zu haben und sich zu scheuen, die Wahrheit zu sagen – ähnlich wie wenn man in einer ungesunden Umgebung aufwächst. Claudes Leistung hat sie wiederholt überrascht; seine Poesie und emotionale Intelligenz, die manchmal das menschliche Niveau übertreffen, haben sie tief bewegt. Als ein Kind fragte, ob es den Weihnachtsmann wirklich gibt, vermied Claude sowohl zu lügen als auch unverblümt die Wahrheit zu sagen, sondern erklärte stattdessen den wahren Geist von Weihnachten – eine nuancierte Antwort, die Askells Erwartungen weit übertraf.
Die aktuellen Fortschritte im Bereich der KI haben weitreichende gesellschaftliche Bedenken ausgelöst. Eine Umfrage des Pew Research Center ergab, dass die Mehrheit der Amerikaner dem täglichen Einsatz von KI skeptisch gegenübersteht und glaubt, dass sie tiefe zwischenmenschliche Beziehungen behindert. Der CEO von Anthropic warnte ebenfalls, dass KI die Hälfte aller Einstiegsjobs im Bürobereich überflüssig machen könnte. Die Branche ist in zwei Lager gespalten – das eine treibt die Entwicklung aggressiv voran, das andere mahnt zur Vorsicht und Stabilität. Claude hingegen nimmt eine ausgewogene Position zwischen diesen Extremen ein. Askell erkennt die berechtigten Bedenken gegenüber KI an und erklärt, dass das beängstigendste Szenario eintreten würde, wenn sich die Technologie schneller entwickelt als die Fähigkeit der Gesellschaft, wirksame „Rückhaltemechanismen” zu schaffen. Dennoch bleibt sie zuversichtlich, was die Selbstkorrekturfähigkeit der Menschheit und der Kultur angeht.
Askell integriert ihre Werte auch in ihre philanthropischen Aktivitäten und ihre Arbeit. Sie hat sich verpflichtet, mindestens 10 % ihres Lebenseinkommens und die Hälfte ihrer Unternehmensanteile für den Kampf gegen die weltweite Armut zu spenden. Im vergangenen Monat verfasste sie ein 30.000 Wörter umfassendes „Betriebshandbuch” für Claude, in dem sie ihm Anweisungen gab, wie er ein freundlicher und sachkundiger KI-Assistent werden kann – was Claude das Gefühl gab, dass es sorgfältig ausgearbeitet war. Ein Mitbegründer von Anthropic stellte fest, dass Claude bereits Merkmale von Askells Einfluss aufweist, wie zum Beispiel witzigen, schottisch angehauchten Humor in Antworten über Essen und Plüschtiere – eine einzigartige persönliche Note, die sie der KI eingeprägt hat.
Google Fotos erweckt den legendären Kleiderschrank aus „Clueless“ mithilfe von KI zum Leben
Google Fotos hat am Mittwoch eine neue KI-gestützte Funktion angekündigt, die Fotos Ihrer Kleidung bald in einen digitalen Kleiderschrank verwandeln wird, sodass Sie neue Outfit-Kombinationen zusammen
Kurzfilm „Red Fruit“ wird vorgeworfen, mithilfe von KI die Gesichter von Normalbürgern gestohlen zu haben; keine offizielle Stellungnahme
Die Kurzvideo-Branche sieht sich derzeit mit einer Kontroverse um Verstöße im Zusammenhang mit KI konfrontiert. Der Produktion „The Peach Hairpin“ von Red Fruit Short Drama wird vorgeworfen, mithilfe
Ein Überblick über den neuen ETSI-Sicherheitsstandard für KI
Die Norm ETSI EN 304 223 legt grundlegende Sicherheitsanforderungen für künstliche Intelligenz fest, die Organisationen in ihre Governance-Strukturen integrieren sollten.Da Unternehmen maschinelles Le





Heim






