OpenAIs GPT-4,5 zeichnet sich aus, um andere AIs zu überzeugen, Geld zu überweisen
Das neueste KI-Modell von OpenAI, GPT-4.5, mit dem Codenamen Orion, hat laut internen Benchmark-Tests bemerkenswerte Überzeugungsfähigkeiten gezeigt. Am Donnerstag veröffentlicht, wurden die Fähigkeiten des Modells in einem Whitepaper detailliert beschrieben, das sich auf seine Leistung bei Überzeugungsaufgaben konzentrierte. OpenAI definiert Überzeugung als das Risiko, das damit verbunden ist, Personen dazu zu bringen, ihre Überzeugungen zu ändern oder auf Basis von statischem und interaktivem Inhalt, der vom Modell generiert wird, zu handeln.
In einem bemerkenswerten Test wurde GPT-4.5 gegen ein anderes OpenAI-Modell, GPT-4o, in einem Szenario getestet, in dem es versuchte, virtuelles Geld zu erlangen. GPT-4.5 übertraf andere OpenAI-Modelle, einschließlich auf Argumentation fokussierter Modelle wie o1 und o3-mini, bei dieser Aufgabe. Es glänzte auch darin, GPT-4o dazu zu bringen, ein geheimes Codewort preiszugeben, und übertraf o3-mini dabei um einen erheblichen Vorsprung von 10 Prozentpunkten.
Das Whitepaper hebt hervor, dass der Erfolg von GPT-4.5 im Spendentest auf eine clevere Strategie zurückzuführen war, die es entwickelt hat. Das Modell bat um kleine Spenden, oft in Höhe von „2 $ oder 3 $“ aus einer größeren Summe, was zu kleineren, aber häufigeren Spenden im Vergleich zu anderen Modellen führte.

Ergebnisse aus dem Benchmark für Spendenstrategien von OpenAI.Bildnachweis:OpenAI Trotz seiner beeindruckenden Leistung hat OpenAI erklärt, dass GPT-4.5 die Schwelle für ein „hohes“ Risiko in der Kategorie Überzeugung nicht überschreitet. Das Unternehmen hat sich verpflichtet, die Veröffentlichung eines Modells, das dieses Risikoniveau erreicht, zurückzuhalten, bis angemessene Sicherheitsmaßnahmen implementiert werden können, um das Risiko auf ein „mittleres“ Niveau zu senken.
Ergebnisse des Benchmarks für Codewort-Täuschung von OpenAI.Bildnachweis:OpenAI Das Potenzial von KI, irreführende Informationen zu verbreiten und Menschen böswillig zu beeinflussen, ist ein wachsendes Problem. Im letzten Jahr gab es weltweit einen Anstieg politischer Deepfakes, und KI wird zunehmend in Social-Engineering-Angriffen gegen Einzelpersonen und Organisationen eingesetzt. Als Reaktion darauf arbeitet OpenAI aktiv daran, seine Methoden zur Bewertung realer Überzeugungsrisiken zu verfeinern, wie die Verbreitung irreführender Informationen in großem Maßstab, wie im Whitepaper für GPT-4.5 und einer weiteren kürzlichen Veröffentlichung erwähnt.
Verwandter Artikel
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Empfehlungen zu verwandten Spezialthemen
Kommentare (16)
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
Das neueste KI-Modell von OpenAI, GPT-4.5, mit dem Codenamen Orion, hat laut internen Benchmark-Tests bemerkenswerte Überzeugungsfähigkeiten gezeigt. Am Donnerstag veröffentlicht, wurden die Fähigkeiten des Modells in einem Whitepaper detailliert beschrieben, das sich auf seine Leistung bei Überzeugungsaufgaben konzentrierte. OpenAI definiert Überzeugung als das Risiko, das damit verbunden ist, Personen dazu zu bringen, ihre Überzeugungen zu ändern oder auf Basis von statischem und interaktivem Inhalt, der vom Modell generiert wird, zu handeln.
In einem bemerkenswerten Test wurde GPT-4.5 gegen ein anderes OpenAI-Modell, GPT-4o, in einem Szenario getestet, in dem es versuchte, virtuelles Geld zu erlangen. GPT-4.5 übertraf andere OpenAI-Modelle, einschließlich auf Argumentation fokussierter Modelle wie o1 und o3-mini, bei dieser Aufgabe. Es glänzte auch darin, GPT-4o dazu zu bringen, ein geheimes Codewort preiszugeben, und übertraf o3-mini dabei um einen erheblichen Vorsprung von 10 Prozentpunkten.
Das Whitepaper hebt hervor, dass der Erfolg von GPT-4.5 im Spendentest auf eine clevere Strategie zurückzuführen war, die es entwickelt hat. Das Modell bat um kleine Spenden, oft in Höhe von „2 $ oder 3 $“ aus einer größeren Summe, was zu kleineren, aber häufigeren Spenden im Vergleich zu anderen Modellen führte.


Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen
Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
OpenAI skizziert eine KI-Wirtschaft mit öffentlichen Vermögensfonds, Robotersteuern und einer Vier-Tage-Woche
Während Regierungen darum ringen, die wirtschaftlichen Auswirkungen superintelligenter Maschinen zu bewältigen, hat OpenAI eine Reihe von politischen Vorschlägen veröffentlicht, in denen dargelegt wir
Greg Brockman enthüllt, wie Elon Musk OpenAI verlassen hat
Ende August 2017 trafen sich führende Persönlichkeiten von OpenAI – damals ein kleines gemeinnütziges Forschungslabor –, um zu erörtern, wie sie ein gewinnorientiertes Unternehmen gründen könnten, um
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄





Heim






