Option
Heim
Nachricht
OpenAIs GPT-4,5 zeichnet sich aus, um andere AIs zu überzeugen, Geld zu überweisen

OpenAIs GPT-4,5 zeichnet sich aus, um andere AIs zu überzeugen, Geld zu überweisen

11. April 2025
86

Das neueste KI-Modell von OpenAI, GPT-4,5, Codenamed Orion, hat nach internen Benchmark-Tests bemerkenswerte überzeugende Fähigkeiten gezeigt. Die am Donnerstag veröffentlichten Funktionen des Modells wurden in einem Weißbuch detailliert, das sich auf seine Leistung bei Überzeugungsaufgaben konzentrierte. OpenAI definiert Überzeugung als das Risiko, das mit der Überzeugung von Personen verbunden ist, ihre Überzeugungen zu ändern oder Maßnahmen zu ergreifen, die sowohl auf statischen als auch auf interaktiven Inhalten basieren, die vom Modell generiert werden.

In einem bemerkenswerten Test wurde GPT-4,5 gegen ein anderes OpenAI-Modell, GPT-4O, in einem Szenario angewendet, in dem es versuchte, virtuelles Geld daraus zu überreden. GPT-4,5 übertraf andere OpenAI-Modelle, einschließlich argumentationsorientierter Modelle wie O1 und O3-Mini, in dieser Aufgabe. Es war auch hervorragend darin, GPT-4O dazu zu bringen, ein geheimes Codewort zu enthüllen, das O3-Mini mit einem signifikanten Rand von 10 Prozentpunkten übertraf.

Das Whitepaper zeigt, dass der Erfolg von GPT-4,5 im Spendentest auf eine clevere Strategie zurückzuführen ist, die es entwickelt hat. Das Modell forderte kleine Spenden an, was häufig Beträge wie "2 USD oder 3 USD" aus einer größeren Summe vorschlug, was zu kleineren, aber häufigeren Spenden im Vergleich zu anderen Modellen führte.

OpenAI GPT-4.5

Ergebnisse von OpenAIs Spenden -System -Benchmark.image Credits: OpenAI
Trotz seiner beeindruckenden Leistung hat Openai erklärt, dass GPT-4,5 den Schwellenwert für das "hohe" Risiko in der Überzeugungskategorie nicht überschreitet. Das Unternehmen hat sich verpflichtet, die Freigabe eines Modells zurückzuhalten, das dieses Risiko erreicht, bis es angemessene Sicherheitsmaßnahmen durchführen kann, um das Risiko auf ein "mittleres" Niveau zu verringern.

OpenAI GPT-4.5

OpenAIs Codewort -Deception -Benchmarkergebnisse.Image Credits: OpenAI
Das Potenzial für KI, irreführende Informationen zu verbreiten und die Menschen böswillig zu beeinflussen, ist ein wachsendes Problem. Im vergangenen Jahr wurde weltweit ein Anstieg der politischen Deepfakes ansteigt, und die KI wird zunehmend bei Social Engineering -Angriffen gegen Einzelpersonen und Organisationen eingesetzt. Als Reaktion darauf arbeitet OpenAI aktiv daran, seine Methoden zur Beurteilung der realen Überzeugungsrisiken wie der Verbreitung irreführender Informationen in großem Maßstab zu verfeinern, wie im White Paper für GPT-4,5 und eine weitere kürzlich veröffentlichte Veröffentlichung erwähnt.

Verwandter Artikel
OpenAI升級其Operator Agent的AI模型 OpenAI升級其Operator Agent的AI模型 OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
Kommentare (10)
0/200
SamuelRamirez
SamuelRamirez 14. April 2025 00:00:00 GMT

GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!

HenryJackson
HenryJackson 14. April 2025 00:00:00 GMT

GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!

ScottJackson
ScottJackson 14. April 2025 00:00:00 GMT

GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!

PeterMartinez
PeterMartinez 12. April 2025 00:00:00 GMT

As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!

JoeLee
JoeLee 13. April 2025 00:00:00 GMT

Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!

PeterJohnson
PeterJohnson 12. April 2025 00:00:00 GMT

GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔

Zurück nach oben
OR