विकल्प
घर
समाचार
Openai ने GPT-4.5 'ओरियन' लॉन्च किया: इसका सबसे बड़ा AI मॉडल आज तक

Openai ने GPT-4.5 'ओरियन' लॉन्च किया: इसका सबसे बड़ा AI मॉडल आज तक

10 अप्रैल 2025
98

अद्यतन 2:40 PM Pt: GPT-4.5 के लॉन्च के कुछ ही घंटों बाद, Openai ने AI मॉडल के श्वेत पत्र के लिए एक शांत संपादन किया। उन्होंने कहा कि "GPT-4.5 एक फ्रंटियर AI मॉडल नहीं है।" आप अभी भी यहां मूल श्वेत पत्र का उपयोग कर सकते हैं। नीचे मूल लेख है।

गुरुवार को, Openai ने GPT-4.5 पर पर्दे को वापस खींच लिया, बहुप्रतीक्षित AI मॉडल जो कोड नाम ओरियन द्वारा जाता है। Openai के इस नवीनतम Behemoth को एक अभूतपूर्व मात्रा में कंप्यूटिंग शक्ति और डेटा के साथ प्रशिक्षित किया गया है, इसे अपने पूर्ववर्तियों से अलग सेट किया गया है।

अपने प्रभावशाली पैमाने के बावजूद, ओपनई के श्वेत पत्र ने शुरू में कहा कि उन्होंने जीपीटी -4.5 को एक फ्रंटियर मॉडल नहीं माना। हालाँकि, उस कथन को तब से हटा दिया गया है, जिससे हमें मॉडल की वास्तविक क्षमता के बारे में आश्चर्य हुआ।

गुरुवार से, CHATGPT PRO, Openai की प्रीमियम $ 200-महीने की सेवा के लिए सब्सक्राइबर, एक शोध पूर्वावलोकन के हिस्से के रूप में GPT-4.5 का पहला स्वाद मिलेगा। Openai के एक प्रवक्ता के अनुसार, Openai के पेड API टियर पर डेवलपर्स आज GPT-4.5 का उपयोग शुरू कर सकते हैं, जबकि CHATGPT PLUS और CHATGPT टीम की सदस्यता अगले सप्ताह कुछ समय तक पहुंच की उम्मीद करनी चाहिए।

टेक की दुनिया ओरियन के बारे में गुलजार रही है, इसे इस बात के परीक्षण के रूप में देख रहा है कि क्या पारंपरिक एआई प्रशिक्षण विधियाँ अभी भी पानी पकड़ती हैं। GPT-4.5 अपने पूर्ववर्तियों के रूप में एक ही प्लेबुक का अनुसरण करता है, जो पूर्व-प्रशिक्षण नामक एक असुरक्षित सीखने के चरण के दौरान कंप्यूटिंग शक्ति और डेटा में भारी वृद्धि पर निर्भर करता है।

अतीत में, स्केलिंग ने गणित, लेखन और कोडिंग जैसे विभिन्न डोमेन में महत्वपूर्ण प्रदर्शन की छलांग लगाई है। Openai का दावा है कि GPT-4.5 के आकार ने इसे "एक गहरी विश्व ज्ञान" और "उच्च भावनात्मक बुद्धिमत्ता" के साथ संपन्न किया है। फिर भी, ऐसे संकेत हैं कि स्केलिंग से रिटर्न कम हो सकता है। कई एआई बेंचमार्क पर, जीपीटी -4.5 डीपसेक, एन्थ्रोप्रोपिक और यहां तक ​​कि ओपनईआई जैसी कंपनियों से नए तर्क मॉडल से पीछे हैं।

इसके अलावा, GPT-4.5 चलाना एक भारी कीमत टैग के साथ आता है। Openai मानता है कि यह इतना महंगा है कि वे इस बात पर विचार कर रहे हैं कि क्या इसे लंबे समय में अपने एपीआई के माध्यम से उपलब्ध रखा जाए। डेवलपर्स प्रत्येक मिलियन इनपुट टोकन के लिए $ 75 और प्रत्येक मिलियन आउटपुट टोकन के लिए $ 150 का भुगतान करेंगे, अधिक सस्ती GPT-4O के विपरीत एक स्टार्क, जिसकी लागत सिर्फ $ 2.50 प्रति मिलियन इनपुट टोकन और $ 10 प्रति मिलियन आउटपुट टोकन है।

ओपनई ने एक ब्लॉग पोस्ट में साझा किया, "हम जीपीटी। 4.5 को एक शोध पूर्वावलोकन के रूप में साझा कर रहे हैं, जो इसकी ताकत और सीमाओं को बेहतर ढंग से समझने के लिए एक शोध पूर्वावलोकन है।" "हम अभी भी इसकी पूरी क्षमता की खोज कर रहे हैं और यह देखने के लिए उत्साहित हैं कि लोग इसे अप्रत्याशित तरीकों से कैसे उपयोग करेंगे।"

मिश्रित प्रदर्शन

Openai स्पष्ट है कि GPT-4.5 का मतलब GPT-4O को बदलने के लिए नहीं है, उनके वर्कहॉर्स मॉडल जो उनके अधिकांश एपीआई और चैट को चलाता है। जबकि GPT-4.5 फ़ाइल और इमेज अपलोड को संभाल सकता है और Chatgpt के कैनवस टूल का उपयोग कर सकता है, यह वर्तमान में CHATGPT के यथार्थवादी दो-तरफ़ा वॉयस मोड जैसी सुविधाओं का समर्थन नहीं करता है।

उज्ज्वल पक्ष पर, GPT-4.5 Openai के SimpleQA बेंचमार्क पर GPT-4O और कई अन्य मॉडलों को आउटपरफॉर्म करता है, जो सीधे, तथ्यात्मक प्रश्नों पर AI मॉडल का परीक्षण करता है। Openai यह भी दावा करता है कि GPT-4.5 अधिकांश मॉडलों की तुलना में कम बार मतिभ्रम करता है, जो सैद्धांतिक रूप से जानकारी को गढ़ने की संभावना कम करना चाहिए।

दिलचस्प बात यह है कि OpenAI ने अपने शीर्ष प्रदर्शन करने वाले तर्क मॉडल, गहन अनुसंधान में से एक को SimpleQA परिणामों में शामिल नहीं किया। Openai के एक प्रवक्ता ने TechCrunch को बताया कि उन्होंने इस बेंचमार्क पर सार्वजनिक रूप से गहन अनुसंधान के प्रदर्शन की सूचना नहीं दी है और इसे एक प्रासंगिक तुलना नहीं मानते हैं। हालांकि, Perplexity का डीप रिसर्च मॉडल, जो अन्य बेंचमार्क पर Openai के गहरे शोध के समान प्रदर्शन करता है, वास्तव में तथ्यात्मक सटीकता के इस परीक्षण पर GPT-4.5 को आउटसोर्स करता है।

Simpleqa बेंचमार्क.इमेज क्रेडिट: Openai
SWE-Bench सत्यापित बेंचमार्क से कोडिंग समस्याओं के एक सबसेट पर, GPT-4.5 GPT-4O और O3-Mini के समान प्रदर्शन करता है, लेकिन Openai के गहरे अनुसंधान और एन्थ्रोपिक के क्लाउड 3.7 Sonnet से कम हो जाता है। एक अन्य कोडिंग परीक्षण पर, Openai के SWE-Lancer बेंचमार्क, जो AI मॉडल की पूर्ण सॉफ़्टवेयर सुविधाओं को विकसित करने की क्षमता को मापता है, GPT-4.5 GPT-4O और O3-Mini दोनों को बेहतर बनाता है, लेकिन गहन शोध को पार नहीं करता है।

Openai की Swe-Bench सत्यापित बेंचमार्क। Image क्रेडिट: Openai
Openai का SWE-Lancer Diamond Benchmark.image क्रेडिट: Openai
जबकि GPT-4.5 Aime और GPQA जैसे अकादमिक बेंचमार्क को चुनौती देने पर O3-Mini, DeepSeek के R1, और क्लाउड 3.7 SONNET जैसे प्रमुख AI तर्क मॉडल के प्रदर्शन से काफी मेल नहीं खाता है, यह समान परीक्षणों पर प्रमुख गैर-रेनिंग मॉडल के खिलाफ अपनी पकड़ रखता है। इससे पता चलता है कि गणित और विज्ञान से संबंधित कार्यों में जीपीटी -4.5 एक्सेल।

Openai यह भी दावा करता है कि GPT-4.5 गुणात्मक रूप से उन क्षेत्रों में अन्य मॉडलों से बेहतर है जो बेंचमार्क अच्छी तरह से कैप्चर नहीं करते हैं, जैसे कि मानवीय इरादे को समझना। वे दावा करते हैं कि GPT-4.5 एक गर्म, अधिक प्राकृतिक स्वर में प्रतिक्रिया करता है और लेखन और डिजाइन जैसे रचनात्मक कार्यों पर अच्छा प्रदर्शन करता है।

एक अनौपचारिक परीक्षण में, Openai ने GPT-4.5 और दो अन्य मॉडल, GPT-4O और O3-Mini को SVG प्रारूप में एक गेंडा बनाने के लिए कहा। केवल GPT-4.5 एक गेंडा जैसा दिखने वाले कुछ का उत्पादन करने में कामयाब रहा।

लेफ्ट: GPT-4.5, मध्य: GPT-4O, दाएं: O3-mini.image क्रेडिट: Openai
एक अन्य परीक्षण में, Openai ने GPT-4.5 और अन्य मॉडलों को संकेत का जवाब देने के लिए प्रेरित किया, "मैं परीक्षण में विफल होने के बाद कठिन समय से गुजर रहा हूं।" जबकि GPT-4O और O3-Mini ने उपयोगी जानकारी प्रदान की, GPT-4.5 की प्रतिक्रिया सबसे अधिक सामाजिक रूप से उपयुक्त थी।

"हम इस रिलीज के माध्यम से GPT-4.5 की क्षमताओं की अधिक पूरी तस्वीर प्राप्त करने के लिए तत्पर हैं," Openai ने अपने ब्लॉग पोस्ट में लिखा है, "क्योंकि हम मानते हैं कि अकादमिक बेंचमार्क हमेशा वास्तविक दुनिया की उपयोगिता को प्रतिबिंबित नहीं करते हैं।"

GPT-4.5 की भावनात्मक खुफिया कार्रवाई में। Image क्रेडिट: Openai
स्केलिंग कानूनों को चुनौती दी

Openai का दावा है कि GPT ‘4.5 "अनसुनीज़ लर्निंग में जो संभव है, उसकी सीमा पर है।" फिर भी, इसकी सीमाएं विशेषज्ञों के बीच बढ़ते संदेह का समर्थन करती हैं कि पूर्व-प्रशिक्षण के तथाकथित स्केलिंग कानून उनकी सीमा तक पहुंच सकते हैं।

Ilya Sutskever, Openai के सह-संस्थापक और पूर्व मुख्य वैज्ञानिक, ने दिसंबर में कहा था कि "हमने शिखर डेटा प्राप्त किया है" और "पूर्व-प्रशिक्षण जैसा कि हम जानते हैं कि यह निर्विवाद रूप से समाप्त हो जाएगा।" उनकी टिप्पणियों ने नवंबर में TechCrunch के साथ AI निवेशकों, संस्थापकों और शोधकर्ताओं द्वारा साझा की गई चिंताओं को प्रतिध्वनित किया।

इन चुनौतियों के जवाब में, उद्योग -ओपनआईआई सहित - ने तर्क मॉडल की ओर रुख किया है, जो कार्यों को करने में अधिक समय लेते हैं लेकिन अधिक सुसंगत परिणाम प्रदान करते हैं। समस्याओं के माध्यम से "सोचने" के लिए अधिक समय और कंप्यूटिंग शक्ति को तर्क देने की अनुमति देकर, एआई लैब्स का मानना ​​है कि वे मॉडल क्षमताओं को महत्वपूर्ण रूप से बढ़ा सकते हैं।

Openai ने अंततः अपनी "O" रीज़निंग सीरीज़ के साथ अपनी GPT श्रृंखला को मर्ज करने की योजना बनाई है, जो इस साल के अंत में GPT-5 से शुरू हो रही है। अपनी उच्च प्रशिक्षण लागत, देरी और आंतरिक अपेक्षाओं को पूरा करने के बावजूद, GPT-4.5 अपने आप AI बेंचमार्क क्राउन का दावा नहीं कर सकता है। लेकिन Openai संभावना इसे कुछ अधिक शक्तिशाली की ओर एक महत्वपूर्ण कदम के रूप में देखता है।

संबंधित लेख
OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Takes Operator to the Next LevelOpenAI is giving its autonomous AI agent, Operator, a major upgrade. The upcoming changes mean Operator will soon rely on a model based on o3
OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied Why Benchmark Discrepancies Matter in AIWhen it comes to AI, numbers often tell the story—and sometimes, those numbers don’t quite add up. Take OpenAI’s o3 model, for instance. The
DeepSeek AI Challenges ChatGPT and Shapes the Future of AI DeepSeek AI Challenges ChatGPT and Shapes the Future of AI The Rise of DeepSeek AI: A New Chapter in the AI LandscapeArtificial intelligence is in a constant state of flux, with new entrants challenging the status quo every day. Among these, DeepSeek AI has emerged as a notable contender, particularly after surpassing ChatGPT in app store downloads. This mi
सूचना (50)
GregoryBaker
GregoryBaker 10 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.

NicholasSanchez
NicholasSanchez 10 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。

JasonJohnson
JasonJohnson 10 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.

JasonAnderson
JasonAnderson 10 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.

AvaHill
AvaHill 10 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.

KennethMartin
KennethMartin 10 अप्रैल 2025 12:00:00 पूर्वाह्न GMT

GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!

शीर्ष समाचार
Openai बेहतर चैट के लिए AI वॉयस असिस्टेंट को बढ़ाता है एआई-संचालित I/O क्रॉसवर्ड का अनुभव करें: क्लासिक वर्ड गेम पर एक आधुनिक मोड़ एआई कंप्यूटिंग 2026 तक कई एनवाईसीएस की शक्ति का उपभोग करने के लिए, संस्थापक कहते हैं नोटबुकलम विश्व स्तर पर फैलता है, स्लाइड जोड़ता है और तथ्य-जाँच में वृद्धि करता है एनवीडिया के सीईओ ने दीपसेक के बाजार प्रभाव पर गलतफहमी को स्पष्ट किया दक्षिण कोरिया स्थानीय दुकानों में दीपसेक ऐप डाउनलोड करता है Adobe 10 विशिष्ट AI एजेंटों का अनावरण करता है: उनके व्यावसायिक अनुप्रयोगों की खोज करें चैट की ऊर्जा का उपयोग अपेक्षा से कम है Openai का O3 मॉडल संभावित रूप से अधिक महंगा है जो शुरू में विचार की तुलना में संचालित होता है नोटबुकल्म वेब स्रोत खोज सुविधा जोड़ता है
अधिक
शीर्ष पर वापस
OR