कस्टमाइज़ेबल थिंकिंग अवधि के साथ एन्थ्रोपिक एआई मॉडल का अनावरण करता है
10 अप्रैल 2025
ArthurThomas
77
एंथ्रोपिक का नवीनतम एआई मॉडल, क्लाउड 3.7 सॉनेट, एआई की दुनिया में चीजों को हिला रहा है। उद्योग के पहले "हाइब्रिड एआई रीज़निंग मॉडल" को डब किया गया, यह आपको त्वरित उत्तर और अधिक विचारशील प्रतिक्रियाएं देने के लिए डिज़ाइन किया गया है, जो आपको चाहिए। आप यह भी चुन सकते हैं कि आप कितने समय तक क्लाउड को अपने सवालों के बारे में "सोचना" चाहते हैं - सही शांत, सही?
क्लाउड 3.7 सॉनेट के पीछे का विचार एआई का उपयोग करने के लिए बहुत सरल है। विभिन्न मॉडलों के एक समूह से लेने के बजाय, एन्थ्रोपिक एक मॉडल चाहता है कि सब कुछ संभालें। सोमवार से, हर कोई क्लाउड 3.7 सॉनेट पर अपना हाथ ले सकता है, लेकिन यदि आप इसकी फैंसी रीजनिंग सुविधाओं का उपयोग करना चाहते हैं, तो आपको एन्थ्रोपिक की प्रीमियम योजनाओं में से एक के लिए साइन अप करना होगा। मुफ्त उपयोगकर्ताओं को अभी भी मॉडल का एक ठोस संस्करण मिलेगा, जो एंथ्रोपिक कहता है कि उनके पिछले एक, क्लाउड 3.5 सॉनेट से बेहतर है।
अब, लागत के बारे में - क्लॉड 3.7 SONNET आपको $ 3 प्रति मिलियन इनपुट टोकन और $ 15 प्रति मिलियन आउटपुट टोकन वापस सेट कर देगा। यह कुछ अन्य मॉडलों की तुलना में थोड़ा सा प्रिकियर है, जैसे कि ओपनई के ओ 3-मिनी और डीपसेक के आर 1, लेकिन याद रखें, वे सिर्फ तर्क देने वाले मॉडल हैं, न कि क्लाउड जैसे संकर।

एन्थ्रोपिक की नई थिंकिंग मोड इमेज क्रेडिट: एन्थ्रोपिक क्लाउड 3.7 सॉनेट एंथ्रोपिक का पहला मॉडल है जो "कारण" कर सकता है, जो एआई दुनिया में एक बड़ी बात है। तर्क मॉडल थोड़ा अधिक समय लेते हैं और सवालों के जवाब देने के लिए कम्प्यूटिंग पावर लेते हैं, उन्हें अधिक सटीक उत्तर के लिए छोटे कदमों में तोड़ते हैं। यह बिल्कुल मानवीय तर्क की तरह नहीं है, लेकिन यह इसके बाद मॉडलिंग है।
एंथ्रोपिक को क्लाउड के लिए बड़ी योजनाएं मिलीं। आखिरकार, वे चाहते हैं कि यह पता लगाना चाहिए कि इसे अपने आप पर सवालों के बारे में "सोचना" चाहिए, बिना आपको इसे सेट करने के लिए। एंथ्रोपिक के उत्पाद और अनुसंधान लीड, डायने पेन ने TechCrunch को बताया कि वे तर्क को देखते हैं कि एक फ्रंटियर मॉडल को कई चीजों में से एक करने में सक्षम होना चाहिए, सभी एक में लुढ़क गए।
क्लाउड 3.7 सॉनेट के साथ, आपको यह भी देखने को मिलेगा कि यह "दृश्यमान खरोंच पैड" के माध्यम से अपने उत्तरों की योजना कैसे बनाती है। अधिकांश समय, आप पूरी प्रक्रिया देखेंगे, लेकिन एन्थ्रोपिक सुरक्षा कारणों से कुछ हिस्सों को फिर से तैयार कर सकता है।

क्लाउड ऐप इमेज इमेज क्रेडिट में क्लाउड की सोच प्रक्रिया: एन्थ्रोपिक एंथ्रोपिक का कहना है कि उन्होंने वास्तविक दुनिया के कार्यों के लिए क्लाउड के सोचने के मोड को ठीक से ट्यून किया है, जैसे कि कठिन कोडिंग समस्याओं या कार्यों को जो कि स्वायत्तता की थोड़ी आवश्यकता होती है। यदि आप एंथ्रोपिक के एपीआई का उपयोग कर रहे हैं, तो आप यह भी नियंत्रित कर सकते हैं कि "सोच" क्लाउड कितना "सोच" की गुणवत्ता के साथ गति और लागत को संतुलित करता है।
कुछ परीक्षणों में, क्लाउड 3.7 सॉनेट ने बहुत अच्छा किया। SWE-Bench पर, वास्तविक दुनिया कोडिंग कार्यों के लिए एक परीक्षण, इसने 62.3%स्कोर किया, ओपनई के O3-Mini को हराकर, जो 49.3%मिला। और ताऊ-बेंच पर, जो यह मापता है कि एआई एक खुदरा सेटिंग में सिम्युलेटेड उपयोगकर्ताओं और बाहरी एपीआई के साथ कितनी अच्छी तरह से बातचीत कर सकता है, क्लाउड 3.7 सॉनेट ने ओपनईएआई के ओ 1 मॉडल की तुलना में 81.2%स्कोर किया, जो 73.5%मिला।
एंथ्रोपिक का कहना है कि क्लाउड 3.7 सॉनेट को सवालों के जवाब देने से इनकार करने की संभावना कम होगी, जिससे हानिकारक और सौम्य संकेतों के बीच अधिक बारीक अंतर हो जाएगा। उन्होंने क्लाउड 3.5 सॉनेट की तुलना में अनावश्यक रिफ्यूजल को 45% तक कम कर दिया है।
क्लाउड 3.7 सॉनेट के साथ, एंथ्रोपिक ने क्लाउड कोड नामक एक नया टूल भी रोल आउट किया। यह एक शोध पूर्वावलोकन है जो डेवलपर्स को अपने टर्मिनल से क्लाउड के माध्यम से विशिष्ट कार्यों को चलाने देता है। एक डेमो में, एंथ्रोपिक ने दिखाया कि कैसे क्लाउड कोड एक साधारण कमांड के साथ एक कोडिंग परियोजना का विश्लेषण कर सकता है, जैसे "इस परियोजना संरचना को समझाएं।" आप एक कोडबेस को संशोधित करने के लिए सादे अंग्रेजी का उपयोग भी कर सकते हैं, और क्लाउड कोड इसके संपादन का वर्णन करेगा क्योंकि यह जाता है, त्रुटियों के लिए परीक्षण, और परियोजना को एक GitHub रिपॉजिटरी में धकेल देता है।
क्लाउड कोड "पहले आओ, पहले पाओ" आधार पर सीमित संख्या में उपयोगकर्ताओं के लिए उपलब्ध होगा।
एंथ्रोपिक रिलीजिंग क्लाउड 3.7 सॉनेट एक ऐसे समय में जब एआई लैब्स नए मॉडल को बाएं और दाएं मंथन कर रहे हैं। जबकि एंथ्रोपिक आमतौर पर अधिक सावधान, सुरक्षा-केंद्रित दृष्टिकोण लिया जाता है, इस बार वे पैक का नेतृत्व करना चाहते हैं। लेकिन वे कितने समय से आगे रहेंगे, किसी का अनुमान है - विशेष रूप से ओपनई के सीईओ, सैम अल्टमैन के साथ, उन्होंने कहा कि उन्हें "महीनों" में अपने स्वयं के आने का एक हाइब्रिड एआई मॉडल मिला है।
संबंधित लेख
La recherche en profondeur ouverte arrive pour défier la perplexité et la recherche de chatpt
Si vous êtes dans le monde de la technologie, vous avez probablement entendu parler du buzz entourant la recherche en profondeur ouverte (ODS), le nouveau cadre open-source de la Fondation Sentient. ODS fait des vagues en offrant une alternative robuste aux moteurs de recherche d'IA propriétaires comme la recherche de perplexité et de chatpt, et il s'agit
Comment l'IA juge-t-elle? Études anthropiques Les valeurs de Claude
Comme les modèles d'IA comme Claude d'Anthropic s'engagent de plus en plus avec les utilisateurs sur des valeurs humaines complexes, des conseils parentaux aux conflits de travail, leurs réponses reflètent intrinsèquement un ensemble de principes directeurs. Mais comment pouvons-nous vraiment saisir les valeurs exprimées par une IA lors de l'interaction avec des millions d'utilisateurs? Fourmi
MCP normalise la connectivité AI avec les outils et les données: un nouveau protocole émerge
Si vous plongez dans le monde de l'intelligence artificielle (IA), vous avez probablement remarqué à quel point il est crucial d'obtenir différents modèles d'IA, sources de données et outils pour bien jouer ensemble. C'est là que le protocole de contexte du modèle (MCP) entre en jeu, agissant comme un changeur de jeu dans la normalisation de la connectivité d'IA. T
सूचना (50)
0/200
JamesWhite
11 अप्रैल 2025 12:09:39 पूर्वाह्न GMT
Claude 3.7 Sonnet is pretty cool! I love how I can choose how long I want it to think before answering. Sometimes I need quick answers, and other times I want a more thoughtful response. It's like having a customizable AI buddy. Only wish it was a bit faster at switching modes. Still, a solid tool!
0
PatrickCarter
11 अप्रैल 2025 12:09:39 पूर्वाह्न GMT
クロード3.7ソネットはすごい!考えさせる時間を選べるのが気に入ってます。急いでる時も、じっくり考えてほしい時も対応してくれるから便利。ただ、モード切り替えがもう少し早ければ完璧なんですけどね。それでも、かなり使えるツールです!
0
JustinMartin
11 अप्रैल 2025 12:09:39 पूर्वाह्न GMT
클로드 3.7 소넷 정말 멋져요! 생각하는 시간을 선택할 수 있어서 좋아요. 급할 때도, 천천히 생각해줬으면 할 때도 잘 맞춰줘서 편리해요. 다만, 모드 전환이 좀 더 빨랐으면 좋겠어요. 그래도 쓸만한 도구예요!
0
NicholasNelson
11 अप्रैल 2025 12:09:39 पूर्वाह्न GMT
O Claude 3.7 Sonnet é incrível! Adoro poder escolher quanto tempo ele deve pensar antes de responder. Às vezes preciso de respostas rápidas, outras vezes quero algo mais pensado. É como ter um amigo de IA personalizável. Só queria que fosse um pouco mais rápido ao mudar de modos. Ainda assim, uma ferramenta sólida!
0
DanielRodriguez
11 अप्रैल 2025 12:09:39 पूर्वाह्न GMT
¡Claude 3.7 Sonnet es genial! Me encanta poder elegir cuánto tiempo quiero que piense antes de responder. A veces necesito respuestas rápidas, y otras veces quiero una respuesta más reflexiva. Es como tener un compañero de IA personalizable. Solo desearía que fuera un poco más rápido al cambiar de modos. Aún así, una herramienta sólida!
0
StephenGonzalez
13 अप्रैल 2025 8:23:55 पूर्वाह्न GMT
Claude 3.7 Sonnet is pretty cool! Being able to adjust how long it thinks is super useful. Sometimes it's a bit slow, but when you need a detailed answer, it's perfect. I wish it could be quicker for simple questions though.
0






एंथ्रोपिक का नवीनतम एआई मॉडल, क्लाउड 3.7 सॉनेट, एआई की दुनिया में चीजों को हिला रहा है। उद्योग के पहले "हाइब्रिड एआई रीज़निंग मॉडल" को डब किया गया, यह आपको त्वरित उत्तर और अधिक विचारशील प्रतिक्रियाएं देने के लिए डिज़ाइन किया गया है, जो आपको चाहिए। आप यह भी चुन सकते हैं कि आप कितने समय तक क्लाउड को अपने सवालों के बारे में "सोचना" चाहते हैं - सही शांत, सही?
क्लाउड 3.7 सॉनेट के पीछे का विचार एआई का उपयोग करने के लिए बहुत सरल है। विभिन्न मॉडलों के एक समूह से लेने के बजाय, एन्थ्रोपिक एक मॉडल चाहता है कि सब कुछ संभालें। सोमवार से, हर कोई क्लाउड 3.7 सॉनेट पर अपना हाथ ले सकता है, लेकिन यदि आप इसकी फैंसी रीजनिंग सुविधाओं का उपयोग करना चाहते हैं, तो आपको एन्थ्रोपिक की प्रीमियम योजनाओं में से एक के लिए साइन अप करना होगा। मुफ्त उपयोगकर्ताओं को अभी भी मॉडल का एक ठोस संस्करण मिलेगा, जो एंथ्रोपिक कहता है कि उनके पिछले एक, क्लाउड 3.5 सॉनेट से बेहतर है।
अब, लागत के बारे में - क्लॉड 3.7 SONNET आपको $ 3 प्रति मिलियन इनपुट टोकन और $ 15 प्रति मिलियन आउटपुट टोकन वापस सेट कर देगा। यह कुछ अन्य मॉडलों की तुलना में थोड़ा सा प्रिकियर है, जैसे कि ओपनई के ओ 3-मिनी और डीपसेक के आर 1, लेकिन याद रखें, वे सिर्फ तर्क देने वाले मॉडल हैं, न कि क्लाउड जैसे संकर।
एंथ्रोपिक को क्लाउड के लिए बड़ी योजनाएं मिलीं। आखिरकार, वे चाहते हैं कि यह पता लगाना चाहिए कि इसे अपने आप पर सवालों के बारे में "सोचना" चाहिए, बिना आपको इसे सेट करने के लिए। एंथ्रोपिक के उत्पाद और अनुसंधान लीड, डायने पेन ने TechCrunch को बताया कि वे तर्क को देखते हैं कि एक फ्रंटियर मॉडल को कई चीजों में से एक करने में सक्षम होना चाहिए, सभी एक में लुढ़क गए।
क्लाउड 3.7 सॉनेट के साथ, आपको यह भी देखने को मिलेगा कि यह "दृश्यमान खरोंच पैड" के माध्यम से अपने उत्तरों की योजना कैसे बनाती है। अधिकांश समय, आप पूरी प्रक्रिया देखेंगे, लेकिन एन्थ्रोपिक सुरक्षा कारणों से कुछ हिस्सों को फिर से तैयार कर सकता है।
कुछ परीक्षणों में, क्लाउड 3.7 सॉनेट ने बहुत अच्छा किया। SWE-Bench पर, वास्तविक दुनिया कोडिंग कार्यों के लिए एक परीक्षण, इसने 62.3%स्कोर किया, ओपनई के O3-Mini को हराकर, जो 49.3%मिला। और ताऊ-बेंच पर, जो यह मापता है कि एआई एक खुदरा सेटिंग में सिम्युलेटेड उपयोगकर्ताओं और बाहरी एपीआई के साथ कितनी अच्छी तरह से बातचीत कर सकता है, क्लाउड 3.7 सॉनेट ने ओपनईएआई के ओ 1 मॉडल की तुलना में 81.2%स्कोर किया, जो 73.5%मिला।
एंथ्रोपिक का कहना है कि क्लाउड 3.7 सॉनेट को सवालों के जवाब देने से इनकार करने की संभावना कम होगी, जिससे हानिकारक और सौम्य संकेतों के बीच अधिक बारीक अंतर हो जाएगा। उन्होंने क्लाउड 3.5 सॉनेट की तुलना में अनावश्यक रिफ्यूजल को 45% तक कम कर दिया है।
क्लाउड 3.7 सॉनेट के साथ, एंथ्रोपिक ने क्लाउड कोड नामक एक नया टूल भी रोल आउट किया। यह एक शोध पूर्वावलोकन है जो डेवलपर्स को अपने टर्मिनल से क्लाउड के माध्यम से विशिष्ट कार्यों को चलाने देता है। एक डेमो में, एंथ्रोपिक ने दिखाया कि कैसे क्लाउड कोड एक साधारण कमांड के साथ एक कोडिंग परियोजना का विश्लेषण कर सकता है, जैसे "इस परियोजना संरचना को समझाएं।" आप एक कोडबेस को संशोधित करने के लिए सादे अंग्रेजी का उपयोग भी कर सकते हैं, और क्लाउड कोड इसके संपादन का वर्णन करेगा क्योंकि यह जाता है, त्रुटियों के लिए परीक्षण, और परियोजना को एक GitHub रिपॉजिटरी में धकेल देता है।
क्लाउड कोड "पहले आओ, पहले पाओ" आधार पर सीमित संख्या में उपयोगकर्ताओं के लिए उपलब्ध होगा।
एंथ्रोपिक रिलीजिंग क्लाउड 3.7 सॉनेट एक ऐसे समय में जब एआई लैब्स नए मॉडल को बाएं और दाएं मंथन कर रहे हैं। जबकि एंथ्रोपिक आमतौर पर अधिक सावधान, सुरक्षा-केंद्रित दृष्टिकोण लिया जाता है, इस बार वे पैक का नेतृत्व करना चाहते हैं। लेकिन वे कितने समय से आगे रहेंगे, किसी का अनुमान है - विशेष रूप से ओपनई के सीईओ, सैम अल्टमैन के साथ, उन्होंने कहा कि उन्हें "महीनों" में अपने स्वयं के आने का एक हाइब्रिड एआई मॉडल मिला है।



Claude 3.7 Sonnet is pretty cool! I love how I can choose how long I want it to think before answering. Sometimes I need quick answers, and other times I want a more thoughtful response. It's like having a customizable AI buddy. Only wish it was a bit faster at switching modes. Still, a solid tool!




クロード3.7ソネットはすごい!考えさせる時間を選べるのが気に入ってます。急いでる時も、じっくり考えてほしい時も対応してくれるから便利。ただ、モード切り替えがもう少し早ければ完璧なんですけどね。それでも、かなり使えるツールです!




클로드 3.7 소넷 정말 멋져요! 생각하는 시간을 선택할 수 있어서 좋아요. 급할 때도, 천천히 생각해줬으면 할 때도 잘 맞춰줘서 편리해요. 다만, 모드 전환이 좀 더 빨랐으면 좋겠어요. 그래도 쓸만한 도구예요!




O Claude 3.7 Sonnet é incrível! Adoro poder escolher quanto tempo ele deve pensar antes de responder. Às vezes preciso de respostas rápidas, outras vezes quero algo mais pensado. É como ter um amigo de IA personalizável. Só queria que fosse um pouco mais rápido ao mudar de modos. Ainda assim, uma ferramenta sólida!




¡Claude 3.7 Sonnet es genial! Me encanta poder elegir cuánto tiempo quiero que piense antes de responder. A veces necesito respuestas rápidas, y otras veces quiero una respuesta más reflexiva. Es como tener un compañero de IA personalizable. Solo desearía que fuera un poco más rápido al cambiar de modos. Aún así, una herramienta sólida!




Claude 3.7 Sonnet is pretty cool! Being able to adjust how long it thinks is super useful. Sometimes it's a bit slow, but when you need a detailed answer, it's perfect. I wish it could be quicker for simple questions though.












