DeepSeek-V3.2: GPT-5 आणि Gemini-3 Pro शी स्पर्धा करू इच्छिणारे चिनी मॉडेल

  • प्रगत तर्कशास्त्रात GPT-5 आणि Gemini-3 Pro शी स्पर्धा करण्याच्या महत्त्वाकांक्षेसह DeepSeek ने DeepSeek-V3.2 आणि V3.2-Speciale लाँच केले आहे.
  • हे मॉडेल बाह्य साधनांच्या वापरामध्ये "विचार" मोडला थेट समाकलित करते आणि १२८,००० टोकन्स पर्यंतच्या संदर्भांना समर्थन देते.
  • V3.2-Speciale गणित आणि संगणक शास्त्रात उत्कृष्ट आहे, आंतरराष्ट्रीय ऑलिंपियाडमध्ये सुवर्णपदकाच्या पातळीवर कामगिरी करतो.
  • कंपनी वजने आणि तांत्रिक अहवाल प्रकाशित करते, ज्यामुळे चीन, युरोप आणि अमेरिका यांच्यातील खुल्या एआयमध्ये नेतृत्वासाठीच्या संघर्षाला बळकटी मिळते.

DeepSeek-V3.2

कृत्रिम बुद्धिमत्तेच्या जागतिक शर्यतीत चिनी कंपनी डीपसीकने आणखी एक पाऊल टाकले आहे. घोषणा करताना DeepSeek-V3.2 आणि त्याचे व्हेरियंट V3.2-Specialeहे दोन्ही ओपन-सोर्स मॉडेल्स बाजारपेठेच्या उच्च टोकाला लक्ष्य करून बनवले आहेत. कंपनीचा दावा आहे की त्यांची तर्क प्रणाली GPT-5 आणि Gemini-3 Pro सारख्या आघाडीच्या बेंचमार्कशी तुलना करता येते, ज्यामुळे तीव्र तांत्रिक स्पर्धेच्या काळात अमेरिकन दिग्गजांवर दबाव निर्माण होतो.

युरोपमध्ये, जिथे वादविवाद होतात जबाबदार एआय, नियमन आणि तांत्रिक सार्वभौमत्व हे ट्रेंड सामान्य आहेत आणि डीपसीकचे पाऊल दुर्लक्षित राहिलेले नाही. एका चिनी प्रयोगशाळेने वजने, तपशीलवार तांत्रिक दस्तऐवजीकरण आणि ओपन सोर्समध्ये प्रगत तर्क मॉडेल प्रकाशित केले आहे ही वस्तुस्थिती अशी भावना बळकट करते की ओपन-सोर्स इकोसिस्टम पूर्णपणे मालकीच्या उपायांविरुद्ध पुन्हा ताकद मिळवत आहे, जे युरोपियन विद्यापीठे, संशोधन केंद्रे आणि टेक एसएमईसाठी विशेषतः मनोरंजक असू शकते.

डीपसीक-व्ही३.२: आघाडीच्या मॉडेल्सच्या पातळीवर तर्क करणे

हांग्झो-आधारित स्टार्टअपने सादर केले आहे DeepSeek-V3.2 कंपनीच्या लाइन ऑफ रिझनिंग मॉडेल्सची अंतिम आणि स्थिर आवृत्ती म्हणून, काही आठवड्यांपूर्वी रिलीज झालेल्या प्रायोगिक आवृत्तीची जागा घेते. कंपनीच्या मते, V3.2 ने GPT-5 सारखी कामगिरी साध्य केली. विविध मध्ये बेंचमार्क बहु-स्तरीय तर्क आणि विचारांचे प्रेक्षक, आणि थोडे खाली स्थित आहे जेमिनी-३.० प्रो काही बेंचमार्क चाचण्यांमध्ये.

हे मॉडेल एकत्र करते बाह्य साधने वापरण्याची क्षमता असलेले मानवी प्रकारचे तर्कजसे की वेब सर्च इंजिन, कॅल्क्युलेटर, कोड एक्झिक्युशन एन्व्हायर्नमेंट किंवा क्लॉड कोड सारख्या थर्ड-पार्टी सिस्टम. कल्पना अशी आहे की सिस्टम केवळ मजकूर तयार करत नाही तर नियोजन करू शकते, संसाधनांची चौकशी करू शकते, कार्ये अंमलात आणू शकते आणि नंतर सतत देखरेखीची आवश्यकता न पडता त्या परिणामांना अधिक संपूर्ण प्रतिसादात समाकलित करू शकते.

डीपसीकने अधोरेखित केले आहे की मॉडेल देते साधनांशी संवाद साधण्याचे दोन प्रकारएक दृश्यमान तर्कासह, जिथे वापरकर्ता मध्यवर्ती पायऱ्या फॉलो करू शकतो आणि दुसरा विचार प्रक्रिया न दाखवता. दोन्ही प्रकरणांमध्ये, टूल्सवर कॉल करतानाही "रिझनिंग मेमरी" कायम राहते त्याच संभाषणात आणि वापरकर्त्याकडून नवीन संदेश आल्यावरच पुन्हा सुरू होतो, विशेषतः दीर्घ कार्यांसाठी किंवा एजंट-प्रकारच्या प्रवाहांसाठी उपयुक्त.

साधनांच्या वापरामध्ये एकत्रित केलेला "विचार" मोड

DeepSeek-V3.2 मधील सर्वात उल्लेखनीय नवीन वैशिष्ट्यांपैकी एक म्हणजे साधनांच्या वापरामध्ये विचार करण्याच्या पद्धतीचे थेट एकत्रीकरणजरी ते कारण देत असले तरी, मॉडेल शोध इंजिनला प्रश्न पाठवू शकते, कॅल्क्युलेटरचा वापर करू शकते, कोड कार्यान्वित करू शकते किंवा इतर सेवांशी संवाद साधू शकते, अंतर्गत विश्लेषण आणि बाह्य कॉलचे चक्र एकत्रित करून उत्तरे देण्याचा प्रयत्न करू शकते. अधिक तपशीलवार आणि अचूक जेव्हा कामाला त्याची आवश्यकता असते.

कंपनीच्या मते, या दृष्टिकोनामुळे V3.2 ला त्याचे तर्क करण्यास आणि स्थानिक साधनांचा वापर करण्यास सक्षम असलेले पहिले मॉडेलमानक मोडमध्ये आणि गहन विचार मोडमध्ये दोन्ही. हे ज्याला म्हणतात त्याबद्दल स्पष्ट वचनबद्धता आहे एजंट-आधारित वर्कफ्लोया प्रकरणांमध्ये, एआय फक्त एकाच प्रश्नाचे उत्तर देत नाही, तर एक स्वायत्त एजंट म्हणून काम करते जे समस्येचे विश्लेषण करते, माहिती शोधते, गणना करते आणि नंतर सर्वकाही एकत्रितपणे एका सुसंगत समाधानात एकत्रित करते.

डीपसीक हे मॉडेल व्यापक प्रमाणात उपलब्ध आहे यावर देखील भर देते: डीपसीक-व्ही३.२ वेब, अॅप आणि एपीआय द्वारे वापरता येते.यामुळे युरोपमध्ये विकसित केलेल्या प्रकल्पांसह उत्पादने, व्हर्च्युअल असिस्टंट किंवा व्यवसाय साधनांमध्ये त्याचे एकत्रीकरण सुलभ होते. युरोपियन विकासक समुदाय आणि खुले पर्याय शोधणाऱ्या कंपन्यांसाठी, एकाच प्रमुख प्लॅटफॉर्मवर अवलंबून न राहता मॉडेल एक्सप्लोर करण्याची आणि अनुकूल करण्याची क्षमता हा एक महत्त्वाचा फायदा आहे.

डीपसीक स्पार्स अटेंशन (डीएसए) आर्किटेक्चर आणि संगणकीय कार्यक्षमता

तांत्रिक पातळीवर, DeepSeek-V3.2 चा गाभा हा आहे डीपसीक स्पार्स अटेंशन (डीएसए), एक लक्ष देणारी यंत्रणा जी संगणकीय खर्च कमी करताना खूप लांब अनुक्रम हाताळण्यासाठी डिझाइन केलेली आहे. डीपसीकने एआयसाठी अनुकूलित समांतर फाइल सिस्टमचे अनावरण केले आहे. जे कार्यक्षमता आणि तैनातीच्या प्रयत्नांना पूरक आहे. मॉडेलमध्ये सुमारे एकूण ६७१ अब्ज पॅरामीटर्सपरंतु प्रत्येक अनुमानाच्या टप्प्यावर ते फक्त सुमारे सक्रिय होतात प्रति टोकन ३७ अब्ज पॅरामीटर्सयामुळे संसाधनांचा वापर न वाढवता क्षमता राखता येते.

हे वितरित आर्किटेक्चर काम करण्यास अनुमती देते १२८,००० टोकन पर्यंतच्या संदर्भ विंडो उत्पादनात, हा आकार विशेषतः विस्तृत कागदपत्रांचे विश्लेषण करण्यासाठी, शैक्षणिक संशोधनासाठी किंवा मोठ्या प्रमाणात कायदेशीर आणि तांत्रिक माहितीचे पुनरावलोकन करण्यासाठी उपयुक्त आहे - युरोपियन संस्थांना खूप रस असलेल्या क्षेत्रांमध्ये. कंपनीने दिलेल्या माहितीनुसार, डीएसए अनुमानाची किंमत अंदाजे निम्म्याने कमी करते दीर्घ संदर्भात पूर्वीच्या दाट वास्तुकलेच्या तुलनेत.

स्पेन आणि उर्वरित EU मधील संस्थांसाठी ज्यांना संगणकीय बजेटच्या अडचणींचा सामना करावा लागत आहे, हे कार्यक्षमता सुधारणा यामुळे अमेरिकेतील प्रमुख तंत्रज्ञान कंपन्यांनी वापरलेल्या महागड्या पायाभूत सुविधांची आवश्यकता न पडता अत्यंत प्रगत मॉडेल्ससह प्रयोग करण्याचे दार उघडते. तरीही, डीपसीक मान्य करतो की त्याच्या स्पर्धकांच्या तुलनेत त्याच्याकडे अजूनही सुधारणा करण्याची संधी आहे. जागतिक ज्ञानाची व्याप्ती आणि कार्यक्षमता यांचे प्रतीकात्मक उदाहरण, मोठ्या प्रमाणात तैनातीसाठी दोन प्रमुख क्षेत्रे.

एजंट्ससाठी आरएल आणि सिंथेटिक डेटा वापरून सघन मजबुतीकरणासह डीपसीक-व्ही३.२

आर्किटेक्चरच्या पलीकडे, डीपसीक आग्रह धरतो की तर्कशक्तीतील बरीचशी झेप एका प्रशिक्षणानंतर मोठ्या प्रमाणात रीइन्फोर्समेंट लर्निंग (RL)कंपनीने पेक्षा जास्त वाटप केले आहे एकूण प्री-वर्कआउट गणनाच्या १०% केवळ या टप्प्यावर, या क्षेत्रात असामान्य टक्केवारी, मॉडेलची क्षमता मजबूत करण्याच्या उद्देशाने चुका दुरुस्त करा, सखोल तर्क करा, साधने वापरा आणि परस्परसंवादी वातावरणात कृती करा..

संघाने एक तयार केले आहे जटिल कृत्रिम डेटा परिसंस्था ज्यामध्ये पेक्षा जास्त समाविष्ट आहेत १,८०० प्रशिक्षण वातावरण आणि आजूबाजूला ८५,००० प्रगत सूचना एजंट्ससाठी विशिष्ट. या कार्यांमध्ये वास्तविक-जगातील शोध, गतिमान सिम्युलेशन, कोड अंमलबजावणी, साखळीतील समस्या आणि डेटासेटमधील त्रुटी कमी करण्यासाठी स्वयंचलितपणे व्युत्पन्न आणि सत्यापित परिस्थितींचा समावेश आहे.

हा दृष्टिकोन तयार करण्याच्या दिशेने आहे काही प्रमाणात स्वायत्ततेसह काम करण्यास सक्षम एआय एजंट्समाहितीचे विश्लेषण करणे, निर्णय घेणे आणि बहु-स्तरीय कार्यप्रवाहांमध्ये कार्य करणे. आर्थिक विश्लेषणापासून ते प्रगत तांत्रिक समर्थनापर्यंत - जटिल प्रक्रियांचे ऑटोमेशन एक्सप्लोर करणाऱ्या युरोपियन कंपन्यांसाठी, ही प्रगती विशेषतः आकर्षक असू शकते, जरी नियंत्रित चाचणी वातावरणाबाहेर मॉडेल्स कशी कामगिरी करतील हे पाहणे बाकी आहे.

डीपसीक-व्ही३.२-स्पेशल: गणित, संगणक विज्ञान आणि विस्तारित विचारसरणी

सामान्यवादी मॉडेलसोबतच, डीपसीकने लाँच केले आहे डीपसीक-व्ही३.२-स्पेशल, एक प्रकार जो प्रगत कॅल्क्युलस, गणितीय पुरावे आणि दीर्घ विचार प्रक्रियाकंपनीचा दावा आहे की ही आवृत्ती समतुल्य आहे जेमिनी-३.० प्रो गुंतागुंतीच्या तर्कशुद्ध कामांमध्ये गुगलची कामगिरी आणि आंतरराष्ट्रीय स्पर्धांमध्ये सुवर्णपदकाच्या निकालांइतकी त्याची कामगिरी.

विशेषतः, स्पेशल पोहोचला असता आंतरराष्ट्रीय गणितीय ऑलिंपियाड (IMO) मधील सुवर्णपदकांच्या तुलनेत पातळी, ला माहितीशास्त्रातील आंतरराष्ट्रीय ऑलिंपियाड (IOI), द आयसीपीसी वर्ल्ड फायनल्स आणि चिनी गणितीय ऑलिंपियाड. शिवाय, ते मॉडेलमधून मिळवलेल्या क्षमता एकत्रित करते डीपसीक-मॅथ-व्ही२, प्रमेये सिद्ध करण्यात आणि अत्यंत कठीण समस्या सोडवण्यात विशेषज्ञता असलेले, जे वैज्ञानिक आणि तांत्रिक संशोधनासाठी मॉडेल्सच्या विभागात त्याचे स्थान मजबूत करते.

मानक आवृत्तीपेक्षा वेगळे, DeepSeek-V3.2-Speciale हे दैनंदिन कामांसाठी तयार नाही. किंवा साधनांसह सामान्यीकृत एकत्रीकरणासाठी नाही. कंपनी यावर भर देते की हे मॉडेल प्रामुख्याने डिझाइन केलेले आहे संशोधन आणि शैक्षणिक कार्य, च्या वापरासह टोकन श्रेष्ठ, आतासाठी हे फक्त API द्वारे दिले जाते. आणि सामान्य-उद्देशीय अनुप्रयोगांद्वारे नाही.

अमेरिकन दिग्गजांसोबत डीपसीक-व्ही३.२, छिद्र आणि कॉन्ट्रास्टची उपलब्धता

डीपसीकने प्रकाशित केले आहे संपूर्ण DeepSeek-V3.2 वजने आणि तपशीलवार तांत्रिक अहवाल त्यांच्या प्रशिक्षणाबाबत, काही मोठ्या अमेरिकन तंत्रज्ञान कंपन्यांच्या वाढत्या प्रतिबंधात्मक धोरणांशी विरोधाभासी काहीतरी, जे बहुतेकदा कोड किंवा त्यांच्या सर्वात प्रगत मॉडेल्सच्या आकारापर्यंत प्रवेश मर्यादित करतात. अगदी प्रकरणांमध्येही मुक्त स्रोत आंशिक, लामाच्या काही आवृत्त्यांप्रमाणे, सुरुवात विशिष्ट परिस्थिती आणि बारकाव्यांसह येते.

युरोपियन संदर्भात, ही पदवी पारदर्शकता आणि मोकळेपणा हे अशा प्रकल्पांसाठी महत्त्वाचे ठरू शकते ज्यांना ऑडिटक्षमता, नियामक अनुपालन किंवा नियामक चौकटींशी मॉडेल्स जुळवून घेण्याची क्षमता आवश्यक असते जसे की युरोपियन युनियन एआय कायदाविद्यापीठे, संशोधन केंद्रे आणि सार्वजनिक प्रशासन हे मॉडेलचा अधिक तपशीलवार अभ्यास करू शकतात, प्रयोगांची प्रतिकृती बनवू शकतात किंवा बंद बाह्य API वर पूर्णपणे अवलंबून न राहता काही भाग त्यांच्या स्वतःच्या गरजांनुसार समायोजित करू शकतात.

कंपनीने ठेवले आहे डीपसीक-व्ही३.२ हे हगिंग फेस आणि मॉडेलस्कोप सारख्या प्लॅटफॉर्मवर समुदायासाठी उपलब्ध आहे.दुसरीकडे, एपीआय द्वारे प्रवेश देण्याव्यतिरिक्त, स्पेशल प्रकार सध्या प्रोग्रामॅटिक इंटरफेसद्वारे वापरण्यापुरता मर्यादित आहे कारण त्याच्या प्रति टोकन जास्त संगणकीय मागणी आणि किंमतही मिश्र वितरण रणनीती संशोधनासाठी मजबूत मॉडेल्स असण्याच्या अनेक युरोपीय खेळाडूंच्या आवडीशी जुळते, जरी त्यांच्या व्यावसायिक तैनातीसाठी अधिक काळजीपूर्वक नियोजन आवश्यक असू शकते.

जागतिक एआय शर्यतीत चीनची भूमिका

DeepSeek-V3.2 चे प्रकाशन अशा वेळी होत आहे जेव्हा चीन एआयमध्ये आपले नेतृत्व मजबूत करण्याचा प्रयत्न करीत आहे प्रगत सेमीकंडक्टर्सच्या प्रवेशावरील निर्बंध आणि वाढत्या भू-राजकीय तणाव असूनही, या वर्षाच्या सुरुवातीला पॉवर-टू-कॉस्ट रेशोने सर्वांना आश्चर्यचकित करणाऱ्या मॉडेलसह दृश्यात उतरल्यानंतर डीपसीक हे चिनी इकोसिस्टममधील सर्वात चर्चेत असलेले नाव बनले आहे आणि आता ते उच्च-स्तरीय एजंट आणि तर्क क्षमतांसह दुप्पट होत आहे.

युरोपसाठी, जिथे चर्चा संतुलन कसे राखायचे यावर केंद्रित आहे नवोन्मेष, डेटा संरक्षण आणि सुरक्षाया प्रकारच्या विकासात संधी आणि आव्हाने दोन्ही आहेत. एकीकडे, चीनमधील उच्च-क्षमतेच्या खुल्या मॉडेल्सच्या अस्तित्वामुळे युरोपियन प्रयोगशाळा आणि कंपन्यांना उपलब्ध असलेल्या साधनांची श्रेणी वाढली आहे. दुसरीकडे, प्रश्न उद्भवतात स्थानिक नियमांशी सुसंगतता, सीमापार डेटा प्रवाह आणि त्याचा परिणाम चीनमधील सामग्री नियम, जे काही तज्ञ या प्रणालींच्या पूर्ण आंतरराष्ट्रीय विस्तारासाठी संभाव्य अडथळा मानतात.

डीपसीकच्या व्ही३.१ मॉडेलने सहभाग घेतल्यानंतर देशांतर्गत बाजारपेठेबाहेरही त्याची दृश्यमानता वाढत आहे. स्वयंचलित गुंतवणूक प्रयोग GPT-5 आणि Gemini 2.5 Pro सारख्या सिस्टीमच्या तुलनेत, जिथे त्याने स्पर्धात्मक परिणाम दाखवले. ही रणनीती इतर मॉडेल्सच्या लाँचद्वारे पूरक आहे जसे की डीपसीक-ओसीआर, दृश्य धारणाद्वारे मजकूर संकुचित करणे आणि कमी संसाधनांसह त्यावर प्रक्रिया करणे, कंपनीची प्रतिमा एका अभिनेत्या म्हणून मजबूत करणे यावर लक्ष केंद्रित करणे कार्यक्षमता आणि मुक्त स्रोत.

अपेक्षा, मर्यादा आणि पुढील पायऱ्या

कंपनीच्या दाव्यांना न जुमानता, डीपसीक कबूल करतो की V3.2 अजूनही त्याच्या काही अमेरिकन समकक्षांपेक्षा मागे आहे. सामान्य जागतिक ज्ञान, व्यापक सांस्कृतिक संदर्भांची समज किंवा टोकन वापरातील कार्यक्षमता यासारख्या पैलूंमध्ये. शिवाय, प्रकल्प नेते स्वतः कबूल करतात की सार्वजनिक बेंचमार्कवर आधारित तुलना ते नेहमीच उत्पादन वातावरणात, विशेषतः खुल्या कामांमध्ये आणि अंतिम वापरकर्त्यांसह वास्तविक-जगातील कामगिरी प्रतिबिंबित करत नाहीत.

आणखी एक मुद्दा विचारात घेण्यासारखा आहे की तर्क पद्धतीमध्ये साधनांचे एकत्रीकरण आरोग्यसेवेपासून ते आर्थिक किंवा कायदेशीर निर्णय घेण्यापर्यंत, गुंतागुंतीच्या, वास्तविक वापराच्या प्रकरणांमध्ये ते अजूनही पूर्णपणे सत्यापित करणे आवश्यक आहे. DSA द्वारे ऑफर केलेली संगणकीय खर्च बचत लक्षणीय आहे, परंतु जेव्हा कार्ये अधिक संदिग्ध होतात किंवा अत्यंत विशिष्ट संदर्भांची आवश्यकता असते तेव्हा प्रतिसादांची गुणवत्ता सातत्याने राखली गेली नाही तर ती झाकली जाऊ शकते.

DeepSeek-V3.2 आणि त्याच्या स्पेशल प्रकाराच्या आगमनाने, प्रगत तर्कसंगत AI च्या लँडस्केपला जागतिक आकांक्षा असलेला एक नवीन खेळाडू मिळतो, जो खुले मॉडेल, एकात्मिक साधने आणि समाविष्ट खर्चया घडामोडींमुळे संशोधन, व्यवसाय आणि सार्वजनिक प्रशासनात उपलब्ध असलेल्या पर्यायांची श्रेणी विस्तृत होते, तर त्याचबरोबर एआयच्या जलद उत्क्रांतीला एका मागणी असलेल्या नियामक चौकटीत आणि तंत्रज्ञान गटांमधील वाढत्या प्रमाणात स्पर्धा कशी बसवायची याचा पुनर्विचार करण्यास भाग पाडले जाते.

डीपसीक
संबंधित लेख:
DeepSeek, ChatGPT चा आणखी एक स्पर्धक आहे जो चीनमधून आला आहे आणि कदाचित त्याला मागे टाकेल