DeepSeek :- जैसे Chinese AI स्टार्टअप DeepSeek सिलिकॉन वैली में हलचल मचा रहा है, इसका भारत और अन्य दावेदारों पर असर हो सकता है।

DeepSeek – की शुरुआत हेज फंड मैनेजर लिआंग वेनफेंग ने 2021 में की थी, जब उन्होंने अपने ट्रेडिंग फंड हाई-फ्लायर चलाते हुए इसे सिर्फ एक एआई साइड प्रोजेक्ट के तौर पर शुरू किया और हजारों एनवीडिया ग्राफिक्स प्रोसेसिंग यूनिट्स खरीदनी शुरू कर दीं।
चिपमेकर एनवीडिया के शेयर की कीमत ने चीनी स्टार्टअप डीपसीक द्वारा एक आर्टिफिशियल इंटेलिजेंस मॉडल के लॉन्च के कारण सार्वजनिक कंपनी के लिए एकल दिन की सबसे बड़ी गिरावट देखी, जिससे न्यूयॉर्क से लेकर टोक्यो तक के बाजारों में तकनीकी स्टॉक्स में व्यापक बिकवाली शुरू हो गई।
एनवीडिया की गिरावट (DeepSeek)
यदि एनवीडिया का शानदार स्टॉक उछाल ओपनएआई के चैटजीपीटी के नवंबर 2022 में लॉन्च होने से हुआ था, तो एक और नए स्टार्टअप ने ग्राफिक्स चिपमेकर के शेयरों के dramatic गिरावट का कारण बना। सोमवार को एनवीडिया के शेयर $118.42 पर बंद हुए, जो लगभग चार महीने का निचला स्तर था, और इस गिरावट ने अमेरिकी चिपमेकर के बाजार मूल्य से लगभग $600 बिलियन की राशि मिटा दी—जो किसी सार्वजनिक कंपनी के लिए एकल दिन की सबसे बड़ी गिरावट थी। इसके परिणामस्वरूप, तकनीकी-भारी नैस्डैक सूचकांक 3 प्रतिशत से अधिक गिर गया, क्योंकि एनवीडिया का अमेरिकी सूचकांकों में महत्वपूर्ण वजन है। मंगलवार की सुबह, टोक्यो स्टॉक्स में गिरावट देखी गई क्योंकि तकनीकी कंपनियों में बिकवाली का सिलसिला दूसरे दिन भी जारी रहा। एकमात्र अपवाद हांगकांग का हैंग सेंग सूचकांक था, जो मंगलवार को शुरुआती बढ़त के साथ खुला, जहां चीनी तकनीकी कंपनियाँ जैसे कि टेन्सेंट, अलीबाबा और बाइडू ने शुरुआती लाभ प्राप्त किया।
बाजार में गिरावट के कारण (DeepSeek)
पश्चिमी शेयर बाजारों में बिकवाली के लिए तीन प्रमुख कारण हो सकते हैं। सबसे बड़ा कारण यह है कि डीपसीक ने एक फाउंडेशनल मॉडल को ट्रेन करने में सफलता हासिल की है, जो अमेरिकी प्रतिद्वंद्वियों जैसे कि चैटजीपीटी और मेटा के लामा द्वारा प्राप्त किए गए परिणामों के समान हैं, लेकिन बहुत कम चिप्स का उपयोग करके बहुत कम लागत पर। इस समझ ने यह चिंता उत्पन्न की कि एआई मॉडल को प्रशिक्षित करने के लिए जो विशेषीकृत हार्डवेयर की तीव्र मांग थी, अब वह कम हो जाएगी। यह स्पष्ट रूप से एनवीडिया जैसी कंपनियों के लिए नकारात्मक है, जिन्होंने वैश्विक एआई उछाल से होने वाली मांग के आधार पर अपने भविष्यवाणियों को आकार दिया था।
दूसरी बड़ी चिंता (DeepSeek)
दूसरी बड़ी चिंता यह है कि अमेरिका की चीन के मुकाबले एआई में बढ़त अब चैटजीपीटी के लॉन्च के बाद से सबसे कम नजर आ रही है। चीन की एआई में पिछड़ने की जो छवि थी, वह अब चौंकाने वाली तेजी से सुधरी है। यह पश्चिमी देशों के लिए चिंता का विषय बन गया है, खासकर क्योंकि बाइडन प्रशासन ने चीन के एआई क्षेत्र में तेजी से प्रगति को रोकने के लिए अपने सर्वोत्तम प्रयास किए थे, जिसमें उच्च-तकनीकी चिप्स और इन चिप्स को बनाने वाली उच्च-स्तरीय मशीनों का निर्यात उस देश को रोकने की कोशिश की गई थी।
फिर यह चिंता है कि सस्ते चीनी मॉडल की सफलता एआई के विकास की अर्थव्यवस्था को उलट सकती है। चीन के LLMs (लैंग्वेज लार्ज मॉडल) को विकसित करना काफी सस्ता है, और क्यूडब्ल्यूक्यू, जो ई-कॉमर्स दिग्गज अलीबाबा द्वारा विकसित एक मॉडल है और जिसे डीपसीक के R1 ‘रीजनिंग मॉडल’ के साथ ही रिलीज़ किया गया था, एआई की दौड़ में एक और भरोसेमंद दावेदार के रूप में उभरा है। इसलिए, चीनी प्रगति कोई संयोग नहीं है।
सबसे महत्वपूर्ण बात यह है कि, जैसा कि इकोनॉमिस्ट के अनुसार, डीपसीक के मॉडल को 2,000 कम गुणवत्ता वाले एनवीडिया चिप्स का उपयोग करके प्रशिक्षित किया गया, जबकि मेटा के लामा जैसे मॉडलों को लगभग 15,000 उच्च गुणवत्ता वाले चिप्स की जरूरत थी। यह LLM के “ट्रेनिंग” प्रक्रिया की पारंपरिक धारणा को बदल देता है, जिसमें निवेश की आवश्यकता बहुत अधिक मानी जाती थी, इससे पहले कि अगला चरण — “इनफरेंस” — पूरा किया जा सके। इनफरेंस उस प्रक्रिया को कहते हैं, जिसके द्वारा एआई मॉडल प्रशिक्षण के बाद डेटा पर आधारित प्रश्नों का उत्तर उत्पन्न करते हैं।
डीपसीक की शुरुआत
डीपसीक की शुरुआत हेज फंड मैनेजर लिआंग वेनफेंग ने 2021 में की थी, जब उन्होंने अपने ट्रेडिंग फंड हाई-फ्लायर चलाते हुए एआई के लिए हजारों एनवीडिया ग्राफिक प्रोसेसिंग यूनिट्स खरीदनी शुरू की थीं, जो उस समय केवल एक साइड प्रोजेक्ट था। डीपसीक का डेटा क्रंचिंग मूल रूप से एआई का उपयोग करके उन पैटर्न्स को पहचानने के लिए किया जा रहा था जो स्टॉक की कीमतों को प्रभावित कर सकते थे। बाद में यह डेटा क्रंचिंग प्रोजेक्ट एक स्वतंत्र एआई वेंचर में बदल गया।
जागरूकता का अलार्म!
डीपसीक की प्रगति पर प्रतिक्रिया देते हुए, अमेरिकी राष्ट्रपति डोनाल्ड ट्रंप ने इसे अमेरिकी उद्योगों के लिए “जागरूकता का अलार्म” करार दिया। ट्रंप ने सोमवार को मियामी में कहा कि अगर डीपसीक के दावे सही हैं, यानी उन्होंने एक ऐसा मॉडल विकसित किया है जो अमेरिकी मॉडल के समान है लेकिन उसे बनाने में बहुत कम संसाधन लगे, तो इसे वह “सकारात्मक” मानते हैं। “चीन की कंपनी द्वारा डीपसीक एआई का लॉन्च हमारे उद्योगों के लिए एक चेतावनी होनी चाहिए कि हमें जीतने के लिए प्रतिस्पर्धा करने पर ध्यान केंद्रित करना होगा,” अमेरिकी राष्ट्रपति ने कहा।
एनवीडिया का प्रतिक्रिया
सोमवार को शेयर बाजार में गिरावट के बाद, एनवीडिया ने कहा कि डीपसीक का काम अमेरिकी चिप निर्यात नियंत्रणों के अनुपालन में किया गया था, और चिपमेकर ने एआई इनफरेंस के लिए मजबूत मांग को जारी रखने की बात की। “डीपसीक का काम यह दिखाता है कि कैसे नई मॉडल्स को उस तकनीक का उपयोग करके बनाया जा सकता है, जो व्यापक रूप से उपलब्ध मॉडल्स और कंप्यूटिंग संसाधनों का लाभ उठाती है, जो पूरी तरह से निर्यात नियंत्रण अनुपालन में हैं,” एनवीडिया ने कहा।
अन्य देशों पर प्रभाव, भारत
भारत जैसे देशों के लिए इसके निहितार्थ यह हैं कि यदि बुनियादी एआई मॉडल्स को तुलनात्मक रूप से सस्ते में प्रशिक्षित किया जा सकता है, तो यह उन देशों के लिए मॉडल बनाने की बाधाओं को काफी हद तक कम कर देगा जो खुद के मॉडल विकसित करने के इच्छुक हैं। डीपसीक और अलीबाबा के मॉडलों की सफलता ने यह दिखाया है कि मॉडल बनाने की निश्चित लागत को वास्तव में कम किया जा सकता है, जो उन देशों के लिए एक महत्वपूर्ण कारक है, जो इस दौड़ में कूदने की उम्मीद करते हैं, लेकिन जिनके पास संसाधन जैसे कि जीपीयू की उपलब्धता या बुनियादी मॉडल बनाने के लिए आवश्यक फंडिंग या डेटा की कमी हो सकती है।
यह स्थिति भारत में एक बहस के बीच उत्पन्न हुई है, जहां यह विचार किया जा रहा है कि क्या बुनियादी मॉडल को पूरी तरह से नए से बनाना चाहिए या पहले से उपलब्ध कुछ ओपन सोर्स LLMs पर आधारित मॉडल्स के ऊपर व्रैपर (wrapper) बनाकर उन्हें उपयोग करना चाहिए। इंफोसिस के सह-संस्थापक नंदन नीलेकणी ने कहा है कि भारत को बड़े लैंग्वेज मॉडल्स बनाने पर ध्यान नहीं देना चाहिए, जबकि एआई उद्योग के कुछ अन्य लोग, जैसे पर्प्लेक्सिटी एआई के संस्थापक अरविंद श्रीनिवास, ने सार्वजनिक रूप से नीलेकणी की टिप्पणी पर यह कहा कि भारत को अपने खुद के एआई मॉडल नहीं बनाने की जरूरत नहीं है, “यह गलत है।” श्रीनिवास ने X पर एक पोस्ट में कहा, “… वह (नीलेकणी) गलत हैं जब वह भारतीयों को मॉडल प्रशिक्षण कौशल की अनदेखी करने और केवल मौजूदा मॉडलों के ऊपर काम करने पर ध्यान केंद्रित करने के लिए कह रहे हैं। दोनों को करना आवश्यक है। (Btrue News)
डीपसीक द्वारा किए गए ब्रेकथ्रू के बारे में बात करते हुए, श्रीनिवास ने एक अन्य पोस्ट में कहा: “मैं आशा करता हूँ कि भारत अपना रुख बदले और ओपन-सोर्स मॉडल्स को पुनः उपयोग करने की बजाय, अपनी क्षमताओं को मजबूत करने की कोशिश करे ताकि वे अपने मॉडल्स को प्रशिक्षित कर सकें जो न केवल भारतीय भाषाओं के लिए अच्छे हों, बल्कि सभी बेंचमार्क्स पर वैश्विक रूप से प्रतिस्पर्धी हों।