China ने अब एक बड़ा AI मॉडल बिना Nvidia चिप्स के बना लिया है। अब OpenAI ने भी कम Nvidia चिप्स पर चलने के तरीके खोज लिए हैं, जिससे inference cost आधे से ज्यादा कम हो गई है। फिर भी Nvidia का stock ऊपर गया।
यही हैरानी की बात है। OpenAI, Nvidia (NVDA) के सबसे बड़े कस्टमर्स में से एक है। फिर भी, जब OpenAI को कम चिप्स की जरूरत होने लगी, Nvidia के शेयर फिर भी चढ़ गए।
OpenAI ने दो तरीकों से Inference Cost घटाई
पहला तरीका है सॉफ्टवेयर। The Information की रिपोर्ट के मुताबिक, OpenAI इंजीनियर्स ने नई optimization methods के साथ inference costs को आधे से भी ज्यादा घटा दिया है। हालांकि, OpenAI ने इन टेक्निकल डिटेल्स को पब्लिश नहीं किया है।
इससे अब OpenAI को कुछ ChatGPT ट्रैफिक संभालने के लिए कम Nvidia चिप्स चाहिए। इससे OpenAI या तो अपनी सर्विस की कीमतें कम कर सकता है या यूज़र्स की usage limit बढ़ा सकता है।
दूसरा तरीका है हार्डवेयर। 24 जून को OpenAI और Broadcom (AVGO) ने मिलकर Jalapeño, अपनी पहली custom chip लॉन्च की। OpenAI का कहना है कि शुरुआती टेस्ट में ये चिप्स आज की सबसे एडवांस्ड चिप्स के मुकाबले बहुत ज्यादा अच्छा performance per watt देती हैं और इनका डिज़ाइन सिर्फ 9 महीनों में तैयार किया गया।
पहली Jalapeño चिप्स को 2026 के आखिर तक गीगावॉट स्केल पर तैनात कर दिया जाएगा, जिसमें Microsoft लीड पार्टनर है। हालांकि, अभी भी OpenAI की ज्यादातर inference Nvidia ही संभालती है, जबकि OpenAI अपने Broadcom chip पार्टनरशिप में भी निवेश कर रही है।
Big Tech कंपनियां अपनी खुद की चिप्स बनाने की दौड़ में
OpenAI अकेली नहीं है। Google 2016 से tensor processing units बना रही है और उसके बाद Amazon ने भी अपनी चिप बनाई। रिसर्च फर्म TrendForce का अनुमान है कि 2026 में ASIC-based सिस्टम्स के जरिए AI सर्वर shipments का 27.8% हिस्सा होगा, जो 2023 के बाद सबसे ज्यादा है।
TrendForce के अनुसार, पहली बार कस्टम चिप्स की ग्रोथ Nvidia के GPUs से ज्यादा होने जा रही है। Broadcom और Marvell जैसे सप्लायर्स मुख्य कस्टम चिप मेकर्स के रूप में इस बिल्ड-आउट में आगे आ रहे हैं।
China में भी यही ट्रेंड sanction के चलते देखने को मिल रहा है। Meituan ने हाल ही में अपने 1.6 ट्रिलियन पैरामीटर वाले LongCat-2.0 मॉडल को China की घरेलू चिप्स पर ट्रेन किया है, बिना किसी Nvidia हार्डवेयर के।
Nvidia शेयर की कीमत लगातार क्यों बढ़ रही है?
खतरा जरूर है, लेकिन आंकड़े दिखाते हैं कि निवेशक अभी भी शांत हैं। 30 जून को Nvidia शेयर करीब 2% बढ़ा और इसका मार्केट कैप लगभग $4.8 ट्रिलियन तक पहुंच गया। Nvidia के ताजा नतीजों में डेटा-सेंटर रेवेन्यू 75% की ग्रोथ के साथ एक तिमाही में रिकॉर्ड $62.3 बिलियन पहुंच गया।
ज्यादातर दबाव inference पर है, training पर नहीं। मॉडल ट्रेनिंग में आज भी Nvidia का दबदबा है, जहां इसका CUDA सॉफ्टवेयर 2006 से डेवेलपर्स को बांधे हुए है। कस्टम चिप्स इतनी flexibility शायद ही दे पाएं।
Nvidia उस inference layer को भी डिफेंड कर रहा है, जिसे यह खोने के आरोप झेल रहा है। GTC में Nvidia ने कहा कि उसका आने वाला Rubin प्लेटफार्म inference की लागत Blackwell की तुलना में प्रति टोकन 10 गुना तक कम कर देगा। सस्ता inference आमतौर पर usage और कुल compute को भी बढ़ा देता है।
हर कोई इससे सहमत नहीं है। कुछ निवेशकों ने प्रतिद्वंदी चिप स्टॉक्स में रोटेट किया है, मानते हुए कि inference शिफ्ट से इनका ग्रोथ और बढ़ेगा। फिर भी Nvidia ने इस तिमाही के guidance में China की कोई सेल्स शामिल नहीं की, और इसके बावजूद डिमांड रिकॉर्ड स्तर पर है।
Nvidia अभी भी जितनी चिप्स बना सकता है, उतनी बेच रहा है। असली टेस्ट यही है कि क्या इसके सबसे बड़े कस्टमर्स इसे मार्केट ग्रोथ से पहले जल्दी रिप्लेस कर सकते हैं या नहीं।









