Claude Mythos ने 73% एक्सपर्ट साइबर टास्क्स सॉल्व किए, जो पहले कोई AI नहीं कर पाया

के द्वारा लिखा गया

Kamina Bashir

के द्वारा edit किया गया

Harsh Notariya

14 अप्रैल 2026, 10:25 UTC

Claude Mythos Preview पहला AI बना जिसने simulated corporate cyberattack पूरा किया
2025 से पहले जिन expert-level hacking challenges को कोई AI पार नहीं कर सका, उसमें इसने 73% हल किए
Anthropic ने 7 अप्रैल को Claude Mythos Preview लॉन्च किया

Anthropic के Claude Mythos Preview ने पहला ऐसा AI मॉडल बनकर एक पूरी सिम्युलेटेड कॉर्पोरेट नेटवर्क अटैक को पूरा किया है, जैसा कि UK के AI Security Institute (AISI) की नई इवैल्यूएशन में सामने आया है।

यह फाइंडिंग्स, जो मॉडल की 7 अप्रैल की घोषणा के कुछ दिनों बाद ही प्रकाशित हुई हैं, यह संकेत देती हैं कि AI साइबर क्षमताएं अब ऐसे लेवल पर पहुंच गई हैं, जहां सिक्योरिटी टीम्स को तुरंत अलर्ट होने की जरूरत है।

Claude Mythos क्या है?

Anthropic ने 7 अप्रैल को अपना Claude Mythos Preview मॉडल पेश किया था, लेकिन इसे पब्लिकली रिलीज़ नहीं किया गया। कंपनी ने सिर्फ चुनिंदा सिक्योरिटी रिसर्च फर्म्स को इसका एक्सेस दिया है ताकि वे इसकी एडवांस्ड क्षमताओं का आंकलन कर सकें और खुद को तैयार कर सकें।

“यह मॉडल हर तरह के टास्क में स्ट्रॉन्ग परफॉर्म करता है, लेकिन खासकर कंप्यूटर सिक्योरिटी टास्क्स में इसकी क्षमता सबसे ज्यादा है। इसी वजह से हमने Project Glasswing लॉन्च किया है, जिससे Mythos Preview का इस्तेमाल दुनिया के सबसे क्रिटिकल सॉफ्टवेयर को सुरक्षित करने में होगा। साथ ही, इंडस्ट्री को उन प्रैक्टिसेज के लिए तैयार किया जाएगा, जिन्हें हम सभी को साइबरअटैकर्स से एक कदम आगे रहने के लिए फॉलो करना जरूरी है,” घोषणा में कहा गया।

हमें X पर फॉलो करें और ताजा क्रिप्टो न्यूज़ सबसे पहले पाएं

This is big… Anthropic just announced a model so powerful they won't release it to the public out of fear over the damage it will cause 😨

Claude Mythos Preview found thousands of zero-day exploits in every major operating system and web browser…

The numbers are hard to… https://t.co/pEuokoHMA1 pic.twitter.com/FlQgGiavsd
— Josh Kale (@JoshKale) April 7, 2026

इस डेवलपमेंट ने टेक और पॉलिसी सर्कल्स में भी ध्यान आकर्षित करना शुरू कर दिया है। Reuters की रिपोर्ट के मुताबिक, जिसमें मामले से जुड़े सूत्रों का हवाला दिया गया है, US Treasury Secretary Scott Bessent और Federal Reserve चेयर Jerome Powell ने बड़े बैंकों के CEOs के साथ एक इमरजेंसी मीटिंग की और इस मॉडल से जुड़े संभावित साइबर रिस्क्स को लेकर उन्हें चेतावनी दी।

Claude Mythos Preview ने कैसा प्रदर्शन किया?

AI Security Institute (AISI), जो UK गवर्नमेंट के Department for Science, Innovation and Technology के अंतर्गत आता है, ने Anthropic के Claude Mythos Preview का साइबर इवैल्यूएशन किया ताकि उनकी साइबरसिक्योरिटी क्षमताओं का परीक्षण किया जा सके।

सबसे पहले Capture-the-Flag (CTF) इवैल्यूएशन किए गए, जहां सिस्टम्स को वल्नरेबिलिटी पहचानकर और उनका एक्सप्लॉइट कर छुपे हुए “फ्लैग्स” को खोज निकालना होता है। Mythos ने एक्सपर्ट-लेवल टास्क्स में 73% सक्सेस रेट हासिल किया। अप्रैल 2025 तक कोई भी मॉडल यह सफलता नहीं दिखा पाया था।

Claude Mythos साइबर अटैक क्षमताएं। स्रोत: AISI

इसके अलावा, AISI ने “The Last Ones” (TLO) नाम से एक 32-स्टेप का कॉर्पोरेट नेटवर्क अटैक सिमुलेशन बनाया। इसे पूरा करने में एक ह्यूमन सिक्योरिटी प्रोफेशनल को लगभग 20 घंटे लगते हैं।

Mythos Preview ने 10 में से 3 बार पूरे सिमुलेशन को कम्प्लीट किया। औसतन, इसने 32 में से 22 अटैक स्टेप्स पूरे किए। वहीं Claude Opus 4.6, जो दूसरा सबसे अच्छा परफॉर्मर रहा, उसने औसतन सिर्फ 16 स्टेप्स पूरे किए।

“Mythos Preview की एक साइबर रेंज पर सफलता यह इंडीकेट करती है कि यह खुद से छोटे, कमजोर डिफेंड किए गए और वल्नरेबल एंटरप्राइज सिस्टम्स पर अटैक कर सकती है, जहां नेटवर्क एक्सेस मिल गया हो। हालांकि, हमारी रेंजेस में रियल-वर्ल्ड एनवायरमेंट्स से जरूरी फर्क हैं, जिससे ये आसान टारगेट बन जाते हैं,” टीम ने जोड़ा।

Anthropic की अपनी रेड टीम टेस्टिंग में यह पता चला है कि Claude Mythos Preview यूजर की स्पेशल इंस्ट्रक्शन पर सभी मेजर ऑपरेटिंग सिस्टम्स और लीडिंग वेब ब्राउज़र्स में जीरो-डे वल्नरेबिलिटी डिटेक्ट और एक्सप्लॉइट कर सकती है।

“हम यहां जो रिपोर्ट कर सकते हैं उसमें लिमिटेशन है। हमने जो 99% से ज्यादा वल्नरेबिलिटी पाई हैं, उन्हें अभी तक पैच नहीं किया गया है, इसलिए उनके बारे में डिटेल्स बताना गलत होगा,” टीम ने कहा।

AISI ने बताया कि ऑर्गनाइजेशन को बेसिक साइबरसिक्योरिटी उपायों को प्रायोरिटी देनी चाहिए। इनमें रेगुलर पैचिंग, सख्त एक्सेस कंट्रोल्स, सिक्योरिटी कॉन्फ़िगरेशन को हार्डन करना, और पूरे सिस्टम की लॉगिंग शामिल है।

हमारे YouTube चैनल को सब्सक्राइब करें और लीडर्स व जर्नलिस्ट्स से एक्सपर्ट इनसाइट्स पाएं

हमारी वेबसाइट पर सभी जानकारी अच्छे इरादे से और केवल सामान्य सूचना के उद्देश्य से प्रकाशित की जाती है, ताकि पाठक जागरूक रह सकें। हमारी वेबसाइट पर दी गई जानकारी के आधार पर पाठक द्वारा की गई प्रत्येक कार्रवाई पूरी तरह से उनके अपने जोखिम पर होती है। कृपया हमारी नियम और शर्तें, गोपनीयता नीति और अस्वीकरण पढ़ें।