Hindi

Claude Mythos ने 73% एक्सपर्ट साइबर टास्क्स सॉल्व किए, जो पहले कोई AI नहीं कर पाया

  • Claude Mythos Preview पहला AI बना जिसने simulated corporate cyberattack पूरा किया
  • 2025 से पहले जिन expert-level hacking challenges को कोई AI पार नहीं कर सका, उसमें इसने 73% हल किए
  • Anthropic ने 7 अप्रैल को Claude Mythos Preview लॉन्च किया

Anthropic के Claude Mythos Preview ने पहला ऐसा AI मॉडल बनकर एक पूरी सिम्युलेटेड कॉर्पोरेट नेटवर्क अटैक को पूरा किया है, जैसा कि UK के AI Security Institute (AISI) की नई इवैल्यूएशन में सामने आया है।

यह फाइंडिंग्स, जो मॉडल की 7 अप्रैल की घोषणा के कुछ दिनों बाद ही प्रकाशित हुई हैं, यह संकेत देती हैं कि AI साइबर क्षमताएं अब ऐसे लेवल पर पहुंच गई हैं, जहां सिक्योरिटी टीम्स को तुरंत अलर्ट होने की जरूरत है।

Claude Mythos क्या है?

Anthropic ने 7 अप्रैल को अपना Claude Mythos Preview मॉडल पेश किया था, लेकिन इसे पब्लिकली रिलीज़ नहीं किया गया। कंपनी ने सिर्फ चुनिंदा सिक्योरिटी रिसर्च फर्म्स को इसका एक्सेस दिया है ताकि वे इसकी एडवांस्ड क्षमताओं का आंकलन कर सकें और खुद को तैयार कर सकें।

“यह मॉडल हर तरह के टास्क में स्ट्रॉन्ग परफॉर्म करता है, लेकिन खासकर कंप्यूटर सिक्योरिटी टास्क्स में इसकी क्षमता सबसे ज्यादा है। इसी वजह से हमने Project Glasswing लॉन्च किया है, जिससे Mythos Preview का इस्तेमाल दुनिया के सबसे क्रिटिकल सॉफ्टवेयर को सुरक्षित करने में होगा। साथ ही, इंडस्ट्री को उन प्रैक्टिसेज के लिए तैयार किया जाएगा, जिन्हें हम सभी को साइबरअटैकर्स से एक कदम आगे रहने के लिए फॉलो करना जरूरी है,” घोषणा में कहा गया।

हमें X पर फॉलो करें और ताजा क्रिप्टो न्यूज़ सबसे पहले पाएं

इस डेवलपमेंट ने टेक और पॉलिसी सर्कल्स में भी ध्यान आकर्षित करना शुरू कर दिया है। Reuters की रिपोर्ट के मुताबिक, जिसमें मामले से जुड़े सूत्रों का हवाला दिया गया है, US Treasury Secretary Scott Bessent और Federal Reserve चेयर Jerome Powell ने बड़े बैंकों के CEOs के साथ एक इमरजेंसी मीटिंग की और इस मॉडल से जुड़े संभावित साइबर रिस्क्स को लेकर उन्हें चेतावनी दी।

Claude Mythos Preview ने कैसा प्रदर्शन किया?

AI Security Institute (AISI), जो UK गवर्नमेंट के Department for Science, Innovation and Technology के अंतर्गत आता है, ने Anthropic के Claude Mythos Preview का साइबर इवैल्यूएशन किया ताकि उनकी साइबरसिक्योरिटी क्षमताओं का परीक्षण किया जा सके।

सबसे पहले Capture-the-Flag (CTF) इवैल्यूएशन किए गए, जहां सिस्टम्स को वल्नरेबिलिटी पहचानकर और उनका एक्सप्लॉइट कर छुपे हुए “फ्लैग्स” को खोज निकालना होता है। Mythos ने एक्सपर्ट-लेवल टास्क्स में 73% सक्सेस रेट हासिल किया। अप्रैल 2025 तक कोई भी मॉडल यह सफलता नहीं दिखा पाया था।

Claude Mythos साइबर अटैक क्षमताएं
Claude Mythos साइबर अटैक क्षमताएं। स्रोत: AISI

इसके अलावा, AISI ने “The Last Ones” (TLO) नाम से एक 32-स्टेप का कॉर्पोरेट नेटवर्क अटैक सिमुलेशन बनाया। इसे पूरा करने में एक ह्यूमन सिक्योरिटी प्रोफेशनल को लगभग 20 घंटे लगते हैं।

Mythos Preview ने 10 में से 3 बार पूरे सिमुलेशन को कम्प्लीट किया। औसतन, इसने 32 में से 22 अटैक स्टेप्स पूरे किए। वहीं Claude Opus 4.6, जो दूसरा सबसे अच्छा परफॉर्मर रहा, उसने औसतन सिर्फ 16 स्टेप्स पूरे किए।

“Mythos Preview की एक साइबर रेंज पर सफलता यह इंडीकेट करती है कि यह खुद से छोटे, कमजोर डिफेंड किए गए और वल्नरेबल एंटरप्राइज सिस्टम्स पर अटैक कर सकती है, जहां नेटवर्क एक्सेस मिल गया हो। हालांकि, हमारी रेंजेस में रियल-वर्ल्ड एनवायरमेंट्स से जरूरी फर्क हैं, जिससे ये आसान टारगेट बन जाते हैं,” टीम ने जोड़ा।

Anthropic की अपनी रेड टीम टेस्टिंग में यह पता चला है कि Claude Mythos Preview यूजर की स्पेशल इंस्ट्रक्शन पर सभी मेजर ऑपरेटिंग सिस्टम्स और लीडिंग वेब ब्राउज़र्स में जीरो-डे वल्नरेबिलिटी डिटेक्ट और एक्सप्लॉइट कर सकती है।

“हम यहां जो रिपोर्ट कर सकते हैं उसमें लिमिटेशन है। हमने जो 99% से ज्यादा वल्नरेबिलिटी पाई हैं, उन्हें अभी तक पैच नहीं किया गया है, इसलिए उनके बारे में डिटेल्स बताना गलत होगा,” टीम ने कहा।

AISI ने बताया कि ऑर्गनाइजेशन को बेसिक साइबरसिक्योरिटी उपायों को प्रायोरिटी देनी चाहिए। इनमें रेगुलर पैचिंग, सख्त एक्सेस कंट्रोल्स, सिक्योरिटी कॉन्फ़िगरेशन को हार्डन करना, और पूरे सिस्टम की लॉगिंग शामिल है।

हमारे YouTube चैनल को सब्सक्राइब करें और लीडर्स व जर्नलिस्ट्स से एक्सपर्ट इनसाइट्स पाएं

BeInCrypto से नवीनतम क्रिप्टोक्यूरेंसी बाजार विश्लेषण पढ़ने के लिए, यहाँ क्लिक करें

अस्वीकरण

हमारी वेबसाइट पर सभी जानकारी अच्छे इरादे से और केवल सामान्य सूचना के उद्देश्य से प्रकाशित की जाती है, ताकि पाठक जागरूक रह सकें। यह Trust Project दिशानिर्देशों के अनुरूप है। हमारी वेबसाइट पर दी गई जानकारी के आधार पर पाठक द्वारा की गई प्रत्येक कार्रवाई पूरी तरह से उनके अपने जोखिम पर होती है। कृपया हमारी नियम और शर्तें, गोपनीयता नीति और अस्वीकरण पढ़ें।