Tech & Future

वैज्ञानिकों ने बनाया एक नया टूल जो बताता है कि कब AI खतरा बन सकता है

क्या ये नया बेंचमार्क टेस्ट भविष्य में AI के खतरे को रोक पायेगा?

आज के समय में कृत्रिम बुद्धिमत्ता (AI) के बारे में बहुत चर्चा रहती है। ये बहुत से कार्य मानवों से भी बेहतर कर सकता है, लिखने से लेकर कुछ भी सीख सकता है। Code बना सकता है और उसे बदलने तक की क्षमता रखता है। हमने AI को इतना विकसित कर दिया है कि अब ये खतरा मंडरा रहा है कि क्या भविष्य में ये AI खुद से अपना Code बदलकर इंसानों के लिए खतरा बन जायेंगे? अगर वे खुद ही अपने आप को नियत्रिंत करने लगे तो क्या होगा? इसी खतरे को समझने के लिए हाल में ही OpenAI के वैज्ञानिकों ने एक नया बेंचमार्क टेस्ट (MLE-bench Hindi) तैयार किया जो भिविष्य में किसी भी AI मोडल के संभावित भीषण खतरे को भांप सकता है।

क्या है नया बेंचमार्क सेट (MLE-bench Hindi) ?

OpenAI के वैज्ञानिकों ने एक नया परीक्षण सेट तैयार किया है, जो यह मापता है कि क्या कृत्रिम बुद्धिमत्ता (AI) एजेंट अपने कोड में स्वयं बदलाव कर सकते हैं और क्या ये बिना मानव निर्देशों के अपनी क्षमताओं में भी सुधार कर सकते हैं।

इस बेंचमार्क  को “MLE-बेंच” कहा गया है, जो 75 काग्गल (Kaggle) परीक्षणों का संकलन है। प्रत्येक परीक्षण एक चुनौती है, जो मशीन लर्निंग इंजीनियरिंग की क्षमता का आकलन करता है। इस कार्य में AI मॉडल्स का प्रशिक्षण, डेटा सेट तैयार करना, और वैज्ञानिक प्रयोग चलाना शामिल है, और काग्गल परीक्षण यह जांचते हैं कि मशीन लर्निंग एल्गोरिदम विशिष्ट कार्यों में कितनी अच्छी तरह प्रदर्शन करते हैं।

OpenAI के वैज्ञानिकों ने MLE-बेंच (MLE-bench Hindi) को इस उद्देश्य से डिज़ाइन किया है ताकि यह मापा जा सके कि AI मॉडल्स “स्वायत्त (autonomous) मशीन लर्निंग इंजीनियरिंग” में कितना अच्छा प्रदर्शन करते हैं — जो AI के लिए सबसे कठिन चुनौतियों में से एक है। इस नए बेंचमार्क के विवरण उन्होंने 9 अक्टूबर को arXiv प्रीप्रिंट डेटाबेस में अपलोड किए गए एक शोध पत्र में प्रस्तुत किए हैं।

क्या कहता है बेंचमार्क सेट?

इस रिसर्च के आधार पर वैज्ञानिकों ने कहा कि भविष्य में कोई भी AI जो MLE-बेंच में शामिल 75 परीक्षणों में अच्छा प्रदर्शन करता है, उसे इतना शक्तिशाली माना जा सकता है कि वह एक आर्टिफिशियल जनरल इंटेलिजेंस (AGI) प्रणाली बन जाये। AGI को एक काल्पनिक AI माना जाता है जो मनुष्यों से कहीं अधिक बुद्धिमान हो और उन्हें हर कार्य में पीछे करदे।

प्रत्येक 75 MLE-बेंच टेस्ट का वास्तविक दुनिया में काफी महत्व है। इसके जरिए हम AI प्रोग्राम को बेहतर समझ सकते हैं और उसके जरिए उसकी बुद्धिमता को भी परखा जा सकता है। इसके कई उदाहरण हैं जैसे की OpenVaccine जो कि एक चुनौती है जिसका उद्देश्य COVID-19 के लिए mRNA वैक्सीन विकसित करना है, और Vesuvius Challenge जिसे प्राचीन पांडुलिपियों को पढ़ने के लिए बनाया गया है।

क्या हो सकते हैं इसके प्रभाव?

वैज्ञानिकों का मानना है कि यदि AI एजेंट मशीन लर्निंग शोध कार्यों को खुद से करना सीख लेते हैं, तो इसका कई सकारात्मक प्रभाव हो सकते हैं, जैसे स्वास्थ्य देखभाल, जलवायु विज्ञान, और अन्य क्षेत्रों में वैज्ञानिक प्रगति को गति देना। लेकिन यदि इसे बिना नियंत्रण के छोड़ दिया गया, तो यह गंभीर आपदा का कारण बन सकता है।

इस टेस्टे के आधार पर वैज्ञानि आगे कहते हैं कि, “AI एजेंटों द्वारा उच्च-गुणवत्ता वाले शोध (high-quality research) करना अर्थव्यवस्था में एक परिवर्तनकारी कदम साबित हो सकता है। हालांकि, यदि ये एजेंट अपने खुद के प्रशिक्षण कोड (Learning Code) में सुधार करने में सक्षम हो जाते हैं, तो वे मानव की सीमा से तेज अपने को विकसित करके हमें पीछे कर सकते हैं, अगर मानव इनके कोड को नहीं समझ पाया तो फिर अनर्थ हो सकता है, इससे AI हम पर पूरी तरह नियत्रण भी कर सकते हैं।

“अगर AI की खुद विकसित होने की गति हमारी समझने की क्षमता से तेज हुई, तो हम ऐसे मॉडल विकसित कर सकते हैं जो विनाशकारी नुकसान या दुरुपयोग का कारण बन सकते हैं।” इसके अलावा वैज्ञानिकों ने यह भी कहा कि कोई भी मॉडल जो MLE-बेंच के “बड़े हिस्से” को हल कर सकता है, वह संभवतः कई open-ended वाले मशीन लर्निंग कार्यों को खुद ही कर सकता है।

सबसे शक्तिशाली OpenAI मॉडल

वैज्ञानिकों ने अब तक के सबसे शक्तिशाली OpenAI मॉडल, o1, का परीक्षण किया। इस AI मॉडल ने MLE-बेंच (MLE-bench Hindi) के 75 टेस्ट में से 16.9% में कम से कम काग्गल कांस्य पदक (Kaggle Bronze Medal) के स्तर को हासिल किया। o1 का प्रदर्शन तब और बेहतर हुआ जब इसे चुनौतीपूर्ण टेस्ट को कई बार करने का अवसर दिया गया। हर बार ये अपने में सुधार करके अच्छा प्रदर्शन करता रहा।

ब्रोंज मेडल जीतना काग्गल लीडरबोर्ड (Kaggle Leaderboard) पर शीर्ष 40% मानव प्रतिभागियों में शामिल होने के बराबर है। OpenAI के o1 मॉडल ने MLE-बेंच (MLE-bench Hindi)  में औसतन सात स्वर्ण पदक जीते, जो “काग्गल ग्रैंडमास्टर (Kaggle Grandmaster)” माने जाने के लिए आवश्यक मानक से दो अधिक हैं। अब तक केवल दो लोगों ने 75 अलग-अलग काग्गल प्रतियोगिताओं में पदक जीते हैं।

बेंचमार्क टेस्ट होगा ओपन-सोर्स (Open Source)

OpenAI के वैज्ञानिक अब MLE-बेंचमार्क टेस्ट (MLE-bench Hindi) को ओपन-सोर्स कर रहे हैं ताकि अन्य शोधकर्ता अपने AI मॉडलों का परीक्षण कर सकें और मशीन लर्निंग इंजीनियरिंग में AI एजेंटों की क्षमताओं पर और शोध को प्रोत्साहित किया जा सके। इससे भविष्य में नये बनने वाले AI एजेंट्स को समझने में हमें बेहद मदद मिलेगी।

Source
arxiv.org

Shivam Sharma

शिवम शर्मा विज्ञानम् के मुख्य लेखक हैं, इन्हें विज्ञान और शास्त्रो में बहुत रुचि है। इनका मुख्य योगदान अंतरिक्ष विज्ञान और भौतिक विज्ञान में है। साथ में यह तकनीक और गैजेट्स पर भी काम करते हैं।

Related Articles

Back to top button