OpenAI ने हाल ही में एक नया AI टूल ‘Operator’ लॉन्च किया है, जो कंप्यूटर और वेबसाइट्स पर बिल्कुल इंसानों की तरह काम करने में सक्षम है। यह एक डिजिटल एजेंट है, जो कंप्यूटर-यूजिंग एजेंट (Cognitive User Agent – CUA) मॉडल के तहत काम करता है। इस AI को माउस और कीबोर्ड का उपयोग करके स्क्रीन के साथ इंटरैक्ट करने और बिना किसी विशेष प्रोग्रामिंग या शॉर्टकट की जरूरत के वेबसाइट ब्राउज करने या फॉर्म भरने जैसे कामों को करने के लिए डिजाइन किया गया है।
Operator की खासियतें
1. फ्लेक्सिबिलिटी और एडाप्टेबिलिटी
CUA की सबसे बड़ी खूबी इसकी फ्लेक्सिबिलिटी है। यह किसी भी पूर्वनिर्धारित टूल या कोडिंग पर निर्भर नहीं रहता, बल्कि स्क्रीन पर मौजूद बटन, मेनू और फॉर्म से सीधे इंटरैक्ट करता है। यह इसे अधिक एडाप्टेबल बनाता है, जिससे यह अलग-अलग एप्लिकेशन और वेबसाइट पर काम करने में सक्षम होता है।
2. कैसे काम करता है Operator?
Operator विजन और रीजनिंग को जोड़कर काम करता है। इसका कार्य करने की प्रक्रिया तीन मुख्य चरणों में बंटी होती है:
- स्क्रीन को प्रोसेस करना: यह स्क्रीनशॉट के जरिए स्क्रीन को ‘देखता’ है और समझता है कि उस पर क्या हो रहा है।
- कार्य योजना बनाना: यह तय करता है कि क्या क्लिक करना है, क्या टाइप करना है और अगला कदम क्या होगा।
- एक्शन लेना: यह वर्चुअल माउस और कीबोर्ड का उपयोग करके कार्यों को पूरा करता है।
3. ऑनलाइन फॉर्म भरने में सक्षम
यदि आप Operator से किसी ऑनलाइन फॉर्म को भरने के लिए कहते हैं, तो यह पहले फॉर्म को स्कैन करेगा, सही फील्ड को पहचानेगा और चरणबद्ध तरीके से आवश्यक जानकारी टाइप करेगा। यदि कोई बटन काम नहीं करता, तो यह अपने आप एक वैकल्पिक दृष्टिकोण आजमाएगा।
4. सुरक्षा और गोपनीयता का ध्यान
Operator संवेदनशील कार्यों के लिए सुरक्षा उपाय अपनाता है। यह पासवर्ड दर्ज करने या खरीदारी की पुष्टि करने जैसे कार्यों के लिए यूजर से अनुमति मांगता है। इसके अलावा, यह:
- हानिकारक या अवैध कार्यों से बचाव करता है।
- जोखिम भरी वेबसाइटों, जैसे गैंबलिंग या एडल्ट कंटेंट, को ब्लॉक करता है।
- गंभीर परिणाम वाले कार्यों (जैसे ईमेल भेजना या खरीदारी करना) को दोबारा जांचता है।
Operator की परफॉर्मेंस और टेस्टिंग
OpenAI के अनुसार, परीक्षण के दौरान Operator ने बेहतरीन प्रदर्शन किया। कुछ प्रमुख परीक्षण परिणाम इस प्रकार हैं:
- लाइव वेबसाइट ब्राउजिंग: वेबवॉयेजर टेस्ट (Amazon और GitHub जैसी वेबसाइटों पर नेविगेट करना) में 87% सफलता प्राप्त की।
- जटिल कार्य: कंप्यूटर सिस्टम को पूरी तरह मैनेज करने जैसे कार्यों में इसका सफलता दर 38.1% थी, जबकि मानव की सटीकता 72.4% थी।
भविष्य की संभावनाएँ
Operator अभी अमेरिका में ChatGPT Pro यूजर्स के लिए एक रिसर्च प्रिव्यू के रूप में उपलब्ध है। OpenAI का उद्देश्य इस तकनीक को बेहतर बनाना और इसकी क्षमताओं का विस्तार करना है।
यह AI टूल डिजिटल वर्कफ़्लो को ऑटोमेट करने और कंप्यूटर पर जटिल कार्यों को आसान बनाने की दिशा में एक बड़ा कदम साबित हो सकता है। हालांकि, अभी इसे और अधिक सुरक्षित और प्रभावी बनाने के लिए निरंतर सुधार की आवश्यकता है।