सबसे प्यारी, सबसे न्यारी, हिंदी से हम, हिंदी है हमारी।
आज, आर्टिफ़िशियल इंटेलिजेंस(Artificial intelligence) का युग है। इसके बारे में बात करते हुए, हम कह सकते हैं कि, लखनऊ के, कई नागरिकों ने, कम से कम एक बार तो, चैट जी पी टी(ChatGPT) का इस्तेमाल किया ही होगा। या फिर, इसके बारे में, सुना ही होगा । चैट जी पी टी, जेनरेटिव आर्टिफ़िशियल इंटेलिजेंस (जेनरेटिव ए आई – Generative AI) का एक प्रमुख उदाहरण है। इसके अन्य उदाहरणों में, डाल-ई 3(DALL-E 3), मिडजर्नी(Midjourney), स्टेबल डिफ़्यूजन(Stable Diffusion), लियोनार्डो ए आई(Leonardo AI), जैसे, ए आई छवि जेनरेटर (Image generators); कर्सर(Cursor) जैसे कोड संपादक(Code editors); और क्लाउडे (Claude) जैसे चैटबॉट सहायक(Chatbot assistants) शामिल हैं। अब, आप सोच रहे होंगे कि, जेनरेटिव ए आई का क्या मतलब है? तो चलिए, आज जेनरेटिव ए आई के बारे में, विस्तार से सीखते हैं। आगे, हम जेनरेटिव ए आई और पारंपरिक ए आई के बीच, अंतर का पता लगाएंगे। हम, विभिन्न प्रकार के ए आई के बारे में भी, बात करेंगे, जो आज उपयोग में हैं। उसके बाद, हम सीखेंगे कि, ए आई छवि या इमेज जेनरेटर क्या है, और यह कैसे काम करता है।
जेनरेटिव आर्टिफ़िशियल इंटेलिजेंस, एक प्रकार की कृत्रिम बुद्धिमत्ता है। यह अक्सर ही, संकेतों के जवाब में, जेनरेटिव मॉडल का उपयोग करके, पाठ, चित्र, वीडियो या अन्य डेटा उत्पन्न करने में सक्षम होती है। जेनरेटिव ए आई मॉडल, अपने इनपुट प्रशिक्षण डेटा के स्वरूप और संरचना को सीखते हैं, और फिर, समान विशेषताओं वाले, नए डेटा आउटपुट उत्पन्न करते हैं।
ट्रांसफ़ॉर्मर(Transformer)-आधारित, डीप न्यूरल नेटवर्क(Deep neural network) या विशेष रूप से, बड़े भाषा मॉडल्स(एल एल एम – Large language models) में, आए सुधारों ने, 2020 की शुरुआत में, जेनरेटिव ए आई प्रणाली में, ए आई के विकास को सक्षम किया। इनमें चैट जी पी टी, कोपायलट(Copilot), जेमिनी(Gemini) और लामा(LLaMA) जैसे चैटबॉट; स्टेबल डिफ़्यूजन, मिडजर्नी और डाल-ई जैसे, टेक्स्ट-टू-इमेज(Text-to-image) ए आई इमेज जेनरेशन सिस्टम(Image generation systems); और सोरा(Sora) जैसे, टेक्स्ट-टू-वीडियो ए आई जेनरेटर(Text-to-video AI generators) शामिल हैं।
पारंपरिक ए आई, और जेनरेटिव ए आई के बीच, मुख्य अंतर, उनकी क्षमताओं और अनुप्रयोग में है। पारंपरिक एआई प्रणाली का उपयोग, मुख्य रूप से, डेटा का विश्लेषण करने, और भविष्यवाणियां करने के लिए, किया जाता है। जबकि, जेनरेटिव ए आई, अपने प्रशिक्षण डेटा के समान, नया डेटा बनाकर, इससे एक कदम आगे बढ़कर, काम करता है। दूसरे शब्दों में, पारंपरिक ए आई स्वरूप, पहचान में, उत्कृष्टता प्रदान करता है। जबकि, जेनरेटिव ए आई स्वरूप निर्माण में, उत्कृष्टता प्रदान करता है। पारंपरिक ए आई, डेटा का विश्लेषण कर सकता है, और आपको बता सकता है कि, वह क्या देखता है। लेकिन, जेनरेटिव ए आई, उसी डेटा का उपयोग, पूरी तरह से, कुछ नया बनाने के लिए, कर सकता है।
डिज़ाइन में, जेनरेटिव ए आई, मिनटों में ही, अनगिनत प्रोटोटाइप(Prototypes) बनाने में मदद कर सकता है, जिससे विचार प्रक्रिया के लिए, आवश्यक समय कम हो जाता है। मनोरंजन उद्योग में, यह, नया संगीत तैयार करने, स्क्रिप्ट लिखने, या यहां तक कि, डीपफ़ेक(Deepfakes) बनाने में भी, मदद कर सकता है।
दूसरी ओर, पारंपरिक एआई, कार्य-विशिष्ट अनुप्रयोगों में, उत्कृष्टता प्राप्त करना जारी रखता है। यह, हमारे चैटबॉट्स, अनुशंसा प्रणाली, पूर्वानुमानित विश्लेषण और अन्य चीज़ों को शक्ति प्रदान करता है। यह, अधिकांश मौजूदा ए आई अनुप्रयोगों के पीछे का इंजन है, जो उद्योगों में, दक्षताओं का अनुकूलन कर रहा है।
इस प्रकार, एआई के विभिन्न प्रकार, निम्नलिखित हैं:
1.) नैरो ए आई(Narrow AI): नैरो ए आई, जिसे ‘अदृढ़ एआई’ के रूप में भी जाना जाता है, उस ए आई को संदर्भित करता है, जिसे, किसी विशिष्ट कार्य या सीमित श्रेणी के कार्यों को करने के लिए, डिज़ाइन किया गया हो । यह एआई का सबसे आम प्रकार है, और चेहरे की पहचान, भाषण पहचान, छवि पहचान, प्राकृतिक भाषा प्रसंस्करण और अनुशंसा प्रणाली जैसे, विभिन्न अनुप्रयोगों में, व्यापक रूप से, प्रयुक्त किया जाता है। नैरो ए आई, मशीन लर्निंग एल्गोरिदम(Machine learning algorithms) का उपयोग करके, काम करता है, जिन्हें किसी स्वरूप की पहचान करने, और भविष्यवाणियां करने के लिए, बड़ी मात्रा में डेटा पर प्रशिक्षित किया जाता है। ये एल्गोरिदम, छवियों में वस्तुओं की पहचान करना, या भाषाओं का अनुवाद करना, आदि विशिष्ट कार्य करने के लिए, डिज़ाइन किए गए होते हैं।
2.) सामान्य ए आई(General AI): सामान्य ए आई, जिसे, ‘दृढ़ एआई’ के रूप में भी जाना जाता है, उस ए आई को संदर्भित करता है, जिसे किसी भी, बौद्धिक कार्य को करने के लिए, डिज़ाइन किया गया हो । इन कामों को सामान्यतः, मनुष्य कर सकता है। यह ए आई का, एक सैद्धांतिक रूप है, जिसे हासिल करना, अभी तक संभव नहीं है। सामान्य ए आई, इंसानों की तरह ही, जटिल अवधारणाओं को तर्क करने, सीखने और समझने में सक्षम है। जनरल ए आई का लक्ष्य, एक ऐसी मशीन बनाना है, जो इंसानों की तरह ही, सोच और सीख सके। यह भाषा को समझने, समस्याओं को सुलझाने, निर्णय लेने और यहां तक कि, भावनाओं को प्रदर्शित करने में भी, सक्षम होगा।
यहां, सामान्य ए आई के, कुछ उदाहरण दिए गए हैं:
A) अल्फ़ागो(AlphaGo): अल्फ़ागो, गूगल(Google) के, डीपमाइंड(DeepMind) द्वारा विकसित, एक कंप्यूटर प्रोग्राम है, जो पेशेवर स्तर पर, बोर्ड गेम(Board game) – गो(Go) खेलने में सक्षम है।
B) सिरी(Siri): सिरी, ऐप्पल(Apple) द्वारा विकसित, एक ए आई-संचालित, व्यक्तिगत सहायक मॉडल है, जो सवालों के जवाब जवाब,सिफारिश, तथा रिमाइंडर सेट करने और संदेश भेजने, जैसे, कार्य कर सकता है।
C) चैट जी पी टी: यह, ए आई तकनीक द्वारा संचालित, एक प्राकृतिक भाषा प्रसंस्करण उपकरण है, जो आपको, चैटबॉट के साथ, मानव जैसी बातचीत, और अन्य सुविधाएं प्रदान करता है। यह भाषा मॉडल, प्रश्नों का उत्तर दे सकता है, और ईमेल, निबंध और कोड लिखने, जैसे, कार्यों में, आपकी सहायता कर सकता है।
3.) सुपर एआई(Super AI): सुपर एआई से तात्पर्य, उस ए आई से है, जो सभी क्षेत्रों में, मानव बुद्धि को मात देने में सक्षम है। यह ए आई का, एक काल्पनिक रूप है, जिसे हासिल करना, अभी तक संभव नहीं है। सुपर ए आई, मानवीय क्षमताओं से परे, जटिल समस्याओं को हल करने में, सक्षम होगा और मानव बुद्धि से, कहीं अधिक दर तक, सीखने और अनुकूलन करने में सक्षम होगा। सुपर ए आई का विकास, ए आई अनुसंधान का, अंतिम लक्ष्य है।
अब चलिए, जानते हैं कि, ए आई इमेज जेनरेटर क्या है? ए आई छवि जनरेटर, एक परिष्कृत उपकरण है, जो पाठ्य विवरण या संकेतों से, छवियां बनाने के लिए, कृत्रिम बुद्धिमत्ता एल्गोरिदम का उपयोग करता है। ये जेनरेटर , इनपुट संदेश का विश्लेषण करते हैं, और यथार्थवादी तस्वीरें व संबंधित दृश्य प्रतिनिधित्व, उत्पन्न करते हैं। मशीन लर्निंग और न्यूरल नेटवर्क(Neural networks) की शक्ति का उपयोग करके, ये प्रणालियां, उच्च गुणवत्ता वाली, छवियां उत्पन्न कर सकती हैं।
एक ए आई छवि जनरेटर, निम्नलिखित तरीकों से काम करता है:
1.) टेक्स्ट इनपुट विश्लेषण(Text Input Analysis): यह प्रक्रिया, उपयोगकर्ता द्वारा प्रदान किए गए, टेक्स्ट इनपुट या संदेश के विश्लेषण से, शुरू होती है। ए आई प्रणाली, संदेश के भीतर वर्णित, वस्तुओं, दृश्यों और भावनाओं जैसे, प्रमुख तत्वों की पहचान करने के लिए, उसे पार्स(Parse) करती है।
2.) अर्थ संबंधी समझ(Semantic Understanding): प्राकृतिक भाषा प्रसंस्करण (एन एल पी – Natural language processing) तकनीकों का उपयोग करके, ए आई प्रणाली, इनपुट पाठ के शब्दार्थ, और संदर्भ की गहरी समझ हासिल करती है। ए आई, अर्थ की सटीक व्याख्या करने के लिए, शब्दों और अवधारणाओं के बीच, संबंधों को पहचानता है।
3.) दृश्य अवधारणा(Visual Conceptualization): जब पाठ का विश्लेषण किया जाता है, तो, ए आई प्रणाली, अर्थ संबंधी जानकारी को दृश्य अवधारणाओं में, अनुवादित करती है। यह रचना, प्रकाश व्यवस्था और परिप्रेक्ष्य जैसे, कारकों पर विचार करते हुए, पाठ में दिए गए, विवरणों के अनुरूप, छवियों का चयन या निर्माण करता है।
4.) छवि संकलन(Image Synthesis): जेनरेटिव एडवरसेरियल नेटवर्क(जी ए एन – Generative adversarial networks (GAN)), या अन्य गहन शिक्षा उपकरण के उपयोग से, ए आई प्रणाली, चयनित दृश्य तत्वों को, एक समेकित छवि में, संकलित करती है।
5.) गुणवत्ता मूल्यांकन(Quality Assessment): उपयोगकर्ता को, अंतिम छवि प्रदान करने से पहले, ए आई प्रणाली, पूर्वनिर्धारित मानदंडों के आधार पर, इसकी गुणवत्ता और प्रासंगिकता का मूल्यांकन करती है। यह आउटपुट को, और अधिक परिष्कृत करने के लिए, इमेज एडिटिंग(Image editing) या स्टाइल ट्रांसफ़र(Style transfer) जैसी, तकनीकें निष्पादित कर सकती है।
6.) आउटपुट प्रस्तुति(Output Presentation): अंत में, एआई छवि जनरेटर, उपयोगकर्ता के लिए, उत्पन्न छवि प्रस्तुत करता है। उपयोगकर्ता, छवि को और अधिक परिष्कृत करने के लिए, प्रतिक्रिया दे सकता है, या इसका समायोजन कर सकता है। साथ ही, यह एक पुनरावृत्तीय और सहयोगात्मक रचनात्मक प्रक्रिया को, बढ़ावा दे सकता है।
संदर्भ
https://tinyurl.com/3as68k7d
https://tinyurl.com/3tyhfs4d
https://tinyurl.com/4zvsau8r
https://tinyurl.com/5xuuxypc
चित्र संदर्भ
1. एक रोबोट और एक युवती को संदर्भित करता एक चित्रण (wikimedia, flickr)
2. आर्टिफ़िशियल इंटेलिजेंस के अनंत उपयोगों को दर्शाने हेतु एक दूसरे से जुड़े कृत्रिम बुलबुलों को संदर्भित करता एक चित्रण (Pexels)
3. मशीन और इंसान के हाथ के मेल को संदर्भित करता एक चित्रण (Pexels)
4. आर्टिफ़िशियल इंटेलिजेंस को संदर्भित करता एक चित्रण (Pexels)