प्राकृतिक भाषा प्रसंस्करण से समझें कैसे काम करती है, “एलेक्सा वॉयस असिस्टेंट”

संचार एवं संचार यन्त्र
09-09-2023 11:07 AM
Post Viewership from Post Date to 09- Oct-2023 (31st Day)
City Subscribers (FB+App) Website (Direct+Google) Email Instagram Total
2475 411 2886
प्राकृतिक भाषा प्रसंस्करण से समझें कैसे काम करती है, “एलेक्सा वॉयस असिस्टेंट”

आपने आर्टिफिशियल इंटेलिजेंस (Artificial Intelligence) के बारे में तो बहुत सुना होगा, आज हम इसकी एक विशेष शाखा के बारे में जानेंगे। प्राकृतिक भाषा प्रसंस्करण (Natural Language Processing), जिसे अब एनएलपी भी कहा जाता है, आर्टिफिशियल इंटेलिजेंस एवं मानव विज्ञान का एक प्रमुख हिस्सा है। एनएलपी एक ऐसी तकनीक है, जिसके द्वारा एक कंप्यूटर या मशीन मनुष्यों की भाषा को समझता है और उस भाषा को बोल सकता है। सरल अर्थ में, एनएलपी किसी कंप्यूटर या डिवाइस (Device) को इंसानी भाषा बोलने और समझने की क्षमता प्रदान करता है। हम यह भी कह सकते हैं कि, प्राकृतिक भाषा प्रसंस्करण ही वह तकनीक है, जिसका उपयोग मशीनों द्वारा इंसानी भाषा को समझने, उसका विश्लेषण करने और उसकी व्याख्या करने के लिए किया जाता है। एनएलपी का मुख्य उदेश्य, एक ऐसी प्रणाली का निर्माण करना है, जो अंग्रेजी या दूसरी भाषाओं के शब्दों को समझ पाए, उसे आसानी से अनुवादित कर पाए और उसमें छिपी गलतियों को ढूंढ सके। एनएलपी का एक सबसे अच्छा उदाहरण, गूगल असिस्ट (Google Assist) है, जो मनुष्य द्वारा बोले गए शब्दों को समझकर, उनके हिसाब से प्रतिक्रिया प्रदान करता है। प्राकृतिक भाषा प्रसंस्करण, आर्टिफीसियल इंटेलिजेंस एवं मशीन लर्निंग (Machine Learning) का उपयोग कभी–कभी एक–दूसरे के साथ किया जाता है। अतः हम कह सकते है कि, ये तीनों तकनीकें एक–दूसरे पर निर्भर हैं।
आर्टिफीसियल इंटेलिजेंस में एनएलपी का उपयोग किया जाता है, जिसकी मदद से ही मशीनें विभिन्न स्रोतों से प्राप्त डेटा को समझने, उसका विश्लेषण करने और इसके हिसाब से, अंतर्दृष्टि प्राप्त करने में सक्षम हो पाती हैं। आर्टिफीसियल इंटेलिजेंस में भाषा प्रसंस्करण का उपयोग निम्नलिखित कार्यों में किया जाता है।
अवांछित चीज़ों को पता लगाना (Spam Detection): भाषा प्रसंस्करण का उपयोग अवांछित चीज़ों या स्पैम (Spam) का पता लगाने के लिए किया जाता है। साथ ही, इससे हम अवांछित ईमेल (Spam Email) का भी पता लगा सकते हैं।
भावनाओं का विश्लेषण (Sentiment Analysis): एनएलपी का इस्तेमाल प्रेषक के व्यवहार, अभिवृत्ति और भावों को समझने के लिए किया जाता है। यह सेन्डर (Sender) या प्रेषक के गुस्से, खुशी और उदासी का पता लगा सकता है।
यांत्रिक अनुवाद (Machine Translation): एनएलपी का इस्तेमाल एक प्राकृतिक भाषा का अन्य भाषा में अनुवाद करने के लिए किया जाता है। उदाहरण के लिए, गूगल ट्रांसलेटर (Google translator) में आप, हिंदी भाषा का अंग्रेजी भाषा या फिर अन्य किसी भी भाषा में अनुवाद कर सकते हैं।
वर्तनी सुधार (Spelling correction): इस तकनीक का उपयोग, वर्तनी में सुधार करने के लिए किया जाता है। हमारे पास कई सॉफ्टवेयर (Software) के विकल्प हैं, जो वर्तनी को सुधारने में हमारी मदद करते हैं।
वाणी की पहचान (Speech Recognition): यह तकनीक हमारे द्वारा बोले गए शब्दों को पहचान कर उन्हें कई प्रकार से इस्तेमाल कर सकती है। जैसे, बोले गए शब्दों को लिखित भाषा (Text) में बदलने में मदद करना।
चैटबॉट (Chatbot): प्राकृतिक भाषा प्रसंस्करण का उपयोग कंपनियों या सेवा प्रदाताओं द्वारा, हमें चैट बॉक्स (Chat box) की सुविधा प्रदान करने हेतु किया जाता है। प्राकृतिक भाषा की समझ (Natural Language Understanding) यह तकनीक, बड़े टेक्स्ट को औपचारिक प्रतिरूप में बदल सकती है। जिससे, हम किसी भाषा को पढ़ भी सकते हैं। इसके अलावा, भाषा प्रसंस्करण में निम्नलिखित दो घटक होते हैं। 1.प्राकृतिक भाषा की समझ (Natural Language Understanding–NLU): यह घटक इंसानी भाषा को समझने तथा उसका विश्लेषण करने में मशीनों की मदद करता है। एनएलयू कंटेंट (Content) या सूचना से मेटाडेटा (Metadata) को निकालकर, फिर उनका विश्लेषण करता हैं तथा भाषा के विभिन्न पहलुओं को समझने और उनका विश्लेषण करने में मदद करता है। सरल अर्थ में, यह भाषा को पढ़ने और समझने का काम करता है।
2.प्राकृतिक भाषा का उत्पादन (Natural Language Generation–NLG) एक बार जब, एनएलयू के माध्यम से मशीन को सूचना समझ में आ जाती है, तब एनएलजी का कार्य शुरू होता है। प्राकृतिक भाषा का उत्पादन, मशीन पर प्रविष्ट डेटा के आधार पर, मौखिक या लिखित रूप से जवाब देकर होता है। यहां, एनएलजी कंप्यूटराइज्ड (Computerise) डेटा को प्राकृतिक भाषा में परिवर्तित करता है, जो की किसी इंसान द्वारा लिखी या बोली गई भाषाओं के समान ही होता है।
प्राकृतिक भाषा प्रसंस्करण एवं आर्टिफिशियल इंटेलिजेंस पर आधारित एलेक्सा (Alexa) और सिरी (Siri) क्रमशः अमेज़ॅन (Amazon) और ऐप्पल (Apple) के डिजिटल वॉयस असिस्टेंट (Digital Voice Assistants), हमारे एक सुविधाजनक उपकरण से परे, कृत्रिम बुद्धिमत्ता के वास्तविक अनुप्रयोग हैं। प्रभावी संचालन एवं बेहतर प्रदर्शन के लिए वे प्राकृतिक भाषा निर्माण और प्रसंस्करण तथा मशीन लर्निंग एवं कृत्रिम बुद्धिमत्ता के रूपों का उपयोग करते हैं। एलेक्सा और सिरी लगातार स्मार्ट (Smart) होते जा रहे हैं। हमारे द्वारा कुछ सूचना पाने पर ही, यह हमारे काम कर सकते हैं।
मशीन लर्निंग, आर्टिफिशयल इंटेलिजेंस का अनुप्रयोग है, जहां मशीनें डेटा तक पहुंच कर डेटा से सीख सकती हैं। डिजिटल वॉयस असिस्टेंट की वृद्धि के लिए, डेटा और मशीन लर्निंग दोनों तकनीकें जिम्मेदार हैं। क्या आपने कभी सोचा है कि, एलेक्सा कैसे काम करती होगी? आइए, जानते हैं। एलेक्सा, प्राकृतिक भाषा प्रसंस्करण पर आधारित है। एलेक्सा हमारी बातें रिकॉर्ड (Record) करती है। फिर, इस भाषण की रिकॉर्डिंग का अधिक कुशलता से विश्लेषण करने हेतु, इसे अमेज़ॅन के सर्वर (Server) पर भेजा जाता है। तब अमेज़ॅन हमारी सूचना को अलग-अलग ध्वनियों में विभाजित करता है। इसके बाद, यह विभिन्न शब्दों के उच्चारण वाले डेटाबेस (Database) से परामर्श लेता है, ताकि यह पता लगाया जा सके कि, कौन से शब्द व्यक्तिगत ध्वनियों के संयोजन से सबसे अधिक मेल खाते हैं। इसके बाद, यह सूचना को समझने और संबंधित कार्यों को करने के लिए, महत्वपूर्ण शब्दों की पहचान करता है। तब अमेज़ॅन के सर्वर आपके डिवाइस (Device) पर वापस जानकारी भेजते हैं और एलेक्सा आपकी बात का जवाब देती है।

संदर्भ
https://tinyurl.com/4empcjjk
https://tinyurl.com/yhpp9nsp
https://tinyurl.com/3nbpe26m
https://tinyurl.com/4df5ty4a
https://tinyurl.com/edaubbhx

चित्र संदर्भ 
1. वॉयस असिस्टेंट को संदर्भित करता एक चित्रण ((Wallpaper Flare)
2. वॉइस सर्च को दर्शाता एक चित्रण (Seobility)
3. Google Pixel XL स्मार्टफोन पर Android Assistant को संदर्भित करता एक चित्रण (Trusted Reviews)
4. एलेक्सा वॉयस असिस्टेंट को दर्शाता एक चित्रण (Flickr)

पिछला / Previous अगला / Next

Definitions of the Post Viewership Metrics

A. City Subscribers (FB + App) - This is the Total city-based unique subscribers from the Prarang Hindi FB page and the Prarang App who reached this specific post.

B. Website (Google + Direct) - This is the Total viewership of readers who reached this post directly through their browsers and via Google search.

C. Total Viewership — This is the Sum of all Subscribers (FB+App), Website (Google+Direct), Email, and Instagram who reached this Prarang post/page.

D. The Reach (Viewership) - The reach on the post is updated either on the 6th day from the day of posting or on the completion (Day 31 or 32) of one month from the day of posting.