वाराणसी ब्यूरो । आईआईटी बीएचयू के कंप्यूटर साइंस इंजीनियरिंग के शोधकर्ताओं ने एआई पद्धति से सोशल मीडिया प्लेटफार्म की अभद्र सामग्री से निपटने का समाधान खोज निकाला है. भारत की मिश्रित भाषाओं में होने वाली साइबर बुलिंग पर अब आईआईटी बीएचयू की ये न्यू रिसर्च ब्रेक लगा देगी.


वाराणसी (ब्यूरो)आज शायद ही कोई ऐसा व्यक्ति हो, जो सोशल मीडिया के किसी भी प्लेटफार्म पर एक्टिव न हो। हर कोई अपनी छोटी से छोटी बातें तक सोशल मीडिया पर शेयर कर रहा है। हम कह सकते हैं कि आज सोशल मीडिया हमारे जीवन का एक अहम हिस्सा बन चुका है। कई बार हम सोशल मीडिया पर कोई पोस्ट करते हैं और कोई व्यक्ति आकर कमेंट सेक्शन में अभद्र टिप्पणी करके चला जाता है। हम सभी के साथ कभी न कभी ऐसा तो हुआ ही होगा। इसी में लगाम लगाने के लिए आईआईटी बीएचयू के कंप्यूटर साइंस इंजीनियरिंग के शोधकर्ताओं ने एआई पद्धति से सोशल मीडिया प्लेटफार्म की अभद्र सामग्री से निपटने का समाधान खोज निकाला है। भारत की मिश्रित भाषाओं में होने वाली साइबर बुलिंग पर अब आईआईटी बीएचयू की ये न्यू रिसर्च ब्रेक लगा देगी।

मिक्स लैंग्वेज पर काम

कंप्यूटर साइंस इंजीनियरिंग के एसोसिएट प्रोफेसर डॉ। रविंद्रनाथ चौधरी सी। ने बताया, भारत, दुनिया की दूसरी सबसे बड़ी डिजिटल आबादी का घर है और सोशल मीडिया प्लेटफॉॅम्र्स (एसएमपीएस) जैसे फेसबुक और एक्स समेत कई सोशल मीडिया प्लेटफार्म पर देश की जनता काफी एक्टिव रहती है। ये प्लेटफॉॅम्र्स हमारे दैनिक जीवन का हिस्सा बन गए हैं, लेकिन इसके साथ ही ये यूजर्स को साइबर बुलिंग (अभद्र साम्रगी) के प्रति भी सेंसेटिव बना रहे हैं। इंडिया के लिए ये समस्या और बढ़ जाती है, क्योंकि यहां पर यूजर्स बहुभाषीय होते हैं, जो हिंदी और अंग्रेजी जैसे भाषाओं के मिश्रण का उपयोग करते हैं। केवल एक भाषा में ही अभद्र सामग्री की पहचान करना चुनौतीपूर्ण है, और जब यह मिश्रित-भाषा की होती है, तो यह और भी जटिल हो जाती है। उन्होंने बताया कि हालांकि अंग्रेजी जैसी उच्च संसाधन वाली भाषाओं में साइबर बुलिंग से निपटने के लिए महत्वपूर्ण प्रयास किए गए हैं, लेकिन मिश्रित-भाषा संदर्भों पर बहुत कम ध्यान दिया गया है।

मेथड किया प्रपोज्ड

डॉ आर। चौधरी के मार्गदर्शन में विभाग के शोध छात्र पारस तिवारी ने देवनागरी-रोमन मिश्रित टेक्स्ट की जटिलताओं का गहन विश्लेषण किया और 20.38 परसेंट रेलेवेंस स्कोर के साथ कोड-मिश्रित अपमानजनक टेक्स्ट उदाहरणों को एकत्र और एनोटेट करने के लिए एक किफायती मेथड प्रपोज्ड किया है। इस अध्ययन से उत्पन्न डेटासेट मौजूदा अत्याधुनिक डेटासेट्स की तुलना में आठ गुना बड़ा है। इसके अतिरिक्त, उनके काम ने पारंपरिक मशीन लर्निंग तकनीकों और उन्नत प्री-ट्रेंड बड़े भाषा मॉडलों का उपयोग करके प्रभावी समाधान प्रस्तुत किए हैं।

ऐसे करेगा काम

आसान भाषा में समझे तो मार्केट में कई ऐसे मेथड हैं, जिससे ये पता लगाया जा सकता है कि सोशल मीडिया के किसी प्लेटफार्म पर किसी व्यक्ति ने किसी को गलत कमेंट लिख दिया। लेकिन उस व्यक्ति के कमेंट को हम तब ही खोज पाएंगे, जब उसने उस कमेंट को इंग्लिश में किया हो। पर भारत में तो हिंगलिश भाषा का उपयोग भी बहुत किया जाता है। यहां गुजराती, बंगाली, मराठी और भी भाषा बोलने वालों की कमी नहीं है। ऐसे में इस भाषा में कोई कमेंट करता है तो उसे खोजना बहुत मुश्किल का काम होता है। पर आईआईटी बीएचयू की शोधकर्ताओं के इस मेथड से जब भी कोई सोशल मीडिया पर किसी भी भाषा में गलत कमेंट करता है तो ये सोफ्टवेयर तुरंत उसे पकड़ लेगा। इस सॉफ्टवेयर की खासियत है कि ये उन कमेंट को सोशल मीडिया में खोजता है, जो कि हिंगलिश में या अन्य दूसरी भाषाओं में किए गए होते है। जो कि भारत में बोली जाती है।

Posted By: Inextlive