Tuesday, May 18, 2021
Home Internet NextGen Tech AI मॉडल, IT न्यूज़, ET CIO की ट्रेनिंग में सबसे बड़ी गलतियाँ

AI मॉडल, IT न्यूज़, ET CIO की ट्रेनिंग में सबसे बड़ी गलतियाँ

एआई एल्गोरिदम विकसित करना एक खेल नहीं है। मॉडल को सफलतापूर्वक काम करने और व्यावसायिक लाभ देने के लिए कौशल और विशेषज्ञता के एक विशेष सेट की आवश्यकता होती है। प्रशिक्षण के दौरान कोई गलती एआई मॉडल न केवल यह गलत तरीके से प्रदर्शन करता है बल्कि व्यावसायिक निर्णय लेते समय भी विनाशकारी साबित हो सकता है।

आप जो करते हैं, उसमें से अधिकांश कृत्रिम होशियारी आपके डेटा सेट सही होने के बारे में है। इसके बिना, आपका पूरा AI मॉडल केवल कचरा, कचरा बाहर करने के बारे में समाप्त होता है। लेकिन एक सही डेटा सेट क्या है और आप एक त्रुटिपूर्ण AI मॉडल के नुकसान से कैसे बच सकते हैं? ETCIO आपके लिए उन तीन सबसे बड़ी गलतियों को लाता है जो लोग अपने AI मॉडल को प्रशिक्षित करते समय करते हैं और आप इन जाल में गिरने से कैसे बच सकते हैं।

1. सभी डेटा के बारे में नहीं जानना:

आज लगभग हर संगठन ‘डेटा’ समस्या से निपट रहा है। कम या ज्यादा डाटा होना यहां बड़ी चिंता नहीं है। हमारे सभी संगठनात्मक डेटा के बारे में नहीं पता है कि वास्तविक समस्या कहां है। उद्यम वे जो वे नहीं जानते, उसका प्रबंधन नहीं कर सकते।

“यदि आप सकारात्मक व्यावसायिक परिणामों की तलाश कर रहे हैं, तो आपको अपने सभी संगठनात्मक डेटा को जानना होगा – क्लाउड में, ऑन-प्रिमाइसेस, वस्तुतः, मोबाइल उपकरणों पर और हर जगह, बीच में संग्रहीत”, प्रदीप शेषाद्रि, निदेशक – सेल्स इंजीनियरिंग, भारत ने कहा & सार्क, कमवला

“हम जिन संगठनों के साथ काम करते हैं, उनमें से अधिकांश के पास केवल उनके डेटा का एक आंशिक दृष्टिकोण होता है, जो उन्हें डेटा जोखिमों के लिए उजागर करता है, जिससे खराब व्यावसायिक क्षमता और बिना व्यावसायिक लक्ष्यों के नेतृत्व होता है। संगठन के डेटा के एक एकीकृत दृष्टिकोण के साथ, एनालिटिक्स और एआई उपकरण आसानी से व्यापार जोखिमों का पूर्वानुमान लगाने और व्यापार परिणामों में तेजी लाने के लिए प्रासंगिक डेटा का उपयोग कर सकते हैं। शेषाद्रि ने बताया, डेटा के साथ व्यावसायिक इकाइयों में बैठे और केंद्रीय प्रबंधन के तहत नहीं – सार्वजनिक और निजी दोनों ही संगठन मूल्य जोड़ने, लागत कम करने, जोखिम प्रबंधन और बेहतर तरीके से चलाने के अवसर गायब हैं।

उन्होंने सुझाव दिया कि कंपनियों को सही मायने में डेटा और व्यवसाय की क्षमता को अनलॉक करने और पर्याप्त डेटा होने की चिंता को रोकने और अपना ध्यान इस बात पर स्थानांतरित करने की आवश्यकता है कि क्या वे वास्तव में अपने सभी डेटा को जानते हैं और उन्हें कुशल प्रबंधन के लिए वर्गीकृत करते हैं क्योंकि सभी डेटा हर समय महत्वपूर्ण नहीं होते हैं। एक मजबूत डेटा प्रबंधन रणनीति आज के डेटा-संचालित युग में सफलता की आधारशिला है।

2. होने वाला गंदे डेटासेट:

एआई संचालित समाधान विकसित करते समय, मॉडल अंतर्दृष्टि और विश्लेषण केवल उतना ही अच्छा है जितना डेटा का उपयोग किया जा रहा है। अधिकांश समय प्रारंभिक इनपुट के रूप में उपयोग किए जाने वाले कच्चे डेटा विषम स्रोतों से आते हैं और “गंदे” होते हैं, अर्थात सेट में अशुद्धियाँ, लापता डेटा, मिसकॉडिंग और अन्य मुद्दे हो सकते हैं जो समाधान की ताकत को प्रभावित करते हैं। AI में सबसे बड़ी चुनौतियों में से एक गंदे डेटा की खोज और मरम्मत करना है; ऐसा करने में विफलता के कारण गलत विश्लेषण और अप्रत्याशित निष्कर्ष हो सकते हैं। अनिवार्य रूप से, कचरा डेटा बाहर कचरा विश्लेषण है।

“एआई मॉडल कई कारकों के माध्यम से सुविधाओं के लिए प्रसिद्ध हैं, जैसे डाक कोड, ऊंचाई, आदि। जब डेटा इनपुट पक्षपाती है, तो एआई मॉडल को परिणामों में पूर्वाग्रह को दोहराने का एक तरीका मिलेगा, भले ही पूर्वाग्रह स्पष्ट रूप से न हो। मॉडल के चर में शामिल है। इसलिए, गलत या “गंदे” डेटा के कारण गलत निष्कर्ष खराब व्यावसायिक रणनीति और निर्णय लेने की सूचना दे सकते हैं, “सौरभ कुमार, साथी, डेलॉइट इंडिया

इस प्रकार, यह सुनिश्चित करना कि एआई के विश्लेषण और प्रशिक्षण के लिए उपयोग किया जाने वाला डेटा त्रुटि से मुक्त है, पूर्वाग्रह, और अन्य खराब घटक जोखिम मुक्त संचालन सुनिश्चित करने के लिए आवश्यक है। एआई के साथ डेटा सफाई का अभ्यास अब खराब डेटा को खत्म करने और यह सुनिश्चित करने का सबसे अच्छा तरीका बन रहा है कि सभी उपकरण और अन्य उपकरणों और प्रौद्योगिकियों के बीच प्रयोग करने योग्य है।

“एआई मॉडल के लिए उपयोग किए जा रहे डेटा को मापने और निगरानी के लिए संगठनों को एक मजबूत रूपरेखा विकसित करने की आवश्यकता है। उन्हें यह समझने के लिए डेटा पर खोजपूर्ण डेटा विश्लेषण (EDA) करने में काफी समय बिताने की ज़रूरत है कि क्या डेटा में कोई पूर्वाग्रह या चूक है। एमएल मॉडल के लिए डेटा पाइपलाइन बनाते समय, मॉडल में बहने वाले डेटा की गुणवत्ता को समझने और बेहतर निगरानी करने के लिए विभिन्न बिंदुओं पर डिज़ाइन किए गए ऑडिट चेक और रिपोर्ट का एक अच्छा अभ्यास है। कंपनियों को एआई सक्षम समाधान विकसित करने की ओर देखना चाहिए, जो पारदर्शी हों, जिसका अर्थ है कि एआई मॉडल के परिणाम को अच्छी तरह से समझाया और संप्रेषित किया जा सकता है। पारदर्शी AI व्याख्या करने योग्य AI है, “कुमार ने कहा।

3. डेटासेट में विविधता नहीं होना:

एल्गोरिदम डेटा से सीखते हैं। वे समझ विकसित करते हैं, निर्णय लेते हैं और उनके द्वारा दिए गए प्रशिक्षण डेटा से उनके आत्मविश्वास का मूल्यांकन करते हैं। प्रशिक्षण डेटा जितना बेहतर होगा, AI उतना ही बेहतर प्रदर्शन करेगा। और डेटासेट की गुणवत्ता और मात्रा प्रभाव डाल सकती है कि AI कैसे प्रदर्शन करता है। इसलिए बड़े डेटासेट और अधिक से अधिक विविधता रखना महत्वपूर्ण है क्योंकि यह एआई को अधिक बढ़त के मामलों को सीखने में मदद करता है और बदले में, बेहतर प्रदर्शन करने के लिए अपनी सीखने की क्षमता में सुधार करता है।

“हालांकि, डेटा की पर्याप्त विविधता नहीं होने के कारण, पूर्वाग्रह हो सकता है, जो एआई को हल करने की कोशिश कर रहे समस्या पर गंभीर परिणाम हो सकता है। उदाहरण के लिए, अगर न्यायिक प्रणाली ने अपराधों के दोषी लोगों के लिए सजा अवधि निर्धारित करने और असाइन करने के लिए एआई का उपयोग किया तो क्या हो सकता है। यदि एआई में पूर्वाग्रह है, तो यह विशिष्ट नस्लीय समूहों के लिए लंबे वाक्यों के पैटर्न का कारण बन सकता है, ”सचिन देव दुग्गल, सह-संस्थापक और सीईओ, बिल्डर.ई ने कहा।

“एआई के साथ एक समस्या को हल करने के लिए, आपको उस विशिष्ट समस्या को हल करने के लिए डेटा की सही मात्रा की पहचान करने की आवश्यकता है। उदाहरण के लिए, हमारे एक उत्पाद में जहां हम यूआई स्क्रीन में विसंगतियों का पता लगाने के लिए कंप्यूटर विज़न को लागू करते हैं, जिसे दृश्य क्यूए के रूप में नामित किया गया है, हम केवल चित्र बनाते हैं। लेकिन अन्य अनुप्रयोगों में, हम संख्यात्मक और पाठ डेटा के संयोजन का उपयोग कर सकते हैं। इसलिए, डेटा की विविधता के लिए एआई की मदद करने की जरूरत नहीं है, प्रति से, लेकिन इसके बजाय समस्या को हल करने के लिए महत्वपूर्ण होगा, “उन्होंने कहा।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular

Recent Comments