Home Education डैल-ई मिनी: क्रिएटर ने धुंधले चेहरों, वायरल होने और प्रोजेक्ट के भविष्य के बारे में बताया

डैल-ई मिनी: क्रिएटर ने धुंधले चेहरों, वायरल होने और प्रोजेक्ट के भविष्य के बारे में बताया

0
डैल-ई मिनी: क्रिएटर ने धुंधले चेहरों, वायरल होने और प्रोजेक्ट के भविष्य के बारे में बताया

एआई इमेज जेनरेटर अभी अपना पल बिता रहे हैं। OpenAI और उनके निर्माण के लिए धन्यवाद जिसे Dall-E 2 के रूप में जाना जाता है, इंटरनेट पर लोग केवल शब्दों के संकेतों से अपनी विस्तृत छवियां बनाने में सक्षम हैं।

लेकिन OpenAI के निर्माण के तुरंत बाद, हमने देखा कि Google ने एक प्रत्यक्ष प्रतियोगी को OpenAI के ओपन-सोर्स कोड का उपयोग करके इमेजेन बनाने में मदद करने के लिए जारी किया – एक समान रूप से प्रभावशाली छवि जनरेटर, सरल वाक्यांशों से एक बार फिर से चित्र बनाने में सक्षम।

हालाँकि, जबकि ये दोनों आविष्कार एआई की दुनिया में क्रांतिकारी थे, वे केवल कुछ चुनिंदा लोगों के लिए उपलब्ध थे, प्रतीक्षा सूची की पेशकश करते हुए उन्होंने धीरे-धीरे नए उपयोगकर्ताओं तक पहुंच प्रदान की।

कुछ ही समय बाद, इंटरनेट में विस्फोट हो गया और लोगों ने अपनी खुद की Dall-E छवियां बना लीं, हालांकि गुणवत्ता का स्तर बहुत कम था। ऐसा इसलिए नहीं था क्योंकि OpenAI ने अचानक पहुंच खोल दी थी, बल्कि इसलिए कि किसी ने सॉफ्टवेयर का अपना संस्करण मूल रूप से मूल पर आधारित बनाया था, जिसे जाना जाता है दल-ई मिनी.

हमने दल-ई मिनी के निर्माता से बात की कि यह कैसे हुआ, इसकी वायरल क्षमता और परियोजना के भविष्य के बारे में।

दल-ई मिनी क्या है और यह कैसे बना?

© दल-ई मिनी

© दल-ई मिनी

डैल-ई मिनी एक और एआई इमेज जेनरेटर है जो इंटरनेट पर धूम मचा रहा है। हालाँकि, जहाँ यह भिन्न है कि यह सभी के उपयोग के लिए पूरी तरह से मुफ़्त है। लगभग समान नाम के बावजूद, इसका OpenAI से कोई लेना-देना नहीं है, ओपनएआई ने अपने मॉडल पर उपलब्ध कराई गई सार्वजनिक रूप से उपलब्ध जानकारी की बड़ी मात्रा का उपयोग करने के अलावा।

इसके बजाय, यह परियोजना एक सॉफ्टवेयर इंजीनियर द्वारा बनाई गई थी जिसे बोरिस डेमा के नाम से जाना जाता है। “जब मैंने इसके बारे में सुना [Dall-E], मैंने सोचा था कि यह बहुत अच्छा था और मैं ऐसा कुछ बनाना चाहता हूं। इसलिए मैंने मॉडल पर उनका पेपर पढ़ा, लेकिन मैं इसे कभी नहीं समझ पाऊंगा, यह इतना जटिल था, ”दयामा कहती हैं।

यह जुलाई 2021 तक नहीं था कि बोरिस के पास इस परियोजना को आजमाने और फिर से बनाने का मौका था जब उन्होंने Google और हगिंग फेस, एक एआई समुदाय द्वारा संचालित एक प्रतियोगिता के लिए साइन अप किया। उन्हें एक टीम के साथ जोड़ा गया और उनकी परियोजना पर समर्थन दिया गया, जहां उन सभी ने कोशिश करने और एक AI छवि जनरेटर बनाने का फैसला किया जैसे कि Dall-E।

“महीने के अंत तक, हमारे पास कुछ अच्छा था। यह उस स्तर पर नहीं था जो अब है, लेकिन यह रात या दिन में समुद्र तट जैसे सरल संकेत उत्पन्न कर सकता है। हमने प्रतियोगिता जीती और मैंने तब से सुधार करते हुए उत्पाद पर काम करना जारी रखा।”

मॉडल ने शुरुआत में केवल एक छोटे से दर्शकों के साथ उठाया, लेकिन लगभग दो महीने पहले, इंटरनेट ने इसे अपनी वायरल छवि क्षमताओं के लिए गले लगा लिया।

डेल-ई मिनी के साथ एक महत्वपूर्ण अंतर यह है कि छोटी टीम और फ्री-टू-यूज़ प्रकृति के कारण इसे बिल्कुल भी फ़िल्टर नहीं किया जाता है। इसका मतलब है कि Google के इमेजेन और ओपनएआई की तुलना में दल-ई 2, जिसमें सुरक्षा प्रोटोकॉल हैं, किसी भी संकेत को स्वीकार किया जाएगा। इसका मतलब यह है कि लोग टेड टॉक प्रदर्शन करने वाले कार्टून से लेकर क्विडिच खेलने वाली मशहूर हस्तियों तक, नस्लवाद, अत्यधिक हिंसा या वास्तविक दुनिया की दर्दनाक स्थितियों के चित्रण के लिए हर चीज के लिए डेल-ई मिनी का उपयोग करने में सक्षम हैं।

© ओपनएआई

एक विशेषज्ञ मेजबान के साथ एक टेड टॉक © Dall-E mini

लोकप्रिय होना

इस मुफ्त सेवा के ऑनलाइन वायरल होने के साथ, मंच का उपयोग करने वाले बोरिस की तुलना में अचानक बहुत अधिक लोग थे। उनका मुख्य टेकअवे इसके नए उपयोगकर्ताओं की रचनात्मकता थी।

“मैं चांदनी के नीचे एक झील, या चंद्रमा पर एफिल टॉवर के दृश्य जैसा कुछ लिखूंगा और ये मेरे सबसे जटिल संकेत थे। लेकिन जब मैं देखता हूं कि लोग इसका इस्तेमाल किस लिए करते हैं, तो मैं हैरान रह जाता हूं। मेरे पास रचनात्मकता का वह स्तर नहीं है और वे सीखते हैं कि वास्तव में विशिष्ट संकेत बनाने के लिए मॉडल को कैसे मोड़ना है, जो मैं कभी नहीं आ सकता था, ”बोरिस कहते हैं।

उन्होंने ट्विटर पर स्क्रॉल करना भी शुरू कर दिया है, जब उन्हें आराम करने की आवश्यकता होती है, यह देखते हुए कि लोग क्या बना सकते हैं। उन्हें ‘ट्रेल कैम’ शब्द के उपयोग का विशेष शौक है, जो रात में कम रेज वाले कैमरे से दिखने वाली दानेदार छवियां बनाते हैं।

© दल-ई मिनी

टिंकी-विंकी, लाला और पो के पास एक दुःस्वप्न है © दल-ई मिनी

धुंधले चेहरे और रचनात्मक इनपुट

मॉडल की लोकप्रियता के बावजूद, यह अपनी सीमाओं के बिना नहीं है। OpenAI के मूल मॉडल या Google के हाल के इमेजेन की तुलना में, Dall-E मिनी छवि गुणवत्ता के मामले में स्पष्ट रूप से मेल खाने के लिए संघर्ष करता है।

जबकि कोई भी शब्द संभवतः एक ऐसे परिणाम का उत्पादन करेगा जो मेल खाता हो, चाहे वह कितना भी विशिष्ट क्यों न हो, आप तुलना देखने के लिए खुद को निचोड़ते हुए पा सकते हैं। हस्तियाँ और कार्टून चरित्र अक्सर बूँद के रूप में सामने आ सकते हैं जो अस्पष्ट रूप से मूल से मिलते जुलते हैं, और एक अजीब मुद्दा भी है, मॉडल वास्तव में चेहरे नहीं कर सकता है।

“छवि को संख्याओं के एक बहुत ही शॉट अनुक्रम में एन्कोड किया गया है ताकि मॉडल तेजी से सीख सके। इस वजह से, मॉडल बहुत सारी गलतियाँ करता है। हालाँकि, जब आप चंद्रमा, एक परिदृश्य या एक पेड़ खींचते हैं, तो आप वास्तव में वहां के मुद्दों पर ध्यान नहीं देते हैं।

“जब यह चेहरे पर होता है, तो हम बहुत अधिक ध्यान देते हैं। अगर आंखें खराब हैं या नाक का आकार खराब है, तो यह अजीब है। यह जानवरों और कार्टून चरित्रों पर समान है, यह केवल कुछ ऐसा है जिस पर हम गलत आकार की वस्तुओं की तुलना में अधिक ध्यान देते हैं। वास्तव में, मॉडल हर चीज में समान रूप से अच्छा या बुरा होता है।”

इसका मतलब यह नहीं है कि मॉडल चेहरे बनाने में असमर्थ है, इसके लिए उपयोगकर्ता के हिस्से पर बहुत काम करना पड़ता है। कुछ ने चेहरे के प्रत्येक भाग के आकार और स्थान को सूचीबद्ध करते हुए, लंबे और विस्तृत संकेत लिखकर मॉडल को एक चेहरा बनाने के लिए मजबूर करने के तरीके खोजे हैं।

© दल-ई मिनी

आप पास नहीं होंगे … रस © दल-ई मिनी

बड़ी संख्या और दल-ई मिनी के भविष्य से निपटना

जबकि दल-ई मिनी की मुक्त प्रकृति इसे सबसे अलग बनाती है, यह अपनी सीमाओं के बिना नहीं है। OpenAI की कतार प्रणाली की तुलना में, यहाँ और वहाँ कुछ हज़ार तक पहुँच की पेशकश करते हुए, Dall-E मिनी सभी के लिए तुरंत उपलब्ध था।

“इसका उपयोग करने वाले लोगों की संख्या अभी पागल है। जैसे-जैसे यह वायरल हुआ, मैंने इसे और अधिक कुशल बनाने के लिए छोटे-छोटे बदलाव किए और फिर मैं अधिक ट्रैफ़िक को संभाल सकता था, लेकिन फिर ट्रैफ़िक फिर से बढ़ जाएगा, और मैं कभी भी नहीं रख सकता था।

“मैं इसे और अधिक सर्वरों के साथ बढ़ाना चाहता हूं और अनुकूलित करने में सक्षम हूं। धीरे-धीरे हम अधिक ट्रैफ़िक का समर्थन करने में सक्षम हैं और उम्मीद है कि भविष्य में ट्रैफ़िक कोई समस्या नहीं होगी। ”

हालाँकि, अधिक पैमानों और विकास के साथ, बोरिस अब वही सवाल पूछ रहा है जो OpenAI और Google दोनों सवाल कर रहे होंगे – क्या यह बिना किसी वित्तीय सहायता या मुद्रीकरण के जारी है।

“मुझे लगता है कि मुद्रीकरण महत्वपूर्ण है। मैं इसे स्केलेबल बनाने में सक्षम होना चाहता हूं ताकि हर कोई इसका उपयोग कर सके और मेरे लिए यह बहुत महत्वपूर्ण है कि इसे सभी के उपयोग के लिए निःशुल्क बनाया जाए। मेरा लक्ष्य इसके लिए एक आत्मनिर्भर परियोजना बनना है जिसका उपयोग हर कोई शुल्क के लिए कर सकता है। ”

अधिक पढ़ें:

LEAVE A REPLY

Please enter your comment!
Please enter your name here