Friday, March 29, 2024
HomeTechस्थिर प्रसार ने कलाकारों की नकल करना और पोर्न बनाना कठिन बना...

स्थिर प्रसार ने कलाकारों की नकल करना और पोर्न बनाना कठिन बना दिया और उपयोगकर्ता पागल हो गए

एआई इमेज जेनरेटर स्टेबल डिफ्यूजन के यूजर्स एक को लेकर नाराज हैं सॉफ्टवेयर के लिए अद्यतन विशिष्ट कलाकारों की शैली में NSFW आउटपुट और चित्र उत्पन्न करने की अपनी क्षमता को “nerfs” करता है।

स्थिरता एआई, वह कंपनी जो सॉफ्टवेयर को निधि और प्रसार करती है, ने स्थिर प्रसार संस्करण 2 की घोषणा की इस सुबह जल्दी यूरोपीय समय। अद्यतन मॉडल के प्रमुख घटकों को फिर से इंजीनियर करता है और कुछ विशेषताओं जैसे अपस्केलिंग (छवियों के रिज़ॉल्यूशन को बढ़ाने की क्षमता) और इन-पेंटिंग (संदर्भ-जागरूक संपादन) में सुधार करता है। लेकिन, परिवर्तन भी स्थिर प्रसार के लिए कुछ प्रकार की छवियों को उत्पन्न करना कठिन बनाते हैं जिन्होंने विवाद और आलोचना दोनों को आकर्षित किया है। इनमें नग्न और अश्लील आउटपुट, मशहूर हस्तियों के फ़ोटो-यथार्थवादी चित्र और विशिष्ट कलाकारों की कलाकृति की नकल करने वाली छवियां शामिल हैं।

“उन्होंने मॉडल को कमजोर कर दिया है”

“उन्होंने मॉडल को कमजोर कर दिया है,” एक यूजर ने कमेंट किया एक स्थिर प्रसार उप-रेडिट पर। “यह थोड़े अप्रिय आश्चर्य है,” दूसरे ने कहा सॉफ्टवेयर के आधिकारिक डिस्कॉर्ड सर्वर पर।

उपयोगकर्ता ध्यान दें कि स्टेबल डिफ्यूजन के संस्करण 2 को ग्रेग रुतकोव्स्की की शैली में छवियां उत्पन्न करने के लिए कह रहे हैं – एक डिजिटल कलाकार जिसका नाम है उच्च-गुणवत्ता वाली छवियों के निर्माण के लिए एक शाब्दिक आशुलिपि बनें – अब ऐसी कलाकृति नहीं बनाता है जो अपने आप से मिलती-जुलती हो। (तुलना करना इन दो छवियां, उदाहरण के लिए)। “तुमने ग्रेग😔 के साथ क्या किया,” टिप्पणी की डिस्कॉर्ड पर एक उपयोगकर्ता।

सॉफ्टवेयर के रूप में स्थिर प्रसार में परिवर्तन उल्लेखनीय हैं बेहद प्रभावशाली और मानदंड निर्धारित करने में मदद करता है तेजी से आगे बढ़ने वाले जनरेटिव एआई दृश्य में। OpenAI के DALL-E जैसे प्रतिद्वंद्वी मॉडल के विपरीत, स्थिर प्रसार खुला स्रोत है। यह समुदाय को टूल में तेजी से सुधार करने और डेवलपर्स के लिए इसे अपने उत्पादों में मुफ्त में एकीकृत करने की अनुमति देता है। लेकिन इसका मतलब यह भी है कि स्थिर प्रसार में इसका उपयोग करने में कम बाधाएं हैं और परिणामस्वरूप, महत्वपूर्ण आलोचना को आकर्षित किया है। विशेष रूप से, रुतकोव्स्की जैसे कई कलाकार इस बात से नाराज़ हैं कि स्थिर प्रसार और अन्य छवि बनाने वाले मॉडल को उनकी सहमति के बिना उनकी कलाकृति पर प्रशिक्षित किया गया था और अब वे अपनी शैलियों को पुन: पेश कर सकते हैं। इस प्रकार की एआई-सक्षम प्रतिलिपि कानूनी है या नहीं एक खुला प्रश्न का कुछ. विशेषज्ञों का कहना है कि कॉपीराइट-सुरक्षित डेटा पर एआई मॉडल का प्रशिक्षण कानूनी है, लेकिन कुछ उपयोग-मामलों को अदालत में चुनौती दी जा सकती है।

विशिष्ट कलाकारों के समान छवियां उत्पन्न करने के लिए स्थिर प्रसार की क्षमता की तुलना।
छवि: lkwis Reddit के माध्यम से

स्टेबल डिफ्यूजन के उपयोगकर्ताओं ने अनुमान लगाया है कि इस तरह की संभावित कानूनी चुनौतियों को कम करने के लिए स्टेबिलिटी एआई द्वारा मॉडल में बदलाव किए गए थे। हालाँकि, कब कगार स्टैबिलिटी एआई के संस्थापक इमाद मोस्ताक से पूछा कि क्या निजी चैट में ऐसा था, तो मोस्टाक ने कोई जवाब नहीं दिया। मोस्टैक ने पुष्टि की, हालांकि स्थिरता एआई ने प्रशिक्षण डेटा से कलाकारों की छवियों को नहीं हटाया है (जैसा कि कई उपयोगकर्ताओं ने अनुमान लगाया है)। इसके बजाय, मॉडल की कलाकारों की नकल करने की क्षमता में कमी सॉफ्टवेयर द्वारा डेटा को कैसे एनकोड और पुनर्प्राप्त करने के तरीके में किए गए परिवर्तनों का परिणाम है।

मोस्टाक ने कहा, “यहां कलाकारों की कोई विशेष फिल्टरिंग नहीं की गई है।” कगार. (उन्होंने इन परिवर्तनों के तकनीकी आधार पर भी विस्तार किया डिस्कॉर्ड पर पोस्ट किया गया संदेश.)

हालांकि, स्टेबल डिफ्यूजन के प्रशिक्षण डेटा से जो हटा दिया गया है, वह नग्न और अश्लील चित्र हैं। उत्पन्न करने के लिए एआई छवि जनरेटर का उपयोग पहले से ही किया जा रहा है एनएसएफडब्ल्यू आउटपुट, जिसमें फोटोरियलिस्टिक और एनीमे-शैली दोनों चित्र शामिल हैं। हालांकि, इन मॉडलों का उपयोग विशिष्ट व्यक्तियों (गैर-सहमति वाली पोर्नोग्राफ़ी के रूप में जाना जाता है) और बाल शोषण की छवियों से मिलती-जुलती NSFW इमेजरी उत्पन्न करने के लिए भी किया जा सकता है।

सॉफ्टवेयर के आधिकारिक डिस्कोर्ड, मोस्टैक में स्टेबल डिफ्यूजन वर्जन 2 में बदलाव पर चर्चा टिप्पणियाँ यह बाद वाला उपयोग-मामला NSFW सामग्री को फ़िल्टर करने का कारण है। मोस्टाक कहते हैं, “बच्चे और nsfw एक खुले मॉडल में नहीं हो सकते हैं” (चूंकि बाल यौन शोषण सामग्री बनाने के लिए दो प्रकार की छवियों को जोड़ा जा सकता है), “इसलिए बच्चों से छुटकारा पाएं या nsfw से छुटकारा पाएं।”

एक उपयोगकर्ता स्टेबल डिफ्यूज़न के सब-रेडिट पर कहा गया कि NSFW सामग्री को हटाना “सेंसरशिप,” और “ओपन सोर्स समुदाय की भावना दर्शन के खिलाफ” था। उपयोगकर्ता ने कहा: “एनएसएफडब्ल्यू सामग्री को चुनने के लिए या नहीं, अंतिम उपयोगकर्ता के हाथों में होना चाहिए, नहीं [sic] एक सीमित/सेंसर मॉडल में। हालांकि, अन्य लोगों ने कहा कि स्थिर प्रसार के खुले स्रोत की प्रकृति का मतलब नग्न प्रशिक्षण डेटा हो सकता है आसानी से वापस जोड़ा जा सकता है तीसरे पक्ष के रिलीज़ में और यह कि नया सॉफ़्टवेयर पिछले संस्करणों को प्रभावित नहीं करता है: “V2.0 कलाकारों / NSFW की कमी के बारे में चिंता न करें, आप जल्द ही अपने पसंदीदा सेलेब को नग्न बनाने में सक्षम होंगे और वैसे भी आप पहले से ही कर सकते हैं। ”

हालांकि स्थिर प्रसार संस्करण 2 में परिवर्तन ने कुछ उपयोगकर्ताओं को नाराज कर दिया है, कई अन्य लोगों ने गहरी कार्यक्षमता के लिए इसकी क्षमता की प्रशंसा की, जैसा कि सॉफ्टवेयर की मौजूदा छवि की गहराई से मेल खाने वाली सामग्री का उत्पादन करने की नई क्षमता के साथ है। अन्य लोगों ने कहा कि परिवर्तनों ने उच्च-गुणवत्ता वाली छवियों को जल्दी से तैयार करना कठिन बना दिया है, लेकिन यह कि समुदाय भविष्य के संस्करणों में इस कार्यक्षमता को वापस जोड़ देगा। डिस्कॉर्ड पर एक उपयोगकर्ता के रूप में परिवर्तनों का सारांश दिया: “2.0 अब तक के मेरे अनुभव में संकेतों की व्याख्या करने और सुसंगत फोटोग्राफिक चित्र बनाने में बेहतर है। हालांकि यह किसी भी Rutkowski titties नहीं बना देगा।”

मोस्टाक ने खुद नए मॉडल की तुलना पिज्जा बेस से की है जो किसी को भी अपनी पसंद की सामग्री (यानी प्रशिक्षण डेटा) जोड़ने की सुविधा देता है। “एक अच्छा मॉडल हर किसी के द्वारा प्रयोग करने योग्य होना चाहिए और यदि आप सामान जोड़ना चाहते हैं, तो सामान जोड़ें,” उन्होंने कहा डिस्कॉर्ड पर कहा.

मोस्टैक ने यह भी कहा कि स्थिर प्रसार के भविष्य के संस्करण प्रशिक्षण डेटासेट का उपयोग करेंगे जो कलाकारों को ऑप्ट-इन या ऑप्ट-आउट करने की अनुमति देगा – एक ऐसी सुविधा जिसे कई कलाकारों ने अनुरोध किया है, और जो कुछ आलोचनाओं को कम करने में मदद कर सकती है। मोस्टाक ने कहा, “हम सुपर पारदर्शी होने की कोशिश कर रहे हैं क्योंकि हम आधार मॉडल में सुधार करते हैं और सामुदायिक प्रतिक्रिया को शामिल करते हैं।” कगार.

स्टेबल डिफ्यूजन वर्जन 2 का पब्लिक डेमो हो सकता है यहाँ पहुँचा (हालांकि उपयोगकर्ताओं की उच्च मांगों के कारण मॉडल अप्राप्य या धीमा हो सकता है)।

Leave a Reply

Most Popular

Recent Comments