एकृत्रिम बुद्धिमत्ता एल्गोरिदम का प्रोटीन संरचना पर उल्का प्रभाव पड़ा है, जैसे कि जब डीपमाइंड के अल्फाफोल्ड 2 ने संरचनाओं की भविष्यवाणी की 200 मिलियन प्रोटीन. अब, डेविड बेकर और वाशिंगटन विश्वविद्यालय में बायोकेमिस्ट की उनकी टीम ने प्रोटीन-फोल्डिंग एआई को एक कदम आगे बढ़ाया है। में एक प्रकृति 22 फरवरी से प्रकाशन, उन्होंने रेखांकित किया कि कैसे उन्होंने AI का उपयोग दर्जी, कार्यात्मक प्रोटीन को डिजाइन करने के लिए किया जिसे वे जीवित कोशिकाओं में संश्लेषित और उत्पादन कर सकते थे, जिससे प्रोटीन इंजीनियरिंग के लिए नए अवसर पैदा हुए। अली मदनीके संस्थापक और सीईओ समृद्धएक कंपनी जो प्रोटीन डिजाइन करने के लिए अन्य एआई तकनीक का उपयोग करती है, का कहना है कि यह अध्ययन प्रोटीन डिजाइन में “दूर चला गया” और टिप्पणी करता है कि अब हम “एक नए क्षेत्र का बोझ” देख रहे हैं।
प्रोटीन मुड़ी हुई जंजीरों में एक साथ जुड़े अमीनो एसिड के विभिन्न संयोजनों से बने होते हैं, जो 3 डी आकृतियों की एक असीम विविधता का निर्माण करते हैं। केवल अनुक्रम के आधार पर प्रोटीन की 3डी संरचना की भविष्यवाणी करना मानव मस्तिष्क के लिए एक असंभव कार्य है कई कारक जो प्रोटीन फोल्डिंग को नियंत्रित करता है, जैसे कि बायोमोलेक्यूल के अमीनो एसिड का अनुक्रम और लंबाई, यह अन्य अणुओं के साथ कैसे इंटरैक्ट करता है, और इसकी सतह पर चीनी मिलाई जाती है। इसके बजाय, वैज्ञानिकों ने प्रायोगिक तकनीकों जैसे कि दशकों से प्रोटीन संरचना का निर्धारण किया है एक्स – रे क्रिस्टलोग्राफी, जो क्रिस्टलीकृत प्रोटीन के माध्यम से एक्स-रे को विवर्तित करके परमाणु विस्तार में प्रोटीन सिलवटों को हल कर सकता है। लेकिन इस तरह के तरीके महंगे हैं, समय लेने वाले हैं और कुशल निष्पादन पर निर्भर करते हैं। फिर भी, इन तकनीकों का उपयोग करने वाले वैज्ञानिकों ने हजारों प्रोटीन संरचनाओं को हल करने में कामयाबी हासिल की है, जिससे डेटा का खजाना तैयार किया जा सकता है जिसका उपयोग अन्य प्रोटीनों की संरचनाओं को निर्धारित करने के लिए एआई एल्गोरिदम को प्रशिक्षित करने के लिए किया जा सकता है। डीपमाइंड प्रसिद्ध रूप से प्रदर्शित किया गया कि मशीन लर्निंग अपने अमीनो एसिड अनुक्रम से प्रोटीन की संरचना की भविष्यवाणी कर सकता है अल्फाफोल्ड प्रणाली और फिर प्रशिक्षण द्वारा इसकी सटीकता में सुधार किया अल्फाफोल्ड2 पर 170,000 प्रोटीन संरचनाएं।
देखना “डीपमाइंड एआई प्रोटीन की संरचना निर्धारित करने के लिए समय को गति देता है”
उसी दिन जब AlphaFold2 पेपर प्रकाशित हुआ, बेकर और उनके सहयोगियों ने एक स्वतंत्र, स्वतंत्र रूप से सुलभ विकल्प जारी किया जो AlphaFold2 के समान सटीकता के साथ प्रोटीन संरचना की भविष्यवाणी करता है, जिसे के रूप में जाना जाता है। RoseTTAFold.
तब से, बेकर और उनकी टीम ने यह पता लगाया है कि क्या रिवर्स में उपयोग की जाने वाली मशीन लर्निंग औद्योगिक या चिकित्सा क्षमता वाले एक काल्पनिक प्रोटीन के लिए अमीनो एसिड अनुक्रम उत्पन्न कर सकती है। प्रोटीन इंजीनियरिंग काफी हद तक उन प्रयोगों पर निर्भर करती है जो प्रोटीन में वृद्धिशील परिवर्तन करते हैं और उनके प्रभावों का अध्ययन करते हैं, जैसे कि द्वारा यादृच्छिक उत्परिवर्तन की शुरुआत प्रासंगिक प्रोटीन-व्यक्त करने वाले जीन में और वांछित अनुकूलन के लिए परिणामी प्रोटीन की स्क्रीनिंग। बेकर का कहना है कि एआई के साथ “हम ऐसे प्रोटीन के लिए” और भी बेहतर डिजाइन बना सकते हैं “पहले से कहीं ज्यादा तेजी से।”
अपनी प्रोटीन डिज़ाइन रणनीति का परीक्षण करने के लिए, उन्होंने प्रकाश-उत्पादक एंजाइमों के एक समूह का रुख किया, जिसे ल्यूसिफरेज कहा जाता है (लूसिफ़ेर लैटिन में “लाइटबियरर” का अर्थ है)। जब ल्यूसिफरिन नामक छोटे अणुओं से बंधे होते हैं, तो ये एंजाइम अंधेरे में चमकते हैं और कई जीवों में पाए जाते हैं, जिनमें जुगनू और समुद्र की पिच-काली गहराई में जलीय जीवन शामिल हैं।
देखना “मछली शिकार से बायोल्यूमिनेसेंस चुराती है”
फ्लोरोसेंट प्रोटीन के विपरीत, ल्यूसिफरेज को उत्तेजना प्रकाश स्रोत की आवश्यकता नहीं होती है और जानवरों के ऊतकों के अंदर गहरी इमेजिंग के लिए उपयोगी अनुप्रयोग होते हैं। लेकिन प्रकृति में बहुत कम ल्यूसिफरेज पाए गए हैं; अधिकांश अस्थिर होते हैं और अनुकूल गुणों के लिए इंजीनियर किए गए सिंथेटिक लूसिफ़ेरिन की तुलना में प्राकृतिक लूसिफ़ेरिन को बेहतर तरीके से बांधते हैं। इन कारकों ने बाधा डाली है प्रयास वैज्ञानिक अनुप्रयोगों में ल्यूसिफरेज का उपयोग करने और इन एंजाइमों के कृत्रिम संस्करणों को इंजीनियर करने के लिए।
अल्फाफोल्ड2 सहित एआई सिस्टम के मिश्रण के साथ काम करना, प्रोटीन एमपीएनएनऔर trRosetta, शोधकर्ताओं ने एक ल्यूसिफरेज के लिए एक अमीनो एसिड अनुक्रम का आविष्कार करने के लिए निर्धारित किया जो सिंथेटिक ल्यूसिफरिन को बांध सकता है और स्थिर रह सकता है। चूंकि प्राकृतिक ल्यूसिफरेज सिंथेटिक ल्यूसिफरिन से अच्छी तरह से नहीं जुड़ते हैं, इसलिए उन्होंने मशीन लर्निंग का उपयोग यह अनुमान लगाने के लिए किया कि छोटे अणुओं को बांधने के लिए जाने जाने वाले 4,000 अन्य प्रोटीन तुलना में कितने अच्छे हैं। एक प्रोटीन समूह बाहर खड़ा था: परमाणु परिवहन कारक 2 (NTF2) के समान प्रोटीन का सुपरफैमिली। एल्गोरिदम से पता चला कि इस सुपरफैमिली के सदस्य एक जेब साझा करते हैं जो सिंथेटिक ल्यूसिफरिन को पकड़ सकता है। एक संरचना के साथ जो टो में सिंथेटिक ल्यूसिफरिन से बंध सकती है, टीम ने तब स्थिरता पर ध्यान केंद्रित किया। दुर्भाग्य से, NTF2 जैसे प्रोटीन में अमीनो एसिड के लंबे लूप होते हैं, जो सिंथेटिक हाइब्रिड प्रोटीन में मिसफॉल्डिंग के लिए प्रवण हो सकते हैं। हालांकि, लूप ल्यूसिफरेज गतिविधि के अभिन्न अंग नहीं हैं, इसलिए शोधकर्ताओं ने मशीन लर्निंग एल्गोरिदम को अन्य, अधिक स्थिर अमीनो एसिड संयोजनों के साथ बदलने के लिए नियोजित किया।
अंत में, एआई तकनीकों के संयोजन ने टीम को प्रोटीन के 7,648 कस्टम डिजाइन तैयार करने की इजाजत दी जो प्रकृति में मौजूद नहीं हैं लेकिन शोधकर्ता जो चाहते थे वह करने में सक्षम हो सकते हैं। शोधकर्ताओं को तब सिंथेटिक ल्यूसिफरिन के साथ इलाज किए गए कोशिकाओं में प्रकाश उत्पन्न करने वाले को निर्धारित करके उन्हें सबसे अच्छे से कम करना पड़ा। शोधकर्ताओं ने इनमें से प्रत्येक डिज़ाइन को पेश किया ई कोलाई बैक्टीरिया और पाया कि केवल तीन (0.04 प्रतिशत) डिजाइनों ने काम किया।
देखना “अधिकांश मानव प्रोटीन संरचनाओं की भविष्यवाणियां स्वतंत्र रूप से उपलब्ध कराई गईं”
मदनी का कहना है कि एंजाइम डिजाइन अविश्वसनीय रूप से चुनौतीपूर्ण है क्योंकि इसे काम करने के लिए अत्यधिक सटीकता की आवश्यकता होती है और “कोई भी सफलता बहुत प्रभावशाली होती है।” प्रोफ्लुएंट में मदनी काम करते हैं प्रोजेन, प्रोटीन डिज़ाइन के लिए एक अलग AI वर्कफ़्लो, जिसके बारे में उनका कहना है कि “50% से अधिक हिट रेट हैं।” लेकिन, वह कहते हैं, इन तरीकों की तुलना करना सेब और संतरे की तुलना करने जैसा होगा क्योंकि वे विभिन्न प्रकार के प्रोटीन को अनुकूलित करने के लिए आदर्श हैं।
अपने वर्कफ़्लो को अनुकूलित करने के लिए निर्धारित, टीम ने लागू ज्ञान को पहली बार एक अलग आकार के एक अन्य सिंथेटिक ल्यूसिफरिन के खिलाफ अन्य ल्यूसिफरेज डिजाइन करने के लिए प्राप्त किया और सभी 46 पुटेटिव डिजाइनों के 4 प्रतिशत तक उपज को बढ़ाया। एंडी सीन-वी ये, बेकर की प्रयोगशाला में एक पोस्टडॉक्टरल शोधकर्ता का कहना है कि पहले दौर ने यह समझने में मदद की कि “किस प्रकार की ज्यामिति आपको एक ल्यूसिफरेज देगी” और इससे एल्गोरिथम पर विचार करने वाले उम्मीदवार अनुक्रमों की संख्या को कम करने में मदद मिली। अब बेकर और ये ने डायग्नोस्टिक बायोसेंसर नामक एक कंपनी बनाई है मोनोड बायो जिसने उनके सिंथेटिक ल्यूसिफरेज को लाइसेंस दिया है।
प्रोटीन डिजाइन अभी पूरी तरह से स्वचालित नहीं है। बेकर का कहना है कि “अभी भी सुधार की गुंजाइश है” क्योंकि ल्यूसिफरेज एंजाइम सक्रिय साइट को सही करने के लिए कुछ मैनुअल अनुक्रम परिवर्तन अभी भी आवश्यक थे। हालांकि, उन्हें उम्मीद है कि एक दिन, एआई प्रोटीन को “बॉक्स के ठीक बाहर” संश्लेषित कर सकता है। उन्होंने यह भी नोट किया कि ल्यूसिफरेज एंजाइम प्रतिक्रिया की नकल करना अपेक्षाकृत सरल है: “हमें यह देखने के लिए काम करना है कि यह दृष्टिकोण अधिक कठिन रासायनिक प्रतिक्रियाओं के लिए कितनी अच्छी तरह काम करता है।”
आगे बढ़ते हुए, बेकर और उनकी टीम नामक एक अन्य एआई प्रणाली विकसित कर रहे हैं आरएफप्रसार प्रोटीन डिजाइन को सुव्यवस्थित करने के लिए और नाक स्प्रे के लिए सिंथेटिक प्रोटीन का आविष्कार करने के लिए इसका उपयोग करने का इरादा है जो इन्फ्लूएंजा वायरस को मेजबान कोशिकाओं से जोड़ने से रोकता है। चूंकि एल्गोरिदम से बहुत स्थिर प्रोटीन उत्पन्न होने की उम्मीद है, बेकर उम्मीद करते हैं कि नाक स्प्रे का लंबा शेल्फ जीवन हो सकता है और नियमित रूप से पूरे सर्दियों में संक्रमण को रोकने के लिए उपयोग किया जा सकता है। श्वसन वायरस को अवरुद्ध करने से परे, बेकर का कहना है कि एल्गोरिदम का उपयोग भविष्य में सौर ऊर्जा पर कब्जा करने वाले नए बायोमटेरियल्स, स्थिर प्लास्टिक-अपमानजनक एंजाइम और प्रोटीन को डिजाइन करने के लिए किया जा सकता है।