चैटजीपीटी बनाने वाली कंपनी ओपनAI ने एक नए टेक्स्ट-टू-वीडियो मॉडल सोरा को लॉन्च कर दिया है, जो विजुअल क्वालिटी और यूजर के प्रॉम्प्ट का पालन करते हुए एक मिनट तक के वीडियो तैयार कर सकता है. सोरा एक ऐसा मॉडल है, जो एक वीडियो तैयार करता है और वीडियो में मौजूद शोर को धीरे-धीरे कई स्टेप में हटाकर इसे बदल देता है. कंपनी ने कहा, ‘सोरा एक बार में पूरी वीडियो बनाने या जेनरेट किए गए वीडियो को लंबा करने में सक्षम है.’
केवल टेक्स्ट इंस्ट्रक्शन से एक वीडियो तैयार करने में सक्षम होने के अलावा, मॉडल एक मौजूदा स्टिल इमेज लेने और इमेज कंटेंट को सटीकता और छोटी डिटेल्स पर ध्यान देने के साथ एक वीडियो तैयार करने में भी सक्षम है.
जीपीटी मॉडल के समान, सोरा एक ट्रांसफॉर्मर आर्किटेक्चर का इस्तेमाल करता है, जो बेहतर स्केलिंग परफॉर्मेंस को अनलॉक करता है. कंपनी ने कहा कि वह सोरा को रेड टीमर्स (डोमेन एक्सपर्ट्स) को नुकसान या जोखिम के लिए महत्वपूर्ण क्षेत्रों का आकलन करने के लिए उपलब्ध करा रही है.
ओपनएआई ने एक बयान में कहा, ‘हम क्रिएटिव प्रोफेशनल्स के लिए मॉडल को सबसे ज्यादा उपयोगी बनाने के तरीके को आगे बढ़ाने के बारे में फीडबैक प्राप्त करने के लिए कई विजुअल आर्टिस्ट्स, डिजाइनर्स और फिल्म मेकर्स तक पहुंच प्रदान कर रहे हैं.’
सोरा कई करेक्टर्स, कई तरह के मोशन और बैकग्राउंड के सटीक डिटेल्स के साथ मुश्किल सीन्स जनरेट करने में सक्षम होगा. ओपनएआई के अनुसार, ‘मॉडल न केवल यह समझता है कि यूजर ने प्रॉम्प्ट में क्या मांगा है, बल्कि यह भी समझता है कि फिजिकल वर्ल्ड में वे चीजें कैसे मौजूद हैं.’
सोरा एक ही जेनरेट किए गए वीडियो के अंदर कई शॉट भी बना सकता है जो करेक्टर्स और विजुअल स्टाइल को सटीक रूप से बनाए रखता है. हालांकि, कंपनी ने स्वीकार किया कि मौजूदा मॉडल की अपनी कमजोरियां हैं. कंपनी ने कहा कि वह सोरा को ओपन AI के प्रोडक्ट्स में उपलब्ध कराने से पहले ज़रूरी सुरक्षा कदम उठाएगी.
कंपनी ने कहा, ‘हम गलत सूचना, नफरत फैलाने वाले कंटेंट और भेदभाव जैसे क्षेत्रों में रेड टीमर्स डोमेन एक्सपर्ट्स के साथ काम कर रहे हैं जो मॉडल की टेस्टिंग करेंगे. हम भ्रामक कंटेंट का पता लगाने में मदद करने के लिए टूल भी बना रहे हैं, जैसे कि एक डिटेक्शन क्लासिफायर जो बता सकता है कि सोरा द्वारा कोई वीडियो कब बनाया गया था.’