ट्रेंडिंगविज्ञान-टेक्नॉलॉजी

Google I/O 2025: गूगल ने अपने सबसे एडवांस्ड AI इमेज और वीडियो जेनरेशन टूल्स को पेश किया; ऑडियो ऑटोमैटिकली जनरेट होगा

Google I/O 2025 में गूगल ने Imagen 4 और Veo 3 जैसे अपने सबसे विकसित AI इमेज और वीडियो जेनरेशन टूल्स को पेश किया।

Google I/O 2025: ये आर्टिफिशियल इंटेलिजेंस मॉडल्स टेक्स्ट या इमेज प्रॉम्प्ट्स से छोटे वीडियो और इमेज बनाते हैं। Imagen 4 2K रेजोल्यूशन और टेक्स्ट हैंडलिंग में बेहतर है, लेकिन Veo 3 ऑटोमैटिक ऑडियो बनाता है। आइए इनके बारे में अधिक जानें।

Google I/O 2025 कीनोट में गूगल ने Imagen 4 इमेज जेनरेशन और Veo 3 वीडियो जेनरेशन टूल्स पेश किए, जो अब तक की सबसे विकसित AI इमेज और वीडियो जेनरेशन तकनीक हैं। ये नए AI मॉडल्स, इमेज प्रॉम्प्ट्स या टेक्स्ट के आधार पर छोटे वीडियो क्लिप्स और इमेज बनाएंगे। वीडियो के साथ-साथ, Veo 3 अपने क्लिप्स में ऑटोमैटिक और रिलेवेंट ऑडियो भी जनरेट करेगा।

गूगल ने कहा कि Veo 3 एक नवीनतम वीडियो जेनरेशन मॉडल है, जो टेक्स्ट या चित्रों से छोटे वीडियो टुकड़े बना सकता है। कम्पनी ने कहा कि Veo 3 मॉडल मोशन, सामाजिक कनेक्टिविटी और सीन कंसिस्टेंसी को बेहतर ढंग से नियंत्रित करता है, जो वीडियो रियलिटी को बढ़ाता है।

कम्पनी ने कहा कि Veo 3 अब यूएस में Google AI Ultra Plan सब्सक्राइबर्स के लिए बीटा में उपलब्ध है. Gemini ऐप और Google AI फिल्ममेकिंग प्लेटफॉर्म Flow के जरिए एक्सेस किया जा सकता है, जिसे I/O में भी रिवील किया गया। एंटरप्राइज एक्सेस Vertex AI के जरिए दिया जा रहा है।

इसके अलावा, गूगल ने पहले संस्करण Veo 2 को भी अपडेट किया है। इनमें शामिल हैं:

रिफरेंस इनपुट्स: अब यूजर्स लोगों, चीजों या स्टाइल्स की इमेज अपलोड करके सीन में सहयोग बनाए रख सकते हैं।

कैमरा कंट्रोल्स: नए मॉडल में पैन, जूम और रोटेट जैसे विकल्प हैं, जो प्रस्ताव में समायोजित किए जा सकते हैं।

आउटपेंटिंग: वीडियो को मूल फ्रेम से आगे बढ़ाया जा सकता है, जो फॉर्मेट्स को बदलने में फायदेमंद है।

ऑब्जेक्ट ऐड और रिमूव: Veo 2 मॉडल फ्रेम्स में सामग्री जोड़ने और हटाने की क्षमता प्रदान करता है। मॉडल लाइटिंग और शैडोज में सहायक है।

Imagen 4 के बारे में जानें

गूगल ने Imagen 4 नामक एक नवीनतम AI इमेज जेनरेटर भी पेश किया है, जो एक वीडियो AI मॉडल है। नया मॉडल 2K रेजोल्यूशन को सपोर्ट करता है, जिससे फर, रिफ्लेक्शन्स और फैब्रिक टेक्सचर्स जैसे डिटेल्स को बेहतर ढंग से हैंडल किया जा सकता है। मॉडल कई स्टाइल्स में काम करता है, जैसे फोटोरियलिस्टिक और इलस्ट्रेटिव प्रॉम्प्ट्स।

Imagen 4 की खासियत है कि ये इमेज में टेक्स्ट को हैंडल कर सकता है- यानी सटीक स्पेलिंग- जो इसे पोस्टर्स, स्लाइड्स या कस्टम टाइपोग्राफी वाले कार्ड्स जनरेट करने के लिए उपयोगी बनाता है।

गूगल अब Imagen 4 को Gemini, Vertex AI, Whisk और Docs, Slides, Vids जैसे Workspace टूल्स में इंटीग्रेट कर रहा है। गूगल ने ये भी घोषणा की कि जल्द ही Imagen 3 से 10 गुना तेज वर्जन रिलीज होगा, जो रैपिड प्रोटोटाइपिंग के लिए होगा।

Related Articles

Back to top button