قابلیتهای شگفتانگیز Veo 2 گوگل؛ حذف اشیا و افکتهای سینمایی
گوگل با معرفی Veo 2 در پلتفرم Vertex AI، ویرایش و تولید ویدیو را متحول کرده است؛ قابلیتهایی مانند حذف اشیای ناخواسته، گسترش ویدیو و جلوههای سینمایی حرفهای، تجربهای منحصربهفرد را برای کاربران فراهم میکند.

گوگل با ارتقاء مدل ویدیویی پیشرفته خود به نام Veo 2، زمینهساز ایجاد انقلابی در تولید و ویرایش ویدیوهای حرفهای شده است. این قابلیتها که در پلتفرم Vertex AI گوگل کلاد در دسترس قرار گرفتهاند، در کنار بهروزرسانیهای دیگر مدلهای هوش مصنوعی گوگل، از جمله مدل تولید تصویر Imagen 3 و مدلهای صوتی پیشرفته، به کاربران ارائه شدهاند.
ویژگیهای پیشرفته Veo 2
از مهمترین ویژگیهای جدید این مدل هوش مصنوعی میتوان به قابلیتهای زیر اشاره کرد:
- حذف اشیای ناخواسته (Inpainting): این ابزار توانایی حذف خودکار لوگوها، اشیای مزاحم یا عناصر پسزمینهی ناخواسته در ویدیوها را دارد.
- گسترش ویدیو (Outpainting): این امکان به کاربران اجازه میدهد تا ویدیوهای خود را گسترش داده و محتوای اضافی تولیدشده توسط هوش مصنوعی را بهطور طبیعی با ویدیوی اصلی ترکیب کنند.
- تنظیمات سینمایی: کاربران هنگام تولید ویدیو با متن در Veo 2 میتوانند از پیشتنظیمهایی مانند تایملپس، نماهای پهپادی و حرکات متنوع دوربین بهرهمند شوند.
- تولید ویدیو از تصاویر ثابت (Interpolation): این ویژگی قادر است بین دو تصویر ثابت، فریمهایی برای تولید ویدیوهای پیوسته و طبیعی ایجاد کند.
شباهت به ابزارهای پیشرفته Adobe
جالب است که قابلیتهای جدید Veo 2 شباهت بسیار زیادی به ابزار پیشرفته Firefly شرکت ادوبی دارد که اخیراً در نرمافزار پریمیر پرو ارائه شدهاند. این موضوع نشان میدهد که گوگل بهدنبال رقابت مستقیم با بزرگترین بازیگران حوزه ویرایش حرفهای محتوا است.
پیشرفتهای مدل تولید تصویر Imagen 3
مدل تولید تصویر گوگل، یعنی Imagen 3، نیز ارتقاء یافته و اکنون توانایی حذف اشیای ناخواسته در تصاویر را به شکلی طبیعیتر فراهم کرده است. بر اساس گزارشها، برندهای مشهوری مانند L’Oreal و Kraft Heinz از این فناوری برای تولید محتوای تبلیغاتی استفاده میکنند. بهگفته مدیر دیجیتال برند Heinz: «کاری که قبلاً ۸ هفته زمان نیاز داشت، حالا تنها در ۸ ساعت انجام میشود.»
نوآوریها در حوزه صوت و گفتار
گوگل در زمینه صوت نیز پیشرفتهای جذابی ارائه کرده است. مدل Lyria بهصورت پیشنمایش خصوصی برای تبدیل متن به موسیقی منتشر شده است. همچنین ویژگی Instant Custom Voice به مدل هوش مصنوعی Chirp 3 اضافه شده که با استفاده از تنها ۱۰ ثانیه صدای ورودی، صدای سفارشی و واقعگرایانه تولید میکند. این ابزار برای تشخیص و تفکیک گویندگان مختلف در تماسهای تلفنی نیز بسیار کاربردی است.
نگاهی به آینده: مدل سریعتر Gemini 2.5
گوگل اعلام کرده که مدل سریع جدید خود با نام جمینای ۲٫۵ فلش بهزودی در پلتفرم Vertex AI ارائه خواهد شد. این مدل قادر است زمان پردازش درخواستهای پیچیده را بهطور خودکار کاهش دهد و تجربه کاربری بهتری فراهم کند.
ارتقاء ایجنتهای هوش مصنوعی
گوگل قابلیت تعامل میان ایجنتهای هوش مصنوعی را نیز ارتقاء داده است. این ایجنتها اکنون میتوانند وظایف پیچیدهتری را در پلتفرمهایی مانند پیپال و Salesforce انجام دهند. همچنین بازار جدیدی به نام Cloud Marketplace معرفی شده که به شرکتها امکان خرید ایجنتهای هوش مصنوعی توسعهیافته توسط شرکا را فراهم میکند.
تحلیل و نتیجهگیری
با معرفی قابلیتهای جدید در مدل Veo 2 و ابزارهای مکمل، گوگل یک گام بزرگ در جهت حرفهایتر شدن فرآیندهای تولید محتوای دیجیتال برداشته است. این پیشرفتها، هم در حوزه ویدیو و تصویر و هم در زمینه صوت و پردازش دادهها، باعث خواهند شد کاربران صرفهجویی بسیاری در زمان و هزینه انجام دهند. بدون شک، این مسیر میتواند آینده محتوای دیجیتال را به شکل چشمگیری تغییر دهد و رقابت را در این صنعت وارد فاز جدیدی کند.
-
فیلم آواز باشکوه بهنام بانی ! / ببینید این پسر چطوری آهنگ بهنام بانی رو متفاوت خوند !
ارسال نظر