قابلیت‌های شگفت‌انگیز Veo 2 گوگل؛ حذف اشیا و افکت‌های سینمایی

گوگل با ارتقاء مدل ویدیویی پیشرفته خود به نام Veo 2، زمینه‌ساز ایجاد انقلابی در تولید و ویرایش ویدیوهای حرفه‌ای شده است. این قابلیت‌ها که در پلتفرم Vertex AI گوگل کلاد در دسترس قرار گرفته‌اند، در کنار به‌روزرسانی‌های دیگر مدل‌های هوش مصنوعی گوگل، از جمله مدل تولید تصویر Imagen 3 و مدل‌های صوتی پیشرفته، به کاربران ارائه شده‌اند.

ویژگی‌های پیشرفته Veo 2

از مهم‌ترین ویژگی‌های جدید این مدل هوش مصنوعی می‌توان به قابلیت‌های زیر اشاره کرد:

  • حذف اشیای ناخواسته (Inpainting): این ابزار توانایی حذف خودکار لوگوها، اشیای مزاحم یا عناصر پس‌زمینه‌ی ناخواسته در ویدیوها را دارد.
  • گسترش ویدیو (Outpainting): این امکان به کاربران اجازه می‌دهد تا ویدیوهای خود را گسترش داده و محتوای اضافی تولیدشده توسط هوش مصنوعی را به‌طور طبیعی با ویدیوی اصلی ترکیب کنند.
  • تنظیمات سینمایی: کاربران هنگام تولید ویدیو با متن در Veo 2 می‌توانند از پیش‌تنظیم‌هایی مانند تایم‌لپس، نماهای پهپادی و حرکات متنوع دوربین بهره‌مند شوند.
  • تولید ویدیو از تصاویر ثابت (Interpolation): این ویژگی قادر است بین دو تصویر ثابت، فریم‌هایی برای تولید ویدیوهای پیوسته و طبیعی ایجاد کند.

مدل هوش مصنوعی Veo 2

شباهت به ابزارهای پیشرفته Adobe

جالب است که قابلیت‌های جدید Veo 2 شباهت بسیار زیادی به ابزار پیشرفته Firefly شرکت ادوبی دارد که اخیراً در نرم‌افزار پریمیر پرو ارائه شده‌اند. این موضوع نشان می‌دهد که گوگل به‌دنبال رقابت مستقیم با بزرگترین بازیگران حوزه ویرایش حرفه‌ای محتوا است.

پیشرفت‌های مدل تولید تصویر Imagen 3

مدل تولید تصویر گوگل، یعنی Imagen 3، نیز ارتقاء یافته و اکنون توانایی حذف اشیای ناخواسته در تصاویر را به شکلی طبیعی‌تر فراهم کرده است. بر اساس گزارش‌ها، برندهای مشهوری مانند L’Oreal و Kraft Heinz از این فناوری برای تولید محتوای تبلیغاتی استفاده می‌کنند. به‌گفته مدیر دیجیتال برند Heinz: «کاری که قبلاً ۸ هفته زمان نیاز داشت، حالا تنها در ۸ ساعت انجام می‌شود.»

مدل هوش مصنوعی Veo 2

نوآوری‌ها در حوزه‌ صوت و گفتار

گوگل در زمینه صوت نیز پیشرفت‌های جذابی ارائه کرده است. مدل Lyria به‌صورت پیش‌نمایش خصوصی برای تبدیل متن به موسیقی منتشر شده است. همچنین ویژگی Instant Custom Voice به مدل هوش مصنوعی Chirp 3 اضافه شده که با استفاده از تنها ۱۰ ثانیه صدای ورودی، صدای سفارشی و واقع‌گرایانه تولید می‌کند. این ابزار برای تشخیص و تفکیک گویندگان مختلف در تماس‌های تلفنی نیز بسیار کاربردی است.

مدل هوش مصنوعی Veo 2

نگاهی به آینده: مدل سریع‌تر Gemini 2.5

گوگل اعلام کرده که مدل سریع جدید خود با نام جمینای ۲٫۵ فلش به‌زودی در پلتفرم Vertex AI ارائه خواهد شد. این مدل قادر است زمان پردازش درخواست‌های پیچیده را به‌طور خودکار کاهش دهد و تجربه کاربری بهتری فراهم کند.

ارتقاء ایجنت‌های هوش مصنوعی

گوگل قابلیت تعامل میان ایجنت‌های هوش مصنوعی را نیز ارتقاء داده است. این ایجنت‌ها اکنون می‌توانند وظایف پیچیده‌تری را در پلتفرم‌هایی مانند پی‌پال و Salesforce انجام دهند. همچنین بازار جدیدی به نام Cloud Marketplace معرفی شده که به شرکت‌ها امکان خرید ایجنت‌های هوش مصنوعی توسعه‌یافته توسط شرکا را فراهم می‌کند.

تحلیل و نتیجه‌گیری

با معرفی قابلیت‌های جدید در مدل Veo 2 و ابزارهای مکمل، گوگل یک گام بزرگ در جهت حرفه‌ای‌تر شدن فرآیندهای تولید محتوای دیجیتال برداشته است. این پیشرفت‌ها، هم در حوزه ویدیو و تصویر و هم در زمینه صوت و پردازش داده‌ها، باعث خواهند شد کاربران صرفه‌جویی بسیاری در زمان و هزینه انجام دهند. بدون شک، این مسیر می‌تواند آینده محتوای دیجیتال را به شکل چشم‌گیری تغییر دهد و رقابت را در این صنعت وارد فاز جدیدی کند.

  • فیلم آواز باشکوه بهنام بانی ! / ببینید این پسر چطوری آهنگ بهنام بانی رو متفاوت خوند !

اخبار تاپ حوادث