ادغام جمنای و Veo توسط گوگل؛ تغییری بزرگ در تکنولوژی

به گزارش رکنا، در جلسه‌ای که به میزبانی یکی از بنیان‌گذاران لینکدین برگزار شد، دمیس هاسابیس، مدیرعامل گوگل دیپ‌مایند، اعلام کرد برنامه‌ای برای ادغام مدل‌های هوش مصنوعی جمنای با مدل‌های تولید ویدیو Veo در دست دارند. هدف این ادغام، بهبود توانایی مدل‌ها در درک بهتر از دنیای واقعی و فیزیکی اعلام شده است.

هدف طراحی جمنای؛ یک دستیار دیجیتال جهانی

هاسابیس در ادامه توضیح داد که مدل جمنای از همان ابتدا با هدف چندجانبه‌گرایی طراحی شده است. این تصمیم در راستای هدف بزرگ‌تر گوگل برای خلق یک دستیار دیجیتال جهانی است؛ ابزاری که بتواند در محیط واقعی به افراد کمک کند.

مسیر حرکت به سمت مدل‌های همه‌کاره

در صنعت هوش مصنوعی ، به‌تدریج مدل‌های چندمنظوره و همه‌کاره جایگاه ویژه‌ای پیدا می‌کنند. این مدل‌ها توانایی پردازش و ترکیب انواع محتوا شامل متن، صدا و تصویر را دارا هستند. به عنوان مثال، مدل‌های جمنای گوگل می‌توانند متن، صدا و تصویر ایجاد کنند، در حالی که مدل GPT-4 ساخته شده توسط OpenAI نیز قابلیت تولید تصاویر را دارد.

داده‌های آموزشی؛ کلید موفقیت مدل‌ها

ایجاد چنین مدل‌هایی نیازمند مجموعه عظیمی از داده‌های آموزشی است. این داده‌ها شامل متن، تصاویر، ویدیوها و صداها می‌شود. هاسابیس توضیح داد که مدل Veo به‌طور عمده با داده‌های ویدئویی از پلتفرم یوتیوب آموزش داده می‌شود. وی تاکید کرد که از طریق تحلیل حجم بالایی از ویدیوهای موجود در یوتیوب، نسخه دوم Veo قادر به درک و استنباط مفاهیمی همچون قوانین فیزیک شده است.

نقش یوتیوب در آموزش مدل‌های هوش مصنوعی

گوگل پیش‌تر اعلام کرده بود که مدل‌های آن ممکن است از محتواهای خاصی در یوتیوب، با رعایت توافق‌نامه‌هایی میان این شرکت و خالقان محتوا، برای آموزش استفاده کنند. اطلاعات موجود نشان می‌دهد سال گذشته گوگل قوانین خدمات خود را گسترش داد تا امکان دسترسی به مجموعه اطلاعات بیشتری از یوتیوب برای آموزش مدل‌های هوش مصنوعی فراهم شود.

  • فیلم / انفجار خمپاره دوران جنگ در مدرسه دخترانه کوهدشت ! / قطع یک دست کوری یک چشم و نقص عضو یک پا با کلی ترکش در بدن فاطمه رضایی ! / چرا به دخترم جانبازی نمی دهند ! / فقط 200 میلیون تومان دیه !

اخبار تاپ حوادث