شرکت Odyssey با مدل جدید هوش مصنوعی خود، ویدیوها را به دنیای تعاملی تبدیل کرد. این مدل هوش مصنوعی به ورودی‌های کاربران در زمان واقعی پاسخ می‌دهد. فریم‌های ویدیویی را هر ۴۰ میلی‌ثانیه تولید می‌کند.

مدل Odyssey به جای تولید ویدیوهای ثابت، هر فریم را بر اساس ورودی کاربر و وضعیت فعلی خلق می‌کند. کاربران می‌توانند با صفحه‌کلید، موبایل، کنترلر یا حتی فرمان صوتی با ویدیو تعامل کنند.

غلبه بر چالش‌های تاریخی ویدیوهای تعاملی هوش مصنوعی

ساخت چنین مدلی آسان نیست. یکی از بزرگترین مشکلات، حفظ پایداری ویدیو در طول زمان است؛ زیرا خطاهای کوچک در تولید هر فریم می‌توانند تجمع پیدا کنند که به آن «انحراف» می‌گویند.

هوش مصنوعی Odyssey برای حل این مشکل از مدل «توزیع باریک» استفاده کرده است؛ ابتدا هوش مصنوعی خود را روی کلیپ‌های ویدیویی عمومی آموزش داده و سپس آن را روی محیط‌های محدودتر بهینه‌سازی کرده است. این کار باعث کاهش تنوع اما افزایش پایداری می‌شود.

این شرکت اعلام کرده که روی مدل نسل بعدی با «پیکسل‌ها، دینامیک‌ها و حرکات غنی‌تر» به سرعت پیشرفت می‌کند.

اجرای این فناوری در زمان واقعی هزینه‌بر است و زیرساخت‌های آن بین ۰.۸ تا ۱.۶ پوند به ازای هر ساعت کاربر هزینه دارد که از خوشه‌های GPU های H100 در آمریکا و اروپا بهره می‌برد.

اگرچه هزینه بالایی برای پخش ویدیو به نظر می‌رسد، اما در مقایسه با تولید بازی یا فیلم‌های سنتی بسیار ارزان‌تر است. Odyssey انتظار دارد با بهینه‌تر شدن مدل‌ها، این هزینه‌ها کاهش یابد.

هوش مصنوعی Odyssey می‌تواند آینده سرگرمی، آموزش و تبلیغات را تغییر دهد.

به اشتراک بگذارید:

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *