شرکت Odyssey با مدل جدید هوش مصنوعی خود، ویدیوها را به دنیای تعاملی تبدیل کرد. این مدل هوش مصنوعی به ورودیهای کاربران در زمان واقعی پاسخ میدهد. فریمهای ویدیویی را هر ۴۰ میلیثانیه تولید میکند.
مدل Odyssey به جای تولید ویدیوهای ثابت، هر فریم را بر اساس ورودی کاربر و وضعیت فعلی خلق میکند. کاربران میتوانند با صفحهکلید، موبایل، کنترلر یا حتی فرمان صوتی با ویدیو تعامل کنند.
غلبه بر چالشهای تاریخی ویدیوهای تعاملی هوش مصنوعی
ساخت چنین مدلی آسان نیست. یکی از بزرگترین مشکلات، حفظ پایداری ویدیو در طول زمان است؛ زیرا خطاهای کوچک در تولید هر فریم میتوانند تجمع پیدا کنند که به آن «انحراف» میگویند.
هوش مصنوعی Odyssey برای حل این مشکل از مدل «توزیع باریک» استفاده کرده است؛ ابتدا هوش مصنوعی خود را روی کلیپهای ویدیویی عمومی آموزش داده و سپس آن را روی محیطهای محدودتر بهینهسازی کرده است. این کار باعث کاهش تنوع اما افزایش پایداری میشود.
این شرکت اعلام کرده که روی مدل نسل بعدی با «پیکسلها، دینامیکها و حرکات غنیتر» به سرعت پیشرفت میکند.
اجرای این فناوری در زمان واقعی هزینهبر است و زیرساختهای آن بین ۰.۸ تا ۱.۶ پوند به ازای هر ساعت کاربر هزینه دارد که از خوشههای GPU های H100 در آمریکا و اروپا بهره میبرد.
اگرچه هزینه بالایی برای پخش ویدیو به نظر میرسد، اما در مقایسه با تولید بازی یا فیلمهای سنتی بسیار ارزانتر است. Odyssey انتظار دارد با بهینهتر شدن مدلها، این هزینهها کاهش یابد.
هوش مصنوعی Odyssey میتواند آینده سرگرمی، آموزش و تبلیغات را تغییر دهد.