اخبار

مدل QwQ-32B علی‌بابا؛ پیشرو در تفکر انتقادی و استدلال تطبیقی

تیم Qwen از علی‌بابا مدل جدید Qwen QwQ-32B را با ۳۲ میلیارد پارامتر معرفی کرده است که عملکردی نزدیک به مدل DeepSeek-R1 با ۶۷۱ میلیارد پارامتر (۳۷ میلیارد پارامتر فعال) دارد. این دستاورد نشان‌دهنده‌ی ظرفیت بالای یادگیری تقویتی (RL) در بهبود عملکرد مدل‌های پایه‌ قدرتمند است.

علی‌بابا با معرفی مدل QwQ-32B با ۳۲ میلیارد پارامتر، توانایی رقابت با مدل‌های بزرگ‌تر را نشان داده است. این مدل با یادگیری تقویتی (RL)، مهارت تفکر انتقادی، حل مسئله و استدلال را تقویت کرده است.

مدل QwQ-32B در AIME24 امتیاز ۷۹.۵ گرفته و به امتیاز ۷۹.۸ مدل DeepSeek-R1 نزدیک شده است. این مدل از OpenAI-o1-mini با ۶۳.۶ جلو زده است.

در LiveCodeBench، با امتیاز ۶۳.۴ به امتیاز ۶۵.۹ مدل DeepSeek-R1 نزدیک شده و از OpenAI-o1-mini با ۵۳.۸ بهتر عمل کرده است.

در LiveBench با امتیاز ۷۳.۱، مدل DeepSeek-R1 با ۷۱.۶ و OpenAI-o1-mini با ۵۷.۵ را پشت سر گذاشته است. در IFEval با امتیاز ۸۳.۹ به امتیاز ۸۳.۳ مدل DeepSeek-R1 نزدیک شده و از OpenAI-o1-mini با ۵۹.۱ پیش افتاده است. در BFCL هم با امتیاز ۶۶.۴، مدل DeepSeek-R1 با ۶۲.۸ و OpenAI-o1-mini با ۴۹.۳ را شکست داده است.

علی‌بابا با این مدل کوچک، به عملکردی در سطح مدل‌های بزرگ رسیده است. تیم Qwen اعلام کرده که مقیاس‌گذاری RL باعث این پیشرفت شده است. این موفقیت، مسیر دستیابی به هوش عمومی مصنوعی (AGI) را هموار کرده است.

علی‌بابا مدل QwQ-32B را به‌صورت منبع باز تحت مجوز Apache 2.0 در Hugging Face و ModelScope منتشر کرده است. کاربران می‌توانند از این مدل در Qwen Chat هم استفاده کنند. علی‌بابا با این دستاورد، جایگاه خود را به‌عنوان بازیگری قدرتمند در رقابت جهانی هوش مصنوعی تثبیت کرده است.

Iranads

Recent Posts

ادغام هوش مصنوعی Gemini با Google Photos

گوگل با افزودن قابلیت‌های هوش مصنوعی Gemini به Google Photos، امکان جستجوی پیشرفته و هوشمند…

25 دقیقه ago

استودیو هیبو برنده جایزه نقره‌ای Muse Creative Awards 2025

استودیو هیبو با ارائه خدمات برندینگ به مجموعه‌های داخلی و بین‌المللی، برای پروژه برندینگ و…

21 ساعت ago

تحلیل بازار: قطب‌نمایی برای برندها در مسیر موفقیت

تحلیل بازار یکی از ارکان اساسی در تدوین استراتژی‌های بازاریابی و تصمیم‌گیری‌های تجاری است. این…

22 ساعت ago

بی‌پاسخ ماندن ۴۲٪ از بازاریابان پس از مصاحبه استخدامی

نتایج نظرسنجی سالانه «حقوق و مشاغل ۲۰۲۵» منتشرشده توسط Marketing Week نشان می‌دهد که ۴۲٪…

22 ساعت ago

​افزایش چشمگیر بودجه تبلیغات در پلتفرم‌های نمایش خانگی ایران

بر اساس گزارش سالانه Iran CMO Annual Report، بودجه تبلیغات در پلتفرم‌های نمایش خانگی ایران…

1 روز ago

درخشش استودیو طراحی A4 در جوایز Muse Design Awards ؛ پنج نشان طلا و یک نشان نقره

استودیو طراحی A4 با پیشینه‌ای معتبر و بین‌المللی در زمینه طراحی و برندینگ، به تازگی…

2 روز ago