اخبار

مدل QwQ-32B علی‌بابا؛ پیشرو در تفکر انتقادی و استدلال تطبیقی

تیم Qwen از علی‌بابا مدل جدید Qwen QwQ-32B را با ۳۲ میلیارد پارامتر معرفی کرده است که عملکردی نزدیک به مدل DeepSeek-R1 با ۶۷۱ میلیارد پارامتر (۳۷ میلیارد پارامتر فعال) دارد. این دستاورد نشان‌دهنده‌ی ظرفیت بالای یادگیری تقویتی (RL) در بهبود عملکرد مدل‌های پایه‌ قدرتمند است.

علی‌بابا با معرفی مدل QwQ-32B با ۳۲ میلیارد پارامتر، توانایی رقابت با مدل‌های بزرگ‌تر را نشان داده است. این مدل با یادگیری تقویتی (RL)، مهارت تفکر انتقادی، حل مسئله و استدلال را تقویت کرده است.

مدل QwQ-32B در AIME24 امتیاز ۷۹.۵ گرفته و به امتیاز ۷۹.۸ مدل DeepSeek-R1 نزدیک شده است. این مدل از OpenAI-o1-mini با ۶۳.۶ جلو زده است.

در LiveCodeBench، با امتیاز ۶۳.۴ به امتیاز ۶۵.۹ مدل DeepSeek-R1 نزدیک شده و از OpenAI-o1-mini با ۵۳.۸ بهتر عمل کرده است.

در LiveBench با امتیاز ۷۳.۱، مدل DeepSeek-R1 با ۷۱.۶ و OpenAI-o1-mini با ۵۷.۵ را پشت سر گذاشته است. در IFEval با امتیاز ۸۳.۹ به امتیاز ۸۳.۳ مدل DeepSeek-R1 نزدیک شده و از OpenAI-o1-mini با ۵۹.۱ پیش افتاده است. در BFCL هم با امتیاز ۶۶.۴، مدل DeepSeek-R1 با ۶۲.۸ و OpenAI-o1-mini با ۴۹.۳ را شکست داده است.

علی‌بابا با این مدل کوچک، به عملکردی در سطح مدل‌های بزرگ رسیده است. تیم Qwen اعلام کرده که مقیاس‌گذاری RL باعث این پیشرفت شده است. این موفقیت، مسیر دستیابی به هوش عمومی مصنوعی (AGI) را هموار کرده است.

علی‌بابا مدل QwQ-32B را به‌صورت منبع باز تحت مجوز Apache 2.0 در Hugging Face و ModelScope منتشر کرده است. کاربران می‌توانند از این مدل در Qwen Chat هم استفاده کنند. علی‌بابا با این دستاورد، جایگاه خود را به‌عنوان بازیگری قدرتمند در رقابت جهانی هوش مصنوعی تثبیت کرده است.

Iranads

Recent Posts

آیا در عصر اطلاعات نادرست، برندها باید به حقیقت پایبند باشند؟

اسپنسر بک، بنیان‌گذار و مدیر خلاق آژانس طراحی Taxi Studio، بر این باور است که…

9 ساعت ago

رقابت آژانس‌های دبلیو پی پی و پابلیسیس برای تصاحب قرارداد رسانه‌ای کوکاکولا

شرکت کوکاکولا در حال بررسی یکی از بزرگ‌ترین قراردادهای رسانه‌ای آمریکا است. دو آژانس تبلیغاتی…

12 ساعت ago

کمپین «قدرت او» از برند Athleta: تشویق زنان به حرکت بیشتر

برند Athleta، یکی از شرکت‌های زیرمجموعه Gap Inc.، با کمپین «قدرت او» (Power of She)…

1 روز ago

کمپین روز جهانی زن لورآل :«چون من ارزشش را دارم»

در ۲۱ فوریه، لورآل پاریس کمپین روز جهانی زن (IWD) خود را بیش از ۳…

4 روز ago

هوش مصنوعی متا برای تعامل کاربران با کسب‌وکارها

متا در حال آزمایش ویژگی جدیدی به نام «Business AI» است که به کاربران امکان…

4 روز ago

IAmarket: گفت‌وگو با مرتضی زبده

گفت‌وگو با مرتضی زبده کارشناس و مشاور مدیران و صاحبان کسب‌وکار پیرامون ثبت علائم تجاری…

5 روز ago