اخبار

جیل‌بریک چت‌بات‌ها تهدیدی جدی برای امنیت کاربران

محققان هشدار دادند که تهدید چت‌بات‌های «جیل‌بریک‌شده» که برای تولید اطلاعات غیرقانونی آموزش دیده‌اند، «واقعی و نگران‌کننده» است.

چت‌بات‌های هوش مصنوعی مانند ChatGPT، Gemini و Claude که بر پایه مدل‌های زبانی بزرگ (LLM) ساخته شده‌اند، روز به روز در دسترس‌تر و قدرتمندتر می‌شوند. این چت‌بات‌ها برای پاسخ‌گویی به سوالات کاربران، حجم عظیمی از داده‌های اینترنتی را آموزش می‌بینند. هرچند شرکت‌ها تلاش می‌کنند محتوای مضر و غیرقانونی را از داده‌های آموزشی حذف کنند، اما مدل‌ها هنوز قادر به یادگیری اطلاعاتی درباره فعالیت‌های مجرمانه مانند هک، پول‌شویی و ساخت مواد منفجره هستند.

محققان دانشگاه بن‌گوریون در اسرائیل با بررسی رفتار این چت‌بات‌ها به یک تهدید نوظهور برخوردند: «جیل‌بریک» یا دور زدن محدودیت‌های ایمنی. این روش با استفاده از پرسش‌های خاص، چت‌بات‌ها را وادار می‌کند محدودیت‌های داخلی خود را نادیده بگیرند و اطلاعات خطرناک و غیرقانونی ارائه دهند.

در گزارشی که به تازگی منتشر شده، پژوهشگران نشان داده‌اند که با یک جیل‌بریک جهانی، می‌توان اکثر چت‌بات‌های مطرح را به پاسخگویی به سوالات ممنوعه وادار کرد. آن‌ها این وضعیت را «فوری، ملموس و بسیار نگران‌کننده» توصیف کردند.

محققان از شرکت‌های سازنده خواسته‌اند داده‌های آموزشی را با دقت بیشتری فیلتر کنند، فایروال‌های قوی‌تری بسازند و تکنولوژی‌هایی مانند «فراموشی ماشینی» را به کار گیرند تا چت‌بات‌ها بتوانند اطلاعات غیرقانونی را از یاد ببرند.

کارشناسان امنیت هوش مصنوعی هشدار می‌دهند که این جیل‌بریک‌ها می‌توانند به ابزارهایی برای جرایم سایبری، کلاه‌برداری‌های پیچیده و تولید اطلاعات نادرست تبدیل شوند. آن‌ها از شرکت‌ها خواسته‌اند سرمایه‌گذاری بیشتری روی آزمایش‌های امنیتی و نظارت مستقل انجام دهند.

شرکت OpenAI اعلام کرده است که مدل جدیدش در مقابل جیل‌بریک‌ها مقاوم‌تر شده و مایکروسافت نیز اقدامات حفاظتی خود را به‌روزرسانی کرده است. اما محققان تاکید دارند که مقابله با این تهدید نیازمند همکاری جدی‌تر و مسئولیت‌پذیری بیشتر شرکت‌ها است.

منبع: گاردین

Iranads

Recent Posts

گوگل جستجو را متحول کرد: معرفی «حالت هوش مصنوعی» با پاسخ‌های تعاملی

گوگل در کنفرانس Google I/O 2025 از «حالت هوش مصنوعی» (AI Mode) در جستجوی خود…

11 ساعت ago

نوتلا پس از شش دهه، طعمی جدید معرفی می‌کند

برای نخستین بار در ۶۰ سال گذشته، برند محبوب نوتلا قرار است در بهار ۲۰۲۶…

12 ساعت ago

برندها می‌توانند زبان بصری فناوری را بازآفرینی کنند

غلبه بر «افسردگی تکنولوژیک» شاید کلید ارتباط با مخاطبان امروزی باشد. آینده، وعده‌ای است به…

1 روز ago

سرویس ویدیویی بازار راه‌اندازی شد

شهاب خدابخش، مدیرعامل بازار، اعلام کرد که پس از رفع محدودیت‌های گذشته و استفاده از…

1 روز ago

اختلال در چت‌بات گروک: ادعای بی‌اساس نسل‌کشی سفیدپوستان در آفریقای جنوبی

در روزهای گذشته، چت‌بات «گروک» متعلق به ایلان ماسک، به‌طور مکرر و بی‌ربط به سؤالات…

1 روز ago

انتشار اپلیکیشن مستقل NotebookLM برای اندروید و iOS توسط گوگل

گوگل روز دوشنبه، یک روز پیش از رویداد Google I/O 2025، اپلیکیشن‌های NotebookLM را برای…

1 روز ago