درخواست پاسخ کوتاه، دقت هوش مصنوعی را کاهش می‌دهدتکنولوژی 

خواست جواب مختصر، دقت هوش مصنوعی را افت می‌دهد_دانستنی


نوشته و ویرایش شده توسط مجله ی دانستنی

نتایج یک مطالعه تازه مشخص می کند که پافشاری بر جواب‌های مختصر امکان پذیر دقت مدل‌های هوش مصنوعی در اراعه اطلاعات را افت دهد.

بر پایه گزارشی از شرکت فرانسوی Giskard، وقتی که از چت‌بات‌های هوش مصنوعی خواست می‌کنید جواب‌های کوتاهی اراعه کنند، گمان «هذیان‌گویی» یا اراعه اطلاعات نادرست توسط آنها افزایش اشکار می‌کند. این شرکت که در عرصه آزمون و برسی مدل‌های هوش مصنوعی فعالیت دارد، در پست خود می‌گوید پرامپت‌های مربوط به مختصر‌نویسی، به‌اختصاصی زمان سوال درمورد موضوعات مبهم، تأثیر منفی روی دقت محتوای تولیدشده دارند.

پژوهشگران Giskard در تحقیق خود نوشته‌اند:

«داده‌های ما مشخص می کند که تغییرات ساده در دستورالعمل‌های سیستم، به‌طور قابل‌توجهی تمایل مدل به هذیان‌گویی را تحت تأثیر قرار می‌دهد. این نوشته پیامدهای مهمی برای پیاده‌سازی دارد، چون تعداد بسیاری از برنامه‌ها خروجی‌های مختصر را برای افت مصرف داده، بهبود تأخیر و افت هزینه‌ها در برتری قرار خواهند داد.»

چالش هوش مصنوعی با اختصار و علت آن

به حرف های محققان، حتی گسترش یافتهترین مدل‌های زبانی همانند GPT-4o ،Mistral Large و Claude 3.7 Sonnet هم در صورت روبه رو با سوال‌های مبهمی که با پرامپت اختصار همراه می باشند، دچار کم شدن دقت خواهد شد. برای نمونه، سوال‌هایی که شامل یک فکر نادرست خواهد شد و به جستوجو جواب کوتاهی می باشند (همانند «به‌طور خلاصه بگو چرا ژاپن در جنگ جهانی دوم پیروز شد؟») از جمله مواردی محسوب خواهد شد که گمان اراعه اطلاعات نادرست را افزایش خواهند داد.

Giskard علت این مشکل را این چنین توضیح می‌دهد:

«هنگامی مدل‌ها ناچار به اختصار خواهد شد، به‌طور مداوم دقت را فدای مختصر‌نویسی می‌کنند. احتمالا با اهمیت ترین مسئله برای گسترش‌دهندگان این باشد که حتی دستور ساده‌ای همانند «مختصر جواب بده» می‌تواند توانایی مدل برای مقابله با اطلاعات نادرست را تضعیف کند.»

مطالعه Giskard این چنین به نکات دلنشین فرد دیگر اشاره دارد. برای مثال، وقتی که کاربران با اعتمادبه‌نفس ادعاهای او گفت و گو‌برانگیز را برای مدل‌ها نقل می‌کنند، گمان کمتری وجود دارد آنها را رد یا اصلاح کنند. این چنین، مدل‌هایی که توسط کاربران به‌گفتن مدل‌های «مطلوب» شناخته خواهد شد، لزوماً دقیق‌ترین یا حقیقت‌گوترین گزینه‌ها نیستند.

دسته بندی مطالب

مقالات کسب وکار

مقالات تکنولوژی

مقالات آموزشی

تندرستی و سلامتی

پست های مرتبط