به گزارش برداشت روز، کلود از آنتروپیک نمیتواند حتی مسائل سادهای را حل کند، جمینای در درک معادلات درجه دوم ناتوان است و سایر چتباتها نیز در ریاضیات شکست میخورند. چگونه این رباتهای هوشمند به محاسبات ریاضی مقطع ابتدایی برخورد میکنند؟
به گزارش سایت برداشت روز، پاسخ در «فرآیند رمزگذاری» است که توسط آن هوش مصنوعی به رمزگذاری فشرده اطلاعات از طریق فرآیند تقسیمبندی دادهها به بخشهای مختلف کمک میکند (برای مثال، تقسیم کلمه «زیبا» به هجاهای «c» «m» «j» «l»). از آنجایی که ابزارهای تقسیمبندی در مدلهای هوشمند نمیدانند چه اعدادی هستند، اغلب روابط بین آنها را از بین میبرند.
به عنوان مثال، یک ابزار هش ممکن است “۳۸۰” را به عنوان یک شی تلقی کند، اما “۳۸۱” را به عنوان یک جفت اعداد (“۳۸” و “۱”) درک کند و خطا رخ می دهد.
اما فرآیند کدگذاری تنها دلیل ضعیف بودن هوش مصنوعی در ریاضیات نیست. سیستمهای هوش مصنوعی، ماشینهای آماری هستند و پس از آموزش روی موارد فراوان، الگوهای آن نمونهها را برای پیشبینیها یاد میگیرند.
در یک مثال دیگر؛ وقتی از چت جیپیتی در مورد مسئله ضربی مانند ۵.۷۸۹۷ x 1.2832 پرسیده میشود، مدل احتمالاً نتیجه میگیرد که حاصل ضرب عددی که به «۷» ختم میشود و عددی که به «۲» ختم میشود به «۴» ختم میشود. این کار با تکیه بر اشتباهاتی در عملیات ضرب که قبلاً با آنها مواجه شده و از آنها یاد میگیرد، انجام میشود.
اما چت جیپیتی در قسمت میانی مشکل خواهد داشت و پاسخ را ۷۴۲,۰۲۱,۱۰۴ میدهد در حالی که پاسخ صحیح ۷۴۲,۹۳۴,۳۰۴ است.
یونتیان دینگ، استادیار دانشگاه واترلو که متخصص در زمینه هوش مصنوعی است، در مطالعهای که امسال انجام داد، برخی قابلیتهای GPT را به طور جامع ارزیابی کرد.
او و همکارانش دریافتند که مدل پیش فرض، GPT-4o، در ضرب اعداد با بیش از ۴ رقم، مانند ۳۴۵۹×۵۲۸۴ مشکل دارد.
دینگ گفت که GPT-4O در ضرب اعداد متعدد مشکل دارد و در ضرب اعداد ۴ رقمی به دقت کمتر از ۳۰ درصد دست مییابد. وی افزود که محاسباتی از این دست «برای مدلهای زبان چالشی ایجاد میکند، زیرا هر گونه خطایی در هر مرحله بعدی میتواند انباشته شود و سپس منجر به نتیجه نهایی نادرست شود».
اما از طرفی دینگ خوشبین است. در مطالعهای که او و همکارانش بر روی مدل «O1» انجام دادند، که مدل «استنتاج» OpenAI است، این مدل به نتایج بسیار بهتری نسبت به GPT-4 دست یافت، زیرا قادر به حل عملیات ضرب اعداد مؤلفهها بود.
وی افزود: «این مدل ممکن است فرآیند ضرب را به روشهایی حل کند که با روشهایی که ما آن را به صورت دستی حل میکنیم متفاوت باشد، و این کنجکاوی ما را در مورد رویکرد مدل برای حل مشکلات و تفاوت آن با استدلال انسانی افزایش میدهد