مطلب خواندنی از سایت برداشت روز این مدلها بهویژه برای استفاده در دستگاههای محدود، مانند لپتاپهایی با کمتر از 1 گیگابایت رم، طراحی شدهاند و برای توسعهدهندگانی که نیاز به پردازش حجم زیادی از دادهها با هزینه کم دارند، ایدهآل هستند.
Hugging Face اخیراً مدلهای هوش مصنوعی جدیدی به نامهای SmolVLM-256M و SmolVLM-500M منتشر کرده که به گفته این شرکت، کوچکترین مدلهای هوش مصنوعی در نوع خود هستند و میتوانند تصاویر، ویدیوهای کوتاه و متن را تجزیه و تحلیل کنند.
این مدلها بهویژه برای استفاده در دستگاههای محدود، مانند لپتاپهایی با کمتر از ۱ گیگابایت رم، طراحی شدهاند و برای توسعهدهندگانی که نیاز به پردازش حجم زیادی از دادهها با هزینه کم دارند، ایدهآل هستند.
این مدلها، با ۲۵۶ میلیون و ۵۰۰ میلیون پارامتر، به ترتیب قابلیت انجام کارهایی نظیر توصیف تصاویر، تجزیه و تحلیل ویدیوهای کوتاه، و پاسخ به سوالات مرتبط با فایلهای PDF و دادههای درون آنها را دارند. تیم Hugging Face برای آموزش این مدلها از مجموعه دادههای “The Cauldron” و “Docmatix” استفاده کرده است که شامل عکسها، متنها و اسکنهای فایل با زیرنویسهای دقیق میباشد.
علیرغم اندازه کوچک این مدلها، SmolVLM-256M و SmolVLM-500M در برخی از آزمایشها مانند AI2D که توانایی مدلها را در تحلیل نمودارهای علمی آزمایش میکند، عملکرد بهتری نسبت به مدلهای بزرگتری مانند Idefics 80B داشتهاند. این مدلها اکنون در وبسایت Hugging Face برای دانلود و استفاده تحت مجوز Apache 2.0 در دسترس هستند.
با این حال، استفاده از مدلهای کوچک مانند SmolVLM ممکن است چالشهایی نیز داشته باشد. یک مطالعه اخیر از Google DeepMind، Microsoft Research و موسسه Mila نشان داده است که مدلهای کوچک ممکن است در انجام کارهای استدلالی پیچیده ضعیفتر از مدلهای بزرگتر عمل کنند. این مشکل به احتمال زیاد به دلیل توانایی محدودتر این مدلها در شناسایی الگوهای پیچیده و استفاده از آنها در زمینههای جدید است.
این مدلها نشاندهنده گامی مهم در راستای بهینهسازی و ارزانسازی مدلهای هوش مصنوعی هستند و میتوانند برای بسیاری از کاربردها، به ویژه در دستگاههای محدود، مفید واقع شوند.