DeepSeek هوش مصنوعی مولد تصویر جدیدی منتشر کرد؛ رقیب DALL-E 3
در چند روز گذشته هوش مصنوعی DeepSeek بسیار خبرساز بوده است. اکنون این شرکت مجموعه جدیدی از مدلهای هوش مصنوعی مولد تصویر و چندوجهی منتشر کرده است که ادعا میکند میتوانند از DALL-E 3 شرکت OpenAI بهتر عمل کنند.
براساس گزارش تککرانچ، مدلهای مولد تصویر و چندوجهی جدید که برای دانلود در Hugging Face قرار گرفتهاند، Janus-Pro نام دارند. اندازه این مدلها از 1 میلیارد تا 7 میلیارد پارامتر متغیر است. مقدار پارامترها تقریباً با مهارتهای حل مسئله یک مدل مطابقت دارند و مدلهایی با پارامترهای بیشتر معمولاً بهتر از مدلهایی با پارامترهای کمتر عمل میکنند.
مدلهای متنباز Janus-Pro تحت مجوز MIT منتشر شدهاند، به این معنی که میتوان از آنها به صورت تجاری و بدون محدودیت استفاده کرد. سال گذشته میلادی این شرکت مدلهای چندوجهی Janus را نیز منتشر کرده بود.
هوش مصنوعی مولد تصویر DeepSeek
مدل Janus-Pro، که DeepSeek آن را به عنوان یک «فریمورک اتورگرسیو جدید» توصیف میکند، میتواند تصاویر را تجزیهوتحلیل و ایجاد کند. به گفته این شرکت، بزرگترین مدل آن یعنی Janus-Pro-7B در 2 بنچمارک هوش مصنوعی GenEval و DPG-Bench توانسته مدلهای DALL-E 3 ،PixArt-alpha و Stable Diffusion X را شکست بدهد.
البته برخی از مدلهای چندوجهی دیپسیک با تعداد پارامترهای کمتر نسبت به مدلهای فعلی کمی قدیمی به نظر میرسند و فقط میتوانند تصاویر کوچک را با وضوح حداکثر 384 در 384 پیکسل تجزیهوتحلیل کنند. اما عملکرد Janus-Pro باتوجهبه اندازههای فشرده مدلها قابلتوجه است. این شرکت چینی میگوید که سرعت و دقت ارائه خروجی نسخه مدل بزرگتر آن، با حداکثر 7 میلیارد پارامتر، نسبت به نسل قبل بهبود یافته است.
شرکت چینی DeepSeek این هفته پس از اینکه اپلیکیشن iOS آن در صدر جدول برنامههای اپ استور اپل قرار گرفت، توجه بسیاری از افراد را جلب کرد. مدلهای زبانی DeepSeek که با استفاده از تکنیکهای محاسباتی کارآمد آموزش داده شدهاند، باعث شده بسیاری از تحلیلگران والاستریت این سؤال را مطرح کنند که آیا آمریکا میتواند پیشتازی خود را در رقابت هوش مصنوعی حفظ کند و آیا تقاضا برای تراشههای هوش مصنوعی ادامه خواهد داشت یا خیر.
منبع:digiato.com