انقلاب خاموش دیپسیک؛ چگونه محدودیت منابع به خلق نوآوری انجامید
تا همین چند ماه پیش، باور عمومی این بود که موفقیت در عرصه هوش مصنوعی تنها از مسیر منابع عظیم مالی میگذرد. اما ظهور غیرمنتظره یک شرکت چینی این معادله را دگرگون کرده است. DeepSeek (دیپسیک) با رویکردی نو نشان داد که محدودیت منابع میتواند به جای مانع، محرکی برای نوآوری باشد.
صنعت هوش مصنوعی در سالهای اخیر شاهد تحولی بنیادین بوده است. غولهای بزرگی همچون Open AI و گوگل با صرف هزینههای زیاد در حال توسعه ابزارهای هوش مصنوعی هستند. «چت جیپیتی» و «جمنای» دو چتبات این شرکت هستند که بسیار مورد توجه کاربران قرار گرفتهاند. اما به تازگی شاهد ظهور بازیگری جدید هستیم که توانسته زمین بازی در حوزه AI را به کلی تغییر دهد.
این روزها، نام دیپسیک در صدر اخبار هوش مصنوعی قرار گرفته است. این مدل که توسط شرکتی چینی توسعه یافته، با ادعای مصرف منابع کمتر و عملکرد قابل رقابت با بزرگان این صنعت، توجه بسیاری را به خود جلب کرده است.
DeepSeek در مقالهای اعلام کرده که مدل DeepSeek-V3 خود را با تراشههای انویدیا H800 و هزینهای کمتر از 6 میلیون دلار آموزش داده است. DeepSeek-R1 که به تازگی منتشر شده، طبق ادعای این شرکت بسته به وظیفه خود، 20 تا 50 برابر مقرون بهصرفهتر از مدل استدلالگر OpenAI یعنی o1 است. این آمار تحسین شرکتهای رقیب را هم برانگیخت. به طور مثال «سم آلتمن» مدیرعامل Open AI آن را یک مدل «تاثیر گذار» توصیف و اعلام کرد از رقابت استقبال میکنند.
خلق پارادایم جدید با نوآوری
«ایوب ویسمرادی»، کارشناس مدیریت محصول، در تشریح این وضعیت به نیوزلند میگوید تا پیش از این، باور عمومی بر این بود که موفقیت در حوزه هوش مصنوعی مستلزم برخورداری از سه رکن اساسی است: دادههای گسترده، الگوریتمهای پیشرفته و توان محاسباتی قوی که کانالهای توزیع مؤثر برای ایجاد دسترسی کاربر، آنها را تکمیل میکند. یعنی مایکروسافت با توجه به محبوبیت اکسل، کوپایلت را ساخت و به اکسل متصل کرد تا کاربران بتوانند از آن استفاده کنند. نمونه دیگر آن ایجاد دسترسی به جمینای در گوگل داک است.
دیدگاه موجود باعث شده بود که عرصه هوش مصنوعی در انحصار شرکتهای بزرگ باقی بماند. در واقع تصور کلی این بود که برای داشتن مدل موفق باید در هر چهار حوزه مزیت داشته باشید. در نتیجه فقط شرکتهای بزرگ مثل گوگل، متا و اوپنایآی میتوانستند در این عرصه فعالیت کنند، چون هم دادههای زیادی داشتند، هم منابع انسانی متخصص برای تولید الگوریتمهای خوب در دسترسشان بود و هم پول کافی برای ساخت مراکز داده و خرید تجهیزات پردازشی در اختیار داشتند.
این تصور آنقدر در اذهان رسوخ کرده بود که حتی مدیران ارشد صنعت فناوری به دنبال راهکارهایی برای جذب منابع انرژی جدید بودند. ویسمرادی به سخنان اریک اشمیت، مدیرعامل سابق گوگل، اشاره میکند که معتقد بود آمریکا برای پیشرفت در زمینه هوش مصنوعی باید با کانادا همکاری کند، چرا که این کشور از منابع هیدروپاور (انرژی آبی) ارزان و فراوانی برخوردار است که برای تأمین انرژی مراکز داده ضروری است. مراکز دادهای که وجودشان برای انجام محاسبات عظیم توسط هوش مصنوعی لازم است.
اما به نظر میرسد «انقلابی خاموش» در حال وقوع است. شرکت چینی Deepseek توانسته با نوآوری در بخش الگوریتم، نیاز به محاسبات و در نتیجه منابع محاسباتی را کمتر کرده و به نتایج قابل توجهی دست یابد.
ویسمرادی این پدیده را اینگونه تحلیل میکند: «وقتی محدودیت منابع وجود دارد، افراد به سمت خلاقیت سوق پیدا میکنند. این محدودیت مانند یک قوی سیاه عمل کرده و تیمها را مجبور به خلق راهکارهای نوآورانه میکند. در حالی که شرکتهای بزرگ به دلیل دسترسی به منابع فراوان، کمتر به فکر بهینهسازی بودهاند و بیشتر روی افزایش دقت خروجی تمرکز کردهاند.»
البته او تأکید میکند که از این موضوع نمیتوان یک برداشت عمومی ثابت داشت که لزوما با منابع کمتر، میتوان موفق شد؛ چراکه تیمهای دیگر هم بودند که با وجود محدودیتها تلاش کردهاند، اما موفق نشدهاند:
«در واقع با ظهور دیپسیک شاهد خلق یک پارادایم جدید هستیم که با محاسبات پایین هم بتوان مدل با کیفیتی ساخت. آنها ذهنیت قبلی درباره نیاز به منابع عظیم را شکستهاند و شاید تیمهای دیگر با الگو گرفتن، به سراغ بهینهسازی هرچه بیشتر در حوزه هوش مصنوعی بروند.»
محدودیت منابع، محرک نوآوری
ویسمرادی در پاسخ به سوال نیوزلند مبنی بر اینکه آیا منابع مالی شرط لازم موفقیت یک استارتاپ است یا خیر، میگوید: «منابع مالی شرط لازم است و حداقلی از آن باید وجود داشته باشد. اما گاهی کمبود منابع میتواند مزیت محسوب شود. وقتی منابع محدودی داری و میخواهی با رقیب بزرگ رقابت کنی، باید خلاقیت به خرج دهی و این خلاقیت شاید تو را به راهحلهایی برساند که رقیبت به دلیل داشتن منابع کافی، نیازی نمیبیند به سراغ آنها برود.»
ویسمرادی البته معتقد است انتخاب این مسیر به فلسفه و روحیات افراد هم بستگی دارد: «همیشه دو رویکرد وجود دارد. میتوانید مسیر معمول و پذیرفتهشده صنعت را دنبال کنید که نیازمند منابع زیاد است اما ریسک کمتری دارد و در میانه منحنی نرمال قرار میگیرد. یا میتوانید به دنبال راهحلهای غیرمتعارف بروید که اگرچه شانس موفقیت کمتری دارند، اما در صورت موفقیت میتوانند خروجی ده برابر بهتری تولید کنند.»
او تأکید میکند که بایستی تفاوتهای شخصیتی افراد را نیز در نظر گرفت، برخی اهل کارهای غیرمتعارف هستند و برخی ذاتاً ریسکپذیری پایینتری دارند و به دنبال ساخت چیزهای معمول هستند:
«اکثریت مسیر اول را ترجیح میدهند چون ریسک کمتری دارد، اما همیشه افرادی هستند که دوست دارند چیزهای بزرگ بسازند و ریسکپذیری بیشتری دارند.»
بررسی دقیقتر عملکرد دیپسیک
برای ارزیابی دقیقتر عملکرد دیپسیک، به سراغ «حمیدرضا مازندرانی»، کارشناس حوزه هوش مصنوعی رفتیم. او معتقد است برای سنجش عملکرد مدلهای هوش مصنوعی، علاوه بر معیارهایی مانند میزان دانلود اپلیکیشن، رضایت کاربران و میزان استفاده از سرویسها، بنچمارکهای تخصصی نیز وجود دارند که همچون یک آزمون استاندارد، قدرت منطق و تحلیل این مدلها را میسنجند.
مازندرانی بر اساس ارزیابیهای موجود به نیوزلند میگوید: «مدلهای دیپسیک قابل رقابت با برخی از مدلهای OpenAI بوده و اگرچه نه با آخرین نسخه، اما با مدل O1 در یک سطح و حتی بهتر عمل کرده است.» با این حال، او هشدار میدهد که نتایج این آزمونها را باید با احتیاط تفسیر کرد:
«اگر این آزمونها به عنوان داده ورودی مدل استفاده شوند، مثل یک برگه تقلب در آزمون است و مدل با داشتن جوابها میتواند فراتر از توانایی واقعی خود عمل کند. به همین دلیل این آزمونها باید مرتباً بهروزرسانی شوند.»
مازندرانی معتقد است به طور کلی عملکرد DeepSeek خیلی خوب بوده، اما بخشی از اتفاقات فعلی مثل سقوط سهام شرکتهای فناوری آمریکایی، ناشی از هایپ و هیجان زیاد است؛ چراکه اغلب یک سری موضوعات وایرال میشوند، بدون اینکه پشتوانه عمیقی داشته باشند. به باور او باید منتظر ماند و دید آیا این مدل هوش مصنوعی، به جایگاهی که برای آن متصور هستند میرسد یا خیر؟
وجه تمایز DeepSeek
آنچه که دیپسیک را متمایز میکند، فناوری منحصر به فرد آن است. مازندرانی در توضیح این فناوری میگوید: «این مدلها از معماری “Mixture of experts” (ترکیبی از متخصصها) استفاده میکنند. مدل یک سری زیرمجموعه از وزنها دارد که به ازای هر ورودی، فقط بخشی از آنها فعال میشوند. مثلاً وقتی سؤالی در مورد پزشکی میپرسید، فقط اکسپرتهای مرتبط با پزشکی فعال میشوند. این ویژگی باعث کاهش چشمگیر مصرف انرژی میشود.»
او علاوه بر Mixture of experts، دیگر برگ برنده این مدل را دادههای زیادی که در دسترسشان بوده دانست؛ چراکه در چین به راحتی داده از مردم جمعآوری میشود. همچنین ممکن است برای تمرین آن از خروجی سایر مدلهای هوش مصنوعی مثل اوپن ایآی استفاده شده باشد.
بدبینی نسبت به چین
ساختار سیاسی کشور چین موجب شده تا همواره نگاهها به این کشور چندان مثبت نباشد. در ماجرای اخیر نیز برخی کارشناسان نسبت به آمار اعلام شده درباره منابع مصرفی دیپسیک بدبین هستند. آنها برای تأیید سخنان خود به عملکرد نامناسب این چتبات دربرابر سوالات چالشبرانگیز درباره کشور چین اشاره میکنند. به طور مثال معمولا دیپسیک سوالات درباره حزب حاکم چین و رئیس جمهوری آن را بیپاسخ میگذارد. البته نباید فراموش کرد که سانسور در برخی چتباتهای معروف مثل جمینای و چتجیپیتی نیز سابقه دارد. به طور مثال آنها تا پیش از برگزاری انتخابات ریاست جمهوری آمریکا به سوالاتی که حاوی کلمات انتخابات ریاست جمهوری بودند، پاسخ نمیدادند.
مازندرانی با تأیید اینکه برخی کارشناسان به آمار DeepSeek با دیده تردید مینگرند به انتشار متن باز این مدل اشاره کرده و میگوید این شرکت یا اهداف تجاری خیلی خاصی دارد که حاضر به انجام این کار شده یا پای مسائل سیاسی در میان است. به طور مثال Open Ai وزنهای آموزش که به چت جیپیتی کمک میکرد نتایج خود را تولید کند، منتشر نکرد؛ چراکه روی سود این شرکت اثرگذار بود.
رقابتی به سود کاربران
او به طور کلی ظهور دیپ سیک را به سود کاربران نهایی میداند: «این موضوع برای کاربران نهایی بسیار مفید خواهد بود. اول به خاطر رقابتی که ایجاد میکند و دوم اینکه گروههای مختلف و شرکتها میتوانند از وزنهای این مدل برای کاربردهای خاص استفاده کنند.»
به طور مثال وزنهای این مدل را میتوان با یک سری دادههای حوزههای خاص مثل پزشکی یا امنیت شبکه بیشتر آموزش داد و خروجیهای خیلی بهتری گرفت. این اتفاق در نتیجه به نفع کاربران خواهد بود.
به نظر میرسد دیپسیک، علیرغم همه هیاهوها و تردیدها، توانسته است گامی مهم در مسیر توسعه هوش مصنوعی بردارد. زمان نشان خواهد داد که آیا این مدل میتواند انتظارات را برآورده کند و جایگاه مورد نظر خود را در این عرصه به دست آورد یا خیر. چیزی که قطعی است، شکل گرفتن رقابتی به سود کاربران است.
منبع:digiato.com