هوش مصنوعی چینی کاخ سفید را ترساند؛ افت سهام انویدیا و رمزارزها – خبرگزاری نیوزلند | اخبار ایران و جهان
به گزارش خبرنگار نیوزلند، به گفته کارولین لیویت، سخنگوی کاخ سفید، مقامات آمریکایی مشغول بررسی پیامدهای امنیت ملی هوش مصنوعی چینی «دیپ سیک» هستند. این درحالی است که تزار رمزارز دونالد ترامپ اعلام کرد در این زمینه احتمالا سرقت مالکیت معنوی رخ داده است!
لیویت در این باره افزود: این یک زنگ هوشیار برای صنعت هوش مصنوعی آمریکا است. سخنان او انعکاسی از اظهارات ترامپ است. وی همچنین اظهار کرد کاخ سفید تلاش می کند تا تسلط هوش مصنوعی آمریکا بر بازار را تضمین کند.
رویترز با انتشار این مطلب آورده است: سرمایه گذاران بازار سهام در سراسر جهان روز دوشنبه سهام شرکت های فناوری را به دلیل نگرانی ها درباره ظهور یک مدل هوش مصنوعی چین ارزان که تهدیدی برای سلطه رهبران آمریکایی بازار هوش مصنوعی (مانند اوپن ای آی و گوگل) به شمار می روند، فروختند.
«دیوید ساکس» تزار هوش مصنوعی و رمزارز کاخ سفید در پاسخ به سوال شبکه خبری فاکس نیوز درباره آنکه سرقت مالکیت معنوی در اوج گیری دیپ سیک نقشی داشته یا خیر، گفت: خب این امر ممکن است. در هوش مصنوعی تکنیکی به نام عصاره گیری وجود دارد که درباره آن مطالب زیادی خواهید شنید و این زمانی اتفاق می افتد که یک مدل از مدل دیگر می آموزد.
وی در ادامه افزود: تصور می کنم یکی از مواردی که در چند ماه آینده مشاهده می کنید آن است که شرکت های برتر هوش مصنوعی ما با اتخاذ گام هایی سعی در جلوگیری از فرایند عصاره گیری می کنند. این امر به طور حتم برخی از مدل های کپی شده را کندتر می کند.
اما در این میان نمی توان صحبت های تزار هوش مصنوعی کاخ سفید را کاملا صحیح دانست. بیشک، رونمایی از مدل DeepSeek R۱ داغترین اتفاق چند روز گذشته هوش مصنوعی بود. زلزلهای که لرزههایش به هوش مصنوعی محدود نماند و پسلرزههایش باعث ریزش ۲۰ درصدی قیمت سهام انویدیا در ۵ روز گذشته شده و این افت قیمت سهام هم مثل دومینو باعث ریزش قیمت بیت کوین و سایر رمزارزها شد اما اهمیت DeepSeek R۱ چیست.
نخست آنکه این اولین جهش DeepSeek نیست. حدود ۲۰ روز پیش این شرکت چینی، مدل DeepSeek V۳ خود را را به صورت منبع باز منتشر کرد. مدلی که در عملکرد بالاتر از Llama و در رقابت نزدیک با GPT-۴o قرار میگیرد و البته طبق ادعاهایش تنها با ۵.۵ میلیون دلار آموزش دیده است. اهمیت DeepSeek V۳ در این بود که آموزش مدل در چنین ابعادی، مخصوصا با در نظر گرفتن تحریم GPUهای H۱۰۰ که آمریکا بر چین تحمیل کرده، کار راحتی نیست. در واقع برای آموزش LLMهایی در این ابعاد باید تعداد بسیار زیادی H۱۰۰ به هم متصل شوند و با هم آموزش ببینند. حال آنکه آمریکا هم فروش H۱۰۰ به چین را ممنوع کرده است. در همین راستا انویدیا یک نسخه دستکاریشده از H۱۰۰ به نام H۸۰۰ را که نرخ انتقال داده کمتری دارد برای شرکت های چینی می سازد و به آنها می فروشد. به همین دلیل حدس زده شد که چینیها GPUهای H۸۰۰ را به هم متصل کردند و سپس در سطحی پایینتر از Cuda آنها را برنامه ریزی کردند تا بتوانند به چنین عملکردی دست یابند.
اما این روند به DeepSeek V۳ ختم نشد و چین پس از پنجه در پنجه انداختن با GPT-۴o این بار سراغ زورآزمایی با GPT-o۱ رفت و از مدل DeepSeek R۱ رونمایی کرد. نکته این مدل آن است که قدرت استدلال در سطح o۱ دارد، با صرفا ۶ میلیون دلار هزینه درست شده است. همچنین قیمت اینفرنس آن هم نسبت به o۱ پایین تر است.
در درجه سوم نکته فنی که نمی توان از آن عبور کرد، نوآوری R۱ در نحوه آموزش هست. مغز نوآوری که چینیها برای این مدل به خرج دادند آن است که به جای استفاده از SFT مستقیما از RL استفاده کردند. یعنی مدل را صرفا در یک ستینگ RL آن هم با دو ریوارد مدل سادهای که یکی از آنها قرار است جواب نهایی را چک می کند و دیگری مدل را ملزم به خروجی داده در یک فرمت خاص کند، آموزش دادند. نکته جالب اینه که این ریوارد مدلها بسیار ساده هستند و صرفا می توان آنها را Rule-Based دید.
براساس گزارش روزنامه شریف، در درجه چهارم، چرا سیلیکون ولی و انویدیا دچار شوک شدند؟ حرف و حدیث در این زمینه زیاد است. بعضیها تحلیل کرده اند که شاید این که روش R۱ توانسته بدون تکیه بر تکنیکهای Inference Time Compute که مستلزم استفاده بیشتر از قدرت محاسباتی هستند، به AGI نزدیک شود از اهمیت GPUها کاسته است.
آنچه قابل توجه است این است که این یک شوک موقتی است و از ۳ امر ناشی می شود. نخست آنکه بالاخره چینیها توانستند در زمینه مدلهای زبانی به رقابت نزدیک به آمریکا برسند و در حالی که همیشه آزمایشگاههای هوش مصنوعی چینی عقبتر از آمریکاییها بودند، R۳ را می توان به مثابه یک شوک و نقطه عطف برای مونوپلی آمریکا در هوش مصنوعی به حساب آورد. دوما این که قیمت پایین آموزش و اینفرنس R۱ ممکن است باعث یک تکانه به وابستگی به nvidia باشد که البته صرفا در حد یک شوک موقت خواهد بود. در درجه سوم از این زاویه می توان این موضوع را نگاه کرد که DeepSeek توانسته تحریمهای آمریکا در زمینه GPU را کماثرتر کند و شاید این روند در آینده ادامه دار باشد.
پنجم، آیا DeepSeek برنده شده است؟ هنوز نه. چرا که o۳ هنوز عملکرد بسیار بهتری نسبت به R۱ دارد، با این وجود R۱ کاراتر است و می تواند روی دیوایسها اجرا شود و هم هزینه اینفرنس پایینتری دارد. از سوی دیگر با منبع باز کردن آن فشار برای کاهش قیمت به مدلهایی مثل o۱ و o۱-mini وارد میکند. باید دید رقابت بین آمریکاییها و چینیها در ادامه چه خواهد شد.
منبع:www.mehrnews.com