متا با دانلود غیرقانونی کتابها، هوش مصنوعی خود را آموزش داده است
اسناد تازهای منتشر شده که نشان میدهد متا آگاهانه با دانلود غیرمجاز از تورنت از منابع دارای کپیرایت برای آموزش مدلهای هوش مصنوعی استفاده کرده است.
به گزارش Arstechnica، ماه گذشته متا سرانجام اعتراف کرد مجموعه داده بزرگ و بحثبرانگیزی به نام LibGen را از تورنت دانلود کرده است که شامل دهها میلیون کتاب دزدی بوده است. پیشازاین جزئیاتی از این مجموعه کتاب منتشر نشده بود اما ایمیلهای داخلی متا نشان میدهند این شرکت از طریق سایت Anna’s Archive، حداقل ۸۱.۷ ترابایت داده را در چندین کتابخانه، ازجمله حداقل ۳۵.۷ ترابایت داده از Z-Library و LibGen را با تورنت دانلود کرده است.
متا آگاهانه از کتابهای دارای کپیرایت برای آموزش هوش مصنوعی استفاده کرده است
متا همچنین پیشازاین ۸۰.۶ ترابایت داده از LibGen دانلود کرده بود. ناشران این کتابها بارها متا را به استفاده غیرقانونی از این منابع برای آموزش مدلهای هوش مصنوعی متهم کرده بودند اما متا همواره این اتهاماتی را رد کرده بود.
نویسندگان در شکایت خود گفتهاند حجم منابعی که متا سرقت کرده، شگفتانگیز است. البته این منابع فقط ۰.۰۰۸ درصد دادههایی است که متا تاکنون سرقت کرده. این نویسندگان پیشتر برای کسب اطلاعات بیشتر در این زمینه به متا فشار آورده بودند اما متا درخواست نویسندگان برای بازبینی دادههایش را رد کرده بود.
متا کاملاً آگاهانه اقدام به نقض حقوق کپیرایت این کتابها کرده است. «نیکولای باشلیکوف»، مهندس محقق متا، سال ۲۰۲۳، در پیامی به همکارانش گفته بود: «دانلود تورنت از لپتاپ سازمانی کار درستی نیست.» او ظاهراً درباره استفاده از آدرس IP متا برای بارگیری محتوای سرقتشده از طریق تورنت نیز ابراز نگرانی کرده بود.
مارک زاکربرگ، مدیرعامل متا، پیشازاین گفته بود هیچ دخالتی در تصمیمگیری درباره استفاده از کتابهای سرقتشده برای آموزش هوش مصنوعی نداشته اما پیامهای افشاشده نشان میدهند او نیز از این موضوع آگاه بوده است.
منبع:digiato.com