Reddit اقداماتی را برای محافظت از محتوای ارزشمند تولید شده توسط کاربران خود در برابر خزندههای وب شرکتهای هوش مصنوعی انجام داده است و سیاستهای خود را برای محدود کردن دسترسی به دادههای پلتفرم بهروزرسانی کرده است. این پلتفرم شبکه اجتماعی اعلام کرد که برای جلوگیری از استخراج اطلاعات در سایت توسط منابع خارجی، پروتکل حذف روباتها را به روز میکند. خزندههای وب مانند OpenAI's GPTBot در هزاران صفحه را در اینترنت میخزند و حجم عظیمی از دادهها را در طول روز تا هفته جمع آوری میکنند. در دنیای هوش مصنوعی، سازندگان مدل این کار را برای جمعآوری دادهها برای آموزش مدل خود انجام میدهند و اغلب این کار را بدون اجازه صاحب پلتفرم انجام میدهند. تصمیم Reddit برای مسدود کردن خزندهها در حالی است که به دنبال محافظت از یک دارایی سودآور است، یعنی دادههای کاربران خود. این پلتفرم با توسعه دهندگان هوش مصنوعی از جمله گوگل و OpenAI قرارداد دارد و به آنها امکان دسترسی به مجموعهای از پستهای کاربر در ازای دریافت پول نقد را میدهد.
قرارداد Reddit با گوگل 60 میلیون دلار در سال بود. با این حال، Reddit اخیراً به دنبال راههای دیگری برای کسب درآمد بوده است، از جمله دریافت هزینه از اشخاص ثالث برای دسترسی به API خود، اقدامی که در ژوئن گذشته خشم کاربران را برانگیخته بود. با محدود کردن خزندههای توسعهدهندگان هوش مصنوعی که میخواهند مدلهای خود را بر روی محتوای Reddit آموزش دهند، حالا مجبور میشوند برای این کار هزینه بپردازند. طبق اعلامیه این شرکت، افراد علاوه بر پرداخت هزینه در مقابل استفاده از داده های این پلتفرم برای آموزش مدل های خود، باید از قوانین و خط مشی های این پلتفرم برای محافظت از داده های کاربران هم پیروی کنند. با این حال، برخی استثنائاتی وجود دارد که به محققان و سازمانهای آرشیوی مانند Internet Archive اجازه میدهد به دامنه وسیعی از داده های Reddit دسترسی داشته باشند.
مارک گراهام، مدیر عامل شرکت Internet Archive، گفت: بایگانی اینترنتی اهمیت Reddit را در کمک به اطمینان از آرشیو شدن و حفظ سوابق دیجیتالی زمان ما برای نسلهای آینده درک میکند. با مشارکت Reddit، ما به ضبط و در دسترس قرار دادن آرشیو Reddit، همراه با صدها میلیون URL از سایتهای دیگر که هر روز بایگانی میکنیم، ادامه خواهیم داد.
منبع خبر: https://aibusiness.com/data/reddit-blocks-ai-crawlers-protects-data-from-free-access
پاسخ :