
OpenAI از خزنده وب خود با نام "GPTBot" برای فیلتر کردن و جمع آوری داده از سایت ها رونمایی کرد، اما می گوید کاری به اطلاعات شخصی ندارد. گزارش ها همچنین نشان می دهد که سازنده ChatGPT از صدور مجوز برای سیستم های هوش مصنوعی قدرتمندتر از GPT-4 هم استقبال میکند.
OpenAI بی سر و صدا از یک خزنده وب برای جستجو و جمع آوری داده برای تقویت مدل های هوش مصنوعی خود پرده برداری کرده است. در بخش API سایت OpenAI اخباری در مورد GPTBot منتشر شد که نشان میداد این شرکت از یک خزنده وب یا ربات عنکبوتی برای بازدید از صفحات وب استفاده میکند. OpenAI گفت این ابزار برای بهبود مدل های آینده این شرکت استفاده خواهد شد. OpenAI گفت GPTBot سایت هایی را که نیاز به دسترسی با اشتراک دارند یا پلتفرم هایی که خلاف سیاست های آن عمل میکنند را فیلتر می کند. خزنده وب همچنین اطلاعات شخصی مانند نام کامل، شماره حساب بانکی و موارد مشابه را جمع آوری نمی کند. این شرکت گفت که اجازه دسترسی به داده های سایت های محختلف میتواند به مدلهای هوش مصنوعی کمک کند تا دقیقتر شوند و قابلیتهای عمومی و ایمنی خود را بهبود بخشند. اگر نمی خواهید GPTBot به اطلاعات سایت شما دسترسی داشته باشد، باید مجوزهای خزنده مربوط به آن را در سایت خود غیرفعال کنید. شما میتوانید به سادگی با اضافه کردن دستور " User-agent: GPTBot Disallow: / " در فایل robots.txt سایت خود این از دسترس GPTBot خارج کنید. همچنین می توانید قسمت هایی از سایت خود را مشخص کنید که ربات بتواند یا نتواند به آن دسترسی داشته باشد. معرفی یک خزنده وب در حالی است که OpenAI از طرف کمیسیون تجارت فدرال ایالات متحده در حال بررسی است تا مشخص شود که چگونه داده های مورد استفاده برای ساخت مدل های هوش مصنوعی این شرکت جمع آوری میشود. درخواست تحقیق مدنی از طرف کمیسیون تجارت فدرال ایالات متحد در ماه ژوئیه، اطلاعات دقیقی در مورد مجموعه داده های OpenAI می خواهد، از جمله اینکه چه مقدار از داده های جمع آوری شده از وب سایت های در دسترس عموم به دست آمده است.
OpenAI ممکن است مجموعه داده آموزشی DALL-E را در دسترس عموم قرار دهد:
به طور جداگانه، یک یادداشت داخلی از شرکت OpenAI که توسط بلومبرگ به دست آمده است بیان می کند که این شرکت مایل است اطلاعاتی را که برای آموزش ابزار تولید کننده تصویر خود، DALL-E استفاده می کند را در دسترس عموم قرار دهد. چنین اقدامی میتواند عواقب بزرگی داشته باشد، بهویژه با در نظر گرفتن غوغایی که در مورد نقض احتمالی حق نسخهبرداری توسط مدلهایی مانند DALL-E در آموزش رخ داده است. OpenAI چندی پیش در یک دعوی حقوقی که توسط هنرمندان به دلیل نقض حق نسخه برداری مطرح شده بود به عنوان متهم شناخته میشد. OpenAI همچنین خاطرنشان کرد که از ایده صدور مجوز توسط دولت ها برای کسانی که به دنبال توسعه مدل های بنیاد هستند، حمایت می کند. الزامات مجوز فقط مدل های هوش مصنوعی قدرتمندتر از GPT-4 پرچمدار OpenAI را پوشش می دهد.
پاسخ :