گوگل از پست‌های Reddit برای آموزش مدل‌های خود استفاده می‌کند

...

• طبق گزارش‌ها، Reddit یک قرارداد سالانه 60 میلیون دلاری با گوگل منعقد کرده است.
• طبق این قرارداد از پست‌های Reddit برای آموزش مدل‌های هوش مصنوعی گوگل استفاده خواهد شد. 

ردیت، پلتفرم بحث اجتماعی، یکی از مکان‌های عجیب‌ در اینترنت است که پست‌های کاربران را در مورد همه چیز از میم‌ها گرفته تا تئوری‌های توطئه و هرگونه بحثی را منعکس می‌کند. اما پست‌های کاربران ممکن است به زودی به موجب یک قرارداد توسط گوگل برای آموزش مدل‌های هوش مصنوعی این شرکت مورد استفاده قرار گیرد. رویترز گزارش داد که گوگل قراردادی به ارزش 60 میلیون دلار در سال برای دسترسی به محتوای کاربران Reddit امضا کرده است. گوگل قرار است از پست‌های کاربران این پلتفرم برای آموزش مدل‌های هوش مصنوعی خود استفاده کند. نه گوگل و نه ردیت به طور علنی در مورد این قرارداد اظهار نظری نکرده‌اند؛ اما استیو هافمن، مدیرعامل ردیت، قبلاً به نیویورک تایمز گفته بود که مجموعه داده‌های این پلتفرم واقعاً ارزشمند است. در Reddit، کاربران هرگونه حق مالکیت محتوای خود را دارند؛ اما Reddit می‌تواند مجوز استفاده از آن محتوا را به مشتریانی مانند Google بدهد. 

این همکاری به چه معناست؟

این معامله برای گوگل منبع داده دیگری را برای تقویت مدل‌های هوش مصنوعی خود فراهم می‌کند. گوگل هفته گذشته از خانواده‌ای از مدل‌های منبع باز کوچک به نام Gemma رونمایی کرد که توجهات بسیاری را به خود جلب کرد. همچنین این قرارداد برای Reddit، منبع درآمد دیگری را در میان افت درآمد تبلیغاتی فراهم خواهد کرد، زیرا رقابت از سوی تازه واردان رسانه‌های اجتماعی مانند TikTok هر روز بالا می‌گیرد. سال گذشته، Reddit اعلام کرد که دسترسی به API خود را پولی می‌کند. این سرویس قبلاً رایگان بود و کاربران قادر بودند تا برنامه‌های دسترسی مورد نظر خود را با استفاده از API رایگان ایجاد کنند. همچنین مدیران subreddits می‌توانستند با استفاده از این API رایگان  ابزارهای مورد نظر خود را ایجاد کنند.

گوگل و reddit

آیا استفاده گوگل از داده های Reddit یک اشتباه است؟

به طور کلی، Reddit میزبان طیف گسترده‌ای از محتوای کاربران مختلف با طرز فکرهای مختلف است که همه چیز را از بازی گرفته تا دستورالعمل‌ها در برمی‌گیرد. داده‌ها و پست‌های کاربران این پلتفرم همچنین به دلیل رک و بی پرده بودنشان نیز شناخته می‌شود و استفاده از این داده‌ها در آموزش مدل‌های گوگل می‌تواند منجر به آموزش مدل‌های هوش مصنوعی با داده‌هایی که برای کاربر امن نیست و یا توهین آمیز است، شود. در حالی که توسعه دهندگان هوش مصنوعی گوگل احتمالاً از روش‌هایی برای جلوگیری از محتوای خطرناک استفاده می‌کنند، باز هم این موضوع بازدارندگی قطعی ندارد. کاربران Reddit به سرعت به این موضوع پی بردند و شروع به اظهار نظر در رابطه با این اقدام گوگل کردند که مدل‌ها باید برای ایمن بودن و آسیب زا نبودن آموزش داده شوند. 

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟