موضوع حار على الساحة: إن كنت تشك في أن المحتوى الذي تقوم بنشره علنيًا عبر الإنترنت قد يصبح مصدرًا لتغذية نماذج الذكاء الاصطناعي، فمن الجدير أن تلقي نظرة على سياسة الخصوصية المُحدثة لشركة Google. فقد صرحت الوثيقة الآن بشكل واضح أن الشركة تحتفظ بالحق في جمع وتحليل كل ما يشاركه الأشخاص على الويب لغرض تدريب أنظمة الذكاء الاصطناعي الخاصة بها.
جاء تحديث Google لسياسة الخصوصية في نهاية الأسبوع مع تغييرات في الصيغة. فقد ذُكر سابقًا أن بيانات الأشخاص ستُستخدم لتدريب “نماذج لغوية”، مشيرة فقط إلى Google Translate. أما النسخة المحدثة، فقد ذكرت فقط “نماذج الذكاء الاصطناعي”، مع ذُكر كل من Bard وCloud AI بجانب Google Translate،.
أحد القضايا العديدة المثيرة للجدل المرتبطة بأنظمة الذكاء الاصطناعي المولدة مثل ChatGPT وBard هي طريقة جمع واستخدام البيانات التي يتم تدريب هذه الأنظمة عليها. رغم أن هذه البيانات قد تكون متاحة للعوام، لكن ذلك لا يُقلل من المخاوف المتعلقة بالخصوصية والسرقة الأدبية، بالاضافة إلى احتمال أن يفسر الذكاء الاصطناعي ما تم قوله بشكل غير صحيح أو أن يقدم إجابات قديمة و عفا عنها الزمن. حتى Google نفسها حذرت موظفيها من الاعتماد الكامل على بوتات الدردشة مثل Bard الخاصة بها، لأنها قد تقدم اقتراحات برمجية غير مرغوب بها.
هناك أيضًا تساؤلات حول ما إذا كانت هذه الطريقة من جمع البيانات قانونية أم لا. فـ OpenAI منشئة ChatGPT تواجه دعاوى قضائية تتهمها بجمع المعلومات الشخصية لمستخدمي الإنترنت بطرق غير قانونية واستخدام هذه البيانات في صنع منتجاتها.
تتعامل OpenAI أيضًا مع دعوى قضائية أخرى تتعلق بانتهاكات لحقوق الطبع والنشر والخصوصية، حيث يُدعى أنها استخدمت الكتب المحمية بحقوق الطبع والنشر دون إذن لتدريب أنظمة الذكاء الاصطناعي الخاصة بها. وقد زُعم أن الشركة نسخت النصوص من هذه الكتب بطريقة غير قانونية دون الحصول على موافقة من حاملي حقوق الطبع والنشر ودون إعطائهم الائتمان المستحق أو التعويض.
تجميع البيانات يبدو أنه أصبح مصدر قلق كبير لـ Elon Musk. حيث قامت منصة Twitter في نهاية الأسبوع بتقييد عدد التغريدات التي يمكن قراءتها في اليوم بشكل مؤقت، بحجة معالجة “مستويات غير عادية” من تجميع البيانات و”التلاعب في النظام” على المنصة، رغم أن الرأي لم يكن موحدًا حول إن كانت هذه الأسباب حقيقية وراء هذا التقييد.
كما واجهت منصة Reddit مجموعة من المشكلات منذ أن تم إيقاف الوصول المجاني إلى واجهات برمجة التطبيقات API الخاصة بها في محاولة لوقف جمع البيانات. أدى هذا القرار إلى انعدام الوصول إلى أكثر من 8000 منتدى فرعي Subreddits في حركة احتجاجية من المستخدمين و مالكي هذه المنتديات Subreddits.