تقرير: بيع بيانات Tumblr وWordPress لـ OpenAI وMidjourney لتدريب نماذج الذكاء الاصطناعى

8:05 م

2 دقائق

تقرير: بيع بيانات Tumblr وWordPress لـ OpenAI وMidjourney لتدريب نماذج الذكاء الاصطناعى

مي كمال الدين

كشف تقرير حديث أن شركة Automattic، الشركة الأم لمواقع التدوين Tumblr وWordPress، قد أبرمت صفقات مع OpenAI وMidjourney لبيع المحتوى الذي ينشئه المستخدمون والذي يقال إنه سيتم استخدامه للمساعدة في تدريب الذكاء الاصطناعي. وفي حين أن تفاصيل الصفقات وممارسات تبادل البيانات لا تزال غير واضحة في الوقت الحالي، فقد أثار ذلك تساؤلاً حول خصوصية البيانات وأخلاقيات الشركات التي تشارك بيانات مستخدميها مع أطراف ثالثة.

وأكدت الاتصالات الداخلية من موظفي Automattic، التي اطلعت عليها 404 Media، الصفقة مع شركات الذكاء الاصطناعي وكشفت تفاصيل حول هذه الممارسات، كما أكدت المجلة في تقريرها أنه من الممكن الإعلان عن صفقة Automattic مع OpenAI وMidjourney قريبا.

علاوة على ذلك، يبدو أن جمع البيانات لشركات الذكاء الاصطناعي قد بدأ بالفعل. وفي الوقت نفسه، أشار منشور داخلي لمدير المنتج Cyle Gage إلى أنه تم جمع كل محتوى Tumblr العام بين عامي 2014 و2023.

يسلط التقرير الضوء أيضًا على رسالة محددة تشير إلى أنه تم أيضًا جمع محتوى المستخدم الخاص والمحذوف تلقائيًا، إلى جانب البيانات العامة. ولم يكن من الواضح ما إذا كانت مجموعة البيانات هذه قد تمت مشاركتها بالفعل مع شركات الذكاء الاصطناعي.

علاوة على ذلك، نظرًا لأن مثل هذا الحادث يعرض المعلومات الخاصة لقاعدة المستخدمين بأكملها للخطر، فإنه يثير أيضًا سؤالاً حول السياسة الأخلاقية للشركة والبنية التحتية لسلامة البيانات.

وفي يوم الثلاثاء، أصدرت شركة Automattic بيانًا جاء فيه: “يعمل الذكاء الاصطناعي على تغيير سريع لكل جانب من جوانب عالمنا تقريبًا، بما في ذلك الطريقة التي ننشئ بها المحتوى ونستهلكه. في Automattic، نؤمن دائمًا بالويب الحر والمفتوح والاختيار الفردي، مثل شركات التكنولوجيا… بالإضافة إلى ذلك، نحن نتابع هذه التطورات عن كثب، بما في ذلك كيفية عملنا مع شركات الذكاء الاصطناعي بطريقة تحترم تفضيلات مستخدمينا .

يوضح المنشور تفاصيل العديد من الأشياء التي تفعلها الشركة لمستخدميها، بما في ذلك حظر برامج زحف الذكاء الاصطناعي الخاصة بالمنصة، والإعداد لمنع محركات البحث من فهرسة موقع على WordPress وTumblr، وضمان إعداد إلغاء الاشتراك للمستخدمين الذين لا يرغبون في المشاركة. البيانات مع أطراف ثالثة. في المنشور: “في الوقت الحالي، لا يوجد قانون يلزم برامج الزحف باتباع هذه التفضيلات.”

كما أن آلية إلغاء الاشتراك في مشاركة البيانات غير واضحة إلى حد ما، وبينما ذكرت الشركة في المنشور أن شركات الذكاء الاصطناعي ستحترم إعدادات إلغاء الاشتراك وحتى إزالة المحتوى السابق من المستخدمين الذين اختاروا عدم المشاركة مؤخرًا، يدعي التقرير أن الواقع هو أكثر تعقيدا.

وجد التقرير وثيقة داخلية بتاريخ 23 فبراير سأل فيها أحد الموظفين عما إذا كان لدى الشركة أي ضمان بأن شريك البيانات سيحترم قرار إلغاء الاشتراك للمستخدمين، ورد أندرو سبيتل، رئيس قسم الذكاء الاصطناعي في Automattic، قائلاً: “نحن سيطلب إزالة المحتوى وإزالته.” “من أي دورات تدريبية مستقبلية، وأعتقد أن الشركاء سيحترمون ذلك بناءً على محادثاتنا معهم حتى هذه اللحظة. لا أعتقد أنهم سيكسبون الكثير بشكل عام من خلال الاحتفاظ به”.

ولوحظ أن الرد غامض ولا يؤكد ما إذا كانت شركة أوتوماتيك لديها موافقة على ذلك، بحسب التقرير. علاوة على ذلك، يبدو أن خط التفكير بأكمله يعتمد على افتراض مفاده أن شركات الذكاء الاصطناعي لن تكسب الكثير من خلال الاحتفاظ ببيانات المستخدم. تجدر الإشارة إلى أن ممارسة مشاركة بيانات الطرف الثالث ليست جديدة، وتمتلك معظم منصات التواصل الاجتماعي حقوق المحتوى العام الذي ينشئه المستخدمون على المنصة. ومع ذلك، فإن عقد مثل هذه الصفقات دون الكشف عنها للمستخدمين قد يؤدي إلى كشف معلومات خاصة للشركات التي تستخدم نفس البيانات لتدريب أنظمة الذكاء الاصطناعي.

للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .