بوابة الوفد الإلكترونية
رئيس حزب الوفد ورئيس مجلس الإدارة
د.عبد السند يمامة
رئيس التحرير
عاطف خليل
المشرف العام
ياسر شوري

الصحف تحاصر أرشيف الإنترنت خوفًا من زحف الذكاء الاصطناعي على المحتوى

بوابة الوفد الإلكترونية

في تصعيد جديد ضمن الصراع المتزايد بين صناع المحتوى وشركات الذكاء الاصطناعي، بدأت مؤسسات صحفية كبرى في تقييد وصول أرشيف الإنترنت إلى موادها، وسط مخاوف من استخدام هذه المنصة كقناة خلفية لالتفاف أدوات الذكاء الاصطناعي على أنظمة الحماية وجمع المحتوى دون إذن. 

الخطوة تعكس تحوّلًا لافتًا في نظرة الناشرين إلى واحدة من أقدم وأهم المكتبات الرقمية المفتوحة على الويب.

لطالما كان أرشيف الإنترنت مصدرًا لا غنى عنه للصحفيين والباحثين، سواء لاسترجاع تغريدات محذوفة، أو تتبع نسخ سابقة من مواقع إلكترونية، أو الوصول إلى كتب وأبحاث أكاديمية يصعب العثور عليها، لكن مع صعود نماذج الذكاء الاصطناعي التوليدي، تغيرت طبيعة العلاقة بين الأرشيف والناشرين، لتتحول من تعاون غير مباشر إلى ساحة توتر قانوني واقتصادي.

القلق الأساسي لدى المؤسسات الإعلامية يتمحور حول استخدام شركات الذكاء الاصطناعي لمحتوى الأرشيف في تدريب نماذجها، دون الحصول على موافقة صريحة أو دفع مقابل مادي. 

وبحسب تصريحات نقلها موقع Nieman Lab، يرى مسؤولو النشر أن قواعد بيانات أرشيف الإنترنت تمثل هدفًا مغريًا لشركات الذكاء الاصطناعي الباحثة عن محتوى منظم وجاهز للاستخدام على نطاق واسع.

روبرت هان، رئيس شؤون الأعمال والتراخيص في صحيفة الجارديان، أوضح أن العديد من شركات الذكاء الاصطناعي تسعى إلى مصادر ضخمة ومنسقة من المحتوى، معتبرًا أن واجهة البرمجة الخاصة بأرشيف الإنترنت كانت بمثابة نقطة دخول مثالية لهذه الأدوات لاستخلاص الملكية الفكرية. هذا التصور دفع الجارديان وغيرها إلى اتخاذ خطوات وقائية للحد من الوصول إلى محتواها عبر الأرشيف.

صحيفة نيويورك تايمز سارت في الاتجاه نفسه، مؤكدة أنها قامت بحجب روبوتات أرشيف الإنترنت عن الوصول إلى محتواها، لأن خدمة واي باك ماشين تتيح وصولًا غير مقيد إلى المواد الصحفية، بما في ذلك من قبل شركات الذكاء الاصطناعي، دون تفويض. الموقف ذاته تبنته مؤسسات أخرى مثل فايننشال تايمز، إلى جانب منصات رقمية كمنتدى Reddit، التي لجأت إلى تقييد طريقة فهرسة محتواها داخل الأرشيف.

هذه التحركات تأتي في سياق أوسع من المواجهات القانونية بين قطاع الإعلام وشركات الذكاء الاصطناعي، خلال الفترة الماضية، رفعت عدة مؤسسات صحفية دعاوى قضائية تتهم فيها شركات تقنية باستخدام محتواها في تدريب نماذج لغوية ضخمة دون ترخيص. من بين هذه القضايا دعوى نيويورك تايمز ضد OpenAI ومايكروسوفت، وقضية مركز الصحافة الاستقصائية ضد الجهتين نفسيهما، إضافة إلى دعاوى رفعتها مؤسسات مثل وول ستريت جورنال ونيويورك بوست ضد Perplexity، ودعوى جماعية شاركت فيها الجارديان وبوليتيكو ضد شركة Cohere.

في المقابل، اختارت بعض المؤسسات الإعلامية نهجًا أقل تصادمًا، عبر إبرام صفقات مالية تتيح لشركات الذكاء الاصطناعي استخدام أرشيفاتها مقابل رسوم، غير أن هذا المسار يثير بدوره جدلًا واسعًا، خصوصًا بين الصحفيين والكتّاب، إذ تذهب العوائد في الغالب إلى المؤسسات المالكة للحقوق، دون ضمان وصولها إلى صناع المحتوى أنفسهم.

ولا يقتصر هذا الصراع على الصحافة وحدها. فكتاب الروايات، والفنانون التشكيليون، والموسيقيون، جميعهم يخوضون معارك متشابهة ضد أدوات الذكاء الاصطناعي، متهمين إياها بالاعتماد على أعمالهم دون إذن لإنتاج محتوى جديد ينافسهم في السوق. 

ما يحدث مع أرشيف الإنترنت يعكس فقط إحدى جبهات هذه الحرب الأوسع حول حقوق الملكية الفكرية في عصر الخوارزميات.

اللافت أن القيود المفروضة على الأرشيف قد تحمل آثارًا جانبية غير مقصودة، فإضعاف الوصول إلى مواد تاريخية أو صحفية قديمة قد يضر بالباحثين والطلاب والصحفيين المستقلين، الذين يعتمدون على هذه الأدوات في التحقق والتوثيق، وهنا يبرز السؤال المعقد: كيف يمكن حماية حقوق النشر دون التضحية بقيم الوصول المفتوح والمعرفة العامة؟

في النهاية، تكشف هذه التطورات عن مرحلة انتقالية صعبة يعيشها الإعلام في مواجهة الذكاء الاصطناعي. 

فبين الخوف من استنزاف المحتوى دون مقابل، والرغبة في الحفاظ على دور الصحافة كمصدر موثوق للمعلومة، يجد الناشرون أنفسهم مضطرين لاتخاذ قرارات قد تعيد رسم خريطة الإنترنت كما نعرفها. 

ومع استمرار تطور تقنيات الذكاء الاصطناعي، يبدو أن الصدام بين الابتكار وحماية الحقوق لن يكون عابرًا، بل معركة طويلة ستحدد شكل العلاقة بين الإنسان والآلة في إنتاج المعرفة.