في العصر الرقمي، يُعتبر الإنترنت مستودعًا ضخمًا للمعلومات، حيث يوثق المعرفة والأنشطة الجماعية لعالمنا الحديث. ومع ذلك، فإن جزءًا كبيرًا من هذا المحتوى زائل. وفقًا لتحليل حديث أجراه مركز بيو للأبحاث، فإن نسبة كبيرة من صفحات الويب التي كانت موجودة قبل عقد من الزمن قد اختفت، مما يبرز قضية “الاضمحلال الرقمي”.
استخدم التحليل بيانات من أرشيف الإنترنت Common Crawl، حيث تم أخذ عينات سنوية تقارب مليون صفحة من 2013 إلى 2023. كما تم تضمين عينة في الوقت الحقيقي من التغريدات التي تم جمعها من مارس إلى أبريل 2023، وتمت مراقبتها لمدة ثلاثة أشهر لتقييم توفرها مع مرور الوقت.
اختفاء صفحات الويب
حتى أكتوبر 2023، فإن حوالي 25% من جميع صفحات الويب التي كانت موجودة في فترة ما بين 2013 و2023 لم يعد باﻷإمكان الوصول إليها. يشمل ذلك الصفحات التي تم حذفها أو إزالتها، حتى لو كان الموقع الإلكتروني نفسه يعمل. الوضع أكثر وضوحًا بالنسبة للمحتوى القديم، حيث أن 38% من الصفحات من عام 2013 أصبحت الآن غير قابلة للوصول مقارنة بـ 8% فقط من تلك التي من عام 2023.
درس التحليل انتشار الروابط المعطلة في مساحات الإنترنت المختلفة، بما في ذلك مواقع الحكومة والمواقع الإخبارية وويكيبيديا ووسائل التواصل الاجتماعي:
- المواقع الحكومية: حوالي 21% من صفحات الويب الحكومية تحتوي على رابط واحد لا يعمل على الأقل. ومواقع الحكومات المحلية معرضة بشكل خاص لهذه المشكلة، ومن بين 500,000 صفحة ويب حكومية تم أخذ عينات منها، كان هناك 42 مليون رابط 6% من هذه الروابط يشير إلى صفحات لا يمكن الوصول إليها.
- المواقع الإخبارية: وبالمثل، فإن 23% من صفحات الويب الإخبارية تحتوي على رابط واحد لا يعمل على الأقل. هذا الاتجاه متسق عبر المواقع الإخبارية ذات الحركة المرورية العالية والمنخفضة على حد سواء، ومن بين 500,000 صفحة إخبارية تم أخذ عينات منها، تحتوي على أكثر من 14 مليون رابط، وُجد أن 5% من الروابط كانت لا تعمل.
- ويكيبيديا: أكثر من نصف (54%) صفحات ويكيبيديا باللغة الإنجليزية تحتوي على رابط مرجعي واحد على الأقل يشير إلى صفحة غير موجودة، وكشفت عينة من 50,000 صفحة في ويكيبيديا باللغة الإنجليزية أن 11% من الروابط المرجعية لم تعد قابلة للوصول. بالإضافة إلى ذلك، 2% من هذه الصفحات كانت جميع روابطها المرجعية مكسورة.
- وسائل التواصل الاجتماعي: على منصة التواصل الاجتماعي “إكس” (المعروفة سابقًا بتويتر)، اختفت نحو 20% من التغريدات من العرض العام خلال بضعة أشهر من نشرها. يحدث هذا الاختفاء غالبًا بسبب تحويل خصوصية الحسابات من عامة إلى خاصة، أو تعليقها، أو حذفها، وتُظهر عينة تقارب 5 ملايين تغريدة أن 18% منها لم تعد مرئية بشكل عام بعد بضعة أشهر. كانت التغريدات باللغة التركية أو العربية، أكثر عرضة للاختفاء. حدث غالبية الحذف في غضون أيام إلى أسابيع من النشر.
تُبرز نتائج مركز بيو للأبحاث الطبيعة الزائلة للمحتوى عبر الإنترنت. مع اختفاء جزء كبير من صفحات الويب والروابط والمنشورات على وسائل التواصل الاجتماعي مع مرور الوقت، تتحدى فكرة الإنترنت كمخزن دائم للمعلومات. يؤثر هذا الاضمحلال الرقمي على مجموعة واسعة من المساحات عبر الإنترنت، من مواقع الحكومة والمواقع الإخبارية إلى مصادر المعلومات مثل ويكيبيديا ومنصات التواصل الاجتماعي. وبالتالي، يثير ذلك تساؤلات مهمة حول الحفاظ على المعلومات الرقمية وموثوقية الإنترنت كمخزن أو مستودع طويل الأجل للمعرفة البشرية.
وهنا تبرز أهمية أرشفة المحتوى عبر الإنترنت. إذ توفر مبادرات مثل “أرشيف الإنترنت” موارد قيمة للباحثين والأكاديميين الذين يسعون للوصول إلى المواقع المحذوفة. بالإضافة إلى ذلك، تقوم مشاريع ذات رؤية طويلة الأمد، مثل مشروع “الوصول الأبدي” (Eternal Access Project)، بتخزين نسخ رقمية من الوسائط المهددة بالحذف والزوال.