ইন্টারনেট আর্কাইভ: ডিজিটাল বিস্মৃতির বিরুদ্ধে এক অনন্য লড়াই
অনলাইন জগৎটি প্রায়ই বালির ওপর আঁকা নকশার মতো অস্থায়ী, যেখানে একটি ঢেউয়ের পর সবকিছু মুছে যায়। এই বিশাল ডিজিটাল মহাবিশ্বে কোনো কিছুই চিরস্থায়ী নয়—সার্ভার ক্র্যাশ, ডোমেইন মেয়াদোত্তীর্ণ বা হ্যাকারদের হামলায় মুহূর্তেই হারিয়ে যেতে পারে প্রিয় ওয়েবসাইট, ছবি বা স্মৃতি। উদাহরণস্বরূপ, ২০১৯ সালে মাইস্পেস সার্ভার পরিবর্তনের সময় ভুলবশত ২০০৩ থেকে ২০১৫ সালের মধ্যে আপলোড করা প্রায় ৫ কোটি গান চিরতরে মুছে ফেলা হয়েছিল, যা ১৪০ লাখ শিল্পীর সৃষ্টিকে অদৃশ্য করে দিয়েছে।
ডিজিটাল স্মৃতি রক্ষার অগ্রদূত
এই ডিজিটাল বিস্মৃতির হাত থেকে ইন্টারনেটকে বাঁচাতে একটি প্রতিষ্ঠান নিরলসভাবে কাজ করে যাচ্ছে—ইন্টারনেট আর্কাইভ। সম্প্রতি, তারা একটি অবিশ্বাস্য মাইলফলক অর্জন করেছে: প্রায় ৩০ বছরের অক্লান্ত পরিশ্রমের পর এই অলাভজনক সংস্থাটি তাদের সংগ্রহশালায় ১ ট্রিলিয়ন বা ১ লাখ কোটি ইউআরএল সংরক্ষণ করেছে। এটি শুধু একটি সংখ্যা নয়, বরং ডিজিটাল ইতিহাসের এক বিশাল ভাণ্ডার।
ওয়েব্যাক মেশিন: সময়ের যাত্রার সেতু
১৯৯৬ সালে ব্রুউস্টার কেল সান ফ্রান্সিসকোতে ইন্টারনেট আর্কাইভ প্রতিষ্ঠা করেন, যার মূল লক্ষ্য ছিল ইন্টারনেটের পরিবর্তনের একটি স্থায়ী রেকর্ড সংরক্ষণ করা। তাদের বিখ্যাত সেবা ওয়েব্যাক মেশিন ব্যবহারকারীদেরকে অতীতে নিয়ে যায়—যেমন ২০ বছর আগের প্রথম আলো বা বিবিসি বাংলার ওয়েবসাইটের চেহারা দেখা। এটি গবেষক, সাংবাদিক এবং সাধারণ মানুষের জন্য একটি অমূল্য রত্নভাণ্ডার, যা ডিজিটাল টাইম মেশিনের মতো কাজ করে।
এক বিশাল ডিজিটাল লাইব্রেরি
ইন্টারনেট আর্কাইভের সংগ্রহশালায় শুধু ওয়েবসাইটই নয়, রয়েছে নানা ধরনের ডিজিটাল সম্পদ। তাদের ডিজিটাল লাইব্রেরিতে সংরক্ষিত হয়েছে ১ লাখ কোটি ওয়েব পেজ, ৪ কোটি ১০ লাখ বই ও টেক্সট ডকুমেন্ট, ১ কোটি ৫০ লাখ অডিও রেকর্ডিং (যার মধ্যে ২ লাখ ৫০ হাজার লাইভ কনসার্ট), ১ কোটির বেশি ভিডিও, ৪৪ লাখ ছবি এবং ১০ লাখের বেশি সফটওয়্যার প্রোগ্রাম। সব মিলিয়ে প্রায় ১ লাখ টেরাবাইট বা ১০০ পেটাবাইট ডেটা জমা হয়েছে, যা বর্তমানে বাজারে থাকা ৫০ হাজার সর্বোচ্চ মেমোরির আইফোন দিয়েও ধারণ করা সম্ভব নয়। প্রতিদিন গড়ে প্রায় ৫০ কোটি নতুন ওয়েব পেজ এই আর্কাইভে যুক্ত হচ্ছে, যা এর ক্রমবর্ধমান গুরুত্বকে তুলে ধরে।
চ্যালেঞ্জ ও ভবিষ্যৎ সম্ভাবনা
তবে এই মহৎ কাজটি দিন দিন কঠিন হয়ে পড়ছে। কৃত্রিম বুদ্ধিমত্তার উত্থানের ফলে বড় প্রযুক্তি কোম্পানিগুলো তাদের এআই মডেলকে শেখানোর জন্য ইন্টারনেটের তথ্য খুঁজছে, যার ফলে নিউইয়র্ক টাইমস, দ্য গার্ডিয়ান বা ইউএসএ টুডের মতো মিডিয়া প্রতিষ্ঠানগুলো তাদের কনটেন্টকে রক্ষা করতে ইন্টারনেট আর্কাইভের মতো বটগুলোকে ব্লক করছে। কপিরাইট জটিলতা আরও চ্যালেঞ্জ তৈরি করছে। তবুও আশা করা যায়, সব আইনি বাধা কাটিয়ে ইন্টারনেট আর্কাইভ টিকে থাকবে, কারণ মানব ইতিহাসের এই ভঙ্গুর কিন্তু গুরুত্বপূর্ণ ডিজিটাল ইকোসিস্টেমকে বাঁচিয়ে রাখার জন্য এর কোনো বিকল্প নেই। ভবিষ্যতে তারা ২ ট্রিলিয়ন ওয়েবসাইটের মাইলফলক ছুঁতে পারে, যা ডিজিটাল সংরক্ষণের ক্ষেত্রে নতুন দিগন্ত উন্মোচন করবে।
