এআই-ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তকরণের সীমাবদ্ধতা ও চ্যালেঞ্জ
এআই-ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তকরণের সীমাবদ্ধতা

জাতিসংঘ ১৮ জুন ‘ঘৃণামূলক বক্তব্য প্রতিরোধ দিবস’ পালন করেছে। এ উপলক্ষে সংস্থার মহাসচিব আন্তোনিও গুতেরেস সতর্ক করে বলেছেন, সামাজিক যোগাযোগমাধ্যমগুলো এ ঝুঁকি আরও বাড়িয়ে তুলছে। অনলাইনে ঘৃণামূলক বক্তব্য শনাক্ত ও অপসারণে এখন কৃত্রিম বুদ্ধিমত্তা (এআই) ব্যবহৃত হচ্ছে। কিন্তু মানুষের বিচারবুদ্ধির তুলনায় এসব ব্যবস্থা কোথায় কোথায় পিছিয়ে পড়ছে, তা বিশ্লেষণ করে দেখেছে আল–জাজিরা।

ঘৃণামূলক বক্তব্যের সংজ্ঞা ও বিস্তৃতি

জাতিসংঘের সংজ্ঞা অনুযায়ী, ঘৃণামূলক বক্তব্য বলতে মৌখিক, লিখিত বা আচরণগত এমন সব যোগাযোগ বোঝানো হয়, যা কোনো ব্যক্তি বা গোষ্ঠীর বিরুদ্ধে বৈষম্য সৃষ্টি করে বা সহিংসতা উসকে দেয়। জাতিসংঘ বলছে, কোনো মানুষের বাস্তব বা ধারণাগত পরিচয়, জাতি, বর্ণ, ধর্ম, লিঙ্গ, যৌনতা বা প্রতিবন্ধকতা এ ধরনের বক্তব্যের লক্ষ্য হয়ে থাকে। এটি শুধু শব্দের মধ্যে সীমাবদ্ধ নয়; বরং তা ছবি, কার্টুন, অঙ্গভঙ্গি, এমনকি বিভিন্ন বস্তু দিয়েও প্রকাশ করা হতে পারে।

অনলাইনে ঘৃণামূলক বক্তব্যের শিকার কতজন?

ইউনেসকো ও ইপসসের ২০২৩ সালের এক জরিপে দেখা যায়, ইন্টারনেট ব্যবহারকারীদের দুই-তৃতীয়াংশের বেশি অনলাইনে ঘৃণামূলক বক্তব্যের শিকার হয়েছেন। জরিপটি ১৬টি দেশের ৮ হাজার মানুষের ওপর পরিচালিত হয়। উত্তরদাতাদের ৩৩ শতাংশ মনে করেন, এলজিবিটিকিউআই গোষ্ঠীর মানুষ সবচেয়ে বেশি ঘৃণামূলক বক্তব্যের শিকার হন। এরপর ২৮ শতাংশ নিয়ে দ্বিতীয় স্থানে রয়েছে জাতি ও বর্ণগত সংখ্যালঘুরা, নারীরা ১৮ শতাংশ নিয়ে রয়েছেন তৃতীয় স্থানে।

Pickt নিবন্ধের পরে ব্যানার — পারিবারিক চিত্রসহ সহযোগী শপিং লিস্ট অ্যাপ
Pickt প্রশস্ত ব্যানার — টেলিগ্রামের জন্য সহযোগী শপিং লিস্ট অ্যাপ

মেটা ও টিকটকের ঘৃণামূলক পোস্ট অপসারণের তথ্য

ফেসবুকের মূল প্রতিষ্ঠান মেটা ২০২৩ সালের পর থেকে ঘৃণামূলক পোস্ট অপসারণের হার কমিয়েছে। ২০২৫ সালের শেষ প্রান্তিকে (অক্টোবর থেকে ডিসেম্বর) প্রতিষ্ঠানটি ইনস্টাগ্রাম থেকে ১৩ লাখ ও ফেসবুক থেকে ১৩ লাখ পোস্ট সরিয়েছে। ২০২৪ সালের একই সময়ে তা ছিল যথাক্রমে ৭৪ লাখ ও ৫৮ লাখ। প্রতিষ্ঠানটি স্বয়ংক্রিয়ভাবে ঘৃণামূলক বক্তব্য শনাক্ত করার পরিবর্তে ব্যবহারকারীদের রিপোর্টের ওপর বেশি নির্ভর করতে শুরু করার পর এ পরিবর্তন এসেছে। অন্যদিকে টিকটক জানিয়েছে, ২০২৫ সালের শেষ প্রান্তিকে তাদের সরানো ঘৃণামূলক বক্তব্য ও কনটেন্টের ৯৬ দশমিক ৩ শতাংশ ব্যবহারকারীর রিপোর্টের আগেই শনাক্ত ও অপসারণ করা হয়েছে।

এআই মডেল কীভাবে ঘৃণামূলক বক্তব্য শনাক্ত করে?

অনলাইনে ঘৃণামূলক বক্তব্য শনাক্ত ও প্রতিরোধে সামাজিক যোগাযোগমাধ্যমগুলো এখন বেশি হারে কৃত্রিম বুদ্ধিমত্তার (এআই) ওপর নির্ভর করছে। এ ক্ষেত্রে বিশেষ করে বৃহৎ ভাষা মডেল বা এলএলএম–ভিত্তিক কনটেন্ট নিয়ন্ত্রণব্যবস্থা ব্যবহার করা হচ্ছে, যা বিপুল পরিমাণ বার্তা স্বয়ংক্রিয়ভাবে বাছাই করে আলাদা করতে পারে। সাধারণভাবে এসব ব্যবস্থা লেবেলযুক্ত ডেটাসেট ও পূর্বপ্রশিক্ষিত ভাষা মডেলের মাধ্যমে আপত্তিকর ভাষা শনাক্ত করে। এরপর একটি নির্দিষ্ট মান বা স্কোরের ভিত্তিতে সিদ্ধান্ত নেয়।

যুক্তরাষ্ট্রের পেনসিলভানিয়া বিশ্ববিদ্যালয়ের গবেষকদের ২০২৫ সালের এক গবেষণায় দেখা গেছে, এ মডেলগুলো ঘৃণামূলক বক্তব্য শনাক্ত ও শ্রেণিবিন্যাসে ব্যাপকভাবে ভিন্ন আচরণ করে। বিশেষ করে বিভিন্ন ডেমোগ্রাফিক গোষ্ঠীর ক্ষেত্রে তাদের সিদ্ধান্তে পার্থক্য দেখা যায়, যা পক্ষপাত ও অনলাইন সুরক্ষায় অসমতার উদ্বেগ তৈরি করে। গবেষণায় ওপেনএআই, অ্যানথ্রপিক, ডিপসিক, মিস্ট্রাল ও গুগলের মতো প্রতিষ্ঠানের সাতটি এআই মডারেশন সিস্টেম বিশ্লেষণ করা হয়। এতে দেখা যায়, একই ধরনের ঘৃণামূলক বক্তব্যকে বিভিন্ন মডেল ভিন্নভাবে মূল্যায়ন ও স্কোর দেয়।

উদাহরণ হিসেবে বলা হয়, মিস্ট্রাল মডারেশন এন্ডপয়েন্টসহ কিছু সিস্টেম অনেক ক্ষেত্রে স্কোরকে প্রায় ১-এর কাছাকাছি রাখে। এর অর্থ, এসব সিস্টেম প্রায় সব ক্ষেত্রে কনটেন্টকে অত্যন্ত ঘৃণামূলক হিসেবে চিহ্নিত করে। অন্যদিকে ওপেনএআই মডারেশন এন্ডপয়েন্ট অনেক ক্ষেত্রে তুলনামূলকভাবে কম স্কোর দেয়। কখনো কখনো অন্যান্য মডেলের তুলনায় অর্ধেকের কম স্কোর দেয়। গবেষকদের ভাষায়, একই কনটেন্ট যদি দুটি সিস্টেমে ভিন্নভাবে চিহ্নিত হয়—একটিতে ঘৃণামূলক বক্তব্য হিসেবে ধরা পড়ে, অন্যটিতে পড়ে না—তাহলে তা মডারেশনের প্রক্রিয়ার গ্রহণযোগ্যতাকে দুর্বল করে দেয়।

এআই–ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তের সীমাবদ্ধতা

এআই বা এলএলএম তখনই কোনো লেখাকে ‘ঘৃণামূলক বক্তব্য’ হিসেবে খুব সহজে ধরে ফেলে, যখন সেখানে সরাসরি কোনো গালিগালাজ, আপত্তিকর শব্দ বা চেনা কোনো অপবাদ ব্যবহার করা হয়। একে বলা হয় ‘সুস্পষ্ট’ ঘৃণামূলক বক্তব্য। কিন্তু মানুষ যখন সরাসরি কোনো খারাপ শব্দ ব্যবহার না করে, ঘুরিয়ে বা সূক্ষ্ম ও পরোক্ষভাবে কাউকে হেয় করে কথা বলে, তখন এআইয়ের পক্ষে সেই চতুরতা ধরা কঠিন হয়ে পড়ে।

লন্ডনের কুইন মেরি বিশ্ববিদ্যালয়ের সহযোগী অধ্যাপক এবং বিশ্ববিদ্যালয়টির সোশ্যাল ডেটা সায়েন্স ল্যাবের সহপ্রধান আর্কাইত্জ জুবিয়াগা আল–জাজিরাকে বলেন, ‘পরোক্ষ বা ইঙ্গিতপূর্ণ ঘৃণামূলক বক্তব্য এক বড় চ্যালেঞ্জ। এ ক্ষেত্রে সাধারণত কোনো গালিগালাজ বা অপমানজনক শব্দ ব্যবহার করা হয় না বলে অনেক সময় তা ঘৃণামূলক বক্তব্য হিসেবে শনাক্ত হয় না।’ জুবিয়াগা উদাহরণ দিয়ে বলেন, ‘ধরুন, একটি বার্তা শুরু হলো এভাবে—পৃথিবীটা কত সুন্দর হতো যদি...’। এরপর সেখানে কোনো একটি গোষ্ঠীকে হেয় বা অবমাননাকর মন্তব্য করা হলো। বার্তার প্রথম অংশ ইতিবাচক শোনালেও পরের অংশে ঘৃণা প্রকাশ পেতে পারে। কিন্তু এআই সিস্টেম অনেক সময় বার্তার ইতিবাচক দিক বেশি গুরুত্ব দেয়, ফলে ভেতরে থাকা ঘৃণার বিষয়টি ধরতে হিমশিম খায়।’

জুবিয়াগা বিপরীত একটি সমস্যার কথাও বলছেন। তিনি বলেন, এখানে ভাষার একটি বিশেষ রূপ দেখা যায়, যাকে বলে ‘রিক্লেইমড ল্যাঙ্গুয়েজ’ বা অধিকার ফিরিয়ে নেওয়া ভাষা। এর মানে হলো, অতীতের কোনো এক সময় যে শব্দগুলো কোনো অবহেলিত বা প্রান্তিক গোষ্ঠীকে অপমান ও হেয় করার জন্য গালি হিসেবে ব্যবহার করা হতো, পরে সেই গোষ্ঠীর মানুষেরাই শব্দগুলো নিজেদের আপন করে নেয় এবং নিজেদের মধ্যে সাধারণ কথাবার্তায় ব্যবহার করতে শুরু করে। ফলে এককালের অপমানসূচক শব্দগুলোই পরে তাদের নিজেদের যোগাযোগের মাধ্যম হয়ে ওঠে। এই অধ্যাপকের মতে, ‘ভাষার এ ধরনের ব্যবহারকে ঘৃণামূলক বক্তব্য হিসেবে চিহ্নিত করা উচিত নয়। কিন্তু এআই সিস্টেমগুলো অনেক সময় এসবও ভুলভাবে ঘৃণামূলক বলে শনাক্ত করে।’