এআই-ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তকরণের সীমাবদ্ধতা ও চ্যালেঞ্জ

জাতিসংঘের ঘৃণামূলক বক্তব্য প্রতিরোধ দিবসে মহাসচিব গুতেরেস সতর্ক করেছেন। আল-জাজিরার বিশ্লেষণে দেখা গেছে, এআই মডেলগুলো ঘৃণামূলক বক্তব্য শনাক্তে পক্ষপাতদুষ্ট ও অসম, যা অনলাইন মডারেশনের গ্রহণযোগ্যতা হ্রাস করছে।

বিডি গেজেট 21/06/2026 07:35

এআই-ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তকরণের সীমাবদ্ধতা ও চ্যালেঞ্জ — এআই-ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তকরণের সীমাবদ্ধতা

জাতিসংঘ ১৮ জুন ‘ঘৃণামূলক বক্তব্য প্রতিরোধ দিবস’ পালন করেছে। এ উপলক্ষে সংস্থার মহাসচিব আন্তোনিও গুতেরেস সতর্ক করে বলেছেন, সামাজিক যোগাযোগমাধ্যমগুলো এ ঝুঁকি আরও বাড়িয়ে তুলছে। অনলাইনে ঘৃণামূলক বক্তব্য শনাক্ত ও অপসারণে এখন কৃত্রিম বুদ্ধিমত্তা (এআই) ব্যবহৃত হচ্ছে। কিন্তু মানুষের বিচারবুদ্ধির তুলনায় এসব ব্যবস্থা কোথায় কোথায় পিছিয়ে পড়ছে, তা বিশ্লেষণ করে দেখেছে আল–জাজিরা।

ঘৃণামূলক বক্তব্যের সংজ্ঞা ও বিস্তৃতি

জাতিসংঘের সংজ্ঞা অনুযায়ী, ঘৃণামূলক বক্তব্য বলতে মৌখিক, লিখিত বা আচরণগত এমন সব যোগাযোগ বোঝানো হয়, যা কোনো ব্যক্তি বা গোষ্ঠীর বিরুদ্ধে বৈষম্য সৃষ্টি করে বা সহিংসতা উসকে দেয়। জাতিসংঘ বলছে, কোনো মানুষের বাস্তব বা ধারণাগত পরিচয়, জাতি, বর্ণ, ধর্ম, লিঙ্গ, যৌনতা বা প্রতিবন্ধকতা এ ধরনের বক্তব্যের লক্ষ্য হয়ে থাকে। এটি শুধু শব্দের মধ্যে সীমাবদ্ধ নয়; বরং তা ছবি, কার্টুন, অঙ্গভঙ্গি, এমনকি বিভিন্ন বস্তু দিয়েও প্রকাশ করা হতে পারে।

অনলাইনে ঘৃণামূলক বক্তব্যের শিকার কতজন?

ইউনেসকো ও ইপসসের ২০২৩ সালের এক জরিপে দেখা যায়, ইন্টারনেট ব্যবহারকারীদের দুই-তৃতীয়াংশের বেশি অনলাইনে ঘৃণামূলক বক্তব্যের শিকার হয়েছেন। জরিপটি ১৬টি দেশের ৮ হাজার মানুষের ওপর পরিচালিত হয়। উত্তরদাতাদের ৩৩ শতাংশ মনে করেন, এলজিবিটিকিউআই গোষ্ঠীর মানুষ সবচেয়ে বেশি ঘৃণামূলক বক্তব্যের শিকার হন। এরপর ২৮ শতাংশ নিয়ে দ্বিতীয় স্থানে রয়েছে জাতি ও বর্ণগত সংখ্যালঘুরা, নারীরা ১৮ শতাংশ নিয়ে রয়েছেন তৃতীয় স্থানে।

Pickt নিবন্ধের পরে ব্যানার — পারিবারিক চিত্রসহ সহযোগী শপিং লিস্ট অ্যাপ

—

Pickt প্রশস্ত ব্যানার — টেলিগ্রামের জন্য সহযোগী শপিং লিস্ট অ্যাপ

মেটা ও টিকটকের ঘৃণামূলক পোস্ট অপসারণের তথ্য

ফেসবুকের মূল প্রতিষ্ঠান মেটা ২০২৩ সালের পর থেকে ঘৃণামূলক পোস্ট অপসারণের হার কমিয়েছে। ২০২৫ সালের শেষ প্রান্তিকে (অক্টোবর থেকে ডিসেম্বর) প্রতিষ্ঠানটি ইনস্টাগ্রাম থেকে ১৩ লাখ ও ফেসবুক থেকে ১৩ লাখ পোস্ট সরিয়েছে। ২০২৪ সালের একই সময়ে তা ছিল যথাক্রমে ৭৪ লাখ ও ৫৮ লাখ। প্রতিষ্ঠানটি স্বয়ংক্রিয়ভাবে ঘৃণামূলক বক্তব্য শনাক্ত করার পরিবর্তে ব্যবহারকারীদের রিপোর্টের ওপর বেশি নির্ভর করতে শুরু করার পর এ পরিবর্তন এসেছে। অন্যদিকে টিকটক জানিয়েছে, ২০২৫ সালের শেষ প্রান্তিকে তাদের সরানো ঘৃণামূলক বক্তব্য ও কনটেন্টের ৯৬ দশমিক ৩ শতাংশ ব্যবহারকারীর রিপোর্টের আগেই শনাক্ত ও অপসারণ করা হয়েছে।

এআই মডেল কীভাবে ঘৃণামূলক বক্তব্য শনাক্ত করে?

অনলাইনে ঘৃণামূলক বক্তব্য শনাক্ত ও প্রতিরোধে সামাজিক যোগাযোগমাধ্যমগুলো এখন বেশি হারে কৃত্রিম বুদ্ধিমত্তার (এআই) ওপর নির্ভর করছে। এ ক্ষেত্রে বিশেষ করে বৃহৎ ভাষা মডেল বা এলএলএম–ভিত্তিক কনটেন্ট নিয়ন্ত্রণব্যবস্থা ব্যবহার করা হচ্ছে, যা বিপুল পরিমাণ বার্তা স্বয়ংক্রিয়ভাবে বাছাই করে আলাদা করতে পারে। সাধারণভাবে এসব ব্যবস্থা লেবেলযুক্ত ডেটাসেট ও পূর্বপ্রশিক্ষিত ভাষা মডেলের মাধ্যমে আপত্তিকর ভাষা শনাক্ত করে। এরপর একটি নির্দিষ্ট মান বা স্কোরের ভিত্তিতে সিদ্ধান্ত নেয়।

যুক্তরাষ্ট্রের পেনসিলভানিয়া বিশ্ববিদ্যালয়ের গবেষকদের ২০২৫ সালের এক গবেষণায় দেখা গেছে, এ মডেলগুলো ঘৃণামূলক বক্তব্য শনাক্ত ও শ্রেণিবিন্যাসে ব্যাপকভাবে ভিন্ন আচরণ করে। বিশেষ করে বিভিন্ন ডেমোগ্রাফিক গোষ্ঠীর ক্ষেত্রে তাদের সিদ্ধান্তে পার্থক্য দেখা যায়, যা পক্ষপাত ও অনলাইন সুরক্ষায় অসমতার উদ্বেগ তৈরি করে। গবেষণায় ওপেনএআই, অ্যানথ্রপিক, ডিপসিক, মিস্ট্রাল ও গুগলের মতো প্রতিষ্ঠানের সাতটি এআই মডারেশন সিস্টেম বিশ্লেষণ করা হয়। এতে দেখা যায়, একই ধরনের ঘৃণামূলক বক্তব্যকে বিভিন্ন মডেল ভিন্নভাবে মূল্যায়ন ও স্কোর দেয়।

উদাহরণ হিসেবে বলা হয়, মিস্ট্রাল মডারেশন এন্ডপয়েন্টসহ কিছু সিস্টেম অনেক ক্ষেত্রে স্কোরকে প্রায় ১-এর কাছাকাছি রাখে। এর অর্থ, এসব সিস্টেম প্রায় সব ক্ষেত্রে কনটেন্টকে অত্যন্ত ঘৃণামূলক হিসেবে চিহ্নিত করে। অন্যদিকে ওপেনএআই মডারেশন এন্ডপয়েন্ট অনেক ক্ষেত্রে তুলনামূলকভাবে কম স্কোর দেয়। কখনো কখনো অন্যান্য মডেলের তুলনায় অর্ধেকের কম স্কোর দেয়। গবেষকদের ভাষায়, একই কনটেন্ট যদি দুটি সিস্টেমে ভিন্নভাবে চিহ্নিত হয়—একটিতে ঘৃণামূলক বক্তব্য হিসেবে ধরা পড়ে, অন্যটিতে পড়ে না—তাহলে তা মডারেশনের প্রক্রিয়ার গ্রহণযোগ্যতাকে দুর্বল করে দেয়।

এআই–ভিত্তিক ঘৃণামূলক বক্তব্য শনাক্তের সীমাবদ্ধতা

এআই বা এলএলএম তখনই কোনো লেখাকে ‘ঘৃণামূলক বক্তব্য’ হিসেবে খুব সহজে ধরে ফেলে, যখন সেখানে সরাসরি কোনো গালিগালাজ, আপত্তিকর শব্দ বা চেনা কোনো অপবাদ ব্যবহার করা হয়। একে বলা হয় ‘সুস্পষ্ট’ ঘৃণামূলক বক্তব্য। কিন্তু মানুষ যখন সরাসরি কোনো খারাপ শব্দ ব্যবহার না করে, ঘুরিয়ে বা সূক্ষ্ম ও পরোক্ষভাবে কাউকে হেয় করে কথা বলে, তখন এআইয়ের পক্ষে সেই চতুরতা ধরা কঠিন হয়ে পড়ে।

লন্ডনের কুইন মেরি বিশ্ববিদ্যালয়ের সহযোগী অধ্যাপক এবং বিশ্ববিদ্যালয়টির সোশ্যাল ডেটা সায়েন্স ল্যাবের সহপ্রধান আর্কাইত্জ জুবিয়াগা আল–জাজিরাকে বলেন, ‘পরোক্ষ বা ইঙ্গিতপূর্ণ ঘৃণামূলক বক্তব্য এক বড় চ্যালেঞ্জ। এ ক্ষেত্রে সাধারণত কোনো গালিগালাজ বা অপমানজনক শব্দ ব্যবহার করা হয় না বলে অনেক সময় তা ঘৃণামূলক বক্তব্য হিসেবে শনাক্ত হয় না।’ জুবিয়াগা উদাহরণ দিয়ে বলেন, ‘ধরুন, একটি বার্তা শুরু হলো এভাবে—পৃথিবীটা কত সুন্দর হতো যদি...’। এরপর সেখানে কোনো একটি গোষ্ঠীকে হেয় বা অবমাননাকর মন্তব্য করা হলো। বার্তার প্রথম অংশ ইতিবাচক শোনালেও পরের অংশে ঘৃণা প্রকাশ পেতে পারে। কিন্তু এআই সিস্টেম অনেক সময় বার্তার ইতিবাচক দিক বেশি গুরুত্ব দেয়, ফলে ভেতরে থাকা ঘৃণার বিষয়টি ধরতে হিমশিম খায়।’

জুবিয়াগা বিপরীত একটি সমস্যার কথাও বলছেন। তিনি বলেন, এখানে ভাষার একটি বিশেষ রূপ দেখা যায়, যাকে বলে ‘রিক্লেইমড ল্যাঙ্গুয়েজ’ বা অধিকার ফিরিয়ে নেওয়া ভাষা। এর মানে হলো, অতীতের কোনো এক সময় যে শব্দগুলো কোনো অবহেলিত বা প্রান্তিক গোষ্ঠীকে অপমান ও হেয় করার জন্য গালি হিসেবে ব্যবহার করা হতো, পরে সেই গোষ্ঠীর মানুষেরাই শব্দগুলো নিজেদের আপন করে নেয় এবং নিজেদের মধ্যে সাধারণ কথাবার্তায় ব্যবহার করতে শুরু করে। ফলে এককালের অপমানসূচক শব্দগুলোই পরে তাদের নিজেদের যোগাযোগের মাধ্যম হয়ে ওঠে। এই অধ্যাপকের মতে, ‘ভাষার এ ধরনের ব্যবহারকে ঘৃণামূলক বক্তব্য হিসেবে চিহ্নিত করা উচিত নয়। কিন্তু এআই সিস্টেমগুলো অনেক সময় এসবও ভুলভাবে ঘৃণামূলক বলে শনাক্ত করে।’