না শিখিয়েই অনুবাদ করতে শিখছে এআই
১৫ এপ্রিল, ২০২৬
এআই মডেলগুলো এখন প্রথাগত প্রশিক্ষণ ছাড়াই অনুবাদ করার ক্ষমতা অর্জন করছে। এটা শুনতে দারুণ হলেও, এই প্রযুক্তি তৈরির কারিগরদের নিয়ন্ত্রণের অভাবকেও চোখে আঙুল দিয়ে দেখিয়ে দেয়।
বেশিরভাগ মানুষ এখনও মেশিন ট্রান্সলেশনকে একটি গোছানো ও নিয়ন্ত্রিত কাজ বলে মনে করেন। তারা ভাবেন, প্রকৌশলীরা একটি মডেলে দুটি ভাষার লক্ষ লক্ষ বাক্য জোড়া দিয়ে দেন, সিস্টেমটি সেই মিলগুলো বিশ্লেষণ করে, এবং তার ফল হিসেবে একটি অনুবাদক তৈরি হয়। কিন্তু এই ধারণা এখন একেবারেই সেকেলে। আজকের কিছু বৃহৎ এআই মডেল নিজে থেকেই অনুবাদের দক্ষতা অর্জন করছে। বিশাল পরিমাণ বহুভাষিক লেখা পড়ার মাধ্যমে এবং ভাষার গঠন বোঝার মাধ্যমে তারা এটা শিখছে। এটি একটি উল্লেখযোগ্য পরিবর্তন। এটি একটি সতর্কবার্তাও বটে। এই সিস্টেমগুলো যত সক্ষম হচ্ছে, ততই স্পষ্ট হচ্ছে যে এদের নির্মাতারাও পুরোপুরি জানেন না যে এগুলো ঠিক কী শিখছে।
এটি কোনো কল্পবিজ্ঞান নয়, বা নিছক বিজ্ঞাপনের ভাষাও নয়। গবেষকরা বেশ কয়েক বছর ধরে এআই-এর এই "স্বতঃস্ফূর্ত" বহুভাষিক দক্ষতার প্রমাণ নথিভুক্ত করছেন। গুগলের বহুভাষিক নিউরাল মেশিন ট্রান্সলেশন নিয়ে করা একটি গবেষণায় দেখা গেছে, অনেকগুলো ভাষার জুটির ওপর প্রশিক্ষণপ্রাপ্ত মডেলগুলো এমন ভাষার মধ্যেও "জিরো-শট" অনুবাদ করতে পারে, যেগুলোর জন্য তাদের সরাসরি প্রশিক্ষণ দেওয়া হয়নি। পুরনো ধারণার ওপর এটি ছিল একটি বড় আঘাত, যেখানে মনে করা হতো যে প্রতিটি অনুবাদের জন্য আলাদাভাবে শেখাতে হবে। এরপর থেকে, ইন্টারনেটের বিশাল ডেটাসেটের ওপর প্রশিক্ষিত লার্জ ল্যাঙ্গুয়েজ মডেলগুলো এই ধারণাকে আরও এগিয়ে নিয়ে গেছে। জিপিটি-স্টাইলের সিস্টেম, মেটার বহুভাষিক মডেল এবং লামা-এর মতো ওপেন মডেলগুলো দেখিয়েছে যে, অনুবাদ তাদের প্রধান কাজ না হলেও তারা বিভিন্ন ভাষার মধ্যে অনুবাদ, সারসংক্ষেপ এবং প্রশ্নের উত্তর দিতে পারে।
যেসব ভাষায় অনলাইন তথ্য বেশি, সেগুলোর ক্ষেত্রে এর প্রমাণ সবচেয়ে জোরালো। ইংরেজি, স্প্যানিশ, ফরাসি, জার্মান, চীনা, আরবি এবং আরও কয়েকটি ভাষা ইন্টারনেটের লেখায় আধিপত্য বিস্তার করে, যা এই সিস্টেমগুলো গ্রহণ করে। ডিপমাইন্ড, গুগল, মেটা এবং বড় বিশ্ববিদ্যালয়গুলোর মতো প্রতিষ্ঠানগুলোর গবেষণায় বারবার দেখা গেছে যে, বহুভাষিক প্রশিক্ষণের পরিধি বাড়ালে এক ভাষা থেকে অন্য ভাষায় জ্ঞান স্থানান্তরের ক্ষমতাও বাড়ে। সহজ কথায়, একটি মডেল যদি অনেক ভাষা সম্পর্কে যথেষ্ট জ্ঞান অর্জন করে, তবে এটি অনেক সময় প্রতিটি জুটির জন্য সরাসরি উদাহরণ না দেখিয়েই তাদের মধ্যে অর্থ স্থাপন করতে পারে। এর ফলাফল প্রায় অলৌকিক মনে হতে পারে। সিস্টেমটিকে একটি ধারণা এক ভাষা থেকে অন্য ভাষায় নিয়ে যেতে বললে, এটি প্রায়শই তা করতে পারে।
কিন্তু "এআই নিজে নিজেই অনুবাদ শিখতে পারে" – এই আকর্ষণীয় শিরোনামটি সতর্কতার সাথে গ্রহণ করা উচিত। প্রথমত, সত্য হলো এই মডেলগুলো শূন্য থেকে কিছু শেখে না। ওয়েব, বই, কোড এবং অন্যান্য বড় উৎস থেকে সংগ্রহ করা মানুষের তৈরি বিশাল পরিমাণ লেখার ওপর তাদের প্রশিক্ষণ দেওয়া হয়। তারা নিজেরা কোনো ভাষা তৈরি করছে না। দ্বিতীয়ত, একে "স্বশিক্ষিত" বলাটা সহজ হলেও কিছুটা বিভ্রান্তিকর হতে পারে। আসলে যা ঘটছে তা হলো, মডেলটি বহুভাষিক লেখা থেকে এমন সব প্যাটার্ন বের করছে, যার ফলে সাধারণ ভাষা শেখার একটি উপজাত হিসেবে অনুবাদ করার ক্ষমতা তৈরি হচ্ছে। এই ব্যাখ্যাটি শিরোনামের মতো রোমাঞ্চকর না হলেও, বাস্তবতার নিরিখে এটি হয়তো আরও বেশি গুরুত্বপূর্ণ।
এমনটা কেন হয়? কারণ অনুবাদ কেবল অভিধানের শব্দ মেলানো নয়। এটি অর্থ, বাক্য গঠন, প্রসঙ্গ এবং সাধারণ জ্ঞানের ওপর ভিত্তি করে প্যাটার্ন মেলানোর কাজ। পর্যাপ্ত ডেটা এবং কম্পিউটিং শক্তি পেলে বড় মডেলগুলো এই প্যাটার্ন খুঁজে বের করতে অত্যন্ত পারদর্শী। যদি একটি সিস্টেম একাধিক ভাষায় একই নাম, ঘটনা, পণ্য, স্থান এবং ধারণা বারবার দেখতে পায়, তবে এটি সেগুলোর মধ্যে সংযোগ স্থাপন করার জন্য অভ্যন্তরীণ একটি কাঠামো তৈরি করতে শুরু করে। গবেষকরা প্রায়শই এটিকে একটি "ভাগ করা смиতি স্থান" (shared semantic space) হিসেবে বর্ণনা করেন। শব্দটি শুনতে জটিল মনে হলেও, এর মূল কথা সহজ: মডেলটি বিভিন্ন ভাষার মধ্যে ধারণাকে বহনযোগ্য বলে মনে করতে শুরু করে।
এটি এআই-এর অর্থনীতিকে বদলে দিচ্ছে। প্রথাগত অনুবাদ সিস্টেমের জন্য সমান্তরাল ডেটা সাবধানে সংগ্রহ করতে হতো, যা ব্যয়বহুল এবং ছোট ভাষাগুলোর জন্য প্রায়ই দুষ্প্রাপ্য। যদি সাধারণ মডেলগুলো মিশ্র বহুভাষিক লেখা থেকে অনুবাদের ক্ষমতা অর্জন করতে পারে, তাহলে কোম্পানিগুলো আরও দ্রুত এবং সস্তায় নতুন পণ্য বাজারে আনতে পারবে। একারণেই এই প্রবণতা গবেষণাগারের বাইরেও গুরুত্বপূর্ণ। এটি সার্চ, কাস্টমার সার্ভিস, সোশ্যাল মিডিয়া মডারেশন, আন্তর্জাতিক বাণিজ্য, শিক্ষা সরঞ্জাম এবং ভয়েস অ্যাসিস্ট্যান্টের মতো ক্ষেত্রকে প্রভাবিত করছে। অনুবাদ এখন আর কোনো আলাদা ফিচার নয়। এটি সাধারণ এআই সিস্টেমের একটি অন্তর্নির্মিত অংশ হয়ে উঠছে।
এর মধ্যে গণতান্ত্রিকীকরণের একটি আকর্ষণীয় দিকও রয়েছে। সবচেয়ে ভালো দিকটি হলো, যে মডেলগুলো বিভিন্ন ভাষায় কাজ করতে পারে, সেগুলো আরও বেশি মানুষকে তাদের নিজের ভাষায় অনলাইনে আনতে সাহায্য করতে পারে। তারা স্কুল, ক্লিনিক, অভিবাসী এবং ছোট ব্যবসার জন্য কম খরচে অনুবাদের ব্যবস্থা করতে পারে। যেসব দেশে অনেক স্থানীয় ভাষা রয়েছে এবং ডিজিটাল রিসোর্স সীমিত, সেখানে এটি অত্যন্ত গুরুত্বপূর্ণ। ইউনেসকো এবং অন্যান্য বিশ্ব সংস্থা দীর্ঘদিন ধরে সেই সব ভাষার ডিজিটাল বঞ্চনা নিয়ে সতর্ক করে আসছে, যাদের অনলাইন উপস্থিতি দুর্বল। এআই যদি সেই বাধা কমিয়ে দেয়, তবে এর সুবিধাগুলো বাস্তব।
এবার কঠিন সত্য। এই একই প্রবণতা বৈষম্যকেও আরও গভীর করতে পারে। যেখানে ডেটা সবচেয়ে বেশি, সেখানে এই সিস্টেমগুলো সবচেয়ে শক্তিশালী এবং যেখানে সবচেয়ে বেশি প্রয়োজন, সেখানে সবচেয়ে দুর্বল। বহুভাষিক এনএলপি (NLP) নিয়ে গবেষণায় বারবার একটি মারাত্মক ভারসাম্যহীনতা দেখা গেছে: অল্প কয়েকটি ভাষা ডেটা, বেঞ্চমার্ক এবং প্রকৌশলীদের মনোযোগের বেশিরভাগ অংশ দখল করে আছে। কম রিসোর্স থাকা ভাষা, আদিবাসী ভাষা এবং উপভাষাগুলো প্রায়ই খারাপভাবে পরিচালনা করা হয় বা উপেক্ষা করা হয়। একটি মডেল হয়তো একটি প্রধান ভাষায় বেশ সাবলীল, কিন্তু একটি আঞ্চলিক ভাষায় গিয়ে बुरीভাবে ব্যর্থ হতে পারে, অথবা স্থানীয় অর্থকে একটি মানসম্মত রূপে বদলে দিতে পারে। এটি কোনো প্রযুক্তিগত ত্রুটি নয়। এটি ক্ষমতার প্রশ্ন। ভাষা আইন, পরিচয়, সংস্কৃতি এবং বিশ্বাস বহন করে। হাসপাতাল, আদালত বা সরকারি দপ্তরে ভুল অনুবাদের ফল সামান্য কোনো সমস্যা নয়, বরং এটি গুরুতর হতে পারে।
আরও একটি সমস্যা আছে যা এআই শিল্প এড়িয়ে যেতে পছন্দ করে। যদি মডেলগুলো পরোক্ষভাবে দক্ষতা শেখে, তবে তাদের পরীক্ষা এবং নিয়ন্ত্রণ করা কঠিন হয়ে পড়ে। ডেভেলপাররা একটি সিস্টেমকে এক উদ্দেশ্যে বিশেষ কাজের জন্য প্রস্তুত করতে পারে, কিন্তু তারপরেও অন্য ক্ষেত্রে অপ্রত্যাশিত ক্ষমতা বা ব্যর্থতা দেখা দিতে পারে। এটি প্রতিটি ক্ষেত্রে বিপদের প্রমাণ না হলেও, এটি একটি সত্যিকারের প্রশাসনিক চ্যালেঞ্জ। যদি একটি কোম্পানি পরিষ্কারভাবে ব্যাখ্যা করতে না পারে যে কোন ডেটা এবং প্রশিক্ষণের ধাপ থেকে কোন ভাষাগত আচরণ তৈরি হয়েছে, তাহলে নিয়ন্ত্রক এবং ব্যবহারকারীদের হাতে একটি পণ্যের মোড়কে আবৃত "ব্ল্যাক বক্স" ছাড়া আর কিছুই থাকে না।
এর উত্তর আতঙ্কিত হওয়া নয়, এবং অবশ্যই অন্ধভাবে প্রশংসা করাও নয়। এর উত্তর হলো নিয়মানুবর্তী স্বচ্ছতা। কোম্পানিগুলোর উচিত প্রকাশ করা যে তাদের সিস্টেম কোন ভাষাগুলোতে নির্ভরযোগ্যভাবে পরীক্ষা করা হয়েছে এবং কোনগুলোতে হয়নি। এটি একটি মৌলিক বিষয়, কারণ এর প্রয়োজন আছে। এখনও অনেক এআই পণ্য "বহুভাষিক" দক্ষতার বিজ্ঞাপন এমনভাবে দেয়, যেন সব ভাষায় এর মান সমান। কিন্তু তা সত্যি নয়। পাবলিক বেঞ্চমার্কগুলোতে আরও বেশি ভাষা অন্তর্ভুক্ত করা উচিত, বিশেষ করে যেগুলি ডিজিটালি পিছিয়ে আছে। সরকার এবং বিশ্ববিদ্যালয়গুলোর উচিত কম প্রতিনিধিত্বকারী ভাষাগুলোর জন্য উন্মুক্ত ডেটাসেট এবং মূল্যায়ন সরঞ্জামে বিনিয়োগ করা, তবে তা স্থানীয় সম্মতি এবং অংশগ্রহণের মাধ্যমে। যদি অনুবাদের ভবিষ্যৎ বিশাল মডেল দ্বারা নির্ধারিত হয়, তবে বিশ্বের সবচেয়ে লাভজনক কয়েকটি ভাষার ওপর ভিত্তি করে তৈরি একটি সিস্টেমকে জনগণের মেনে নেওয়ার কোনো কারণ নেই।
ডেভেলপারদেরও এটা ভান করা বন্ধ করতে হবে যে, শুধু আকার বড় হলেই মডেল জ্ঞানী হয়ে যায়। হ্যাঁ, বড় মডেলগুলো ভাষার মধ্যেকার চিত্তাকর্ষক প্যাটার্ন আবিষ্কার করতে পারে। কিন্তু তারা পক্ষপাতদুষ্ট ধারণাও গ্রহণ করতে পারে, সংবেদনশীল ধারণার ভুল অনুবাদ করতে পারে বা সূক্ষ্ম তারতম্য মুছে ফেলতে পারে। মানুষ অনুবাদক, ভাষাবিদ এবং স্থানীয় বিশেষজ্ঞরা এখনও গুরুত্বপূর্ণ। প্রকৃতপক্ষে, যখন এআই সিস্টেমগুলো ক্রেতা এবং কর্মকর্তাদের অতিরিক্ত বিশ্বাস করতে বোকা বানানোর মতো যথেষ্ট দক্ষ দেখায়, তখন তাদের গুরুত্ব আরও বেড়ে যায়। বিপদ এটা নয় যে এআই অনুবাদ অকেজো। বিপদ হলো এটি এতটাই কার্যকর যে তা অসাবধানভাবে ব্যবহার করা হতে পারে।
পুরনো গল্পটি ছিল যে, যন্ত্র অনুবাদ করে কারণ মানুষ তাদের প্রতিটি পদক্ষেপ স্পষ্টভাবে শিখিয়েছে। নতুন গল্পটি আরও জটিল এবং শক্তিশালী। এআই মডেলগুলো ব্যাপক ভাষা শেখার একটি পার্শ্ব-প্রতিক্রিয়া হিসেবে অনুবাদের ক্ষমতা অর্জন করতে পারে। এটি একটি সত্যিকারের প্রযুক্তিগত অগ্রগতি। এটি একটি রাজনৈতিক এবং সাংস্কৃতিক বিভেদরেখাও হতে পারে। যখন একটি যন্ত্রকে সরাসরি পদ্ধতি না শিখিয়ে দেওয়ার পরেও ভাষাগুলোর মধ্যে সেতু বন্ধন করতে শুরু করে, তখন সেই অর্জনটি বাস্তব। এর সাথে আসা দায়িত্বও বাস্তব। অনুবাদ কেবল শব্দ নিয়ে নয়। এর মূল কথা হলো, কার অর্থ এই পারাপার পেরিয়ে টিকে থাকে।
Source: Editorial Desk