Roar বাংলা - গেম থিওরি: বুদ্ধিদীপ্ত সিদ্ধান্ত গ্রহণের বিজ্ঞান

‘অ্যা বিউটিফুল মাইন্ড’ সিনেমার কথা মনে আছে? যেখানে একজন তুখোড় মেধাবী গণিতবিদের সিজোফ্রেনিয়ার সাথে যুদ্ধ করে এগিয়ে চলার গল্প বলা হয়েছে। সিনেমাটি মুক্তির পরে জন ফোর্বস ন্যাশ নামক এই গণিতবিদ রাতারাতি সাধারণ মানুষের মধ্যে প্রচুর জনপ্রিয়তা লাভ করেন। মাত্র ২১ বছর বয়সে তিনি যে পিএইচডি থিসিসটি জমা দিয়েছিলেন, সেটির উপর ভিত্তি করে আবিষ্কৃত তত্ত্বের জন্যে পরবর্তীতে তিনি নোবেল পুরষ্কার লাভ করেছিলেন। থিসিসটির শিরোনাম ছিল ‘Non Cooperative Game’। অনেকে ভাবতে পারেন, গণিতের মাঝে ‘গেম’ কেন এলো? সত্যি বলতে, গেম থিওরি নামে একটি বিশাল তত্ত্ব রয়েছে, যেটি এখন আর শুধু গণিত কিংবা বিজ্ঞানের মাঝেই সীমাবদ্ধ নয়। অর্থনীতি, সামাজিক বিজ্ঞান, রাজনীতি, বাণিজ্য, আন্তর্জাতিক সম্পর্কসহ অনেক জায়গাতেই রয়েছে এর ব্যবহার।

প্রতিযোগিতাপূর্ণ সম্পর্কে লিপ্ত এরকম একাধিক এজেন্টের বুদ্ধিদীপ্ত আচরণ কেমন হওয়া উচিত, গেম থিওরি সে সম্পর্কে একটি তাত্ত্বিক ফ্রেমওয়ার্ক তৈরি করে দেয়। অনেক জায়গায় একে ‘কৌশলের বিজ্ঞান’ বলা হয়। প্রতিযোগিতায় লিপ্ত এজেন্টদেরকে এখানে ‘প্লেয়ার’ হিসেবে পর্যালোচনা করা হয়। প্লেয়ারদের মধ্যেকার এই প্রতিযোগিতাটিকে ‘গেম’ বলা হয়। প্লেয়ারদের কার্যক্রমের উপরে নির্ভর করে পুরো গেমের একটি ফলাফল পাওয়া যায়। গেম থিওরি ব্যবহার করে বাস্তব পৃথিবীতে এ ধরনের সম্পর্কগুলোর ভবিষ্যৎ অনুমান করা যায়। তবে, গেম থিওরি কাজ করবে শুধুমাত্র যখন মানুষ যুক্তিসঙ্গত সিদ্ধান্ত নেবে।

গেম থিওরির প্রথম গাণিতিক ফর্মুলা দিয়েছিলেন জন ভন নিউম্যান এবং অস্কার মরগেনস্টার্ন। তাদের এই ফ্রেমওয়ার্কের বিভিন্ন সীমাবদ্ধতার কারণে প্রথম দিকে এই থিওরি শুধুমাত্র নির্দিষ্ট ও সীমিত শর্তের মধ্যে ব্যবহার করতে হতো। তবে, গত সাত দশক ধরে এই অবস্থাটির পরিবর্তন হয়েছে। নিউম্যান ও মরগেনস্টার্নের পরে এই থিওরিতে জন ন্যাশই প্রথম কোনো তাৎপর্যপূর্ণ অবদান রাখেন। ফলে, গেম থিওরির একটি জেনারেলাইজড ফ্রেমওয়ার্ক তৈরি হয়েছে যেটা অর্থনীতি, সামাজিক বিজ্ঞান, বাণিজ্য, আন্তর্জাতিক সম্পর্ক, কম্পিউটার বিজ্ঞান, জীববিজ্ঞানসহ আরো অনেক ক্ষেত্রেই ব্যবহার করা যায়। সত্তরের দশকের পর থেকেই যেকোনো বিশ্লেষকের জন্যে গেম থিওরি সবচেয়ে গুরুত্বপূর্ণ টুল হয়ে দাঁড়িয়েছে, যেখানে তাকে বুদ্ধিমান অন্য প্রতিপক্ষের সিদ্ধান্তের মুখোমুখি হতে হয়।

এই লেখায় আমরা গেম থিওরির তাত্ত্বিক অংশটি আলোচনা করব না। বরং, বিভিন্নরকম উদাহরণ ব্যবহার করে যুক্তিসঙ্গত সিদ্ধান্ত নেওয়ার প্যাটার্ন বুঝার চেষ্টা করব। এরকম একটি আলোচনার জায়গা হচ্ছে বাণিজ্য।

তীব্র প্রতিযোগিতায় লিপ্ত রয়েছে এমন অনেকগুলো ব্যবসা প্রতিষ্ঠানের উদাহরণ দেওয়া যাবে। এ রকম একটি উদাহরণ হচ্ছে পেপসি ও কোকাকোলার প্রতিদ্বন্দ্বিতা। মনে করা যাক, কোকাকোলা সিদ্ধান্ত নিল তাদের পণ্যের মূল্য কমিয়ে দেবে। ফলে, পেপসির তুলনায় তাদের বিক্রি বেশি হবে। এভাবে, তারা বেশি মুনাফা অর্জন করতে পারবে।

অন্যদিকে, পেপসি নিশ্চয়ই চাইবে না ক্রেতা হারাতে। তাই তারাও মূল্য কমিয়ে দিতে বাধ্য হবে। এভাবে তারা একটি সমতার অবস্থানে আসবে যেখানে দুইটি পণ্যেরই মূল্য সমান। যেহেতু মূল্য কমানোর ফলে আদতে কোকাকোলা বেশি ক্রেতা আকর্ষণ করতে পারছে না, কোকাকোলা তাই মূল্য কমানোর কথা ভাববে না। এভাবে, কোম্পানিগুলোর মধ্যে একটি অলিখিত চুক্তি থাকে, তারা মূল্য বেশি রাখবে এবং তাতে লাভও বেশি হবে।

গেম থিওরি ব্যবহার করে আরেকটি প্রশ্নের উত্তর দেওয়া যায়। সেটি হচ্ছে, বেশিরভাগ দোকান কেন গুচ্ছাকারে থাকে। অনেক সময়েই কয়েক মাইল জুড়ে কোনো রেস্টুরেন্ট পাওয়া যায় না। কিন্তু দেখা যায়, এক জায়গায় অনেক কোম্পানির রেস্টুরেন্ট একত্রিত হয়ে আছে। মনে করা যাক, আপনি সিদ্ধান্ত নিলেন সমুদ্র সৈকতে আইসক্রিম বিক্রি করবেন। সৈকতটি এক মাইল লম্বা। তাহলে কোন জায়গাটি আপনার দোকানের জন্যে বেছে নিলে সবচেয়ে বেশি লাভ করতে পারবেন? অবশ্যই মাঝখানে, তাই তো? ধরা যাক, আপনি সেখানেই দোকান বসালেন।

পরদিন সৈকতে গিয়ে দেখলেন, আপনার বন্ধু আরেকটি আইসক্রিম দোকান দিয়েছে। আপনারা সিদ্ধান্ত নিলেন যে, সৈকত নিজেদের মধ্যে ভাগাভাগি করে নেবেন। তাই, আপনার দোকানটি সৈকতের মাঝ থেকে এক চতুর্থাংশ ডানে সরালেন। আর আপনার বন্ধুটির দোকান নিয়ে গেল মাঝ থেকে এক চতুর্থাংশ বামে। এর ফলে, সৈকতের ডানে যারা ঘুরতে গেল, তারা সবাই আপনার থেকেই আইসক্রিম কিনল। আর বামপাশে যারা এসেছিল, তারা আইসক্রিম কিনল আপনার বন্ধুর দোকান থেকে। ক্রেতাদের জন্যে এটা সবচেয়ে ভালো অবস্থান হলো।

সৈকত নিজেদের মধ্যে ভাগাভাগি করে নেওয়া হলো; Image Source: Ted-Ed

পরদিন সৈকতে গিয়ে দেখলেন, আপনার বন্ধু বেশি ক্রেতা পাওয়ার জন্যে তার দোকানটি মাঝখানে নিয়ে এসেছে। অর্থাৎ, বামের সব ক্রেতা তো সে পাচ্ছেই, আবার আপনার ক্রেতার একটা অংশও তার দোকানে যাচ্ছে। আইসক্রিম যুদ্ধে জেতার জন্যে পরদিন আপনি আপনার বন্ধুর অঞ্চলে গিয়ে দোকান বসালেন। আপনার বন্ধুও কম যা য়না, সে আপনার দোকান থেকে একশ মিটার ডানে দোকান বসাল। ফলে, ডানের বড় অঞ্চলের ক্রেতা তার ভাগে চলে এলো। আপনি সে ভাগ পাওয়ার জন্যে তার একশ মিটার ডানে বসালেন। সে আবারো তার দোকান সরালো, আপনি আপনার দোকান সরালেন। এভাবে, সারাদিন ধরে আপনি আর আপনার বন্ধু দোকান সরানোর যুদ্ধে লিপ্ত হলেন। শেষে, দুজনই সৈকতের মাঝে গিয়ে স্থির হলেন, যেখানে দুজনই অর্ধেক ক্রেতা পাচ্ছিলেন।

আপনারা এমন অবস্থানে এলেন, যেটাকে বলা হয় ‘ন্যাশ ইকুইলিব্রিয়াম’। এই অবস্থান থেকে সরে কেউই নিজেদের উন্নতি করতে পারবেন না। আপনি দোকান সরালে আপনার বন্ধু বেশি ক্রেতা পাবে আবার আপনার বন্ধু তার দোকান সরালে আপনি বেশি ক্রেতা পাবেন। আপনাদের প্রথম যে কৌশলটি ছিল, সেটি টেকেনি কারণ সেটি ন্যাশ ইকুইলিব্রিয়ামের সংজ্ঞায়িত কোনো সাম্যাবস্থায় ছিল না। তাই, আপনার বন্ধু দোকান সরিয়ে নিজের অবস্থানের উন্নতি করতে পেরেছিল। সত্যিকার পৃথিবীতে এ কারণেই কোম্পানিগুলো তাদের দোকান পাশাপাশি রাখে। কারণ ন্যাশ ইকুইলিব্রিয়াম অর্জন না করতে পারলে তারা প্রতিপক্ষের তুমুল প্রতিযোগিতার শিকার হবে। আর সেখানে ক্রেতারা সব জায়গা থেকেই হাজির হতে পারে।

আপনার ও বন্ধুর মধ্যেকার ন্যাশ ইকুইলিব্রিয়াম; Image Source: Ted-Ed

গাণিতিক ও যৌক্তিকভাবে গেম থিওরির ফ্রেমওয়ার্ক ১৯৪৪ সালে এলেও, অনেক প্রাচীন সময় থেকেই এরকম যুক্তিসঙ্গত চিন্তাভাবনার উদাহরণ পাওয়া যায়। সক্রেটিস ব্যাটল অব ডেলিয়ামের এ রকম একটি গল্প বলেছেন: একজন সৈন্য তার কমরেডের সাথে সম্মুখ শিবিরে শত্রুর আক্রমণ প্রতিরোধের জন্যে অপেক্ষা করছে। যদি তাদের প্রতিরোধ সফল হয়, তাহলে তার ব্যক্তিগত অবদান এক্ষেত্রে অপরিহার্য নয়। সে যদি যুদ্ধে অবস্থান করে, তাহলে তার আহত বা নিহত হওয়ার একটি ঝুঁকি থেকে যায়। যেহেতু তার অবদান অপরিহার্য নয়, তাই এই ঝুঁকি নেওয়ার কোনো যৌক্তিকতা নেই। অন্যদিকে, শত্রুপক্ষ যদি যুদ্ধে জিতে যায়, তার মৃত্যুঝুঁকি তখন আরো বেশি। আর এক্ষেত্রে এই ঝুঁকিটি একদমই অর্থহীন। কারণ, সে যুদ্ধে অংশগ্রহণ করলেও তাদের প্রতিরক্ষা ভেঙে পড়বে। ফলে, যুদ্ধের ফলাফল যাই হোক না কেন যুদ্ধক্ষেত্র থেকে পালিয়ে যাওয়াই সৈন্যটির জন্যে সবচেয়ে ভালো সিদ্ধান্ত।

এখানে সৈন্যদলের সবাই একইরকম পরিস্থিতিতে রয়েছে। তাই, তারা সবাই যদি একইরকম চিন্তা করে, তাহলে অবশ্যই সেই পরিস্থিতিরই উদ্ভব হবে যেখানে যুদ্ধটি তারা হেরে গেছে। অর্থাৎ, তারা কেউই যুদ্ধে অংশগ্রহণ করতে চাইবে না। ব্যক্তিগতভাবে সবার আলাদা আলাদা সিদ্ধান্ত এখানে এমন একটি পরিস্থিতি তৈরি করেছে, যেটা সবার জন্যেই অনাকাঙ্ক্ষিত ছিল। প্রশ্ন হচ্ছে, বাস্তবে যুদ্ধক্ষেত্রে কি সৈন্যরা এভাবে চিন্তা করে? বরং সেখানে উল্টোটা দেখা যায়। যে সৈন্যের মাঝে যুদ্ধ হেরে যাওয়ার ভয় যতো বেশি, তাকে তত বেশি উদ্দীপ্ত দেখা যায়। অন্যদিকে, যে সৈন্যদলের বিশ্বাস বেশি থাকে যে, তারা জিতবে, তত বেশি তাদেরকে ব্যক্তিগত অবদানের ক্ষেত্রে অমনোযোগী হতে দেখা যায়।

গেম থিওরি আসার বহু আগেই এ ধরনের পরিস্থিতি এড়ানোর জন্যে সামরিক নেতাদের বিভিন্ন পদক্ষেপ নিতে দেখা গেছে। এ রকম একজন সামরিক নেতা ছিলেন স্প্যানিশ বীর হারন্যান করটেজ। মেক্সিকোতে তিনি যখন ছোট একটি বাহিনী নিয়ে গিয়েছিলেন, তার সৈন্যদের নিজেদের সামর্থ্যে সন্দেহ করার বিশাল একটি কারণ ছিল। কারণ সেখানে অ্যাজটেক বাহিনীর সংখ্যা ছিল বিশাল। তার সৈন্যরা ভয়ার্ত অবস্থায় পালিয়ে যেতে পারে, এই ধারণা করটেজের চিন্তায় ছিল। তাই তিনি নিজেদের সমস্ত জাহাজ পুড়িয়ে দিয়েছিলেন। তাতে নিজের বাহিনীর পালানোর আর কোনো উপায় ছিল না। পালিয়ে যাওয়া যখন অসম্ভব হয়ে উঠল, তখন স্প্যানিশ সৈন্যদের বেঁচে থাকার জন্যে প্রাণপণে যুদ্ধ করাই একমাত্র উপায় হয়ে ওঠে।

করটেজ তার জাহাজগুলো এমনভাবে পুড়িয়েছিল যেন তা সবাই দেখতে পায়। এই কাজটি শত্রুদের অর্থাৎ অ্যাজটেকদের মধ্যে একটি নিরুৎসাহ তৈরি করে। তারা ভেবেছিল, কোনো কম্যান্ডার যদি তার পালানোর একমাত্র রাস্তা নষ্ট করে ফেলার সাহস রাখে, তার পেছনে অবশ্যই কোনো কারণ রয়েছে। যে কারণটা তার ছোট বাহিনী হওয়া সত্ত্বেও এতবড় আত্মবিশ্বাস জুগিয়েছে। যে কম্যান্ডারের না হারার জন্যে এরকম কারণ রয়েছে তার বিপক্ষে যুদ্ধ করা অ্যাজটেক সৈন্যরা সমীচীন মনে করেনি। ফলে, করটেজ সহজ একটি জয় পেয়েছিলেন।

এরকম যুক্তি প্রয়োগের আরেকটি ক্ল্যাসিক উৎস হলো শেকসপিয়ারের হেনরি ফাইভ। এজিনকোর্টের যুদ্ধের সময়ে হেনরি সিদ্ধান্ত নিয়েছিল, শত্রুদের সামনে সে তার ফরাসি কয়েদীদের হত্যা করবে। অবশ্য হেনরির যুক্তি ছিল, বন্দিরা নিজেদের মুক্ত করে হেনরিকে ঝুঁকির মধ্যে ফেলে দেবে। কিন্তু গেম থিওরির আলোকে ব্যাপারটিকে ভিন্নভাবে ব্যাখ্যা করা যায়। হেনরির সৈন্যরা দেখেছে যে, বন্দিরা নিহত হয়েছে। তারা এটাও জানে যে, শত্রুপক্ষও এই হত্যাগুলো প্রত্যক্ষ করেছে। তাই, হেনরির সৈন্যরা জানে, তারা যদি যুদ্ধে হেরে শত্রুপক্ষের জেলে বন্দি হয়, শত্রুরা এই হত্যার প্রতিশোধ নেবে। অর্থাৎ, তাদের পরিণতি ভয়াবহ হবে। করটেজের সৈন্যদের মতোই, কিন্তু রূপকভাবে তাদের জাহাজগুলো এক্ষেত্রে পোড়ানো হয়ে গেছে। অর্থাৎ, পালানোর আর রাস্তা নেই।

থমাস হবসের বই লেভিয়্যাথানকে আধুনিক রাজনৈতিক দর্শনের একটি ভিত্তি ধরা হয়। এই বইয়ে নাগরিকের উপরে রাষ্ট্রের আইন প্রয়োগের ন্যায্যতার পক্ষে যুক্তি দেখানো হয়। এখানেও, গেম থিওরির কৌশল দেখা যায়। হবস দাবি করেছেন, সব মানুষের জন্যে সবচেয়ে ভালো অবস্থা হচ্ছে যেখানে তারা যে যার ইচ্ছামতো যেকোনো কিছু করতে পারে। তবে, অনেক সময়েই একজনের ইচ্ছা প্রয়োগ করতে আরেকজনের সহযোগিতার প্রয়োজন হয়। এসবক্ষেত্রে অনেকেরই অনৈতিক অবস্থান নেওয়ার গাঢ় সম্ভাবনা থাকে। উদাহরণ দেওয়া যাক।

থমাস হবস; Image Source: John Michael Wright

তাহমিদের একটি বাড়ি বানানো দরকার এবং অয়ন তাকে সাহায্য করতে সম্মত হয়েছে। তবে, অয়নের শর্ত ছিল, তাহমিদের বাড়ি বানানো হয়ে গেলে তাকে অয়নের বাড়ি বানানোর জন্যে সাহায্য করতে হবে। বাড়ি সম্পূর্ণ হওয়ার পরে তাহমিদ ভাবল, সে যদি চুক্তি অস্বীকার করে, তাহলে তার বাড়তি কাজ করতে হচ্ছে না। অর্থাৎ, চুক্তিরক্ষা করতে গেলে তাকে অতিরিক্ত একটি মূল্য দিতে হচ্ছে। চুক্তি ভঙ্গ করলে সেই দায়টি আর থাকছে না। তাই সে চুক্তিটি অস্বীকার করলো।

অয়নের কোনো বাড়ি নেই এবং তাহমিদ তাকে সাহায্যও করবে না। গেম থিওরিতে সব এজেন্টকেই বুদ্ধিমান হিসেবে চিন্তা করা হয়। এক্ষেত্রে, অয়নের ভালো সম্ভাবনা রয়েছে, সে তাহমিদের বাড়ি ডাকাতি করে দখল করার। তাহমিদ এই ভয়টি আগে থেকেই পেয়েছিল। তাই সে পাহারাদার নিয়োগ দিয়েছে। এতে অনির্দিষ্টকাল ধরে তার অর্থ খরচ হচ্ছে। এই খরচ থেকে বাঁচতে তাহমিদ প্রথমেই অয়নকে হত্যার পরিকল্পনা করতে পারে। অয়নও যেহেতু সমান বুদ্ধিমান, সে চাইবে হত্যাটি সে আগে করতে। এভাবে একজন আরেকজনের পরিকল্পনা আগেই জেনে যাওয়ার একটি চেইন চলতে থাকবে। অনেকগুলো এজেন্ট একে অপরের সাথে যদি এরকম একটি বিপজ্জনক সম্পর্ক তৈরি করে সমাজে একটি চরম বিশৃঙ্খলা তৈরি হবে। হবস এই পরিস্থিতির নাম দিয়েছেন, ‘war of all against all’। এরকম পরিস্থিতিতে মানবজীবন হয়ে উঠবে দুর্বিষহ।

হবসের প্রস্তাবিত সমাধান ছিল একজন শাসক। মানুষ এমন একজন এজেন্টকে নিয়োগ দেবে, যে চুক্তিভঙ্গকারীকে প্রথমেই শাস্তি প্রদান করবে। যতক্ষণ এই শাস্তির ভূমিকা কাজ করবে, ততক্ষণই চুক্তি ভাঙার মূল্য চুক্তি রক্ষার তুলনায় বেশি হবে। তাই যেকোনো যৌক্তিক ও বুদ্ধিমান মানুষই তখন চুক্তি রক্ষা করতে চাইবে। এই যুক্তিটি অনেকটা পলাতক সৈন্যদের মৃত্যুদণ্ড দেওয়ার মতো। সবাই যদি এভাবে চুক্তি রক্ষা করে চলে, সেটাই তখন সমাজের সাধারণ অবস্থা হয়ে উঠবে।

জলবায়ু পরিবর্তন রোধে রাষ্ট্রপ্রধানদের সচেতন না হওয়াকেও ব্যাখ্যা করা যায় গেম থিওরি দিয়ে; Image Source: Jia Zheng

গেম থিওরি আরো অনেক প্রশ্নের উত্তর দেয়। কার্বন ডাইঅক্সাইড অপসারণ করতে পৃথিবীব্যাপী রাষ্ট্রপ্রধানরা এখনো কাজ করছেন না কেন? সমগ্র পৃথিবীর স্বার্থেই জলবায়ু পরিবর্তন বন্ধের জন্যে কাজ করা উচিত। কিন্তু শিল্পজাত উৎপাদনের জন্যে সব দেশেরই কার্বন ডাইঅক্সাইডের জন্য ব্যক্তিগত স্বার্থ রয়েছে, এ কারণেই এই ব্যাপারে পৃথিবীব্যাপী এখনো সচেতনতা দেখা যাচ্ছে না। যারা কার্বন অপসারণে কাজ করবে, তারাই অন্য দেশের তুলনায় প্রতিযোগিতায় পিছিয়ে পড়বে।

ন্যাশ ইকুইলিব্রিয়ামের ধারণাটি আমাদেরকে বুঝতে সাহায্য করে, আকাঙ্ক্ষিত ফলাফলে পৌঁছাতে হলে কেন সমাজকে আমাদের জীবনযাপনের নির্দিষ্ট জায়গাগুলোতে হস্তক্ষেপ করতে হয়। আইনগত বাধ্যবাধকতা থাকলে ব্যক্তিগত স্বার্থের বাইরে মানুষকে সিদ্ধান্ত নিতে বাধ্য করা যায়। জলবায়ু পরিবর্তনও এরকমই একটি সমস্যা যেখানে ব্যক্তিগত স্বার্থের বাইরে সিদ্ধান্ত নিতে সবাইকে বাধ্য করা প্রয়োজন। তবে, সামগ্রিক পরিসরে এমন একটি অবস্থানে পৌঁছানো কঠিন, যেখানে সবাই একে অপরের সাথে প্রতিযোগিতায় লিপ্ত রয়েছে। কারণ, কার্বন অপসারণ কমানোর মানে হচ্ছে, অর্থনৈতিক মুনাফা কমিয়ে ফেলা। কিন্তু, আত্মকেন্দ্রিক চিন্তার মাধ্যমে নেওয়া সবচেয়ে ভালো সিদ্ধান্তটিও সামগ্রিকভাবে আমাদেরকে একটি অনাকাঙ্ক্ষিত পরিস্থিতিতে ফেলতে পারে। এই ব্যাপারটি আমাদের সবার উপলদ্ধি করা উচিত।

Related Articles