গেম থিওরি: বুদ্ধিদীপ্ত সিদ্ধান্ত গ্রহণের বিজ্ঞান

‘অ্যা বিউটিফুল মাইন্ড’ সিনেমার কথা মনে আছে? যেখানে একজন তুখোড় মেধাবী গণিতবিদের সিজোফ্রেনিয়ার সাথে যুদ্ধ করে এগিয়ে চলার গল্প বলা হয়েছে। সিনেমাটি মুক্তির পরে জন ফোর্বস ন্যাশ নামক এই গণিতবিদ রাতারাতি সাধারণ মানুষের মধ্যে প্রচুর জনপ্রিয়তা লাভ করেন। মাত্র ২১ বছর বয়সে তিনি যে পিএইচডি থিসিসটি জমা দিয়েছিলেন, সেটির উপর ভিত্তি করে আবিষ্কৃত তত্ত্বের জন্যে পরবর্তীতে তিনি নোবেল পুরষ্কার লাভ করেছিলেন। থিসিসটির শিরোনাম ছিল ‘Non Cooperative Game’। অনেকে ভাবতে পারেন, গণিতের মাঝে ‘গেম’ কেন এলো? সত্যি বলতে, গেম থিওরি নামে একটি বিশাল তত্ত্ব রয়েছে, যেটি এখন আর শুধু গণিত কিংবা বিজ্ঞানের মাঝেই সীমাবদ্ধ নয়। অর্থনীতি, সামাজিক বিজ্ঞান, রাজনীতি, বাণিজ্য, আন্তর্জাতিক সম্পর্কসহ অনেক জায়গাতেই রয়েছে এর ব্যবহার।

প্রতিযোগিতাপূর্ণ সম্পর্কে লিপ্ত এরকম একাধিক এজেন্টের বুদ্ধিদীপ্ত আচরণ কেমন হওয়া উচিত, গেম থিওরি সে সম্পর্কে একটি তাত্ত্বিক ফ্রেমওয়ার্ক তৈরি করে দেয়। অনেক জায়গায় একে ‘কৌশলের বিজ্ঞান’ বলা হয়। প্রতিযোগিতায় লিপ্ত এজেন্টদেরকে এখানে ‘প্লেয়ার’ হিসেবে পর্যালোচনা করা হয়। প্লেয়ারদের মধ্যেকার এই প্রতিযোগিতাটিকে ‘গেম’ বলা হয়। প্লেয়ারদের কার্যক্রমের উপরে নির্ভর করে পুরো গেমের একটি ফলাফল পাওয়া যায়। গেম থিওরি ব্যবহার করে বাস্তব পৃথিবীতে এ ধরনের সম্পর্কগুলোর ভবিষ্যৎ অনুমান করা যায়। তবে, গেম থিওরি কাজ করবে শুধুমাত্র যখন মানুষ যুক্তিসঙ্গত সিদ্ধান্ত নেবে। 

গেম থিওরির প্রথম গাণিতিক ফর্মুলা দিয়েছিলেন জন ভন নিউম্যান এবং অস্কার মরগেনস্টার্ন। তাদের এই ফ্রেমওয়ার্কের বিভিন্ন সীমাবদ্ধতার কারণে প্রথম দিকে এই থিওরি শুধুমাত্র নির্দিষ্ট ও সীমিত শর্তের মধ্যে ব্যবহার করতে হতো। তবে, গত সাত দশক ধরে এই অবস্থাটির পরিবর্তন হয়েছে। নিউম্যান ও মরগেনস্টার্নের পরে এই থিওরিতে জন ন্যাশই প্রথম কোনো তাৎপর্যপূর্ণ অবদান রাখেন। ফলে, গেম থিওরির একটি জেনারেলাইজড ফ্রেমওয়ার্ক তৈরি হয়েছে যেটা অর্থনীতি, সামাজিক বিজ্ঞান, বাণিজ্য, আন্তর্জাতিক সম্পর্ক, কম্পিউটার বিজ্ঞান, জীববিজ্ঞানসহ আরো অনেক ক্ষেত্রেই ব্যবহার করা যায়। সত্তরের দশকের পর থেকেই যেকোনো বিশ্লেষকের জন্যে গেম থিওরি সবচেয়ে গুরুত্বপূর্ণ টুল হয়ে দাঁড়িয়েছে, যেখানে তাকে বুদ্ধিমান অন্য প্রতিপক্ষের সিদ্ধান্তের মুখোমুখি হতে হয়।

জন ফোর্বস ন্যাশ; Image Source: Peter Badge

এই লেখায় আমরা গেম থিওরির তাত্ত্বিক অংশটি আলোচনা করব না। বরং, বিভিন্নরকম উদাহরণ ব্যবহার করে যুক্তিসঙ্গত সিদ্ধান্ত নেওয়ার প্যাটার্ন বুঝার চেষ্টা করব। এরকম একটি আলোচনার জায়গা হচ্ছে বাণিজ্য।

তীব্র প্রতিযোগিতায় লিপ্ত রয়েছে এমন অনেকগুলো ব্যবসা প্রতিষ্ঠানের উদাহরণ দেওয়া যাবে। এ রকম একটি উদাহরণ হচ্ছে পেপসি ও কোকাকোলার প্রতিদ্বন্দ্বিতা। মনে করা যাক, কোকাকোলা সিদ্ধান্ত নিল তাদের পণ্যের মূল্য কমিয়ে দেবে। ফলে, পেপসির তুলনায় তাদের বিক্রি বেশি হবে। এভাবে, তারা বেশি মুনাফা অর্জন করতে পারবে।

অন্যদিকে, পেপসি নিশ্চয়ই চাইবে না ক্রেতা হারাতে। তাই তারাও মূল্য কমিয়ে দিতে বাধ্য হবে। এভাবে তারা একটি সমতার অবস্থানে আসবে যেখানে দুইটি পণ্যেরই মূল্য সমান। যেহেতু মূল্য কমানোর ফলে আদতে কোকাকোলা বেশি ক্রেতা আকর্ষণ করতে পারছে না, কোকাকোলা তাই মূল্য কমানোর কথা ভাববে না। এভাবে, কোম্পানিগুলোর মধ্যে একটি অলিখিত চুক্তি থাকে, তারা মূল্য বেশি রাখবে এবং তাতে লাভও বেশি হবে।

গেম থিওরি ব্যবহার করে আরেকটি প্রশ্নের উত্তর দেওয়া যায়। সেটি হচ্ছে, বেশিরভাগ দোকান কেন গুচ্ছাকারে থাকে। অনেক সময়েই কয়েক মাইল জুড়ে কোনো রেস্টুরেন্ট পাওয়া যায় না। কিন্তু দেখা যায়, এক জায়গায় অনেক কোম্পানির রেস্টুরেন্ট একত্রিত হয়ে আছে। মনে করা যাক, আপনি সিদ্ধান্ত নিলেন সমুদ্র সৈকতে আইসক্রিম বিক্রি করবেন। সৈকতটি এক মাইল লম্বা। তাহলে কোন জায়গাটি আপনার দোকানের জন্যে বেছে নিলে সবচেয়ে বেশি লাভ করতে পারবেন? অবশ্যই মাঝখানে, তাই তো? ধরা যাক, আপনি সেখানেই দোকান বসালেন। 

পরদিন সৈকতে গিয়ে দেখলেন, আপনার বন্ধু আরেকটি আইসক্রিম দোকান দিয়েছে। আপনারা সিদ্ধান্ত নিলেন যে, সৈকত নিজেদের মধ্যে ভাগাভাগি করে নেবেন। তাই, আপনার দোকানটি সৈকতের মাঝ থেকে এক চতুর্থাংশ ডানে সরালেন। আর আপনার বন্ধুটির দোকান নিয়ে গেল মাঝ থেকে এক চতুর্থাংশ বামে। এর ফলে, সৈকতের ডানে যারা ঘুরতে গেল, তারা সবাই আপনার থেকেই আইসক্রিম কিনল। আর বামপাশে যারা এসেছিল, তারা আইসক্রিম কিনল আপনার বন্ধুর দোকান থেকে। ক্রেতাদের জন্যে এটা সবচেয়ে ভালো অবস্থান হলো।

সৈকত নিজেদের মধ্যে ভাগাভাগি করে নেওয়া হলো; Image Source: Ted-Ed

পরদিন সৈকতে গিয়ে দেখলেন, আপনার বন্ধু বেশি ক্রেতা পাওয়ার জন্যে তার দোকানটি মাঝখানে নিয়ে এসেছে। অর্থাৎ, বামের সব ক্রেতা তো সে পাচ্ছেই, আবার আপনার ক্রেতার একটা অংশও তার দোকানে যাচ্ছে। আইসক্রিম যুদ্ধে জেতার জন্যে পরদিন আপনি আপনার বন্ধুর অঞ্চলে গিয়ে দোকান বসালেন। আপনার বন্ধুও কম যা য়না, সে আপনার দোকান থেকে একশ মিটার ডানে দোকান বসাল। ফলে, ডানের বড় অঞ্চলের ক্রেতা তার ভাগে চলে এলো। আপনি সে ভাগ পাওয়ার জন্যে তার একশ মিটার ডানে বসালেন। সে আবারো তার দোকান সরালো, আপনি আপনার দোকান সরালেন। এভাবে, সারাদিন ধরে আপনি আর আপনার বন্ধু দোকান সরানোর যুদ্ধে লিপ্ত হলেন। শেষে, দুজনই সৈকতের মাঝে গিয়ে স্থির হলেন, যেখানে দুজনই অর্ধেক ক্রেতা পাচ্ছিলেন।

আপনারা এমন অবস্থানে এলেন, যেটাকে বলা হয় ‘ন্যাশ ইকুইলিব্রিয়াম’। এই অবস্থান থেকে সরে কেউই নিজেদের উন্নতি করতে পারবেন না। আপনি দোকান সরালে আপনার বন্ধু বেশি ক্রেতা পাবে আবার আপনার বন্ধু তার দোকান সরালে আপনি বেশি ক্রেতা পাবেন। আপনাদের প্রথম যে কৌশলটি ছিল, সেটি টেকেনি কারণ সেটি ন্যাশ ইকুইলিব্রিয়ামের সংজ্ঞায়িত কোনো সাম্যাবস্থায় ছিল না। তাই, আপনার বন্ধু দোকান সরিয়ে নিজের অবস্থানের উন্নতি করতে পেরেছিল। সত্যিকার পৃথিবীতে এ কারণেই কোম্পানিগুলো তাদের দোকান পাশাপাশি রাখে। কারণ ন্যাশ ইকুইলিব্রিয়াম অর্জন না করতে পারলে তারা প্রতিপক্ষের তুমুল প্রতিযোগিতার শিকার হবে। আর সেখানে ক্রেতারা সব জায়গা থেকেই হাজির হতে পারে।

আপনার ও বন্ধুর মধ্যেকার ন্যাশ ইকুইলিব্রিয়াম; Image Source: Ted-Ed

গাণিতিক ও যৌক্তিকভাবে গেম থিওরির ফ্রেমওয়ার্ক ১৯৪৪ সালে এলেও, অনেক প্রাচীন সময় থেকেই এরকম যুক্তিসঙ্গত চিন্তাভাবনার উদাহরণ পাওয়া যায়। সক্রেটিস ব্যাটল অব ডেলিয়ামের এ রকম একটি গল্প বলেছেন: একজন সৈন্য তার কমরেডের সাথে সম্মুখ শিবিরে শত্রুর আক্রমণ প্রতিরোধের জন্যে অপেক্ষা করছে। যদি তাদের প্রতিরোধ সফল হয়, তাহলে তার ব্যক্তিগত অবদান এক্ষেত্রে অপরিহার্য নয়। সে যদি যুদ্ধে অবস্থান করে, তাহলে তার আহত বা নিহত হওয়ার একটি ঝুঁকি থেকে যায়। যেহেতু তার অবদান অপরিহার্য নয়, তাই এই ঝুঁকি নেওয়ার কোনো যৌক্তিকতা নেই। অন্যদিকে, শত্রুপক্ষ যদি যুদ্ধে জিতে যায়, তার মৃত্যুঝুঁকি তখন আরো বেশি। আর এক্ষেত্রে এই ঝুঁকিটি একদমই অর্থহীন। কারণ, সে যুদ্ধে অংশগ্রহণ করলেও তাদের প্রতিরক্ষা ভেঙে পড়বে। ফলে, যুদ্ধের ফলাফল যাই হোক না কেন যুদ্ধক্ষেত্র থেকে পালিয়ে যাওয়াই সৈন্যটির জন্যে সবচেয়ে ভালো সিদ্ধান্ত।

এখানে সৈন্যদলের সবাই একইরকম পরিস্থিতিতে রয়েছে। তাই, তারা সবাই যদি একইরকম চিন্তা করে, তাহলে অবশ্যই সেই পরিস্থিতিরই উদ্ভব হবে যেখানে যুদ্ধটি তারা হেরে গেছে। অর্থাৎ, তারা কেউই যুদ্ধে অংশগ্রহণ করতে চাইবে না। ব্যক্তিগতভাবে সবার আলাদা আলাদা সিদ্ধান্ত এখানে এমন একটি পরিস্থিতি তৈরি করেছে, যেটা সবার জন্যেই অনাকাঙ্ক্ষিত ছিল। প্রশ্ন হচ্ছে, বাস্তবে যুদ্ধক্ষেত্রে কি সৈন্যরা এভাবে চিন্তা করে? বরং সেখানে উল্টোটা দেখা যায়। যে সৈন্যের মাঝে যুদ্ধ হেরে যাওয়ার ভয় যতো বেশি, তাকে তত বেশি উদ্দীপ্ত দেখা যায়। অন্যদিকে, যে সৈন্যদলের বিশ্বাস বেশি থাকে যে, তারা জিতবে, তত বেশি তাদেরকে ব্যক্তিগত অবদানের ক্ষেত্রে অমনোযোগী হতে দেখা যায়।

গেম থিওরি আসার বহু আগেই এ ধরনের পরিস্থিতি এড়ানোর জন্যে সামরিক নেতাদের বিভিন্ন পদক্ষেপ নিতে দেখা গেছে। এ রকম একজন সামরিক নেতা ছিলেন স্প্যানিশ বীর হারন্যান করটেজ। মেক্সিকোতে তিনি যখন ছোট একটি বাহিনী নিয়ে গিয়েছিলেন, তার সৈন্যদের নিজেদের সামর্থ্যে সন্দেহ করার বিশাল একটি কারণ ছিল। কারণ সেখানে অ্যাজটেক বাহিনীর সংখ্যা ছিল বিশাল। তার সৈন্যরা ভয়ার্ত অবস্থায় পালিয়ে যেতে পারে, এই ধারণা করটেজের চিন্তায় ছিল। তাই তিনি নিজেদের সমস্ত জাহাজ পুড়িয়ে দিয়েছিলেন। তাতে নিজের বাহিনীর পালানোর আর কোনো উপায় ছিল না। পালিয়ে যাওয়া যখন অসম্ভব হয়ে উঠল, তখন স্প্যানিশ সৈন্যদের বেঁচে থাকার জন্যে প্রাণপণে যুদ্ধ করাই একমাত্র উপায় হয়ে ওঠে। 

করটেজ তার জাহাজগুলো এমনভাবে পুড়িয়েছিল যেন তা সবাই দেখতে পায়। এই কাজটি শত্রুদের অর্থাৎ অ্যাজটেকদের মধ্যে একটি নিরুৎসাহ তৈরি করে। তারা ভেবেছিল, কোনো কম্যান্ডার যদি তার পালানোর একমাত্র রাস্তা নষ্ট করে ফেলার সাহস রাখে, তার পেছনে অবশ্যই কোনো কারণ রয়েছে। যে কারণটা তার ছোট বাহিনী হওয়া সত্ত্বেও এতবড় আত্মবিশ্বাস জুগিয়েছে। যে কম্যান্ডারের না হারার জন্যে এরকম কারণ রয়েছে তার বিপক্ষে যুদ্ধ করা অ্যাজটেক সৈন্যরা সমীচীন মনে করেনি। ফলে, করটেজ সহজ একটি জয় পেয়েছিলেন। 

এরকম যুক্তি প্রয়োগের আরেকটি ক্ল্যাসিক উৎস হলো শেকসপিয়ারের হেনরি ফাইভ। এজিনকোর্টের যুদ্ধের সময়ে হেনরি সিদ্ধান্ত নিয়েছিল, শত্রুদের সামনে সে তার ফরাসি কয়েদীদের হত্যা করবে। অবশ্য হেনরির যুক্তি ছিল, বন্দিরা নিজেদের মুক্ত করে হেনরিকে ঝুঁকির মধ্যে ফেলে দেবে। কিন্তু গেম থিওরির আলোকে ব্যাপারটিকে ভিন্নভাবে ব্যাখ্যা করা যায়। হেনরির সৈন্যরা দেখেছে যে, বন্দিরা নিহত হয়েছে। তারা এটাও জানে যে, শত্রুপক্ষও এই হত্যাগুলো প্রত্যক্ষ করেছে। তাই, হেনরির সৈন্যরা জানে, তারা যদি যুদ্ধে হেরে শত্রুপক্ষের জেলে বন্দি হয়, শত্রুরা এই হত্যার প্রতিশোধ নেবে। অর্থাৎ, তাদের পরিণতি ভয়াবহ হবে। করটেজের সৈন্যদের মতোই, কিন্তু রূপকভাবে তাদের জাহাজগুলো এক্ষেত্রে পোড়ানো হয়ে গেছে। অর্থাৎ, পালানোর আর রাস্তা নেই। 

থমাস হবসের বই লেভিয়্যাথানকে আধুনিক রাজনৈতিক দর্শনের একটি ভিত্তি ধরা হয়। এই বইয়ে নাগরিকের উপরে রাষ্ট্রের আইন প্রয়োগের ন্যায্যতার পক্ষে যুক্তি দেখানো হয়। এখানেও, গেম থিওরির কৌশল দেখা যায়। হবস দাবি করেছেন, সব মানুষের জন্যে সবচেয়ে ভালো অবস্থা হচ্ছে যেখানে তারা যে যার ইচ্ছামতো যেকোনো কিছু করতে পারে। তবে, অনেক সময়েই একজনের ইচ্ছা প্রয়োগ করতে আরেকজনের সহযোগিতার প্রয়োজন হয়। এসবক্ষেত্রে অনেকেরই অনৈতিক অবস্থান নেওয়ার গাঢ় সম্ভাবনা থাকে। উদাহরণ দেওয়া যাক।

থমাস হবস; Image Source: John Michael Wright

তাহমিদের একটি বাড়ি বানানো দরকার এবং অয়ন তাকে সাহায্য করতে সম্মত হয়েছে। তবে, অয়নের শর্ত ছিল, তাহমিদের বাড়ি বানানো হয়ে গেলে তাকে অয়নের বাড়ি বানানোর জন্যে সাহায্য করতে হবে। বাড়ি সম্পূর্ণ হওয়ার পরে তাহমিদ ভাবল, সে যদি চুক্তি অস্বীকার করে, তাহলে তার বাড়তি কাজ করতে হচ্ছে না। অর্থাৎ, চুক্তিরক্ষা করতে গেলে তাকে অতিরিক্ত একটি মূল্য দিতে হচ্ছে। চুক্তি ভঙ্গ করলে সেই দায়টি আর থাকছে না। তাই সে চুক্তিটি অস্বীকার করলো।

অয়নের কোনো বাড়ি নেই এবং তাহমিদ তাকে সাহায্যও করবে না। গেম থিওরিতে সব এজেন্টকেই বুদ্ধিমান হিসেবে চিন্তা করা হয়। এক্ষেত্রে, অয়নের ভালো সম্ভাবনা রয়েছে, সে তাহমিদের বাড়ি ডাকাতি করে দখল করার। তাহমিদ এই ভয়টি আগে থেকেই পেয়েছিল। তাই সে পাহারাদার নিয়োগ দিয়েছে। এতে অনির্দিষ্টকাল ধরে তার অর্থ খরচ হচ্ছে। এই খরচ থেকে বাঁচতে তাহমিদ প্রথমেই অয়নকে হত্যার পরিকল্পনা করতে পারে। অয়নও যেহেতু সমান বুদ্ধিমান, সে চাইবে হত্যাটি সে আগে করতে। এভাবে একজন আরেকজনের পরিকল্পনা আগেই জেনে যাওয়ার একটি চেইন চলতে থাকবে। অনেকগুলো এজেন্ট একে অপরের সাথে যদি এরকম একটি বিপজ্জনক সম্পর্ক তৈরি করে সমাজে একটি চরম বিশৃঙ্খলা তৈরি হবে। হবস এই পরিস্থিতির নাম দিয়েছেন, ‘war of all against all’। এরকম পরিস্থিতিতে মানবজীবন হয়ে উঠবে দুর্বিষহ।

হবসের প্রস্তাবিত সমাধান ছিল একজন শাসক। মানুষ এমন একজন এজেন্টকে নিয়োগ দেবে, যে চুক্তিভঙ্গকারীকে প্রথমেই শাস্তি প্রদান করবে। যতক্ষণ এই শাস্তির ভূমিকা কাজ করবে, ততক্ষণই চুক্তি ভাঙার মূল্য চুক্তি রক্ষার তুলনায় বেশি হবে। তাই যেকোনো যৌক্তিক ও বুদ্ধিমান মানুষই তখন চুক্তি রক্ষা করতে চাইবে। এই যুক্তিটি অনেকটা পলাতক সৈন্যদের মৃত্যুদণ্ড দেওয়ার মতো। সবাই যদি এভাবে চুক্তি রক্ষা করে চলে, সেটাই তখন সমাজের সাধারণ অবস্থা হয়ে উঠবে।

জলবায়ু পরিবর্তন রোধে রাষ্ট্রপ্রধানদের সচেতন না হওয়াকেও ব্যাখ্যা করা যায় গেম থিওরি দিয়ে; Image Source: Jia Zheng

গেম থিওরি আরো অনেক প্রশ্নের উত্তর দেয়। কার্বন ডাইঅক্সাইড অপসারণ করতে পৃথিবীব্যাপী রাষ্ট্রপ্রধানরা এখনো কাজ করছেন না কেন? সমগ্র পৃথিবীর স্বার্থেই জলবায়ু পরিবর্তন বন্ধের জন্যে কাজ করা উচিত। কিন্তু শিল্পজাত উৎপাদনের জন্যে সব দেশেরই কার্বন ডাইঅক্সাইডের জন্য ব্যক্তিগত স্বার্থ রয়েছে, এ কারণেই এই ব্যাপারে পৃথিবীব্যাপী এখনো সচেতনতা দেখা যাচ্ছে না। যারা কার্বন অপসারণে কাজ করবে, তারাই অন্য দেশের তুলনায় প্রতিযোগিতায় পিছিয়ে পড়বে। 

ন্যাশ ইকুইলিব্রিয়ামের ধারণাটি আমাদেরকে বুঝতে সাহায্য করে, আকাঙ্ক্ষিত ফলাফলে পৌঁছাতে হলে কেন সমাজকে আমাদের জীবনযাপনের নির্দিষ্ট জায়গাগুলোতে হস্তক্ষেপ করতে হয়। আইনগত বাধ্যবাধকতা থাকলে ব্যক্তিগত স্বার্থের বাইরে মানুষকে সিদ্ধান্ত নিতে বাধ্য করা যায়। জলবায়ু পরিবর্তনও এরকমই একটি সমস্যা যেখানে ব্যক্তিগত স্বার্থের বাইরে সিদ্ধান্ত নিতে সবাইকে বাধ্য করা প্রয়োজন। তবে, সামগ্রিক পরিসরে এমন একটি অবস্থানে পৌঁছানো কঠিন, যেখানে সবাই একে অপরের সাথে প্রতিযোগিতায় লিপ্ত রয়েছে। কারণ, কার্বন অপসারণ কমানোর মানে হচ্ছে, অর্থনৈতিক মুনাফা কমিয়ে ফেলা। কিন্তু, আত্মকেন্দ্রিক চিন্তার মাধ্যমে নেওয়া সবচেয়ে ভালো সিদ্ধান্তটিও সামগ্রিকভাবে আমাদেরকে একটি অনাকাঙ্ক্ষিত পরিস্থিতিতে ফেলতে পারে। এই ব্যাপারটি আমাদের সবার উপলদ্ধি করা উচিত।

This Bangla article discusses a brief introduction to Game theory. It demonstrates some classic examples in order to provide an understanding of rational thinking according to this theory. Necessary references have been hyperlinked inside.

Featured Image: Medium  

Related Articles