কোভিড-১৯ দুর্যোগ মোকাবেলায় ডাটা সায়েন্সের অদেখা লড়াই

বিশ্বব্যাপী কোভিড-১৯ ছড়িয়ে পড়ার পর থেকেই আমাদের চারদিকে চোখে পড়ছে অসংখ্য গ্রাফ-চার্ট। কোথাও কোভিড-১৯ এ আক্রান্ত রোগীদের হার বুঝাতে কিংবা অন্য অঞ্চলের সাথে তুলনা করতে, কোথাও ভ্যাক্সিনের ক্লিনিক্যাল ট্রায়ালের তথ্য দিতে, কোথাও লকডাউনের আর্থিক ক্ষতির গ্রাফ দেখাতে। তথ্য-উপাত্ত নিয়ে বিশ্লেষণ আর গবেষণাকারীরা বলছেন, এই দুর্যোগের একেকটি দিনের প্রতি সেকেন্ডে মানুষ তার ইতিহাসকে ছাপিয়ে যাচ্ছে। ভাইরাসের প্রতিরোধে ডাক্তার-নার্সদের সাথে একদম পর্দার আড়াল থেকে লড়াই করছে তথ্য উপাত্ত গবেষকরা। মানুষের মাঝে সচেতনতা তৈরি থেকে শুরু করে সরকার ও আন্তর্জাতিক সংস্থার নীতি নির্ধারণে প্রভাব ফেলছে বিশ্লেষিত তথ্য-উপাত্ত কিংবা মডেল।

সামাজিক যোগাযোগ মাধ্যম থেকে পলিসি টেবিলে ছেয়ে আছে গ্রাফ আর চার্টে; Image source: informationisbeautiful.net

ভাইরাসঘটিত এই রোগের আন্তর্জাতিক বিস্তারকে কেন্দ্র করে মানুষের তথ্য সংগ্রহ, সংরক্ষণ, বিভিন্নখাতে এর ব্যবহার এবং উপস্থাপনের ক্ষেত্রে একটি বিপ্লব হয়ে যাচ্ছে। মানুষের কাছ থেকে সুনির্দিষ্ট উপায়ে সংগৃহীত প্রতিটি তথ্য বা ডাটা দীর্ঘদিন ধরেই অমূল্য সম্পদ হিসেবে বিবেচিত হয়ে আসছে। কারণ, এই ডাটা ব্যবহার করে মানুষের আচার আচরণ, অভ্যাসের একটি কাঠামো পাওয়া যায়, যাকে ‘প্যাটার্ন’ বা ‘ট্রেন্ড’ বলা হয়ে থাকে। বিশাল পরিমাণ উপাত্ত বিশ্লেষণ (বিগ ডাটা এনালাইসিস) করে পাওয়া এই প্যাটার্নকে কাজে লাগায় ব্যবসা প্রতিষ্ঠানগুলো। তাদের নতুন পণ্য উদ্ভাবন কিংবা পণ্যের বিজ্ঞাপনে কাজে লাগে এই তথ্য। করোনার সময়ে এমন ‘প্যাটার্ন’ কাজে লাগিয়ে একটি এলাকায় সংক্রমণের ব্যাপার ধারণা পাওয়া যেতে পারে।     

তবে শুধু সংক্রমণের ব্যাপারে ধারণা পাওয়াই নয়, আমাদের চোখের আড়ালে জনস্বাস্থ্যের জন্য নেওয়া একেকটি জরুরি সিদ্ধান্তে প্রভাব ফেলছে বিভিন্ন উৎস থেকে ‘ডাটা’। জনস্বাস্থ্য থেকে শুরু করে আমরা প্রতিদিনের সংবাদপত্রে কিংবা সামাজিক যোগাযোগ মাধ্যমে যে গ্রাফ-চার্ট দেখছি সেগুলোও তৈরি হচ্ছে সংগৃহীত তথ্যের ভিত্তিতে।

মানুষকে পরিস্থিতি বুঝতে সহায়তা করছে ডাটা ভিজুয়ালাইজেশন; Image source: informationisbeautiful.net

মানুষের ইতিহাসে মনোযোগ দিয়ে তাকালে দেখা যাবে, ইতিহাসের একটি দীর্ঘ সময় মানুষ তার বিপদ সম্পর্কে আঁচ করতেই ব্যাপক সময় নষ্ট করে ফেলেছে। কিন্তু এই কোভিড-১৯ বিপর্যয় এদিক থেকে বেশ আলাদা। শুরু থেকেই মানুষ বিভিন্ন খাতের অভিজ্ঞতার সমন্বয় করেছে চিকিৎসা খাতে। দীর্ঘদিন যাবত তথ্য উপাত্ত নিয়ে কাজ করার ফলে তার ‘ডাটা সায়েন্স’ নামে যে শাখাটি গড়ে উঠেছে সেটি সুস্পষ্টভাবে অন্য খাতের চেয়ে আলাদা হয়ে ধরা দিয়েছে এই সময়ে। তথ্য উপাত্ত নিয়ে কাজ করার জটিল প্রক্রিয়াকে মোটমাট তিনভাগে ভাগ করা যায়।

  1. তথ্য সংগ্রহ এবং বাছাই
  2.  তথ্যকে বিশ্লেষণ করা
  3.  তথ্যকে মানুষের কাছে উপস্থাপন করা

প্রথম দুটি ধাপ ঘটে যায় আমাদের চোখের আড়ালেই কারণ আমাদের বেশিরভাগ মানুষই শুধুমাত্র উপস্থাপিত তথ্য আমাদের চোখের সামনে দেখতে পাই, যেমন বিভিন্ন ধরনের গ্রাফ-চার্ট, কোনো ‘ডাটা মডেল’।

প্রথমেই আসা যাক তথ্য সংগ্রহ এবং বাছাইয়ের ধাপে। বেশিরভাগ ক্ষেত্রেই দুনিয়াজুড়েই রোগীদের আক্রান্ত হওয়ার তথ্য আসছে হাসপাতাল এবং ডায়াগনস্টিক ল্যাবগুলো থেকে। গবেষণায় দেখা গেছে, উন্নত দেশের হাসতাপালগুলোতে ‘বিগ ডাটা এনালাইসিস’ শুরু হয়েছে বেশ আগে থেকেই। তবে এখনো বেশিরভাগ ক্ষেত্রেই রোগীর সাথে আলাপ আলোচনা করে তার লক্ষণ বা টেস্টের রেজাল্ট ডাক্তার-স্বাস্থ্যকর্মীরা বের করে আনছেন। সেই তথ্য নিয়ম করে জমা হচ্ছে সফটওয়্যারগুলোতে। বেশিরভাগ ক্ষেত্রেই সবগুলো দেশ তাদের বিভিন্ন অঞ্চল থেকে পাওয়া প্রাথমিক ডাটার সংগ্রহ উন্মুক্ত করছে বিশ্বের সবার জন্য।

দ্বিতীয় এবং তৃতীয় ধাপে আছে প্রাথমিক ডাটার বহুমাত্রিক বিশ্লেষণ, উপস্থাপন এবং বহুবিধ মডেল নির্মাণ। কোভিড-১৯ এর একদম শুরু থেকেই জন্স হপকিন্স বিশ্ববিদ্যালয়ের ‘সেন্টার ফর সিস্টেমস সাইন্স এন্ড ইঞ্জিনিয়ারিং’ নামে একটি বিভাগের অধীনে চালু হয় একটি ড্যাশবোর্ড।

জন্স হপকিন্স বিশ্ববিদ্যালয়ের কোভিড-১৯ ড্যাশবোর্ড; Image source: coronavirus.jhu.edu

যেখানে বিশ্বের বিভিন্ন প্রান্ত থেকে পাওয়া ডাটার ভিত্তিতে দেখা যাবে মহামারির বর্তমান অবস্থা। ডিসেম্বরে মহামারি শুরু হওয়ার পর থেকেই এই ড্যাশবোর্ডের পরিকল্পনা শুরু হয়। ২০২০ সালের জানুয়ারির বাইশ তারিখে শুরু হওয়ার দিনেই এটি গণমাধ্যম থেকে সামাজিক যোগাযোগ মাধ্যমে ‘ভাইরাল’ হয়ে যায়। মহামারির প্রতিটি দিন অতিবাহিত হওয়ার সাথে সাথে তথ্যের পরিমাণও বাড়তে থাকে, তাই জন্স হপকিন্স তাদের ড্যাশবোর্ডের পাশাপাশি রিসোর্স সেন্টারও চালু করে। ফলে আমেরিকা এবং বাইরে থেকে প্রাপ্ত তাৎক্ষণিক তথ্য (রিয়েল টাইম ডাটা) উপাত্তকে সাজিয়ে মডেল তৈরি করতে থাকে। প্রতি মিনিটে নতুন করে তথ্য আসার সাথে সাথে এই গ্রাফ-চার্টগুলোও নিজের মতো করে হালনাগাদ হতে থাকে। পাশাপাশি জন্স হপকিন্সের ডাটা নিয়ে সামাজিক যোগাযোগ মাধ্যম কিংবা অন্য এনালিস্টরাও নিজেদের মতো করে এনালাইসিস করতে শুরু করেন।

তাই জন্স হপকিন্সের এই ডাটাবেজে প্রতিদিন গড়ে বিলিয়নেরও বেশি ভিজিট শুরু হয়ে যায়। এর আগেও জন্স হপকিন্স বিশ্ববিদ্যালয় হামের (Measles) সংক্রাম্যতা নিয়েও এমন একটি কাজ করার চেষ্টা করেছে। তাই করোনার ক্ষেত্রে এই কাজটি দ্রুত করতে তারা সক্ষম হয়েছে।

বাম থেকে দ্বিতীয় এনশেং ডং, যার পরিকল্পনাতেই দাঁড়িয়েছিল এই ড্যাশবোর্ড; Image source: coronavirus.jhu.edu

শুরুতে এনশেং ডং নামের এক পিএইচডি শিক্ষার্থী এবং তার দলের সদস্যরা সিডিসি, বিশ্ব স্বাস্থ্য সংস্থা এবং বিভিন্ন দেশের মিডিয়া এবং সরকারি ডাটাবেজ থেকে প্রাপ্ত তথ্য ম্যানুয়ালি ইনপুট দিয়ে ড্যাশবোর্ডটি চালু করছিলেন। দিন যাওয়ার সাথে সাথে ‘ওয়েব স্ক্রাপিং’ টেকনোলজি ব্যবহার করে এই ডাটাবেজ নিজেই নিজেকে তাৎক্ষনিকভাবে হালনাগাদ করতে শুরু করে।

শুরু থেকেই জন্স হপকিন্স তাদের ডাটাবেজের সব তথ্য এবং এর যাবতীয় কোড ‘গিটহাব’ অনলাইন কোড শেয়ারিং প্ল্যাটফর্মে উন্মুক্ত করে দেওয়া হয়। ফলে বিভিন্ন দেশের বিজ্ঞানী এবং গবেষকরা চাইলে নিজেদের ডাটা ব্যবহার করে প্রায় একই রকম ড্যাশবোর্ড নিজেরা বানিয়ে নিতে পারবেন। 

জন্স হপকিন্স বাদেও বিশ্বের বিভিন্ন প্রান্তের মানুষ ডাটা সায়েন্সকে কাজে লাগিয়ে মানুষের চলাচল এবং আক্রান্তদের চলাচলের প্যাটার্ন ফলো করে ইতালিতে বানানো হয় ‘কোভিড-১৯ মোবিলিটি মনিটরিং প্রোজেক্ট’। মানুষের স্মার্টফোন থেকে লোকেশন ডাটা ব্যবহার করে আপতকালীন সময়ে এ ধরনের বিশ্লেষণ করা হয়েছে।

জন্স হপকিন্স বাদেও বিশ্বের নানা প্রতিষ্ঠান, বিশ্ববিদ্যালয় তাদের গবেষণার ডাটা, তাদের তৈরি ড্যাশবোর্ড, ডাটা উপস্থানের কোড উন্মুক্ত করে দেয় গিটহাবে শেয়ার করার মাধ্যমে। 

সর্ববামের ছবিটিতে ফ্রেব্রুয়ারির ২১-১৮ তারিখের মানুষের চলাচল দেখা যাচ্ছে, আক্রান্ত এলাকাগুলোতে কমে আসছে বুঝাতে গাঢ় রঙ ব্যবহার করা হয়েছে, এরপর দেশজুড়ে লকডাউনের ফলে সর্বডানের ছবিতে দেখা যাচ্ছে পুরো দেশ জুড়েই চলাচল বন্ধ; Image source: COVID-19 Mobility Monitoring project’s github.

এর সবচেয়ে বড় সুবিধা হলো পাবলিক হেলথ বা জনস্বাস্থ্যের জন্য গুরুত্বপূর্ণ পদক্ষেপ নিতে এ ধরনের ডাটা এক অমূল্য রত্ন ভাণ্ডার। আগামী দিনগুলোতে ডাক্তার স্বাস্থ্যকর্মীদের কী পরিমাণ রোগীদের সেবা দিতে হতে পারে, স্বাস্থ্যসেবাকে কোথায় বা কোন এলাকায় সবচেয়ে বেশি ঘনীভূত করা দরকার, কোথায় রোগীরা সেরে উঠছে। কোন বয়সের রোগীরা কেমন ঝুঁকিতে আছে তা নির্ধারণে এই ডাটা নীতি নির্ধারক, ডাক্তার-স্বাস্থ্যকর্মী, প্রশাসন সবাইকে সহায়তা করছে। 

তথ্য ভিত্তিক বিশ্লেষণ দেয় আমাদেরকে প্রস্তুতির সুযোগ; Image source: covid19-projections.com

মহামারিতে তাই ডাক্তার-নার্স স্বাস্থ্যকর্মীদের সাথে কম্পিউটার স্ক্রীনের পেছনে কাজ করছেন হাজার হাজার ডাটা গবেষক, মহামারির গতিপথ, সাম্ভাব্য ভ্যাক্সিন, নীতি নির্ধারণী পর্যায়ে গুরুত্বপূর্ণ সিদ্ধান্তের পেছনে রয়ে গেছেন এরা। 

মহামারির গতিপথ বুঝতে মানুষ সহায়তা নিচ্ছে ডাটা সায়েন্সের; Image source: gabgoh.github.io

কোভিড-১৯ বিপর্যয় শেষ হলেও কিন্তু এই ডাটা সায়েন্সের গুরুত্ব কমবে না, নিত্য নতুন যেকোনো স্থানিক মহামারি (Local epidemic) যেকোনো সময় হয়ে উঠতে পারে বিশ্বব্যাপী আরেকটি কোভিড-১৯। তাই ‘বিগ ডাটা এনালাইসিস’, ‘ডাটা সায়েন্স’র এই দুর্যোগকালীন শিক্ষা আমাদেরকে সামনেও নতুন করে ভাবতে শেখাবে। 

This article is in Bangla. This article focuses on how data science is fighting the battle against the Covid-19 behind the scene as this field is shaping our important public health plicy and making us aware of the pandemic more clearly. 

Featured image source: innovaspain

Related Articles