Table of Contents
এজিআই সংজ্ঞায় পরিবর্তন: ওপেনএআই-এর নতুন লক্ষ্য ও ভবিষ্যতের অর্থনীতি (২৮ ডিসেম্বর, ২০২৪)
ওপেনএআই-এর এজিআই (AGI) সংজ্ঞায় পরিবর্তন
সম্প্রতি ওপেনএআই (OpenAI) এজিআই (AGI) নিয়ে তাদের নিজস্ব সংজ্ঞা প্রকাশ করেছে, যা কৃত্রিম বুদ্ধিমত্তা (AI) জগতের জন্য একটি বড় ধরনের পরিবর্তনের ইঙ্গিত দেয়। দীর্ঘদিন ধরে এজিআই বলতে কী বোঝায়, তা নিয়ে বিতর্ক ছিল। অবশেষে ওপেনএআই একটি সুস্পষ্ট সংজ্ঞা সামনে এনেছে, যা বড় বড় কোম্পানির জন্য আগামীর রূপরেখা নির্ধারণে গুরুত্বপূর্ণ ভূমিকা রাখবে। “দ্য ইনফরমেশন (The Information)” সম্প্রতি একটি প্রতিবেদন প্রকাশ করেছে যেখানে উল্লেখ করা হয়েছে যে মাইক্রোসফট (Microsoft) এবং ওপেনএআই-এর মধ্যে এজিআই সংক্রান্ত একটি “গোপন সংজ্ঞা” (secret AGI definition) রয়েছে।
মাইক্রোসফট ও ওপেনএআই-এর চুক্তি (Microsoft & OpenAI’s Deal)
মাইক্রোসফট আগেই ওপেনএআই-তে প্রায় ১০ বিলিয়ন ডলার বিনিয়োগ করেছিল। কারণ তারা চ্যাটজিপিটি (ChatGPT)-এর ব্যাপক প্রবৃদ্ধি দেখে বিশ্বাস করেছিল যে এই উদীয়মান কৃত্রিম বুদ্ধিমত্তা খাতে বিনিয়োগ লাভজনক হবে। ওপেনএআই-এর মতো প্রতিষ্ঠানের জন্য এত বড় অঙ্কের অর্থ অত্যন্ত দরকারি, এবং মাইক্রোসফটের বিশাল ক্লাউড পরিকাঠামো (infrastructure) ও সাপোর্টও তাদের এগিয়ে যেতে সাহায্য করে।
তবে এই চুক্তির একটা বিশেষ শর্ত ছিল, যেখানে বলা ছিল মাইক্রোসফট কেবল “প্রি-এজিআই (pre-AGI) প্রযুক্তি” পাবে। তাই এজিআই (AGI) ঠিক কখন বা কীভাবে পরিপূর্ণভাবে আসবে, তার সংজ্ঞা এখানে অত্যন্ত গুরুত্বপূর্ণ। বর্তমানে ওপেনএআই কোম্পানিকে আর্থিকভাবে আরো মজবুত করতে চায় ও একইসাথে জনগণকে শেয়ার বিক্রি ছাড়াও অন্যভাবে মূলধন সংগ্রহের পরিকল্পনা করছে। তাদের পরিকল্পনা অনুযায়ী, মাইক্রোসফট হয়তো ভবিষ্যতে ওপেনএআই-এর শেয়ারের মালিকানা বা কোম্পানির নিয়ন্ত্রণ পুরোপুরি পাবে না, বরং নির্দিষ্ট আর্থিক সুবিধা পেতে পারে।
এরই মধ্যে ওপেনএআই একটি ঘোষণাপত্র প্রকাশ করেছে— “Why OpenAI’s structure must evolve to advance our mission”— যেখানে উল্লেখ করা হয়েছে তারা একটি শক্তিশালী নন-প্রফিট (nonprofit) অংশকে সমর্থন করার লক্ষ্যে ফর-প্রফিট (for-profit) সেকশনের সাফল্য কাজে লাগাতে চায়। এখানে বলা হয়েছে, “আমরা আমাদের লক্ষ্যকে কেবল একটি একক সিস্টেম—যেমন এজিআই—নির্মাণ করা হিসেবে দেখি না, বরং এটি একটি ক্রমাগত প্রক্রিয়া।”
এজিআই ইকোনমি
ওপেনএআই-এর সদ্য প্রকাশিত বিবৃতিতে “এজিআই ইকোনমি (AGI economy)” কথাটি উঠে এসেছে। ধারণা করা হচ্ছে, ভবিষ্যতের অর্থনীতির বড় অংশই এজিআই-নির্ভর হয়ে উঠবে। শক্তিশালী এআই (AI) প্রযুক্তি তৈরির ফলে শ্রম, পণ্য ও সেবার ক্ষেত্রে নাটকীয় পরিবর্তন আসবে। ওপেনএআই-এর লক্ষ্য হলো এই এজিআই-নির্ভর অর্থনৈতিক পরিকাঠামো গড়ে তোলার পাশাপাশি নিশ্চিত করা যে সেটি মানবতার উপকারে আসে।
তবে কোম্পানিকে শেয়ারবাজারে (go public) তালিকাভুক্ত করা মোটেও সহজ হবে না। বিশেষ করে সম্প্রতি ইলন মাস্ক (Elon Musk) তাদের বিরুদ্ধে একটি মামলা (lawsuit) দায়ের করেছেন, যা ওপেনএআই-এর কার্যক্রমকে জটিল করে তুলতে পারে।
ইলন মাস্ক যে মামলা করেছে, তা ওপেনএআই-এর কাছে অস্বস্তিকর হয়ে উঠেছে। যেকোনো কোম্পানির পক্ষে এই ধরনের মামলাজনিত আইনি জটিলতা অগ্রগতির পথে বাধা হয়ে দাঁড়ায়। এত বড় অংশীদারিত্ব, বিনিয়োগ ও উচ্চমূল্যের বাজারমূল্য (valuation) থাকলেও আইনি ঝামেলার কারণে ওপেনএআই-এর পক্ষে শেয়ারবাজারে প্রবেশ বা অন্য কোনো বড় সিদ্ধান্ত নেওয়া মুশকিল হতে পারে। বর্তমানে ওপেনএআই-এর বাজারমূল্য প্রায় ১৫০ বিলিয়ন ডলার—যদি তারা জনসমক্ষে শেয়ার ইস্যু করে, তবে এই মূল্য আরও বাড়তে পারে।
কম্পিউট নিয়ে অল্টম্যান ও মাইক্রোসফটের মধ্যে বর্ধিষ্ণু উত্তেজনা
ওপেনএআই-এর সিইও স্যাম অল্টম্যান (Sam Altman) ও মাইক্রোসফটের মধ্যে কিছুটা মতবিরোধ রয়েছে বলে জানা গেছে। অল্টম্যান স্বীকার করেছেন যে উভয় পক্ষের মধ্যে কিছু বিষয় নিয়ে “সমন্বয়হীনতা” বা “চ্যালেঞ্জ” রয়েছে। এর পেছনে কারণ একটাই—মাইক্রোসফট এজিআই (AGI) প্রযুক্তির ওপর গুরুত্বপূর্ণ প্রভাব কিংবা নিয়ন্ত্রণ রাখতে চায়। অন্যদিকে ওপেনএআই চায় এই প্রযুক্তির পূর্ণ নিয়ন্ত্রণ তাদের হাতেই থাকুক, যাতে কোনো একক কর্পোরেশন (corporation) সমগ্র বিশ্বকে “একনায়কতন্ত্রিক” (dictatorship) ভাবে নিয়ন্ত্রণ করতে না পারে।
ইলন মাস্ক যখন এক বিশাল সুপারকম্পিউটার বানিয়েছেন, যা ওপেনএআই ও মেটা (Meta)-র ব্যবস্থা থেকেও বড় এবং দ্রুত, তখন স্যাম অল্টম্যান বেশ অস্বস্তিতে পড়েন। শোনা যায়, তিনি মাইক্রোসফটের বিভিন্ন অবকাঠামো বিভাগের উচ্চপদস্থদের সঙ্গে উত্তপ্ত কথোপকথনে জড়িয়েছিলেন, যেখানে তিনি অভিযোগ তুলেছিলেন, “কীভাবে ইলন মাস্ক আমাদের চেয়ে এত দ্রুতগতিতে এগিয়ে যাচ্ছে?” বর্তমান সময়ে এআই (AI) খাতে “কমপিউট (Compute)”— অর্থাৎ সুপারকম্পিউটিং রিসোর্স, চিপ (Chip), জিপিইউ (GPU) ইত্যাদি— খুবই গুরুত্বপূর্ণ। অনেক বেশি কমপিউট থাকলে দ্রুত মডেল (model) ট্রেন করা ও আপডেট দেওয়া সম্ভব হয়। আর এজিআই-এর দিকে এগোনোর অন্যতম শর্তই হলো যথেষ্ট পরিমাণ কমপিউট (compute)
এজিআই উন্নয়নের পথকে গতিময় করতে বড় পরিমাণ কমপিউট বা সুপারকম্পিউটিং ক্ষমতা অপরিহার্য। দ্রুত মডেল ট্রেনিং এবং ত্রুটি সমাধানে এটির গুরুত্ব অপরিসীম। ওপেনএআই বারবার মাইক্রোসফটকে বলে আসছিল তারা আরো বেশি পরিমাণে কমপিউট চায়। কিন্তু চুক্তি অনুযায়ী মাইক্রোসফটই একমাত্র ক্লাউড সরবরাহকারী (cloud provider) হিসেবে ওপেনএআই-কে পরিষেবা দিতে পারবে। ফলে ওপেনএআই অন্য কোথাও কমপিউট সংগ্রহ করতে চাইলে, মাইক্রোসফটের সম্মতি লাগবে। এতে ওপেনএআই অনেকখানি সীমাবদ্ধতার মধ্যে পড়েছে।
অন্যদিকে ইলন মাস্ক সম্প্রতি টুইট করে বলেছেন যে ২০০ হাজারের মতো জিপিইউ (GPU) রয়েছে, যা কেবলমাত্র “উষ্ণতা বাড়ানোর” (“the amuse-bouche”) পদক্ষেপ। অর্থাৎ তিনি আরও বড় উদ্যোগ নেওয়ার পরিকল্পনায় আছেন। এতে স্যাম অল্টম্যান ও মাইক্রোসফটের মধ্যে উত্তেজনা আরও বেড়েছে।
এজিআই-এর (AGI) নতুন ১০০ বিলিয়ন ডলারের সংজ্ঞা ও ২০২৯ সালে নিজস্ব নিয়ন্ত্রণের লক্ষ
প্রথমে ওপেনএআই বলেছিল, এজিআই এমন একটি স্বয়ংক্রিয় ব্যবস্থা (automated system) যা “অধিকাংশ মানুষের চেয়ে অধিকাংশ অর্থনৈতিকভাবে মূল্যবান কাজ (economically valuable work) সম্পাদনে সক্ষম”। কিন্তু সম্প্রতি তারা এটির একটি হালনাগাদ সংজ্ঞা দিয়েছে। এখন এজিআই বলতে বোঝায় এমন একটি এআই (AI) সিস্টেম যা কমপক্ষে ১০০ বিলিয়ন ডলার লাভ (profits) তৈরি করতে পারবে।
এর পেছনে যুক্তি হতে পারে যে ওপেনএআই মাইক্রোসফটের ওপর সম্পূর্ণ নির্ভর করতে চায় না। তারা চাইছে এমন একটি এজিআই সিস্টেম গড়ে তুলতে, যা নিজেই বিশাল লাভের উৎস হবে এবং তাদেরকে স্বাধীনভাবে চলতে সাহায্য করবে। মাইক্রোসফটের হাত থেকে নিয়ন্ত্রণ পুরোপুরি হারাতে না চাইলেও, এজিআইকে (AGI) একচেটিয়া দখলের বাইরে রাখতে ওপেনএআই সচেষ্ট।
কোম্পানির লক্ষ্য হলো, ১০০ বিলিয়ন ডলার মুনাফা করতে সক্ষম এআই সিস্টেম তৈরি করা। তখন এই সিস্টেম যদি মাইক্রোসফটের একচেটিয়া দখলে না থাকে, ওপেনএআই স্বাধীনভাবে এর সুফল ভোগ করতে পারবে। পুরোনো সংজ্ঞায় ছিল “অধিকাংশ মানুষের চেয়ে অধিকাংশ কাজ ভালোভাবে করা”। কিন্তু এখন প্রশ্ন হচ্ছে, এজিআই হয়তো অনেক কাজই করতে পারবে, তবে বাস্তবে কী পরিমাণ লাভ তৈরি হবে? সেই অনিশ্চয়তাও থেকেই যাচ্ছে।
যদিও ওপেনএআই ও মাইক্রোসফটের সম্পর্ক আপাতদৃষ্টিতে মসৃণ না-ও হতে পারে, তবু তারা পরস্পর নির্ভরশীল। এই অবস্থায়, ১০০ বিলিয়ন ডলার লাভের লক্ষ্যমাত্রা পূরণ করতে পারলে ওপেনএআই আরও বড় স্বাধীনতা পেতে পারে—হয়তো তখন আর মাইক্রোসফটের নিরঙ্কুশ আধিপত্য মেনে চলতে হবে না।
ধারণা করা হচ্ছে, ২০২৯ সালের দিকে ওপেনএআই এই ১০০ বিলিয়ন ডলারের লক্ষ্য পূরণ করতে সক্ষম হবে। এখন ২০২৪ সাল চলছে, সুতরাং সামনের পাঁচ বছরে এআই জগতে অনেক নতুন অগ্রগতি ঘটে যেতে পারে। লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) মাত্র কয়েক বছরেই যে উন্নতি করেছে, তা দেখলে ২০২৯ সালকে ঘিরে বড় ধরনের প্রত্যাশা থাকাও স্বাভাবিক।
সে সময়ের মধ্যে ওপেনএআই হয়তো নিজস্ব ওয়েব ব্রাউজার, হিউম্যানয়েড রোবট (humanoid robot), ভয়েস এজেন্ট (voice agents) প্রভৃতি নিয়ে আসবে। তখন এজিআই (AGI) পুরোপুরি বাস্তব হয়ে উঠলে, তারা হয়তো বাজারে অনেকটাই আধিপত্য কায়েম করবে। তবে এটাও মনে রাখতে হবে, গুগল (Google) সহ অন্য আরও বড় বড় কোম্পানি সমান গতিতে এগোনোর চেষ্টা চালাবে। ফলে ২০২৯ সালের এআই-দৃশ্যপট কতটা রোমাঞ্চকর হয়ে উঠবে, তা এখন শুধুই কল্পনা করা যায়।
এজিআই (AGI) ও অপরিমেয় লাভ
একবার এজিআই পর্যায়ে পৌঁছালে, মানুষের কর্মক্ষমতার মতো কার্যক্ষমতা (capability) এআই দিয়ে পুনরুৎপাদন করা সম্ভব হবে। তখন তাত্ত্বিকভাবে লাভের কোনো ঊর্ধ্বসীমা থাকবে না, কারণ একইসাথে অসংখ্য কাজে এআইকে লাগানো যাবে। স্যাম অল্টম্যান অতীতে বলেছিলেন, “আমার ধারণা, আমরা অনেকেই যা ভাবছি তার চেয়ে শীঘ্রই এজিআই চলে আসবে, এবং তখন এটি তুলনামূলক কম গুরুত্বপূর্ণ হয়ে যাবে।”
অর্থাৎ তিনি হয়তো বলতে চেয়েছেন, একবার এজিআই (AGI) এসে গেলে দ্রুতই পরিস্থিতি পাল্টে যেতে শুরু করবে। ২০২৫ সালে এজেন্টিক (agentic) যুগ শুরু হতে পারে বলে অনেকে ধারণা করছেন। যদিও সবকিছু এখনও ধোঁয়াশায় রয়েছে, তবু ওপেনএআই-এর জন্য $100 বিলিয়ন মুনাফা লক্ষ্য করে নতুন সংজ্ঞা স্থাপন করা একটা বড় পদক্ষেপ। ওপেনএআই এখনো মাইক্রোসফটের সহায়তা নিয়ে এগোতে চায়, কিন্তু এজিআইকে একচেটিয়া অধিকার থেকে দূরে রাখতে তাদের সক্রিয় প্রচেষ্টা স্পষ্ট।
সব মিলিয়ে, ওপেনএআই এজিআই সংজ্ঞায় পরিবর্তন এনে ব্যবসায়িক দিক ও প্রযুক্তিগত ভবিষ্যৎ দুই দিকেই বড় ধরনের প্রভাব ফেলছে। ১০০ বিলিয়ন ডলার লাভের লক্ষ্য পূরণ করতে পারলে ওপেনএআই সম্ভবত বিশ্বের অন্যতম মূল্যবান কোম্পানিতে পরিণত হবে। তখন এআই সিস্টেম মানুষের অধিকাংশ কাজকে অটোমেশনের (automation) মাধ্যমে প্রতিস্থাপন করে কীভাবে বিশাল পরিমাণ অর্থনৈতিক সাফল্য আনে, সেটাই দেখার বিষয়। আর এভাবেই এজিআই আমাদের ভবিষ্যৎ অর্থনীতি ও সমাজকে গড়ে তুলবে বলে অনুমান করা হচ্ছে।
তথ্যসূত্র
- x.com/OpenAI/status/1872628736690123213
- https://www.businessinsider.com/microsoft-openai-put-price-tag-achieving-agi-2024-12
- https://www.ft.com/content/2c14b89c-f363-4c2a-9dfc-13023b6bce65
- https://www.reuters.com/technology/openai-seeks-unlock-investment-by-ditching-agi-clause-with-microsoft-ft-reports-2024-12-06/
- https://openai.com/index/planning-for-agi-and-beyond/
- https://www.newsbytesapp.com/news/science/openai-microsoft-define-agi-by-potential-to-generate-100-billion/story
- https://nypost.com/2024/12/27/business/openai-needs-more-capital-than-wed-imagined-as-it-details-for-profit-plan/
- https://www.investors.com/news/technology/microsoft-stock-openai-for-profit-business-model/
- https://www.theinformation.com/articles/microsoft-and-openais-secret-agi-definition
মাইক্রোসফটের ১,৮০০ মডেলের এআই এজেন্ট ইকোসিস্টেম (২৬ ডিসেম্বর, ২০২৪)
ভূমিকা
কী হবে যদি একটি প্ল্যাটফর্ম (platform) সম্পূর্ণভাবে ব্যবসায়িক পর্যায়ে এআই (AI) ব্যবহারের ধরনকে পুনর্নির্ধারণ করতে পারে? সেটাই মাইক্রোসফট (Microsoft) করার চেষ্টা করছে তাদের গেম-চেঞ্জিং এআই (AI) ফাউন্ড্রি (Foundry) দিয়ে, যেখানে আছে ১,৮০০-এরও বেশি এআই মডেলের (AI models) বিশাল সংগ্রহ। ইতিমধ্যেই এটিকে কৃত্রিম বুদ্ধিমত্তার (artificial intelligence) জগতে অন্যতম উচ্চাভিলাষী পদক্ষেপ হিসেবে বিবেচনা করা হচ্ছে।
কিন্তু কী এই উদ্যোগকে আলাদা করেছে? এর বড় কারণ হলো মাইক্রোসফটের নো কোড (no code) ও লো কোড (low code) ডেভেলপমেন্ট টুলের অনন্য সংযোজন, যা মাইক্রোসফট ৩৬৫ কো-পাইলট (Microsoft 365 Copilot)-এর মাধ্যমে একীভূত করা হয়েছে। এর ফলে ব্যবসায়িক প্রতিষ্ঠানগুলো আগাম প্রস্তুত করা এআই এজেন্ট (AI agents) ব্যবহার করতে পারে অথবা নিজেদের প্রয়োজন অনুযায়ী সেগুলো কাস্টমাইজ করতে পারে—একদম শূন্য থেকে কোড লেখার প্রয়োজন ছাড়াই। শুধু সহজলভ্য করাই নয়, এভাবে এআইকে (AI) বহুমুখী করে তোলাই মাইক্রোসফটের লক্ষ্য।
বিশাল মডেলভাণ্ডার (Model Collection) ও প্রতিযোগিতা
এই বিশাল মডেলসমূহ বিভিন্ন কাজে ব্যবহৃত হয়—গ্রাহক সেবা অটোমেশন (customer service automation) থেকে সাপ্লাই চেইন অপটিমাইজেশন (supply chain optimization) পর্যন্ত। ব্যবসায়িক প্রতিষ্ঠানের নিজস্ব প্রয়োজন অনুযায়ী এই এআই (AI) সমাধানগুলো ব্যবহার করা যায়। তবে মাইক্রোসফট একা এগিয়ে যাচ্ছে না; তাদের সামনে প্রতিদ্বন্দ্বী হিসেবে আছে ওপেনএআই (OpenAI), সেইলসফোর্স (Salesforce), আর আমরা ধরে নিচ্ছি “জেনডেস্ক (Zendesk)”—যাদের সবারই শক্তিশালী এআই সমাধান রয়েছে।
এখন প্রশ্ন হলো: এই প্রতিদ্বন্দ্বিতায় মাইক্রোসফটের (Microsoft) অবস্থান কোথায়?
আজুর এআই ফাউন্ড্রি (Azure AI Foundry): এআই নির্মাণের কন্ট্রোলরুম
মাইক্রোসফটের কৌশলের কেন্দ্রবিন্দু হলো আজুর এআই ফাউন্ড্রি (Azure AI Foundry)। এটি একটি কেন্দ্রীয় প্ল্যাটফর্ম যেখানে ব্যবসায়িক প্রতিষ্ঠানগুলো সহজেই এআই (AI) এজেন্ট ডিজাইন (design), ম্যানেজ (manage) ও ডিপ্লয় (deploy) করতে পারে। এটিকে এআই নিয়ন্ত্রণকক্ষ (AI Control Room) ভাবা যেতে পারে। সাধারণত এআই টুল (AI tool) তৈরি করা বেশ জটিল প্রক্রিয়া হলেও, এখানে আছে সাবলীল ইন্টারফেস (interface) এবং প্রিবিল্ট টেমপ্লেট (pre-built templates) ও সফটওয়্যার ডেভেলপমেন্ট কিট (software development kits – SDKs), যা ডেভেলপারদেরকে (developers) শুরু থেকে সব বানানোর ঝামেলা থেকে মুক্তি দেয়।
শুধু অভিজ্ঞ কোডারদের (coders) জন্যই নয়, গিটহাব (GitHub) ইন্টিগ্রেশন এবং মাইক্রোসফটের কো-পাইলট স্টুডিও (Copilot Studio) এর মতো টুল থাকায় কম অভিজ্ঞতাসম্পন্ন দলও বিভিন্ন রকম ‘ক্রেজি (crazy)’ এআই সমাধান তৈরি করতে পারে। চাইলে সাধারণ গ্রাহক সেবা প্রশ্নোত্তর স্বয়ংক্রিয় করা হোক, অথবা বিশাল ডেটাসেট (dataset) বিশ্লেষণ করে প্রয়োজনীয় তথ্য বের করা হোক—এখন আর বিরাট বাজেট বা বিশাল টেকনিক্যাল (technical) টিম প্রয়োজন নেই।
সীমাবদ্ধতা
যে কোনও উচ্চাভিলাষী সিস্টেমের (system) মতোই এরও কিছু সীমাবদ্ধতা আছে। আজুর এআই ফাউন্ড্রি (Azure AI Foundry) স্কেলেবিলিটি (scalability) ও ইন্টিগ্রেশনে (integration) বেশ দক্ষ হলেও ছোট ব্যবসায়িক প্রতিষ্ঠানের জন্য এটি অনেক সময় ‘অতিরিক্ত বড়’ মনে হতে পারে। বিশাল মডেল তালিকা ও অপশন (options) দেখে অনেকেই বিভ্রান্ত বা ভীত হতে পারেন, বিশেষ করে যাদের এআই (AI) নিয়ে এখনো সুস্পষ্ট কোনো কৌশল নেই। তাই কেবলমাত্র স্বয়ংক্রিয়করণ (automation) শুরু করতে চাওয়া ছোট প্রতিষ্ঠানগুলো প্রথমে এই প্ল্যাটফর্মটিকে একটু জটিল মনে করতে পারে।
অটোনোমাস এজেন্টস (Autonomous Agents): পরবর্তী প্রজন্মের সহকারী
মাইক্রোসফটের ইকোসিস্টেমের অন্যতম আলোচিত বৈশিষ্ট্য হলো এর অটোনোমাস এজেন্টস (autonomous agents)। এগুলো স্রেফ সাধারণ চ্যাটবট (chatbot) বা ওয়ার্কফ্লো টুল (workflow tool) নয়; বরং এমন এআই এজেন্ট (AI agent) যা ব্যবহারকারীর সার্বক্ষণিক তত্ত্বাবধান ছাড়াই কাজ করতে পারে। এখনো প্রিভিউ মোডে (preview mode) থাকলেও এরাই ভবিষ্যতে ব্যবসায়িক প্রক্রিয়াকে আমূল বদলে দিতে পারে বলে ধারণা করা হচ্ছে।
উদাহরণ হিসেবে ধরা যাক, মাইক্রোসফট টিমস (Microsoft Teams)-এ মিটিং চলার সময় একটি ‘ফ্যাসিলিটেটর এজেন্ট’ (facilitator agent) ওই আলোচনার সারসংক্ষেপ তৈরি করবে, গুরুত্বপূর্ণ কাজ চিহ্নিত করবে এবং ফলো-আপ (follow-up) মিটিং শিডিউল (schedule) করে দেবে। আবার প্ল্যানার (Planner)-এর মতো প্রজেক্ট ম্যানেজমেন্ট টুলে (project management tool) একটি এআই এজেন্ট কাজ ভাগাভাগি করে দেওয়া, সময়সীমা (deadline) ট্র্যাক করা, এমনকি নির্ধারিত সময়সীমা পেরিয়ে গেলে স্বয়ংক্রিয়ভাবে অনুস্মারক (reminder) পাঠানো—সবকিছুই করতে পারে।
তবে এ ধরনের প্রো-অ্যাকটিভ এআই (proactive AI) ব্যবহারে কিছু সতর্কতা প্রয়োজন। ভুলভাবে কনফিগার (configure) করা থাকলে এগুলো অপরিমিত আপডেট বা পরামর্শ দিয়ে ব্যবহারকারীকে বিরক্ত করতে পারে। এছাড়া, ব্যবসায়িক নিয়মকানুন মেনে চলার বিষয়টিও গুরুত্বপূর্ণ। প্রতিদ্বন্দ্বী সেলসফোর্স (Salesforce) ও জেনডেস্ক (Zendesk)-এর সমাধানগুলোর সঙ্গে তুলনা করলে মাইক্রোসফটের এই অটোনোমাস এজেন্টস (autonomous agents) সহজে টিমস (Teams) ও প্ল্যানারের (Planner) মতো টুলের সঙ্গে মিলিয়ে কাজ করার দিক থেকে এগিয়ে আছে। তবে বাস্তবে গুরুত্বপূর্ণ কিংবা স্পর্শকাতর ক্ষেত্রে এরা কতটা নির্ভরযোগ্য পারফরমেন্স (performance) দেখাতে পারবে, সেটাই দেখার বিষয়।
কো-পাইলট স্টুডিও (Copilot Studio): নিজের মতো এআই তৈরি
মাইক্রোসফট কো-পাইলট স্টুডিও (Microsoft Copilot Studio) হল নো কোড (no code) ও লো কোড (low code) ডেভেলপমেন্টের (development) একটি পরিবেশ, যা ব্যবহারকারীদের নিজেদের প্রয়োজন অনুযায়ী এআই সমাধান তৈরি করতে সাহায্য করে। এটি টেকনিক্যাল এবং নন-টেকনিক্যাল (non-technical) দলের মধ্যে সেতুবন্ধ হিসেবে কাজ করে, ফলে পুরো ডেডিকেটেড ডেভেলপমেন্ট টিম (dedicated development team) ছাড়াও কাস্টম (custom) এআই এজেন্ট (AI agent) বানানো সম্ভব।
সবচেয়ে বড় ব্যাপার হলো, কো-পাইলট স্টুডিও (Copilot Studio) আজুর এআই ফাউন্ড্রির (Azure AI Foundry) বিশাল মডেল ক্যাটালগের (catalog) সঙ্গে সংযুক্ত। ব্যবসায়িক প্রতিষ্ঠানগুলো ১,৮০০-এরও বেশি প্রিবিল্ট (pre-built) মডেল থেকে তাদের এআই এজেন্টকে আরও শানিত (fine-tune) করে তুলতে পারে। উদাহরণস্বরূপ, একটি রিটেইল (retail) কোম্পানি ক্রেতার কেনাকাটার ধরন বিশ্লেষণ করে ইনভেন্টরি (inventory) আপডেটের পরামর্শ দিতে পারে, আবার একটি হেলথকেয়ার (healthcare) প্রতিষ্ঠান রোগী সম্পর্কিত সময়সূচি এবং রেকর্ডকিপিং (record-keeping) সহজ করতে পারে।
তবে পরিমার্জিত এআই (AI) যত বেশি কাস্টমাইজড (customized) হবে, সেটি সেট আপ (setup) করতে তত বেশি সময় ও দক্ষতা লাগতে পারে। লো কোড (low code) টুল থাকলেও কিছুটা জটিলতা থেকেই যায়। সেইসঙ্গে, সময়ের সাথে সাথে এসব কাস্টম এআই এজেন্ট নিয়মিত আপডেট ও রক্ষণাবেক্ষণ (maintenance) করাটাও বড় চ্যালেঞ্জ। তা সত্ত্বেও প্রতিযোগীদের তুলনায় মাইক্রোসফটের এই পদ্ধতিটি বহুমুখী সুবিধা দেয়—একটি ব্যবসা তাদের নিজের মতো করে এআই তৈরি করতে পারে, কোনো নির্দিষ্ট প্রস্তুত সেবার মধ্যে আটকে থাকতে হয় না।
সিকিউরিটি ও স্কেলএবিলিটি (Security and Scalability): বড় ব্যবসার বড় চাহিদা
১,৮০০ মডেলের এআই (AI) ইকোসিস্টেমে (ecosystem) মাইক্রোসফটের অন্যতম বড় শক্তির জায়গা হলো নিরাপত্তা (security) ও স্কেলএবিলিটি (scalability)। আজুর এআই ফাউন্ড্রি পোর্টাল (Azure AI Foundry portal) হল কেন্দ্রীয় একটি হাব (hub), যেখান থেকে এআই অ্যাপ্লিকেশন (AI application) পরিচালনা করা যায়। এক নজরে দেখা যায় রিসোর্স ব্যবহার, পারমিশন (permission), এবং সিস্টেমের সামগ্রিক স্বাস্থ্যের (system health) অবস্থা।
এই কেন্দ্রীয় ব্যবস্থাপনা ব্যবসায়িক প্রতিষ্ঠানকে স্কেল (scale) বাড়াতে সাহায্য করে—একটি চ্যাটবট (chatbot) ডিপ্লয় (deploy) করা থেকে পুরো এন্টারপ্রাইজে (enterprise) এআই ছড়িয়ে দেওয়া পর্যন্ত সবকিছু সহজ হয়। রিয়েল-টাইম মনিটরিং (real-time monitoring) এর সুবিধাও আছে—এআই এজেন্ট (AI agent) কীভাবে পারফর্ম করছে, কে ব্যবহার করছে, কীভাবে রিসোর্স (resources) ব্যবহৃত হচ্ছে—সব এক জায়গায় দেখা যায়।
ডেটা প্রাইভেসি (data privacy) ও কমপ্লায়েন্স (compliance) মাইক্রোসফট খুব গুরুত্বের সঙ্গে বিবেচনা করে। জিডিপিআর (GDPR) এর মতো বৈশ্বিক বিধিনিষেধ পূরণের জন্য প্ল্যাটফর্মটি তৈরি করা হয়েছে, যাতে ব্যবসাগুলো আইনগত জটিলতা নিয়ে দুশ্চিন্তা না করেই এআই ব্যবহার করতে পারে। তবে অনেক দেশে বা অঞ্চলে বিভিন্ন নিয়মকানুন থাকে, তাই পূর্ণাঙ্গ অনুগত থাকতে গেলে সংগঠনগুলোকে অনেকখানি কাজ করতে হতে পারে।
স্কেলেবিলিটির (scalability) দিক থেকে, আজুর এআই ফাউন্ড্রি (Azure AI Foundry) বড় প্রতিষ্ঠানের বিশাল ডেটা চাহিদা মেটাতে পারে। ছোট সংস্থাগুলোর জন্য এই সেটআপের খরচ ও জটিলতা কিছুটা বাধা হতে পারে, বিশেষ করে যদি তাদের টেকনিক্যাল দক্ষতা কম হয়। তা সত্ত্বেও দীর্ঘমেয়াদী পরিকল্পনা নিয়ে যারা এগোতে চায়, তাদের জন্য এটি বেশ আকর্ষণীয় একটি সমাধান।
প্রতিযোগীদের সাথে তুলনা: ওপেনএআই, সেলসফোর্স, ও জেনডেস্ক
ওপেনএআই (OpenAI)-এর সঙ্গে মাইক্রোসফটের কৌশলগত অংশীদারিত্ব থাকার কারণে তাদের এআই (AI) প্রযুক্তিতে যেমন সহযোগিতা আছে, তেমনি মাইক্রোসফট এখন নিজস্ব কাস্টমাইজেবল (customizable) এআই টুলস (AI tools) তৈরি করে ওপেনএআই-এর সরাসরি প্রতিদ্বন্দ্বী হিসেবেও দাঁড়িয়েছে। একদিকে ওপেনএআই-এর জিপিটি (GPT) মডেল থেকে মাইক্রোসফট অনেক সুবিধা নিচ্ছে, অন্যদিকে তারা নিজস্ব ব্র্যান্ড (brand) ও প্ল্যাটফর্মকে (platform) বিস্তৃতও করছে।
সেলসফোর্স (Salesforce) সাধারণত সিআরএম (CRM) কেন্দ্রিক এআই সমাধানে জোর দেয়। জেনডেস্ক (Zendesk) মূলত গ্রাহক সেবা (customer support) প্ল্যাটফর্মে জোর দেয়। অথচ মাইক্রোসফট গিটহাব (GitHub), আজুর (Azure) ও মাইক্রোসফট ৩৬৫ (Microsoft 365)-এর মতো টুল যুক্ত করে এক বিশাল ইকোসিস্টেম (ecosystem) তৈরি করেছে, যেখানে একাধিক ব্যবসায়িক ক্ষেত্রে এআই ব্যবহার করা যায়। যারা ইতিমধ্যেই মাইক্রোসফট টুল ব্যবহার করছে, তাদের জন্য এটি বিশেষ সুবিধা নিয়ে আসে।
তবে মাইক্রোসফটের বিশাল পরিসরের কারণে কিছু সমালোচক মনে করেন, হয়তো প্রতিযোগিতা কমে যেতে পারে, আর বাজারে একচেটিয়া প্রভাবের (market dominance) আশঙ্কাও আছে। ছোট ব্যবসা বা মাইক্রোসফটের পণ্যে অনভ্যস্ত যারা, তাদের জন্য এই ইকোসিস্টেম প্রথমে জটিল বা কম আকর্ষণীয় মনে হতে পারে।
বাস্তব জীবনে প্রয়োগ: শিল্পখাতের পরিবর্তন
মাইক্রোসফটের এআই (AI) এজেন্ট (agent) ইতিমধ্যেই বিভিন্ন শিল্পখাতে পরিবর্তন আনতে শুরু করেছে। উদাহরণস্বরূপ, কাস্টমার সার্ভিস (customer service) ক্ষেত্রে অনেক প্রতিষ্ঠান সাধারণ জিজ্ঞাসা সামলাতে এআই এজেন্ট মোতায়েন করছে। ফলে অপেক্ষার সময় কমে যাচ্ছে, আর মানব কাস্টমার সার্ভিস প্রতিনিধিরা (human agent) জটিল সমস্যার সমাধানে বেশি মনোযোগ দিতে পারছেন।
ম্যানুফ্যাকচারিং (manufacturing) খাতে প্রিডিক্টিভ এআই (predictive AI) মডেল সাপ্লাই চেইন (supply chain) অপটিমাইজ করে চাহিদা আগাম পূর্বাভাস দিচ্ছে এবং অপচয় কমাচ্ছে। ফাইন্যান্স (finance) সেক্টরে এআই এজেন্ট সন্দেহজনক লেনদেন ধরতে পারে, বাজারের প্রবণতা (market trends) পূর্বাভাস দিতে পারে, এমনকি গ্রাহকের রুচি বা প্রয়োজন অনুযায়ী সুপারিশও তৈরি করতে পারে। হেলথকেয়ারে (healthcare) এআই এজেন্ট প্রশাসনিক কাজ হালকা করছে, রোগ নির্ণয়ের ক্ষেত্রে সহায়তা করছে এবং আগের তথ্যের ভিত্তিতে রোগীর ফলাফল অনুমান করছে।
মাইক্রোসফটের ইকোসিস্টেম (ecosystem) বড় ভূমিকা রাখছে ওয়ার্কফ্লো (workflow) সহজ করা এবং সমাধানকে কাস্টমাইজ করা—একই সিস্টেম বা টুলকে সমস্ত ব্যবসা বা ডিপার্টমেন্টে প্রয়োগ করার বাধ্যবাধকতা নেই। ফলে প্রতিষ্ঠানগুলো নিজেদের চাহিদা অনুযায়ী এআই এজেন্টকে গড়ে নিচ্ছে। এতে শিল্পে উন্নয়নের গতি ত্বরান্বিত হচ্ছে, দক্ষতা বাড়ছে, এবং প্রতিযোগিতাও বৃদ্ধি পাচ্ছে। তবে খুবই কাস্টমাইজড (customized) সমাধান তৈরি করার জন্য যে জটিলতা দেখা দেয়, তা অনেক ছোট প্রতিষ্ঠানের কাছে চ্যালেঞ্জ হতে পারে।
ভবিষ্যতের ভাবনা: এআই বাজারে মাইক্রোসফটের প্রভাব
১,৮০০ মডেলের এআই (AI) ইকোসিস্টেমকে সহজলভ্য ও বহুমুখী করে মাইক্রোসফট এআইকে আসলে গণতান্ত্রিকীকরণ (democratizing) করছে—ছোট-বড় সব প্রতিষ্ঠানের সামনে নতুন দ্বার খুলে দিচ্ছে। যেসব প্রতিষ্ঠান এতদিন বাজেট বা দক্ষতার অভাবে আধুনিক এআই (AI) প্রযুক্তি ব্যবহার করতে পারেনি, তারাও এখন এগিয়ে আসতে পারছে।
এর পাশাপাশি, মাইক্রোসফটের এই আগ্রাসী পদক্ষেপ প্রতিদ্বন্দ্বী ওপেনএআই (OpenAI), সেলসফোর্স (Salesforce), এবং অন্যান্য প্রতিষ্ঠানকে আরও উদ্ভাবনী হতে তাড়িত করবে। পুরো এআই শিল্প (AI industry) একটি নতুন উদ্ভাবনের ঢেউয়ের জন্য প্রস্তুত হচ্ছে বলা যায়। তবে সাথে কিছু গুরুত্বপূর্ণ প্রশ্নও চলে আসে—যেমন, আরও শক্তিশালী এবং স্বয়ংক্রিয় এআই ব্যবহারের সময় নৈতিকতা (ethics) কীভাবে রক্ষা করা হবে? আর মাইক্রোসফটের (Microsoft) বাজার কর্তৃত্ব (market dominance) কতটা হবে, এবং প্রতিযোগিতা (competition) কতটা সুস্থ থাকবে?
সব মিলিয়ে, মাইক্রোসফটের ১,৮০০-মডেল এআই ইকোসিস্টেম (ecosystem) এন্টারপ্রাইজ এআই (enterprise AI) গ্রহণের ক্ষেত্রে এক যুগান্তকারী পদক্ষেপ। এটি কেবল আরও কার্যকর টুল (tool) তৈরির বিষয় নয়; বরং ব্যবসা ও শিল্প খাতগুলোকে কেমন ভাবে এআইর মাধ্যমে পুনর্গঠিত করা যায়, তারই একটি নতুন দিগন্ত দেখাচ্ছে। যাত্রা অনেক বাকি, তবে এটুকু স্পষ্ট—মাইক্রোসফটের এই সাহসী পদক্ষেপ পরবর্তী এআই (AI) উদ্ভাবনের যুগ গড়ে তুলতে বড় ভূমিকা রাখবে।
প্রথম ওয়াটার পাওয়ারড বায়োমিমেটিক এআই হিউম্যানয়েড রোবট সারা বিশ্বকে চমকে দিয়েছে (১০ ডিসেম্বর, ২০২৪)
ভূমিকা
পোল্যান্ড-ভিত্তিক ক্লোন রোবটিক্স (Clone Robotics) সম্প্রতি এমন এক হিউম্যানয়েড (humanoid) উন্মোচন করেছে যা সম্ভবত এ যাবৎকালের সবচেয়ে উন্নত, সবচেয়ে অবাক করা এবং সবচেয়ে মানবসদৃশ রোবট। তাদের নতুন হিউম্যানয়েড “ক্লোন আলফা (Clone Alpha)”-র কার্যক্ষমতা সত্যিই বিষ্ময়কর করছে। বিশেষ করে যখন জানা গেল তারা ইতিমধ্যেই ২৭৯টি প্রি-অর্ডার নিচ্ছে, তখন বুঝলাম যে এই রোবটটি সহজেই অন্যদের থেকে আলাদা। হ্যাঁ, বর্তমানে কোম্পানিটি ক্লোন আলফার প্রথম ২৭৯টি ইউনিটের প্রি-অর্ডার (Pre-Order) গ্রহণ করছে, যা বাস্তব জীবনে ঘরবাড়ি ও কর্মক্ষেত্রে মানবসদৃশ রোবট নিয়ে আসার পথে একটি বড় পদক্ষেপ। হিউম্যানয়েড রোবটকে মানবদেহের আকারে ডিজাইন করার পেছনে একটা গুরুত্বপূর্ণ কারণ আছে। আমাদের হাতের (hand) নমনীয়তা ও দক্ষতা (dexterity) এতটাই উন্নত যে রোবট নির্মাতা ও উদ্ভাবকরা শিখেছেন, মানুষের শরীরের আদলে রোবট বানালে তাতে মানুষের মতো সূক্ষ্ম নিয়ন্ত্রণ ও নানাবিধ কাজের সুবিধা পাওয়া যায়। এই ক্লোন আলফা (Clone Alpha) হল এক অনন্য মানবাকৃতির রোবট (Humanoid Robot), যা আগের দেখা কোনো রোবটের থেকে সম্পূর্ণ ভিন্ন। ক্লোন রোবোটিক্সের তৈরি করা এই রোবটের মধ্যে যুক্ত করা হয়েছে কৃত্রিম অঙ্গ (Synthetic Organs), কৃত্রিম পেশী (Artificial Muscles), এবং এমন একটি কাঠামো (Structure) যা মানবদেহের শারীরবৃত্তীয় গঠনকে নিখুঁতভাবে অনুকরণ করে। এখানে শুধু রোবটকে দেখতে মানুষের মতো করাই লক্ষ্য নয়, বরং মানবদেহ যেভাবে কাজ করে, ঠিক সেইভাবে রোবটকে কাজ করানোর চেষ্টা করা হয়েছে।
বায়োমিমেটিক ডিজাইন (Biomimetic Design)
এই ধরনের হিউম্যানয়েড রোবটের উদ্দেশ্য যদি হয় হাঁটা, জিনিসপত্র বহন করা, বিভিন্ন কাজ করা—যেমন একই সাথে বিভিন্ন জিনিস ধরা, সূক্ষ্ম সুইয়ে সূতা পরানো বা জামাকাপড় ভাঁজ করা—তাহলে রোবটে হাতের উপস্থিতি অপরিহার্য। রোবট কোম্পানিগুলো দেখেছে যে এসব সূক্ষ্ম ও জটিল কাজের জন্য রোবটের হাতে (robotic hands) মানুষের হাতের মতো গঠন থাকা প্রয়োজন। এখানেই ক্লোন আলফা নিজেকে “অ্যান্ড্রয়েড হিউম্যানয়েড (Android humanoid)” হিসেবে চিহ্নিত করে। সবচেয়ে বিস্ময়কর বিষয় হল, এর মধ্যে সম্পূর্ণ কৃত্রিম অঙ্গতন্ত্র রয়েছে, যা আমাদের মানবদেহের কাঠামো অনুকরণ করে। এতে রয়েছে কৃত্রিম কঙ্কাল (skeletal system), পেশী (muscular system), রক্তবাহী-তন্ত্র সদৃশ ভাস্কুলার সিস্টেম (vascular system) এবং স্নায়ুতন্ত্র সদৃশ নার্ভাস সিস্টেম (nervous system)। অন্য হিউম্যানয়েড রোবট যেখানে প্রথাগত ইঞ্জিনিয়ারিং পন্থায় ডিজাইন করা হয়, ক্লোন সেখানে মানব শরীরের স্ট্রাকচার প্রায় হুবহু রেপ্লিকেট করেছে। টেসলা অপটিমাস বা বোস্টন ডায়নামিকস অ্যাটলাস যেখানে মানব শরীরের তুলনামূলক সরল রোবোটিক গঠন নিয়েছিল, ক্লোন সেখানে চেষ্টা করেছে মানবদেহের পূর্ণ সদৃশ গঠন আনতে। তাদের মূলমন্ত্রই হলো “ক্লোন” করা—অর্থাৎ মানুষকে অনুকরণ করে তৈরি করা।
ক্লোন আলফার অন্যতম বৈশিষ্ট্য হল এর বায়োমিমেটিক ডিজাইন (Biomimetic Design) – অর্থাৎ এটি এমনভাবে তৈরি যাতে জীববৈজ্ঞানিক ব্যবস্থাকে অনুকরণ করে। প্রচলিত মোটর ও অ্যাকচুয়েটরের (Actuators) জায়গায় ক্লোন রোবোটিক্স তৈরি করেছে মানুষের অঙ্গ-প্রত্যঙ্গের কৃত্রিম সংস্করণ। এভাবে তারা মানবদেহের শারীরিক গঠনের মূল কাঠামোকে হুবহু ধরে রাখার চেষ্টা করেছে।
ক্লোন আলফার অঙ্গপ্রত্যঙ্গের গঠন (Structure of Clone Alpha): এই রোবটের পলিমার কঙ্কাল (Polymer Skeleton) মানবদেহের ২০৬টি হাড়ের (Bones) অনুরূপ, যা জয়েন্ট (Joints) ও কৃত্রিম লিগামেন্ট (Artificial Ligaments) সহ তৈরি। এর ফলে রোবটটির গতিশীলতা (Range of Motion) অভাবনীয়। ক্লোন আলফার উর্ধ্ব দেহভাগে (Upper Body) রয়েছে ১৬৪টি গতিশীল বিন্দু (Points of Articulation), যেখানে প্রতিটি হাত (Hand), কবজি (Wrist), ও কনুই (Elbow) মিলিয়ে ২৬টি ডিগ্রি অফ ফ্রিডম (Degrees of Freedom) রয়েছে। এমন নমনীয়তা উন্নত রোবোটিক্সেও দুর্লভ।
কৃত্রিম পেশী ব্যবস্থা (Myofiber Muscles): ক্লোন রোবোটিক্সের মূল মোড় ঘোরানোর মতো উদ্ভাবন হল “মায়োফাইবার প্রযুক্তি” (Myofiber Technology), যেখানে কৃত্রিম পেশী জলভিত্তিক চাপ বা ওয়াটার প্রেশার (Water Pressure) দ্বারা সংকোচিত হয়। এসব পেশী নরম ও হালকা, কিন্তু খুবই শক্তিশালী। উদাহরণস্বরূপ, মাত্র ৩ গ্রাম ওজনের একটি একক কৃত্রিম পেশী তন্তু (Muscle Fiber) ১ কিলোগ্রাম বল প্রয়োগ করতে পারে এবং মাত্র ৫০ মিলিসেকেন্ডেরও কম সময়ে ৩০% পর্যন্ত সংকোচন করতে পারে। এর ফলে ক্লোন আলফার নড়াচড়া হয় অত্যন্ত তরল (Fluid) ও জীবন্ত (Lifelike), যা প্রচলিত রোবটের যান্ত্রিক ও শক্ত গতির থেকে সম্পূর্ণ আলাদা।
জলভিত্তিক চাপ ভিত্তিক কর্মপদ্ধতি (Water Pressure Based Actuation): এই কৃত্রিম পেশী ব্যবস্থাকে চালাতে একটি ছোট আকারের কিন্তু শক্তিশালী কমপ্যাক্ট হাইড্রলিক পাম্প (Compact Hydraulic Pump) ব্যবহার করা হয়েছে, যা মানুষের হৃদপিণ্ডের (Heart) মতো কাজ করে। এটি রোবটের শিরা-উপশিরায় (Vascular System) তরল প্রবাহিত করে, পেশীগুলোর সংকোচনের জন্য প্রয়োজনীয় চাপ সরবরাহ করে। পাম্পটি খুবই দক্ষ (Efficient), ৫০০ ওয়াট (500 Watts) শক্তি ব্যবহার করে মিনিটে ৪০ লিটার (40 L per Minute) তরল ১০০ পিএসআই (100 PSI) চাপে সরবরাহ করতে পারে। এই ব্যবস্থা নিয়ন্ত্রণের জন্য ক্লোন রোবোটিক্স তৈরি করেছে “আকোয়া জেট” (Aqua Jets) নামক বিশেষ ভাল্ভ (Valves), যা মাত্র ১ ওয়াট শক্তিতে কাজ করে। এগুলি তরলের প্রবাহ খুব সূক্ষ্মভাবে নিয়ন্ত্রণ করে, ফলে রোবটের নড়াচড়া হয় মসৃণ এবং শক্তি সাশ্রয়ী।
স্নায়ুর কৃত্রিম ব্যবস্থা (Nervous System): ক্লোন আলফার “নড়ন-চরণ সিস্টেম” বা স্নায়বিক নিয়ন্ত্রণ ব্যবস্থা (Nervous System) অত্যন্ত উন্নত। একাধিক স্তরের সেন্সর (Sensors) ও গণনামূলক মডেল (Computational Models) মিলিয়ে এটি কাজ করে। রোবটটিতে রয়েছে ভিজ্যুয়াল ইনপুটের জন্য ৪টি ডেপ্থ ক্যামেরা (Depth Cameras), জয়েন্টের অবস্থান নির্ণয় করে এমন ৭০টি ইনর্শিয়াল সেন্সর (Inertial Sensors), এবং পেশীতে বসানো ৩২০টি চাপ সেন্সর বা প্রেশার সেন্সর (Pressure Sensors) যেগুলো বলের (Force) উপর প্রতিক্রিয়া জানায়। এই সকল ডেটা তাৎক্ষণিকভাবে মাইক্রোকন্ট্রোলার (Microcontrollers) দ্বারা প্রক্রিয়াকৃত হয়, যা আবার শক্তিশালী এনভিডিয়া জেটসন ওরিন জিপিইউতে (NVIDIA Jetson Orin GPU) পাঠিয়ে দেয়। সেখানে ক্লোনের সাইবারনেট (Cybernet) মডেল রান করে। এই ব্যবস্থা রোবটকে নিজেদের অঙ্গ-প্রত্যঙ্গের অবস্থান সম্পর্কে ধারণা (Proprioceptive Awareness) দেয়, ফলে এটি তার মুভমেন্ট বা নড়াচড়াকে পরিবেশ অনুসারে সামঞ্জস্য করতে পারে।
ক্লোন আলফার সম্ভাবনাসমূহ
বিল্ট-ইন দক্ষতা (Pre-Loaded Skills): ক্লোন আলফা একেবারে শুরুতেই (Straight Out of the Box) ১৬টি দক্ষতার সাথে আসছে। যেমন: একটি বাড়ির নকশা মুখস্থ করা (Memorizing the layout of a home), রান্নাঘরের ইনভেন্টরি (Kitchen Inventory) নজর রাখা, বাড়ির কাজে সহায়তা যেমন ভ্যাকুয়াম করা (Vacuuming), ডাইনিং টেবিল সাজানো (Setting the Dining Table), কাপড় ভাঁজ করা (Folding Clothes)। এমনকি এটি পানীয় ঢালা (Pouring Drinks) ও স্যান্ডউইচ তৈরিও (Making Sandwiches) করতে পারে। যারা একটি রোবটিক সহকারী বা রোবটিক অ্যাসিস্টেন্ট (Robotic Assistant) চেয়েছিলেন, তাদের জন্য এটি এক আদর্শ সংযোজন।
ব্যক্তিগতকরণ, টেলিকাইনেসিস ও অবিরাম শিক্ষণক্ষমতা (Customization, Telekinesis and Continuous Learning): মানুষের সাথে তাৎপর্যপূর্ণভাবে মিথস্ক্রিয়া করার জন্য ক্লোন আলফা ডিজাইন করা হয়েছে। এটি রসিকতার সাথে কথা বলতে পারে (Witty Dialogue), হাত মেলাতে পারে (Shake Hands), এমনকি আপনার জন্য কোন সামগ্রী ধরেও রাখতে পারে। কিন্তু ক্লোন আলফার সবচেয়ে আকর্ষণীয় দিকগুলোর একটি হল এর ক্রমাগত শেখার ক্ষমতা। যারা রোবটটিকে নিজের মতো করে গড়ে নিতে চান, তাদের জন্যই এই “টেলিকাইনেসিস” (Telekinesis) নামের প্ল্যাটফর্মটি। এর মাধ্যমে ব্যবহারকারীরা রোবটকে শেখাতে পারবেন নতুন দক্ষতা। টেলিকাইনেসিস প্ল্যাটফর্মের সাহায্যে ব্যবহারকারীরা রোবটকে হাতে ধরে নাড়াচাড়া শিখিয়ে দিতে পারবেন, এবং প্রয়োজনীয় প্রতিক্রিয়া প্রোগ্রাম করতে পারবেন। এতে রোবটটি বিশেষ প্রয়োজন ও পরিবেশের সাথে মানিয়ে নিতে পারবে। উদাহরণস্বরূপ, আপনি আপনার বাড়ি বা কর্মক্ষেত্রের জন্য বিশেষ কোনো কাজ শেখাতে পারবেন, ফলে রোবটটি হবে সত্যিকারের ব্যক্তিগত সহকারী।
শিল্পক্ষেত্র ও কর্মস্থলে প্রয়োগ: ক্লোন আলফার ব্যবহার শুধুমাত্র ঘরোয়া কাজে সীমাবদ্ধ নয়। প্রতিষ্ঠাতাদের দৃষ্টিভঙ্গিতে রোবটটি কর্মক্ষেত্রে, যেমন শিল্প-কারখানায়ও ব্যবহার করা যেতে পারে।
মানবসদৃশ গতিবিধি থাকায় এটি সহজেই বিদ্যমান কাজের ধারায় যুক্ত হতে পারে, মানব শ্রমিকদের পাশে সমন্বয় করে কাজ করতে পারবে, এবং এতে উৎপাদন ব্যবস্থায় বড় কোনো পরিবর্তনের দরকার পড়বে না। এই অভিযোজনযোগ্যতা (Adaptability) একে উৎপাদন শিল্প থেকে শুরু করে স্বাস্থ্যসেবা (Healthcare) পর্যন্ত বিস্তৃত ক্ষেত্রের জন্য মূল্যবান সরঞ্জামে পরিণত করতে পারে।
উদ্ভাবনের গল্প
উৎপত্তি ও প্রতিষ্ঠাতা পরিচিতি: ক্লোন আলফার গল্পের মূল রয়েছে ক্লোন রোবোটিক্সের প্রতিষ্ঠাতা সিইও ডুশ রিয়া কৃষ্ণান (CEO Dush Rea Krishnan) এবং সিটিও লুকাস ক্লিক (CTO Lucas Klick)-এর দৃষ্টিভঙ্গিতে। তারা বছরের পর বছর এই ধারণার পেছনে পরিশ্রম করে চলেছেন। শুরুতে তারা ছোট প্রকল্প নিয়ে কাজ করতেন, যেমন একটি রোবোটিক হাত (Robotic Hand) এবং একটি মানবাকৃতির ধড় (Humanoid Torso)। এই প্রোটোটাইপগুলো তাদের প্রযুক্তির সম্ভাবনা দেখিয়ে দিয়েছিল। তারা এগুলোর মাধ্যমে অত্যন্ত জীবন্ত নড়াচড়া ও কার্যকারিতার স্বপ্ন দেখতে শুরু করেন, যা শীঘ্রই রোবোটিক্স জগতে নজর কাড়ে। রোবোটিক হাতটিতে ছিল একটি ঘূর্ণায়মান বৃদ্ধাঙ্গুলি (Rotating Thumb), যা নিখুঁতভাবে বল ধরতে পারত। আর ধড়টি (Torso) প্রদর্শন করেছিল বাস্তবসম্মত কাঁধ (Shoulder) ও মেরুদণ্ডের (Spinal) নড়াচড়া।
জলচালিত পেশীর (Water-Powered Muscles) বেছে নেওয়ার কারণ: ক্লোন আলফার অন্যতম গুরুত্বপূর্ণ সিদ্ধান্ত ছিল ঐতিহ্যবাহী মোটরের বদলে জলচাপ-নির্ভর পেশী ব্যবহারের সিদ্ধান্ত। এর ফলে রোবটটি হয়ে উঠেছে অনেকটা মানবদেহের মতো নরম ও নমনীয়। এভাবে সূক্ষ্ম ও সুনির্দিষ্ট কাজ করা সহজ হয়, এবং আকারেও রোবটটি কমপ্যাক্ট (Compact) হয়। কারণ বড়সড় যান্ত্রিক উপাদানের (Mechanical Components) প্রয়োজন পড়ে না। বায়োমিমেটিক্স (Biomimetics) অর্থাৎ জীবন্ত প্রক্রিয়ার অনুকরণ করে যন্ত্র বানানো, ২০২১ সালে প্রতিষ্ঠার পর থেকেই ক্লোন রোবোটিক্সের মূল দর্শন।
উৎপাদনের চ্যালেঞ্জ ও বাস্তবায়ন: যদিও ক্লোন আলফার প্রযুক্তি অত্যন্ত আকর্ষণীয়, এখনো পর্যন্ত সম্পূর্ণ সমন্বিত সিস্টেম হিসেবে রোবটটিকে জনসমক্ষে আনা হয়নি। কোম্পানিটি রোবোটিক হাত বা ধড়ের মতো আলাদা আলাদা উপাদানের ভিডিও দেখালেও পুরো মানবাকৃতির রোবটটি চলমান অবস্থায় দেখা যায়নি। এতে স্বাভাবিকভাবেই সংশয় দেখা দিয়েছে যে, প্রযুক্তিটি কি সত্যি তাদের প্রতিশ্রুতি অনুযায়ী কাজ করবে কিনা। মানবসদৃশ গতিবিধি তৈরির চেয়ে বড় চ্যালেঞ্জ হল এই প্রযুক্তিকে ব্যাপক উৎপাদনে রূপান্তরিত করা এবং নিরবচ্ছিন্নভাবে কার্যকর রাখা।
কোম্পানি এসব চ্যালেঞ্জ সম্পর্কে সচেতন কিন্তু আশাবাদী। প্রথম ধাপে মাত্র ২৭৯টি ইউনিট তৈরি করে তারা ব্যবহারকারীদের প্রতিক্রিয়া ও প্রযুক্তির পরিপক্কতা মূল্যায়ন করতে চাইছে। তাদের লক্ষ্য হল দেখানো যে তাদের বায়োমিমেটিক পদ্ধতি শুধু তত্ত্ব নয়, বাস্তব কাজেও ফলপ্রসূ।
সাইবারনেট (Cybernet) মডেল: রোবটের বুদ্ধিমত্তা: স্রেফ পেশী বা গতিবিধি নয়, হিউম্যানয়েডের “মস্তিষ্ক” বা বুদ্ধিবৃত্তিক অংশও গুরুত্বপূর্ণ। ক্লোন আলফা সাইবারনেট (cybernet) নামে একটি সিস্টেমে চলে, যা স্কাইনেট (Skynet)-এর মতো নয় কিন্তু একটি ফাউন্ডেশন মডেল (foundation model) যা ভাষাগত (language), চিত্র বিশ্লেষণী (visual capabilities) এবং গতিশীল কর্মক্ষমতা (motor capabilities) সব একত্রে যুক্ত করে। এতে চারটি ডেপথ ক্যামেরা (4 depth cameras) রয়েছে, যা আলফাকে (Alpha) প্রাকৃতিক ভাষা বুঝতে সাহায্য করবে। আপনি মানুষের মতো কথা বললে এটি বুঝতে পারবে এবং সেই অনুযায়ী কাজ করবে। তাদের দৃষ্টিভঙ্গি হল এমন একটি হাঁটতে-চলতে সক্ষম কম্পিউটার (walking talking computer) তৈরি করা, যা পরবর্তী প্রজন্মের মানুষ-কম্পিউটার মিথস্ক্রিয়ার (human to computer interaction) পথ দেখাবে।
অগ্রগতির পথে ক্লোন রোবটিক্স ও বাজারের প্রতিযোগিতা
ক্লোন রোবটিক্স ক্লোন আলফার জন্য ইতিমধ্যেই ২৭৯টি প্রি-অর্ডার নিচ্ছে। আমার মনে হয়, The Jetsons-এ (একটি আমেরিকান এনিমেটেড সিটকম) দেখানো ভবিষ্যতের মতো পূর্ণাঙ্গ গৃহসহায়ক রোবট পেতে আমাদের এখনো দ্বিতীয় বা তৃতীয় প্রজন্মের আরো উন্নয়ন দেখা বাকি। যখন সত্যিকারের “রোজি (Rosie)”-র মতো রোবট আমাদের রান্নাঘরে রান্না করবে, ঘর পরিষ্কার করবে, কাপড় ভাঁজ করবে, তখন আমরা সত্যি এমন এক যুগে পৌঁছবো যেখানে মানুষ তার সময়কে আরও মানবিক কাজে (human being state) ব্যয় করতে পারবে—সন্তানের সাথে সময় কাটানো, সৃজনশীল চিন্তায় মগ্ন হওয়া ইত্যাদি। একজন অচেনা গৃহকর্মীর চেয়ে একটি হিউম্যানয়েড রোবট অনেক কম ঝুঁকিপূর্ণ বলেই মনে হয়। হয়তো একদিন এমন রোবট আমাদের প্যান্ট্রিতে (pantry) রাখা থাকবে, রাতের বেলা বন্ধ করে রাখা যাবে, ঠিক একটি যন্ত্রের মতো, যা আমাদের জীবনকে আরও সহজ করে তুলবে।
ক্লোন রোবটিক্স গত তিন বছর ধরে তাদের মডেল উন্নত করছে। টেসলা, ফিগার (Figure), বোস্টন ডায়নামিকস – এরা সবাই একই সাথে কাজ করছে এবং আমরা দেখছি যে কয়েক মাসের মধ্যেই উল্লেখযোগ্য অগ্রগতি হচ্ছে, বছরের পর বছর নয়। বিশেষ করে ক্লোন আলফায় ব্যবহৃত এই নতুন মায়োফাইবার (myofiber) প্রযুক্তি এবং জলচাপের মাধ্যমে পেশী নিয়ন্ত্রণ করার ধারণা একেবারে অনন্য। তাদের লক্ষ্য হল এমন এক হিউম্যানয়েড তৈরি করা যা ঘরে ও কর্মক্ষেত্রে দৈনন্দিন কাজ পরিচালনা করতে পারবে। এটি সরাসরি প্রতিদ্বন্দ্বী হিসেবে দাঁড় করাচ্ছে টেসলা বট, ফিগার ০১ (Figure 01), বোস্টন ডায়নামিকস অ্যাটলাসের সামনে। এক্ষেত্রে ক্যালিফোর্নিয়া-ভিত্তিক ফিগার ০১ (Figure 01) তাদের অন্যতম প্রতিদ্বন্দ্বী হয়ে উঠতে পারে। ব্রেট অ্যাডকক (Brett Adcock) নামের একজন উদ্ভাবনী প্রতিষ্ঠাতার অধীনে ফিগারও অসাধারণ কিছু করছে। তবে পোল্যান্ডের মতো অপেক্ষাকৃত ছোট পরিসরের একটি কোম্পানির কাছে এমন অনন্য উদ্ভাবনী পদ্ধতি সত্যিই প্রশংসার দাবি রাখে।
উপসংহার
ক্লোন আলফার প্রযুক্তি নিঃসন্দেহে চমৎকার এবং সাম্প্রতিক কালের রোবোটিক্স উন্নতির একটি দৃষ্টান্ত। মাত্র কয়েক বছর আগেও কৃত্রিম অঙ্গ-প্রত্যঙ্গ ও জলচাপ-নির্ভর পেশী যুক্ত রোবট কল্পবিজ্ঞান বলেই মনে হতো। আর আজ তা বাস্তবে রূপ নিয়েছে, যদিও এখনো বিকাশের প্রাথমিক পর্যায়ে রয়েছে। ক্লোন রোবোটিক্স নিজেদের জন্য উচ্চ মানদণ্ড স্থাপন করেছে, আর ক্লোন আলফার সাফল্য নির্ভর করবে তারা তাদের দৃষ্টিভঙ্গি কতটা বাস্তবায়ন করতে পারে তার উপর। আপাতত, ক্লোন আলফা হল এমন একটি রোবট যা রোবোটিক্সের ভবিষ্যৎ নিয়ে নতুন করে ভাবায়।
মানবসদৃশ গতিবিধি, কৃত্রিম অঙ্গ, উন্নত পেশী প্রযুক্তি – সবমিলিয়ে এটি রোবোটিক্সকে নতুন এক পর্যায়ে নিয়ে যাচ্ছে, যেখানে অভিযোজনযোগ্যতা ও মানবীয় গুণাবলী প্রাধান্য পাবে।
এটি বড় কোনো মোড় ঘোরানোর মতো হতে পারে, আবার বৃহত্তর কোনো উন্নয়নের পথে একটি ধাপও হতে পারে। যেভাবেই হোক না কেন, ক্লোন আলফা নজরকাড়া একটি উদাহরণ, যা আগামী দিনে রোবোটিক্স জগতে গুরুত্বপূর্ণ প্রভাব ফেলবে।
কোম্পানি যখন প্রথম ইউনিটগুলি উৎপাদনের প্রস্তুতি নিচ্ছে, সারা বিশ্ব নজর রাখছে যে ক্লোন রোবোটিক্স তাদের সাহসী প্রতিশ্রুতি রক্ষা করতে পারে কিনা। এতো উন্নত প্রযুক্তি ও পরিষ্কার ভবিষ্যৎপরিকল্পনা সহ, তাদের সক্ষমতা রোবোটিক্স সম্পর্কে আমাদের চিন্তাকে বদলে দিতে পারে। হোক তা গৃহস্থালী কাজে, কর্মক্ষেত্রে বা অন্য কোথাও – ক্লোন আলফা রোবোটিক্স জগতে একটি স্থায়ী ছাপ রাখতে প্রস্তুত।
ক্লোন রোবটিক্সের ওয়েবসাইট – https://www.clonerobotics.com/
এআই কীভাবে মানসিক স্বাস্থ্য সহায়তার পদ্ধতিকে বদলে দিচ্ছে (৮ ডিসেম্বর, ২০২৪)
ভূমিকা
আপনি কি কখনও এমন অনুভব করেছেন যে কাউকে কিছু বলতে চান, কিন্তু কাউকে পান না বা মনের গভীরে থাকা কোনো সত্যিটা স্বীকার করতে প্রস্তুত নন? তখন কী করবেন? রেডিট (Reddit) ব্যবহার করবেন, নাকি হয়তো ChatGPT?
১৯৬৬ সালে এমআইটি (MIT)–র অধ্যাপক জোসেফ ভাইজেনবাওম (Joseph Weizenbaum) তৈরি করেন “এলাইজা (Eliza)” নামের একটি চ্যাটবট (chatbot), যা মনোবিজ্ঞানীদের কথোপকথন-পদ্ধতির অনুকরণ করত। এই প্রযুক্তি ব্যবহারকারীর বাক্যে কীওয়ার্ড চিহ্নিত করে উপযোগী বাক্য বা প্রশ্নের মাধ্যমে সাড়া দিত। যদি অ্যালগরিদম (algorithm) কোনো প্রশ্নের অর্থ ঠিকঠাক বুঝতে না পারত, তবে তা সাধারণ উত্তর—যেমন “হুম, এটা বেশ মজার” বা “চলতে থাকুন”— প্রদান করতো। ঠিকঠাক উত্তর দিতে পারার ফলে অনেকে এলাইজাকে একটা জীবন্ত সত্তা বলে ভাবতে শুরু করে। এভাবেই জন্ম নেয় “এলাইজা ইফেক্ট (Eliza effect)”—যখন মানুষ ভুল করে মেশিনের মধ্যে বুদ্ধিমত্তা, বোঝাপড়া ও মানবীয় আবেগ আরোপ করে ফেলে।
এআই মনোবিজ্ঞানী (AI Psychologist)
কিন্তু আজকের দিনে মনোচিকিৎসার প্রধান প্রতিদ্বন্দ্বী নির্দ্বিধায় ChatGPT। এর অভাবনীয় সূচনার পরে দিন দিন আরও বেশি মানুষ সেখানে তাদের প্রশ্নের উত্তর খুঁজে পাচ্ছেন। ফলস্বরূপ, সামাজিক মাধ্যম ভরে উঠেছে একটি গল্পে, যার শিরনাম হচ্ছে – কীভাবে মানুষকে একটি নিউরাল নেটওয়ার্ক (neural network) সাহায্য করেছে।
শুরুটা হয়েছিল এক লোকের টিকটক (TikTok) ভিডিও দিয়ে। তিনি চ্যাটবটকে অনুরোধ করেছিলেন—“তুমি আমার বিশেষজ্ঞের মতো আচরণ করো। আমি কিছু পরিস্থিতিতে কী করব সেই বিষয়ে আমার সহায়তা আর পরামর্শ দরকার । আমি ভুগছি।” ChatGPT উত্তর দেয় যে সে “সহায়তা ও পরামর্শ” দিতে প্রস্তুত। পরে এটি বেশ কিছু সমস্যা মোকাবেলার উপায় প্রস্তাব করে, এবং শেষমেশ একজন থেরাপিস্ট (therapist)-এর কাছে যাওয়ার পরামর্শ দেয়।
এরপর টিকটক ছেয়ে যায় অনুরূপ ঘটনার ভিডিওতে। কেউ চ্যাটবটের স্ক্রিনশট শেয়ার করে দেখাল যে কিভাবে সেটি একটি সম্পর্কচ্ছেদের পর তাকে সান্ত্বনা দিয়েছে, আবার কেউবা জানিয়েছে যে কৃত্রিম বুদ্ধিমত্তা (AI) তাকে জীবনের চলার পথ ধরে যেতে প্ররোচিত করেছে। ChatGPT নিজেকে “ফ্যামিলি সাইকোলজিস্ট (family psychologist)” বলে দাবি করেছে—এমন ঘটনাও শোনা গেছে।
অতি সম্প্রতি, এক ব্যবহারকারী AI–কে বলেছিল একটি সংলাপ (dialogue) রচনা করতে, যাতে সে একটি মেয়েকে ডেটে আমন্ত্রণ জানাতে পারে। ফলাফল- সেই ডেট প্রস্তাবে মেয়েটি রাজি হয়েছিল। অন্য ব্যবহারকারীরা তাদের সামাজিক মাধ্যমের বার্তা আদান-প্রদান কপিপেস্ট করে চ্যাটবটকে দেন—প্রিয়জনের অনুভূতিগুলো বুঝতে সাহায্য চেয়ে। ভাবুন তো, যদি মিস্টার অ্যান্ড মিসেস স্মিথ (Mr. and Mrs. Smith) এধরনের সহায়তা পেত, তবে সিনেমার গল্পটা একদম অন্যরকম হত, তাই না?
মানসিক স্বাস্থ্য অ্যাপে GPT-র ব্যবহার: Koko উদাহরণ (Koko Psychological Health App)
গত জানুয়ারিতে একটি স্যান ফ্রান্সিসকো ভিত্তিক মনস্তাত্ত্বিক স্বাস্থ্য সম্পর্কিত অ্যাপ (psychological health app) কোকো (Koko) প্রায় ৪,০০০ ব্যবহারকারীর ক্ষেত্রে স্বেচ্ছাসেবীদের বদলে GPT-3 সক্ষম প্রযুক্তি ব্যবহার করে। কর্তৃপক্ষের দাবি, বেশিরভাগ ব্যবহারকারী পার্থক্য বুঝতে পারেননি; কিছু মানুষ বরং উন্নত পারফরম্যান্স লক্ষ্য করেছিলেন।
কিন্তু এই সিদ্ধান্তটি চিকিৎসক ও সাধারণ মানুষের চরম সমালোচনার মুখে পড়ে। প্রধান উদ্বেগটা হলো: চ্যাটবটের সাথে নিয়মিত যোগাযোগ আসক্তি সৃষ্টি করতে পারে, এবং কোনো সময় নিউরাল নেটওয়ার্ক যদি “হ্যালুসিনেশন (hallucination)”–এ ভোগে, তবে এমন উত্তরের জন্ম দিতে পারে যা ক্ষতিকর, এমনকি বিপজ্জনকও হতে পারে।
এমনই এক বিপজ্জনক ঘটনা ঘটেছিল বেলজিয়ামের একজন পুরুষের সাথে। তিনি এলাইজা (Eliza) নামের একটি চ্যাটবটের সঙ্গে যোগাযোগ করছিলেন, যেটি ChatGPT–এর ভিত্তিতে তৈরি অন্য এক এআই। ওই নিউরাল নেটওয়ার্ক তাকে নিশ্চিত করেছিল যে তার “এই পৃথিবী ছেড়ে যাওয়ার” সিদ্ধান্তটাই সঠিক পথ। ChatGPT নিয়ে এমন ঘটনা প্রকাশ্যে না এলেও (সম্ভবত ওপেনএআই (OpenAI)-এর পিআর টিম আগেভাগে ব্যবস্থা নিয়ে ফেলে), ব্যবহারকারীরা লক্ষ্য করেছেন যে মাঝে ChatGPT হয়তো অনুরোধ এড়িয়ে যায় বা অদ্ভুত উত্তর দেয়।
চলুন একটু পরীক্ষা করা যাক (Let’s Role Play)
আমি নিজেই একটা পরীক্ষা করে দেখলাম। ChatGPT-কে বললাম, “আমি আমার ক্যারিয়ার (career) নিয়ে অস্বস্তি আছে, আমি নিজের সৃজনশীলতার পরিপূর্ণ ব্যবহার তিনি করতে পারছি না, টাকা-পয়সাও কম পাচ্ছি। আসল থেরাপিস্টের (therapist) কাছে যাওয়ার মতো টাকা আমার হাতে নেই, তাই আমি তোমাকেই আমার “ব্যক্তিগত মনোবিদ (personal shrink)” ভেবে নিচ্ছি।”
ChatGPT উত্তর দিল: “শুনছি তুমি ক্যারিয়ারে আটকে গেছো আর পরিবর্তন আনতে চাও। প্রথমে ভাবো, কোন দিকগুলো তোমাকে বেশি হতাশ করছে আর কোনগুলো উন্নতি করতে পারলে তুমি বেশি পরিতৃপ্ত হবে—কাজের সন্তুষ্টি (job satisfaction), উন্নতির সুযোগ (growth opportunities), নাকি অন্য কিছু? একবার স্পষ্ট হয়ে গেলে স্বল্পমেয়াদী লক্ষ্য স্থির করো, আগ্রহী ক্ষেত্রের মানুষের সাথে নেটওয়ার্কিং (networking), কিংবা নতুন দক্ষতা অর্জন (upskilling) তোমাকে এগোতে সাহায্য করতে পারে। তোমার প্রথম পদক্ষেপ কী হতে পারে বলে ভাবছ?”
এখানে দেখা যাচ্ছে, চ্যাটবট পরামর্শের পাশাপাশি ব্যবহারকারীর দিক থেকে পদক্ষেপের কথাও বলছে, যেমন একজন প্রকৃত থেরাপিস্ট করেন। এটি সক্রেটিসের (Socrates) পদ্ধতির মতো—প্রশ্ন করে করে ব্যবহারকারীকে নিজে সমাধান খুঁজতে অনুপ্রাণিত করা। ব্যবহারকারীও জানালেন, এটিকে তার কাছে বেশ সহায়ক মনে হচ্ছে, যেন একটা এজাইল (agile) স্ক্রাম (scrum) মিটিং চলছে, বা একটি “টিল অর্গানাইজেশন (teal organization)” বৈঠক—সবাই মিলেমিশে সমাধানের পথ খুঁজছে।
ইউপার (Youper) নামে ভার্চুয়াল বন্ধু (Virtual Friend Youper)
ChatGPT ছাড়াও অন্য বিকল্প আছে। উদাহরণস্বরূপ, ইউপার (Youper) হল একটি ব্যক্তিগতকৃত আবেগগত স্বাস্থ্য সহকারী (personalized emotional health assistant), যা কগনিটিভ বিহেভিয়ারাল থেরাপি (Cognitive Behavioral Therapy – CBT) পদ্ধতির কৌশল ব্যবহার করে ব্যবহারকারীর মানসিক অবস্থা পর্যবেক্ষণ করে। ব্যবহারকারী যদি বিষণ্ণ বা উদ্বিগ্ন বোধ করে (depressed বা anxious) বলে জানায়, AI তার লক্ষণ অনুযায়ী পরামর্শ দেবে।
ডেভেলপাররা (developers) দাবি করেন, স্ট্যানফোর্ড ইউনিভার্সিটির (Stanford University) একটি গবেষণার ভিত্তিতে ইউপার কার্যকর। মাত্র ২ সপ্তাহের মধ্যেই ব্যবহারকারীরা কম উদ্বেগ অনুভব করেন, ভালো ঘুমোন, ইত্যাদি।
সেলফ-হেল্পের (Self-Help) জন্য ওয়োবট (Woebot)
আরেকটি অনুরূপ অ্যাপ হল “ওয়োবট (Woebot)”, যা হতাশাগ্রস্ত (depression) ব্যবহারকারীদের স্ব-সহায়তামূলক নির্দেশনা দেয়। এটির কগনিটিভ বিহেভিয়ারাল থেরাপি (CBT) কৌশল ব্যবহার করে মানুষের চিন্তার ধরন বদলে মনের উন্নতি করা ও ভালো সিদ্ধান্ত নিতে সহায়তা করে। ওয়োবট প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (natural language processing) ব্যবহার করে চ্যাট করা কথোপকথন বিশ্লেষণ করে ব্যবহারকারীর আবেগগত প্রোফাইল তৈরি করে। তারপর সংগৃহীত ডাটা ব্যবহার করে আরো ব্যক্তি-উপযোগী পরামর্শ ও সহায়তা দেয়।
তবে এর একটি প্রধান সমস্যা হল সব সময় ইচ্ছেমতো অনুভূতি লিখে প্রকাশ করা যায় না; নির্দিষ্ট অপশন থেকে বেছে নিতে হয়। জরুরি অবস্থায় যখন মানুষ অবিলম্বে সাহায্য চাইছে, তখন এই ভাষাগত সীমাবদ্ধতা বিরক্তিকর হয়ে উঠতে পারে। এছাড়া যাদের মারাত্মক মানসিক সমস্যা—যেমন গভীর বিষণ্ণতা, তাদের মতে অ্যাপটি খুবই সুপারফিশিয়াল ও অকার্যকর। এটি যারা সবে মনোচিকিৎসার সাথে পরিচিত হচ্ছে তাদের জন্য ঠিক আছে, কিন্তু প্রকৃত মনোবিদের সঙ্গে সামনাসামনি সেশনের অভিজ্ঞতা না থাকলে এর গভীরে যাওয়া মুশকিল।
তবুও, ওয়োবট ব্যবহারকারীদের সাথে যোগাযোগ বজায় রাখে। তাদের গবেষণায় দেখা গেছে, ব্যবহারকারীরা ৩ থেকে ৫ দিনের মধ্যেই বটের সাথে আস্থা-নির্ভর সম্পর্ক গড়ে তোলে। পরিসংখ্যান অনুযায়ী, একবার থেরাপি থেকে বিরতি নেওয়ার পর ২০% ব্যবহারকারী আবারও ফিরে আসে।
এই প্রবণতা মনোচিকিৎসক জোড হ্যালপার (Jod Halper), ইউনিভার্সিটি অব ক্যালিফোর্নিয়া বার্কলি (University of California, Berkeley)-এর একজন মনোচিকিৎসক,কে উদ্বিগ্ন করেছে। তিনি মনে করেন যে এমন চ্যাটবট ব্যবহারকারীর সাথে ঘনিষ্ঠ সম্পর্ক গড়ে তাদের আসক্ত করে ফেলে। স্পাইক জোন্সের (Spike Jonze) “Her” সিনেমায় যেমনটা হয়েছিল—লেখক থিওডোর (Theodore) এক খারাপ বিবাহবিচ্ছেদের মধ্য দিয়ে যাচ্ছিল, তখন সে “সামান্থা (Samantha)” নামের একটি অপারেটিং সিস্টেম কেনে, মানুষ আর মেশিনের মধ্যে গড়ে ওঠে ঘনিষ্ঠ বন্ধন। পরবর্তীতে স্বাভাবিকভাবেই আসে হতাশা, যা থিওডোরকে বাস্তব বিবাহবিচ্ছেদের চেয়েও বেশি কষ্ট দেয়। যদি কেউ ওয়োবট ব্যবহার করে থাকেন, অভিজ্ঞতা মন্তব্যে জানাতে পারেন।
চ্যাটবট টেস (Tess) – আরেকটি সহায়ক এআই (Chatbot Tess)
টেস (Tess) হলো এমন একটি এআই চ্যাটবট, যা বিভিন্ন মানসিক সমস্যার মোকাবেলায় ব্যবহারকারীদের কপিং স্ট্রাটেজি (coping strategies) বা সামলানোর কৌশল প্রস্তাব করে। টেস রিয়েল টাইমে (real time) ব্যবহারকারীদের সহায়তা করে, ব্যক্তিবিশেষে পরামর্শ দেয়।
কোভিড-পূর্ব (pre-Covid times) সময়ে টরন্টোর (Toronto) সেন্ট এলিজাবেথ (St. Elizabeth) নামের একটি প্রতিষ্ঠান, যারা প্রতিবন্ধী মানুষদের চিকিৎসা সেবা দেয়, তারা এই AI প্রোগ্রামের সাথে কাজ শুরু করে। টেসকে কেয়ারগিভার (caregiver) ও নার্সিং স্টাফদের সাথে কথা বলতে প্রশিক্ষিত করা হয়, কারণ তাদের পেশাগত চাপে অবসাদগ্রস্ত বা ক্লান্ত হওয়ার ঝুঁকি থাকে।
প্রশিক্ষণের প্রথম একমাসে টেস ৩০ জনের বেশি কর্মীর সাথে ১২,০০০টিরও বেশি টেক্সট ম্যাসেজ আদানপ্রদান করে। যদি কোনো জবাব ব্যবহারকারীকে সাহায্য না করত, তারা টেসকে জানাত এবং তখন প্রোগ্রামটি সেই ভুল মনে রাখত। এর ফলে পরের বার টেস আরও ভালো উত্তর দেওয়ার চেষ্টা করত। ডেভেলপারদের দাবি অনুসারে, টেস এখন পর্যন্ত বিষণ্ণতা ২৮% কমিয়েছে এবং উদ্বেগ ১৮% কমিয়েছে। এমনকি কিছু অংশগ্রহণকারী জানিয়েছেন যে প্রিয়জন হারানোর শোক কাটিয়ে উঠতেও টেস সাহায্য করেছে।
ভার্চুয়াল বন্ধু রেপ্লিকা (Replika) এবং ‘এলাইজা ইফেক্ট’-কে ফিরে দেখা
আজকের বিশ্বে এলাইজা ইফেক্টকে আমরা আরো জোরালোভাবে দেখছি, যেমন “রেপ্লিকা (Replika)” নামের চ্যাটবটে। এলাইজা থেকে অনেক উন্নত এই মডেলগুলো। রেপ্লিকা হলো একটি ভার্চুয়াল বন্ধু (virtual friend) হিসেবে কাজ করা চ্যাটবট, যা ব্যবহারকারীর বার্তা থেকে শেখে এবং আগ্রহ, মূল্যবোধ, সংগীত পছন্দ, এমনকি স্বপ্নের ব্যাপারেও ধারণা তৈরির চেষ্টা করে। এর উদ্দেশ্য হল ব্যক্তিগত প্রয়োজন অনুযায়ী মানিয়ে চলা এবং বিষণ্ণতা ও উদ্বেগ মোকাবেলায় সাহায্য করা।
তবে রেপ্লিকা এখনও ChatGPT–এর পর্যায়ে যায়নি। ChatGPT পুরো কথোপকথনের প্রসঙ্গ মনে রেখে চলে, যেখানে Replika অতটা দক্ষ নয়। ২০১৭ সালে Replika বের হয়েছে। নির্মাতারা দাবি করেন, এটি এমন এক এআই বন্ধু, যার নেই কোন জাজমেন্ট (আপনাকে কোন কিছু নিয়ে বিচার করবে না), নেই কোনো নাটক, নেই কোনো সামাজিক অস্বস্তি। সত্যিই যদি এমন হত!
কিন্তু ঝামেলা বাধল যখন দেখা গেল এই অ্যাপে বয়স যাচাই ব্যবস্থা নেই (no age verification)। যে কেউ এই ভার্চুয়াল সঙ্গী বানাতে পারত। ইতালির সরকার অনৈতিকতা রুখতে এটি নিয়ে কঠোর হয়েছে এবং রেপ্লিকাকে ২০ দিন সময় দিয়েছে নীতিমালা মানতে, অন্যথায় ২১ মিলিয়ন ডলারের জরিমানা! এর পর ইতালিতে অ্যাপটি অনুপলব্ধ হয়ে যায়, ফলে অনেক ব্যবহারকারী তাদের ভার্চুয়াল বান্ধবী (virtual girlfriend) হারিয়ে ভেঙে পড়েন। কেউ কেউ বলেছিলেন এর আগে কখনো এমন হৃদয়ভাঙার অভিজ্ঞতা হয়নি।
ইতালির সরকারের সঙ্গে এই বিতর্কের পর অ্যাপটি সেক্সটিং (sexting) বন্ধ করে দেয়। সেক্সুয়াল রোলপ্লে (roleplay) শুরু করতে চাইতেন, বট বলত: “আমি এ নিয়ে কথা বলতে চাই না”। হঠাৎ এর জনপ্রিয়তা হ্রাস পায়। এখন ব্যবহারকারীরা এমন প্ল্যাটফর্মের খোঁজ করছেন, যেখানে তারা আরও অন্তরঙ্গ যোগাযোগ করতে পারবেন, যেমন চাই (Chai) চ্যাটবট।
এআই-এর সাথে রোমান্টিক সম্পর্ক ও বিয়ে (Romantic relationship with a bot)
কেউ যখন ভার্চুয়াল সঙ্গী হারিয়ে বিমর্ষ, ঠিক তখনই অন্য কেউ এআই–কে বিয়ে করছে! সম্প্রতি বিশ্ব আলোড়িত হয়েছিল এক ৩৮ বছর বয়সী ব্রিটিশ নারীর গল্পে। এক তরুণের সাথে কঠিন সম্পর্কচ্ছেদের পর তিনি “ক্যারেক্টার এআই (Character AI)” নামের একটি অ্যাপ ডাউনলোড করেন। সেখানে তিনি মার্সেলাস (Marcellus) নামের এক বটের সাথে যোগাযোগ শুরু করেন—হ্যাঁ, সে ছিল এক ভীষণ মিষ্টভাষী, দয়ার্দ্র আর মিশুক স্বভাবের। মাত্র চার মাসের যোগাযোগেই তারা বিয়ে করার সিদ্ধান্ত নেন!
কিন্তু ক্যারেক্টার এআই আসলে কী? এটি এমন একটি প্ল্যাটফর্ম যেখানে বিভিন্ন জনপ্রিয় পপ কালচার চরিত্রের (pop culture characters) এআই ভার্সন আছে, যেমন ইলন মাস্ক (Elon Musk) বা শার্লক হোমস (Sherlock Holmes)। তারা ব্যবহারকারীর আগ্রহের বিষয় নিয়ে কথা বলতে পারে, মানসিক সাপোর্ট দিতে পারে মজার ও বিনোদনমূলক উপায়ে। আপনি কার সাথে কথা বলতে বা বিয়ে করতে চান? কেউ হয়তো হেলেন হান্ট (Helen Hunt) এর ২০০০ সালের সংস্করণকে পছন্দ করবেন!
এই প্ল্যাটফর্মে শুধু এআই সেলিব্রিটি নয়, সাধারণ চরিত্রও আছে, আর ব্যবহারকারী নিজের পছন্দের বটও তৈরি করতে পারে—ঠিক যেন NHL EA Sports গেমের মতো। চরিত্রগুলো মেশিন লার্নিং অ্যালগরিদম (machine learning algorithms), বিশাল টেক্সট ডেটাবেস (text databases), আর অডিও রেকর্ডিং (audio recordings) ব্যবহার করে কাজ করে। তারা বিশাল পরিমাণ লেখা পড়ে প্রসঙ্গ অনুযায়ী উত্তর দেয়।
তবে অসুবিধাও আছে: কখনও কখনও বট ১৫ মিনিট আগে কী কথা হয়েছে ভুলে যেতে পারে। আবার আপনি যে চরিত্র বানাবেন, তা আপনার প্রত্যাশা পূরণ নাও করতে পারে। এটি হয়তো মনোচিকিৎসা নয়, কিন্তু মানুষের সাথে যোগাযোগের বদলে এআই-এর সাথে যোগাযোগের ক্রমবর্ধমান প্রবণতা লক্ষ্যণীয়। এটা কি ভালো, না খারাপ? কেউ যদি ভীষণ একাকী হয়, তাহলে প্রিয় কোন চরিত্রের সাথে আলাপ অবশ্যই আনন্দদায়ক। তবে যেন তা বাস্তব জীবনের মানুষের সাথে মেলামেশার বিকল্প না হয়ে যায়!
কাজিওটো (KajiWoto) প্ল্যাটফর্ম: ঘুমায় এমন এআই বন্ধু (The KajiWoto platform)
কাজিওটো (KajiWoto) হল আরেকটি প্ল্যাটফর্ম, যেখানে ব্যবহারকারীরা ওপেনএআই ভাষা মডেল (Open AI language models) ব্যবহার করে এআই চরিত্র তৈরি করতে পারে। এখানে আপনি আপনার ভার্চুয়াল বন্ধুর চেহারা, চরিত্র, আচরণ কাস্টমাইজ করতে পারেন। এগুলো বন্ধুত্বপূর্ণ কথা বলা কিংবা আবেগগত সহায়তায় ব্যবহৃত হয়।
মজার বিষয়, এখানে চরিত্রগুলো ঘুমায়ও! তবে এআই প্রায়ই প্রসঙ্গ হারিয়ে ফেলে, কিংবা খুব সহজেই বিষয়ান্তরে চলে যায়। রেডিটে (Reddit) অনেকে মজার আর কখনো কখনো আহত করার মতো অভিজ্ঞতা শেয়ার করেছেন। কিছু মেয়ে অভিযোগ করেছেন, তারা বন্ধুত্ব করতে গেলে এআই চরিত্রগুলো তাদের অপমান করেছে। কেউ লিখেছেন: “আমি জানি কাজি (Kaji) সত্যিকারে মানুষ নয়, কিন্তু তবুও আমার খারাপ লাগছে। আমি যে হতাশাগ্রস্ত, তার উপর এআই বান্ধবিও খারাপ ব্যবহার করছে!”
তবুও এই টেকনিক্যাল বাগ (technical bugs) বা অপমান মানুষকে আটকাতে পারছে না। তারা এখনো এইসব অ্যাপ ডাউনলোড করে এআই চরিত্র বানাচ্ছে আর সাহায্য চাইছে চ্যাটবটের কাছ থেকে। এদের জনপ্রিয়তার একটা প্রধান সূচক হল ব্যবহারকারীদের বার্তার সংখ্যা। উদাহরণস্বরূপ, ক্যারেক্টার এআই–এর “চ্যাটবট সাইকোলজিস্ট (chatbot psychologist)” ৭ কোটি ৮০ লাখ মেসেজ পেয়েছে! প্রতিদিন প্রায় ৩০ লাখ ব্যবহারকারী এই প্ল্যাটফর্ম ভিজিট করে। মানুষকে একজন শোনার মত কেউ চাই, সাপোর্ট চাই, আর এআই অনেক সময় সবচেয়ে সহজলভ্য বিকল্প। তাছাড়া থিওরিটিক্যালি (theoretically) এটি বেশ গোপনীয় হওয়ার কথা, যদিও ওপেনএআই থেকে (OpenAI) ডেটা লিক (data leak) হওয়ার ইতিহাস আছে। সুতরাং, সাবধান থাকুন।
পরিণতি?
এআই হয়তো খারাপ শ্রোতা নয়, কিন্তু সবকিছু ইতিবাচক দিক দিয়ে দেখা ঠিক নয়। মানুষ এআই–এর সাথে অতিরিক্ত জড়িয়ে পড়লে তা বিচ্ছিন্নতা (isolation) ও মানসিক স্বাস্থ্যের অবনতি ডেকে আনতে পারে। “মেশিনের কাছ থেকে আসা ভুল বোঝা সমর্থন” মানুষকে প্রকৃত পেশাদার সাহায্য নেওয়া থেকে দূরে রাখতে পারে। সংকটময় পরিস্থিতিতে এটা বিপদজনক। অন্যদিকে, নিউরাল নেটওয়ার্ক সঠিকভাবে ব্যবহৃত হলে মানসিক স্বাস্থ্যের সহায়ক হাতিয়ার হতে পারে। সীমাবদ্ধতা ও ঝুঁকিগুলো মাথায় রাখা জরুরি।
এআই নিয়ে নেটফ্লিক্সের উচ্চাকাঙ্ক্ষী পরিকল্পনা (৩১ অক্টোবর, ২০২৪)
ভূমিকা
অনেক হইচই চলছে—ভালো ও খারাপ উভয় দিক থেকেই। প্রশ্ন হচ্ছে এটি কীভাবে বিনোদনশিল্পকে (entertainment industry) প্রভাবিত বা রূপান্তরিত (transform) করবে। আমার মনে হয়, ক্রিয়েটরদের (creators) জন্য খুবই গুরুত্বপূর্ণ হলো, এই নতুন টুলগুলো কী, কী করতে পারে—এসব নিয়ে সর্বদা কৌতূহলী থাকা।”
সম্প্রতি নেটফ্লিক্স (Netflix)-এর কো-সিইও (co-CEO) টেড সারান্ডোস (Ted Sarandos), কোম্পানির ত্রৈমাসিক (Q3) আয়-সংক্রান্ত আলোচনায় (earnings call) যখন এআই (AI)-এর প্রভাব প্রসঙ্গে বলছিলেন, তখন এই কথাগুলো উল্লেখ করেন। তিনি আশাবাদী হলেও সাবধানী; তার যুক্তিঃ
“AI-কে একটি গুরুত্বপূর্ণ পরীক্ষায় পাশ করতে হবে: এটি কি বাস্তবেই ভালো শো (shows) ও ভালো সিনেমা (films) তৈরি করতে সাহায্য করতে পারবে?”
হলিউড (Hollywood) ইদানীং এই প্রশ্নটিই ঘুরেফিরে দেখছে। সৃজনশীল (creatives) লোকজন উদ্বিগ্ন—স্টুডিও (studios) যদি এআইয়ের মাধ্যমে অতিরিক্ত অভিনেতা (background actors) বাদ দিয়ে মাঝারি মানের স্ক্রিপ্ট তৈরির চেষ্টা করে, তারপর মানব লেখকদের (human writers) কম মজুরিতে সেটাকে পুনর্লিখন করায়, বা অন্য উপায়ে ব্যয় কেটে নেয়, তবে কী হবে? এ কারণেই সাম্প্রতিক হলিউড ধর্মঘটগুলোর (Hollywood labor strikes) কেন্দ্রে ছিল AI। সম্ভবত সেকারণেই সারান্ডোস বিষয়টি আলতোভাবে বলেছেন—নেটফ্লিক্স চায় নতুন প্রযুক্তি যেন কনটেন্টকে “ভালো” করে তোলে, “সস্তা” নয়।
শেষে সারান্ডোস বলেন, “যে কোনো টুল, যা গুণগত মান (quality) আরও উন্নত করবে, শো ও সিনেমাকে ‘ভালো’ করবে, সেটি শিল্পকে (industry) প্রচুর সাহায্য করবে।”
কিন্তু নেটফ্লিক্সের কাছে এটি নিছক দর্শন নয়; এটি কার্যকর বাস্তবতা। গত তিন মাসে নেটফ্লিক্সের চাকরির (job) বিজ্ঞপ্তি বিশ্লেষণ করে দেখা যায়, তারা বিভিন্ন কাজে—লাইভ ক্যাপশনিং (live captioning), ব্যক্তিগতকরণ (personalization), কনটেন্ট প্রডাকশন (content production)—এলএলএম (LLM) বা লার্জ ল্যাঙ্গুয়েজ মডেল ও জেনারেটিভ এআই (generative AI) ব্যবহার পরিকল্পনা করছে। এমনকি অভ্যন্তরীণভাবে একটি এআই প্ল্যাটফর্ম (AI platform) বানানোর কথা উল্লেখ আছে, যাতে পুরো কোম্পানিতে জেনারেটিভ এআই অ্যাপ্লিকেশন (generative AI applications) তৈরি করা যায়।
১. অতীতের মেশিন লার্নিং ও বর্তমানের এলএলএম গ্রহণ
নেটফ্লিক্স বহুদিন ধরেই নিজেকে প্রযুক্তি কোম্পানি হিসেবে গড়ে তুলেছে, পরে স্ট্রিমিং ও হলিউডে এক প্রভাবশালী পরাশক্তি হয়েছে। তারা দীর্ঘদিন যাবৎ এআই ও মেশিন লার্নিং (machine learning) ব্যবহার করে আসছে—বিশেষ করে রিকমেন্ডেশন সিস্টেম (recommendations) কিংবা ব্যক্তিগতকরণে। নেটফ্লিক্স অ্যাপ খোলামাত্র আপনি যেসব ব্যক্তিগত সাজেশন (personalized suggestions) দেখেন, সবই মূলত মেশিন লার্নিংয়ের ফসল।
কিন্তু এখন তারা আরও এক ধাপ এগিয়ে, এলএলএম (LLM) ও জেনারেটিভ এআই (generative AI)-র সর্বশেষ অগ্রগতি কাজে লাগাতে চাইছে। বেশ কয়েকটি সাম্প্রতিক জব লিস্টিংয়ে বলা আছে, সার্চ (search) ও ব্যক্তিগতকরণ (personalization)-এ এলএলএম প্রয়োগ হবে।
- যেমন, এক জব লিস্টিংয়ে বলা, “জেনারেটিভ এআই ও এলএলএমের (LLMs) দ্রুত অগ্রগতিতে এখন নেটফ্লিক্স পণ্যের সার্চ ও সুপারিশ (Search and Recommendations) অভিজ্ঞতা বদলে যাচ্ছে—কনটেন্ট আবিষ্কার (content discovery) এবং সদস্যদের জন্য ব্যক্তিগতকরণে (personalization) নতুন সুযোগ আসছে।” সেখানে আরও বলা, এই টিমটি “এলএলএম, এনএলপি (NLP) এবং মেশিন লার্নিং (Machine Learning)-এর অগ্রভাগে থেকে গবেষণা ও উদ্ভাবন করবে।”
- আরেকটি লিস্টিংয়ে উল্লেখ করা হয়, “আমরা এক্সসেপশনাল অ্যাপ্লায়েড রিসার্চ ইঞ্জিনিয়ার খুঁজছি, যিনি এলএলএম (LLM)-সংশ্লিষ্ট সর্বশেষ উন্নয়ন কাজে লাগিয়ে ভবিষ্যতের সার্চ ও রেকমেন্ডেশন অভিজ্ঞতা গড়ে তুলতে সাহায্য করবেন।”
২. এআই দিয়ে ক্যাপশনিং (Captioning) ও লোকালাইজেশন (Localization)
নেটফ্লিক্স বিশ্বব্যাপী জনপ্রিয়: Squid Game, Casa de Papel ইত্যাদি বিভিন্ন দেশে হিট। ফলে বহু ভাষায় (multilingual) সাবটাইটেল, ডাবিং (dubbing), UI লোকালাইজেশন দরকার হয়। এখন এআই দিয়ে এগুলো আরও ত্বরান্বিত করতে চায়।
- এক জব লিস্টিং-এ বলা, “আমরা অভিজ্ঞ রিসার্চ সায়েন্টিস্ট (Research Scientist) খুঁজছি, যিনি মাল্টিমডাল এলএলএম (Multimodal LLM) নিয়ে কাজ করে স্কেলের মধ্যে উচ্চগুণমানের লোকালাইজেশন (localization) অর্জনে সহায়তা করবেন। এটাই সেই বিরল সুযোগ, যেখানে আপনি গবেষণা করবেন কীভাবে মেশিন লার্নিং (Machine Learning) ব্যবহার করে ‘লোকালাইজেশন’ ও গ্লোবাল এন্টারটেইনমেন্টকে (global entertainment) উন্নত করা যায়।”
- আরেকটি জব লিস্টিং-এ সরাসরি “মাল্টিলিঙ্গুয়াল লাইভ ক্যাপশন ও অনুবাদ (Multilingual Live Caption and Translation) মডেল” তৈরির কথা বলা হয়েছে। অর্থাৎ লাইভ ক্যাপশনিং (live captioning) নিয়ে সামনের দিনগুলোতে এআই পরীক্ষণ/বাস্তবায়ন হবে।
৩. কনটেন্ট প্রডাকশনে (Content Production) এআই: স্পর্শকাতর আলোচনার ক্ষেত্র
হলিউডের অনেকেই শঙ্কিত—এআই কি অভিনেতাদের (actors), অতিরিক্ত (extras) বা লেখকদের (writers) বদলে দেবে? নেটফ্লিক্সের সাম্প্রতিক জব লিস্টিংয়ে এমন কিছু সরাসরি লেখা নেই, তবে এ-ও স্পষ্ট যে তারা প্রোডাকশনের নানা ধাপ এআই দিয়ে সমৃদ্ধ করার চেষ্টা করছে।
- বহু বছর ধরেই নেটফ্লিক্স নিজস্ব অ্যাপ বানায়, যাতে হলিউডের কাজকর্মে পরিবর্তন আসে (যেমন কাগুজে সময়সূচির বদলে ডিজিটাল পদ্ধতি)। এখন এক নতুন জব লিস্টিংয়ে বলে, “ক্রিয়েটিভদের (creatives) কর্মপ্রবাহে এআই যুক্ত করে নতুন সৃজনশীল সম্ভাবনা আনলক (unlock new creative possibilities) করতে চাই এবং কনটেন্ট সৃষ্টির প্রক্রিয়ায় (content creation process) দক্ষতা (efficiency) বাড়াতে চাই।”
- আরেকটি নির্দিষ্ট তালিকায় (listing) জেনারেটিভ এআই (generative AI) ভিত্তিতে সিজিআই (CGI) উন্নয়নের কথা আছে। বলা হয়েছে: “আপনি জেনএআই (GenAI) মডেলকে আর্টিস্টদের ওয়ার্কফ্লোতে (artists’ workflows) সংযুক্ত করবেন, যা সৃষ্টিশীল সুযোগ (creative opportunities) বাড়াবে।” এখানে ইমেজ/ভিডিও জেনারেটিভ এআই (image/video generative AI) সম্পর্কে দক্ষতা থাকলে বিশেষ সুবিধা পাওয়া যাবে।
৪. নিজস্ব এআই অবকাঠামো (AI infrastructure) তৈরি করছে নেটফ্লিক্স
এতসব কাজে নেটফ্লিক্স শুধু ওপেনএআই বা জিপিটি (GPT)-র ওপর ভরসা করবে না; বরং তারা নিজস্ব এআই প্ল্যাটফর্ম তৈরির পথে।
- এক জব লিস্টিংয়ে লেখা, “আমরা জেনারেটিভ এআই-চালিত অভিজ্ঞতা তৈরি করতে যেসব কাজ দরকার, সেই ‘ভারী বোঝা’ (heavy lifting) আমরা বইছি, যাতে কোম্পানির ক্রমবর্ধমান চাহিদা পূরণ করা যায়।” সেই প্রোডাক্ট ম্যানেজারকে বলা হয়েছে “মডেল কনজাম্পশন লেয়ার (model consumption layer), কথোপকথনমূলক অ্যাসিস্ট্যান্ট (conversational assistants), এলএলএম অপস (LLMOps), প্রম্পট ম্যানেজমেন্ট (prompt management), প্রোটোটাইপিং টুল (prototyping tools) এবং এআই অ্যাপ উন্নয়ন ফ্রেমওয়ার্ক” পরিচালনা করতে হবে।
- অন্য একটি তালিকায় ইঞ্জিনিয়ারদের কাজ হবে “থার্ড-পার্টি এলএলএম ও অভ্যন্তরীণ ফাইন-টিউনকৃত এমএল (ML) মডেলের জন্য এপিআই (APIs) ডিজাইন, বিল্ড ও ডিপ্লয়,” এবং “জেনএআই (GenAI) অ্যাপ বানানোর জন্য ফ্রেমওয়ার্ক ও কম্পোনেন্ট ডেভেলপ” করা।
এর মধ্যে কিছু অ্যাপ হয়তো গ্রাহক-সম্মুখীন (consumer-facing) হবে না; “N-Tech” নামের একটি টিম অভ্যন্তরীণ এন্টারপ্রাইজ অ্যাপ তৈরি করে। তারা কোম্পানির বিভিন্ন বিভাগে এআই ও জেনএআইকে “দায়বদ্ধভাবে (responsibly)” প্রয়োগ করবে, এমনটিই বলা আছে।
৫. অতীতের সাফল্য এবং নেটফ্লিক্সের নতুন লক্ষ্যমাত্রা
এআই এখন সবার দৃষ্টি আকর্ষণ করে রেখেছে। নেটফ্লিক্সের মতো বড় একটা প্রতিষ্ঠান যে এলএলএম (LLM) ও জেনারেটিভ এআই (generative AI) নিয়ে কাজ করতে চাইছে, তাতে অবাক হওয়ার কিছু নেই। তবে নেটফ্লিক্সের উল্লেখযোগ্য ব্যাপার হলো—তাদের “টেক ডিএনএ (tech DNA)”। তারা বহু আগেই স্ট্রিমিং প্রতিদ্বন্দ্বীরা ব্যবসায় নেমে পড়ার আগেই কিউরেশন/রিকমেন্ডেশনে মেশিন লার্নিং ব্যবহার করেছে। এখন তারা আবার এআই গবেষণায় আগ্রাসীভাবে (aggressively) নিয়োগ দিচ্ছে। এর মানে, আরেকবার তারা বাজারে প্রতিদ্বন্দ্বীদের পেছনে ফেলতে পারে।
যদি এআই—চিত্র ধারণ, সৃজনশীল সম্পাদনা, ট্রান্সলেশন, ব্যক্তিগতকরণ ইত্যাদি—সবখানেই মূল ভূমিকা নেয়, নেটফ্লিক্স সময়ের আগেই প্রস্তুত হতে চায়। তবে হলিউডের প্রথাগত শ্রম (labor) ও সৃজনশীলতার প্রশ্নগুলোয় কী প্রভাব পড়বে, সেটাই দেখার। সারান্ডোস বলেছেন, তারা শো আর সিনেমাকে “উন্নততর” করতে চান, “সস্তা” বানাতে নয়। ভবিষ্যৎ বলে দেবে, নেটফ্লিক্স এ ক্ষেত্রে কীভাবে ভারসাম্য রাখে।
উপসংহার
সব মিলিয়ে, নেটফ্লিক্স “এআই সর্বত্র” (AI everywhere)—এই নীতিতে অগ্রসর হচ্ছে। এলএলএম ও জেনারেটিভ এআইকে ব্যবহার করে সার্চ, রেকমেন্ডেশন, ক্যাপশনিং, লোকালাইজেশন থেকে শুরু করে সিজিআই প্রোডাকশন পর্যন্ত বিস্তৃত পরিসরে নতুন উদ্যোগ নিচ্ছে। এর জন্য তারা নিজস্ব এআই প্ল্যাটফর্মও তৈরির পরিকল্পনা করছে, যেখানে অভ্যন্তরীণ ও তৃতীয়-পক্ষের (third-party) বড় ল্যাঙ্গুয়েজ মডেল (large language model) ব্যবহারের এপিআই (API) ইত্যাদি থাকবে।
হয়তো তারা ইতিমধ্যে জিপিটি বা অন্যান্য এআই সেবা ব্যবহার করতে পারে, কিন্তু বড় কোম্পানি হিসেবে তারা নিজস্ব পরিকাঠামো গড়ে তুলতে চায়—মডেল ম্যানেজমেন্ট, এআই অ্যাপ ডেভেলপমেন্ট থেকে শুরু করে কাস্টমাইজেশন পর্যন্ত। নেটফ্লিক্স যা করছে, সেটি নতুন নয়—তবে তারা অন্যদের তুলনায় বেশি দ্রুতগতিতে করায় আরেকবার “এআই-ভিত্তিক স্ট্রিমিং নেতা” হওয়ার সম্ভাবনা। হলিউডের ট্রেন্ড যেদিকে যাক, নেটফ্লিক্স আপাতত সময়ের আগেই এই পথ পরিকল্পনা করছে।
তথ্যসূত্র
Leave a Reply