টিকটক এর নতুন এআই টুল ওমনিহিউম্যান-১ এটি স্থির ছবিকে জীবন্ত করে তুলে

টিকটক-এর মালিক বাইটড্যান্স সম্প্রতি একটি নতুন কৃত্রিম বুদ্ধিমত্তার (AI) টুল চালু করেছে, যার নাম ওমনিহিউম্যান-১ (OmniHuman-1)। এই টুলের মূল কাজ হলো একক একটি ছবির উপর ভিত্তি করে অত্যন্ত প্রামাণিক ও জীবন্ত ভিডিও তৈরি করা। এই ভিডিওতে মানুষ কথা বলছে, হাত নড়াচড়া করছে, গান গাইছে, বাদ্যযন্ত্র বাজাচ্ছে এবং আরও অনেক কিছু দেখানো হচ্ছে।

এই টুলটির সাথে সংযুক্ত একটি গবেষণা পত্র arXiv প্রকাশিত হয়েছে, যেখানে বলা হয়েছে, “ওমনিহিউম্যান অন্যান্য এআই এর তুলনায় অনেক ভালো ফলাফল দিচ্ছে। এটি খুবই বাস্তবসম্মত মানব ভিডিও তৈরি করতে সক্ষম, বিশেষ করে যখন ইনপুট হিসেবে অডিও বা অন্যান্য তথ্য হিসেবে ন্যূনতম সঠিক সংকেত দেওয়া হয়।” টুলটি যে কোনো ধরনের ছবি ইনপুট নিতে পারে, সেটা হতে পারে পর্ট্রেট, অর্ধ-দেহের বা পূর্ণদেহের ছবি। ফলে বিভিন্ন পরিস্থিতিতে আরও বাস্তব এবং মানসম্পন্ন ফলাফল পাওয়া যায়।

প্রদত্ত নমুনা ভিডিওগুলোতে দেখা যাচ্ছে যে, এই টুলটি কেবল মানুষকে নয়, প্রাণী, এনিমেটেড চরিত্র এবং এমনকি ইতিহাসের বিখ্যাত ব্যক্তিত্বকেও জীবন্ত করে তুলতে সক্ষম। উদাহরণস্বরূপ, একটি কালো ও সাদা ভিডিওতে আলবার্ট আইনস্টাইন একটি ব্ল্যাকবোর্ডের সামনে দাঁড়িয়ে কথা বলছেন, যেখানে তিনি হাতের নড়াচড়া এবং সূক্ষ্ম মুখের অভিব্যক্তির মাধ্যমে তাঁর বক্তব্য প্রকাশ করছেন। নিচে ভিডিওটি সংযুক্ত করা হলো,

এই এআই টুলটির চমৎকার আউটপুট নিয়ে বিভিন্ন বিশেষজ্ঞ তাদের মতামত দিয়েছেন। অ্যানেনবার্গ স্কুল ফর কমিউনিকেশন অ্যান্ড জার্নালিজম-এর ক্লিনিক্যাল অ্যাসোসিয়েট প্রফেসর ফ্রেডি ট্রান নাগার জানান, “এই ধরনের ভিডিও খুবই চিত্তাকর্ষক। যদিও বড় পর্দায় যেমন কোনো চলচ্চিত্রে এই ধরনের প্রযুক্তির ব্যবহার কেমন হবে তা আমি নিশ্চিত নই, কিন্তু মোবাইল ফোনের ছোট পর্দায় দেখলে এসব ভিডিও বেশ ইম্প্রেশন ফেলে।” তিনি আরও বলেন, “যদি আপনি ভাবেন যে, ভবিষ্যতে কোনো সময় আমরা এমন কিছু দেখবো যেখানে টিকটকের মতো প্ল্যাটফর্মে মানুষ নিজেই ভিডিও তৈরি না করে ভার্চুয়াল হিউম্যান ব্যবহার করবে, তবে এই প্রযুক্তি সেই সম্ভাবনাকে আরও বাস্তবতার কাছাকাছি নিয়ে আসছে।”

অন্যদিকে, স্টেইনহার্ড্ট স্কুল অফ কালচার, এডুকেশন অ্যান্ড হিউম্যান ডেভেলপমেন্ট-এর অ্যাডজনক প্রফেসর সামান্থা জি. ওল্ফ এর মন্তব্যে বলা হয় , “একটি ছবি থেকে এমনকি কথা বলা ও চলাফেরা করা সহ ভিডিও তৈরি করা প্রযুক্তিগত দিক থেকে অত্যন্ত আকর্ষণীয়।” তিনি সতর্ক করে দিয়েছেন, “এই ধরনের ভিডিও যদি ভুল তথ্য বা ভ্রান্ত বক্তব্য প্রদর্শন করে, তাহলে তা ব্যবসায়িক বা রাজনৈতিক দিক থেকে ক্ষতিকর প্রভাব ফেলতে পারে।” বিশেষ করে, ভবিষ্যতে এধরনের ভিডিও ব্যবহার করে ভুল তথ্য বা মিথ্যা বক্তব্য প্রচার করা যেতে পারে, যা জনসাধারণের মধ্যে বিভ্রান্তি সৃষ্টি করতে পারে।

টুলটির প্রশিক্ষণে ব্যবহৃত ডেটা সম্পর্কে জানা যায়, বাইটড্যান্স প্রায় ১৮,৭০০ ঘণ্টার মানব ভিডিও ডেটা ব্যবহার করেছে। এই ডেটার মধ্যে রয়েছে বিভিন্ন ধরনের ইনপুট যেমন পাঠ্য, অডিও এবং শারীরিক অঙ্গভঙ্গি। এই বৃহৎ ডেটাসেটের সাহায্যে ওমনিহিউম্যান-১ আরও বাস্তবসম্মত ভিডিও তৈরি করতে সক্ষম হয়েছে।

প্রযুক্তির এই উন্নয়নের ফলে ভার্চুয়াল হিউম্যান তৈরি করার প্রচেষ্টা আরও ত্বরান্বিত হয়েছে। তবে আজকাল ভার্চুয়াল প্রভাবশালী, সরকারী প্রতিনিধির ভার্চুয়াল সংস্করণ এমনকি বিখ্যাত ব্যক্তিত্বদের মিথ্যা সংস্করণ তৈরি করা হচ্ছে। এ ধরণের প্রযুক্তি ব্যবহার করে যদি রাজনৈতিক বা বাণিজ্যিক প্রচারণায় মিথ্যা বক্তব্য প্রদান করা হয়, তাহলে তা বড় ধরনের সমস্যার সৃষ্টি করতে পারে। তাই এই সকল টুলস ব্যবহারের ক্ষেত্রে আমাদের যথেষ্ঠ পরিমানে সচেতন থাকতে হবে।

ওপেনএআই নিয়ে এসেছে নতুন ভিডিও জেনারেটর টুল “সোরা”

WhatsApp Group Join Now
Telegram Group Join Now
instagram Group Join Now

সাম্প্রতিক খবর

.আরো