কৃত্রিম বুদ্ধিমত্তার এআই মডেল তৈরির ক্ষেত্রে অ্যাপল এনভিডিয়ার সহযোগিতায় উল্লেখযোগ্য উন্নতি হয়েছে, যা মডেল তৈরির গতি তিনগুণ বাড়িয়েছে। এই উন্নতিটি অ্যাপলের সর্বশেষ মেশিন লার্নিং গবেষণার ফল, যেখানে এনভিডিয়া জিপিইউ ব্যবহার করে টোকেন উৎপাদনের হার প্রায় তিনগুণ বাড়ানোর একটি কৌশল উদ্ভাবন করা হয়েছে। বড় মাপের ভাষার মডেল তৈরির প্রধান চ্যালেঞ্জগুলোর একটি হল এই প্রক্রিয়ার ধীরগতি ও উচ্চ সম্পদ প্রয়োজন। মেশিন লার্নিংয়ের জন্য মডেল প্রশিক্ষণ অত্যন্ত সময়সাপেক্ষ এবং ব্যয়বহুল। সাধারণত, প্রশিক্ষণের গতি বাড়ানোর জন্য আরও হার্ডওয়্যার কেনা এবং বিদ্যুৎ খরচ বাড়ানো হয়। এই সমস্যার সমাধানে অ্যাপল একটি উন্নত পদ্ধতি তৈরি করেছে।
২০২৪ সালের শুরুর দিকে অ্যাপল “রিকারেন্ট ড্রাফটার” বা রিড্রাফটার নামে পরিচিত একটি নতুন পদ্ধতি চালু করে। এটি একটি ধরনের অনুমানমূলক ডিকোডিং পদ্ধতি যা পারফরম্যান্স উন্নত করতে সাহায্য করে। রিড্রাফটার একটি পুনরাবৃত্তি নিউরাল নেটওয়ার্ক (RNN) মডেল ব্যবহার করে, যা টোকেন উৎপাদনের জন্য বিম সার্চ এবং ডাইনামিক ট্রি অ্যাটেনশন কৌশল প্রয়োগ করে। এই পদ্ধতিটি প্রচলিত টোকেন উৎপাদন পদ্ধতির তুলনায় প্রতিটি ধাপে ৩.৫ গুণ বেশি টোকেন উৎপাদন করতে সক্ষম। এর ফলে মডেল প্রশিক্ষণের সময় উল্লেখযোগ্য পরিমাণে কমে যায়। মডেল তৈরির এই উন্নতি কেবল গবেষণার মধ্যেই সীমাবদ্ধ নয় বরং বাস্তব উৎপাদনে প্রয়োগের জন্য উপযোগী।
আরও পড়ুনঃ গুগল নতুন এআই জেমিনি ২.০ ফ্ল্যাশ থিঙ্কিং মডেলটি লঞ্চ করেছে
অ্যাপল সিলিকন ব্যবহার ছাড়াও, অ্যাপল সম্প্রতি রিড্রাফটারকে এনভিডিয়া জিপিইউ-তে ইন্টিগ্রেট করার একটি উদ্যোগ গ্রহণ করেছে। এনভিডিয়া জিপিইউ সাধারণত বড় ভাষার মডেল তৈরির জন্য ব্যবহৃত হয়। তবে, এই উচ্চ পারফরম্যান্স হার্ডওয়্যার ব্যয়বহুল এবং একাধিক জিপিইউ সম্বলিত সার্ভারের মূল্য প্রায় ২,৫০,০০০ মার্কিন ডলার ছাড়িয়ে যেতে পারে।
অ্যাপল এবং এনভিডিয়া একসঙ্গে কাজ করে রিড্রাফটারকে এনভিডিয়ার টেনসরআরটি-এলএলএম ইন্টারফেরেন্স অ্যাক্সিলারেশন ফ্রেমওয়ার্কে সংযুক্ত করেছে। রিড্রাফটার এমন কিছু অপারেটর ব্যবহার করে যা অন্যান্য অনুমানমূলক ডিকোডিং পদ্ধতিতে ব্যবহৃত হয় না। এই কারণে, এনভিডিয়া তাদের ফ্রেমওয়ার্কে অতিরিক্ত উপাদান যোগ করে। এটি ইন্টিগ্রেশন করার ফলে, এনভিডিয়া জিপিইউ ব্যবহারকারী ডেভেলপাররা এখন রিড্রাফটারের টোকেন উৎপাদন প্রক্রিয়ার সুবিধা নিতে পারছেন। এটি শুধুমাত্র অ্যাপল সিলিকনের জন্য সীমাবদ্ধ নয় বরং এনভিডিয়া জিপিইউ-র টেনসরআরটি-এলএলএম ফ্রেমওয়ার্কেও ব্যবহৃত হচ্ছে।
একটি বড় মাপের মডেল (যার প্যারামিটার সংখ্যা কয়েক দশকের মধ্যে) এনভিডিয়া জিপিইউতে ব্যবহার করার সময় দেখা গেছে, টোকেন উৎপাদনের গতি ২.৭ গুণ বেড়েছে। এই গতি বৃদ্ধির ফলে ব্যবহারকারীদের জন্য অপেক্ষার সময় কমবে এবং কোম্পানিগুলোর জন্য হার্ডওয়্যার ও বিদ্যুৎ খরচ কমবে। এর মাধ্যমে ক্লাউড-ভিত্তিক প্রশ্নের দ্রুত ফলাফল পাওয়া সম্ভব হবে।
এনভিডিয়ার টেকনিক্যাল ব্লগে বলা হয়েছে, এই সহযোগিতা টেনসরআরটি-এলএলএম-কে আরও শক্তিশালী এবং নমনীয় করেছে। এর ফলে বড় ভাষার মডেল সম্প্রদায় আরও উন্নত মডেল তৈরি করতে এবং সহজে মোতায়েন করতে পারবে। রিপোর্টটি প্রকাশিত হওয়ার পরে অ্যাপল জানিয়েছে, তারা অ্যামাজনের ট্রেনিয়াম ২ চিপ ব্যবহারের সম্ভাবনাও অনুসন্ধান করছে। এই চিপ ব্যবহারে মডেল প্রশিক্ষণের কার্যক্ষমতা প্রায় ৫০% পর্যন্ত বাড়তে পারে বলে আশা করা হচ্ছে। এই ধরনের উদ্যোগ বড় ভাষার মডেল তৈরির পদ্ধতিতে নতুন মাত্রা যোগ করেছে।
অ্যাপল এবং এনভিডিয়ার এই গবেষণা এবং সহযোগিতা কৃত্রিম বুদ্ধিমত্তার উন্নয়নে গুরুত্বপূর্ণ অবদান রাখছে। এটি কেবল ব্যবহারকারীদের অভিজ্ঞতাকে উন্নত করবে না বরং এআই প্রযুক্তিকে আরও সাশ্রয়ী এবং কার্যকর করবে। ভবিষ্যতে, এই ধরনের উদ্ভাবন বড় আকারের তথ্য প্রক্রিয়াকরণ এবং কৃত্রিম বুদ্ধিমত্তা সমৃদ্ধ ডিভাইস ব্যবহারে একটি বড় ভূমিকা পালন করবে।