ওপেনএআই সম্প্রতি তাদের নতুন এআই “reasoning” মডেল o3-mini প্রকাশ করেছে, যা কোম্পানির o সিরিজের সর্বশেষ সংযোজন। এটি আগের o1 এবং o1-mini মডেলের তুলনায় দ্রুততর, সাশ্রয়ী এবং আরও নির্ভরযোগ্য বলে দাবি করছে ওপেনআই।
অন্যান্য বড় ভাষা মডেলের তুলনায়, o3-mini এর একটি বিশেষত্ব হলো এটি উত্তর দেওয়ার আগে নিজেকে যাচাই করে নেয়। ফলে এটি ভুল কম করে এবং জটিল সমস্যাগুলোর আরও নির্ভরযোগ্য সমাধান প্রদান করতে পারে। যদিও এটি উত্তর দিতে কিছুটা বেশি সময় নেয়, তবে এর নির্ভুলতা তুলনামূলকভাবে বেশি। বিশেষ করে পদার্থবিজ্ঞান, গণিত এবং প্রোগ্রামিং সংক্রান্ত প্রশ্নের ক্ষেত্রে এটি ভালো পারফর্ম করে।
ওপেনএআই দাবি করছে যে, o3-mini আগের o1 পরিবারের সাথে তুলনীয় কর্মক্ষমতা প্রদর্শন করে, তবে এটি দ্রুততর এবং কম খরচে চালানো যায়। পরীক্ষা অনুযায়ী, o3-mini আগের o1-mini এর তুলনায় ৩৯% কম বড় ভুল করেছে এবং ২৪% দ্রুত উত্তর প্রদান করেছে। এটি প্রোগ্রামিং ও গণিত সংক্রান্ত সমস্যাগুলোর সমাধানে দক্ষ।
o3-mini চ্যাটজিপিটি-তে বিনামূল্যে ব্যবহার করা যাবে, তবে যারা চ্যাটজিপিটি প্লাস এবং টিম প্ল্যানের গ্রাহক, তারা প্রতিদিন ১৫০টি কোয়েরি চালানোর সুবিধা পাবেন। চ্যাটজিপিটি প্রো ব্যবহারকারীরা এই মডেলের সীমাহীন ব্যবহার করতে পারবেন। চ্যাটজিপিটি এন্টারপ্রাইজ ও চ্যাটজিপিটি এডু গ্রাহকদের জন্য এটি এক সপ্তাহের মধ্যে উন্মুক্ত করা হবে।
ব্যবহারকারীরা চ্যাটজিপিটি-এর ড্রপডাউন মেনু থেকে o3-mini নির্বাচন করতে পারবেন, যেখানে এটি “medium reasoning effort” মোডে চলবে। অর্থাৎ, এটি গতি ও নির্ভুলতার মধ্যে ভারসাম্য বজায় রেখে কাজ করবে। তবে যারা আরও উন্নত যুক্তি বিশ্লেষণ চান, তারা “o3-mini-high” মোড বেছে নিতে পারবেন, যা তুলনামূলকভাবে আরও বুদ্ধিদীপ্ত উত্তর দেবে কিন্তু কিছুটা ধীর গতিতে।
ডেভেলপারদের জন্যও ওপেনএআই এই মডেলটির API সুবিধা দিচ্ছে। তবে প্রথমদিকে এটি ছবি বিশ্লেষণের জন্য ব্যবহার করা যাবে না। ডেভেলপাররা “low”, “medium” এবং “high” যুক্তি বিশ্লেষণ মোডের মধ্যে বেছে নিতে পারবেন, যাতে নির্দিষ্ট ব্যবহারের ভিত্তিতে মডেলটি কীভাবে কাজ করবে তা নির্ধারণ করা যায়।
API-এর ক্ষেত্রে, o3-mini-এর মূল্য নির্ধারণ করা হয়েছে প্রতি মিলিয়ন ক্যাশড ইনপুট টোকেনের জন্য ০.৫৫ ডলার এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য ৪.৪০ ডলার। এটি আগের o1-mini এর তুলনায় ৬৩% সস্তা।
ওপেনএআই-এর অন্যতম প্রতিদ্বন্দ্বী চীনা কোম্পানি ডিপসিক, যারা R1 নামক একটি reasoning মডেল তৈরি করেছে। ওপেনএআই দাবি করছে যে, o3-mini “high reasoning effort” মোডে R1-এর তুলনায় এআইME 2024 টেস্টে ভালো করেছে। SWE-bench Verified টেস্টেও এটি R1-কে সামান্য পরিমাণে ছাড়িয়ে গেছে। তবে “low reasoning effort” মোডে GPQA Diamond টেস্টে এটি R1-এর তুলনায় পিছিয়ে রয়েছে।
ডিপসিক-এর R1-এর তুলনায় ওপেনএআই-এর নতুন মডেলটি কিছু ক্ষেত্রে এগিয়ে থাকলেও কিছু ক্ষেত্রে পিছিয়ে রয়েছে। তবে এর দাম তুলনামূলকভাবে প্রতিযোগিতামূলক। ডিপসিক R1-এর জন্য প্রতি মিলিয়ন ক্যাশড ইনপুট টোকেনের জন্য ০.১৪ ডলার এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য ২.১৯ ডলার চার্জ করে, যা কিছু ক্ষেত্রে o3-mini এর তুলনায় সস্তা।
o3-mini এখনো ওপেনএআই-এর সবচেয়ে শক্তিশালী মডেল নয়, তবে এটি যুক্তি বিশ্লেষণের জন্য বিশেষভাবে উন্নত। ওপেনএআই-এর মতে, এই মডেলটি আগের তুলনায় আরও নিরাপদ এবং নিরাপত্তা সম্পর্কিত পরীক্ষায় এটি জিপিটি-4o-এর চেয়ে ভালো করেছে।
ওপেনএআই তাদের “deliberative alignment” পদ্ধতি ব্যবহার করে এই মডেলটিকে আরও নিরাপদ করেছে। এই পদ্ধতিতে মডেলটি উত্তর দেওয়ার সময় ওপেনএআই-এর নিরাপত্তা নীতিগুলোকে বিবেচনায় রাখে। ফলে এটি “jailbreak” বা অপব্যবহারের প্রচেষ্টা প্রতিরোধে আরও কার্যকর।
o3-mini ওপেনএআই-এর নতুন “reasoning” মডেল যা গণিত, বিজ্ঞান এবং প্রোগ্রামিংয়ের জন্য বিশেষভাবে উপযোগী। এটি আগের o1 সিরিজের তুলনায় দ্রুততর, নির্ভুল এবং তুলনামূলকভাবে কম খরচে ব্যবহারযোগ্য।
যদিও এটি ওপেনএআই-এর সবচেয়ে শক্তিশালী মডেল নয়, তবে নির্দিষ্ট প্রযুক্তিগত ক্ষেত্রে এটি কার্যকরী। ওপেনএআই-এর দাবি অনুযায়ী, এটি প্রতিদ্বন্দ্বী ডিপসিক R1-এর তুলনায় কিছু নির্দিষ্ট পরীক্ষায় ভালো করেছে, তবে কিছু ক্ষেত্রে পিছিয়েও রয়েছে।
ব্যবহারকারীদের জন্য এটি চ্যাটজিপিটি-তে সহজেই ব্যবহারযোগ্য, এবং ডেভেলপারদের জন্যও এটি API এর মাধ্যমে পাওয়া যাবে। তবে বর্তমানে এটি ছবি বিশ্লেষণের জন্য সমর্থন করে না।
সবমিলিয়ে, o3-mini ওপেনএআই-এর এআই গবেষণার একটি গুরুত্বপূর্ণ অগ্রগতি, যা উন্নত যুক্তি ও নিরাপদ ব্যবহারের দিক থেকে এগিয়ে রয়েছে।