গুগলকে টক্কর দিচ্ছে মাইক্রোসফটের ‘মেই ট্রান্সক্রাইব ওয়ান’

সহজলভ্য এআই মডেল নিয়ে বাজারে নতুন করে আলোচনা তৈরি করেছে প্রযুক্তি জায়ান্ট মাইক্রোসফট। প্রতিষ্ঠানটির নতুন উদ্ভাবন ‘মেই ট্রান্সক্রাইব ওয়ান’ সরাসরি গুগল উদ্ভাবিত জেমিনি ৩.১ ফ্ল্যাশ সংস্করণকে চ্যালেঞ্জ ছুড়ে দিয়েছে।
মাইক্রোসফটের দাবি, তাদের এই নতুন এআই ট্রান্সক্রিপশন মডেলটি বর্তমানে বিশ্বের সবচেয়ে উন্নত স্পিচ-টু-টেক্সট মডেল। এটি কেবল ভয়েস পরিষেবায় সীমাবদ্ধ নয়, বরং আরও বেশ কিছু প্রযুক্তিগত দিকে গুগল জেমিনিকে কড়া প্রতিযোগিতার মুখে ফেলবে।
মাইক্রোসফট সম্প্রতি তিনটি নতুন এআই মডেল উন্মোচন করে এক নতুন মাইলফলক স্পর্শ করেছে। এই মেই সিরিজের মধ্যে রয়েছে ট্রান্সক্রাইব ওয়ান, ভয়েস ওয়ান এবং ইমেজ টু। মডেলগুলো যথাক্রমে নিখুঁতভাবে কণ্ঠস্বরকে টেক্সটে রূপান্তর, বাস্তবের সঙ্গে মিল রেখে কণ্ঠস্বর তৈরি এবং উচ্চমানের ছবি তৈরিতে সক্ষম। উল্লেখ্য, এটি মাইক্রোসফটের ট্রান্সক্রাইব সিরিজের তৃতীয় এবং সবচেয়ে শক্তিশালী সংস্করণ হিসেবে আত্মপ্রকাশ করেছে।
প্রযুক্তিগত সক্ষমতার বিচারে গুগলের তুলনায় মাইক্রোসফট বেশ এগিয়ে রয়েছে। মেই ট্রান্সক্রাইব ওয়ান ৩.৯ শতাংশ গড় শব্দ ত্রুটি হারে ইংরেজি, হিন্দি, জার্মানসহ মোট ২৫টি ভাষায় কাজ করতে পারে। অন্যদিকে গুগলের জেমিনি ৩.১ ফ্ল্যাশ লাইট সংস্করণ বর্তমানে ২২টি ভাষায় সেবা দিতে সক্ষম। এছাড়া মাইক্রোসফটের এই মডেলটি অ্যাজুর ফাস্টের চেয়ে ২.৫ গুণ দ্রুত এবং এটি পরিচালনায় জিপিইউ খরচ হয় অন্য মডেলের তুলনায় অর্ধেক।
নতুন এই এআই প্রযুক্তিকে ইতিমধ্যে মাইক্রোসফটের জনপ্রিয় প্ল্যাটফর্মগুলোতে যুক্ত করা হয়েছে। ট্রান্সক্রাইব ওয়ান সংস্করণটি বর্তমানে কোপাইলটের ভয়েস মোড এবং কোপাইলট পডকাস্টে ব্যবহৃত হচ্ছে। এছাড়া মাইক্রোসফট টিমসে মিটিংয়ের কথা সরাসরি টেক্সটে রূপান্তরের জন্য এটি সক্রিয় করা হয়েছে।
বিশেষজ্ঞরা মনে করছেন, সাশ্রয়ী ও দ্রুতগতির এই উদ্ভাবন ওপেনএআই এবং গুগলের মতো সংস্থাগুলোর জন্য বড় ধরণের ব্যবসায়িক চ্যালেঞ্জ তৈরি করবে।

















