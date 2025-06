আমরা মিনিম্যাক্স-এম 1 প্রবর্তন করি, বিশ্বের প্রথম উন্মুক্ত ওজন, বৃহত আকারের হাইব্রিড-অ্যাটেনশন যুক্তি মডেল। মিনিম্যাক্স-এম 1 একটি বিদ্যুৎ মনোযোগ ব্যবস্থার সাথে মিলিত একটি হাইব্রিড মিশ্রণ-বিশেষজ্ঞ (এমওই) আর্কিটেকচার দ্বারা চালিত। মডেলটি আমাদের আগের উপর ভিত্তি করে তৈরি করা হয়েছে মিনিম্যাক্স-টেক্সট -01 মডেলএতে টোকেন প্রতি সক্রিয় 45.9 বিলিয়ন পরামিতি সহ মোট 456 বিলিয়ন পরামিতি রয়েছে। মিনিম্যাক্স-টেক্সট -01 এর সাথে সামঞ্জস্যপূর্ণ, এম 1 মডেলটি স্থানীয়ভাবে 1 মিলিয়ন টোকেনের প্রসঙ্গ দৈর্ঘ্য সমর্থন করে, ডিপসেক আর 1 এর প্রসঙ্গ আকার 8x। তদ্ব্যতীত, মিনিম্যাক্স-এম 1-তে বজ্রপাতের মনোযোগ প্রক্রিয়াটি পরীক্ষা-সময় গণনার দক্ষ স্কেলিং সক্ষম করে-উদাহরণস্বরূপ, ডিপসেক আর 1 এর তুলনায়, এম 1 100 কে টোকেনের প্রজন্মের দৈর্ঘ্যে 25% ফ্লপ গ্রাস করে। এই বৈশিষ্ট্যগুলি এম 1 কে জটিল কাজের জন্য বিশেষভাবে উপযুক্ত করে তোলে যার জন্য দীর্ঘ ইনপুটগুলি প্রক্রিয়াজাতকরণ এবং ব্যাপকভাবে চিন্তাভাবনা করা প্রয়োজন। মিনিম্যাক্স-এম 1 traditional তিহ্যবাহী গাণিতিক যুক্তি থেকে শুরু করে স্যান্ডবক্স-ভিত্তিক, রিয়েল-ওয়ার্ল্ড সফটওয়্যার ইঞ্জিনিয়ারিং পরিবেশ পর্যন্ত বিভিন্ন সমস্যার জন্য বৃহত আকারের শক্তিবৃদ্ধি লার্নিং (আরএল) ব্যবহার করে প্রশিক্ষণপ্রাপ্ত। আমরা দুটি দৃষ্টিকোণকে হাইলাইট করে এম 1 এর জন্য একটি দক্ষ আরএল স্কেলিং ফ্রেমওয়ার্ক বিকাশ করি: (1) আমরা সিসপো প্রস্তাব করি, একটি অভিনব অ্যালগরিদম যা টোকেন আপডেটের পরিবর্তে স্যাম্পলিং ওজনকে ক্লিপ করে, যা অন্যান্য প্রতিযোগিতামূলক আরএল বৈকল্পিককে ছাড়িয়ে যায়; (২) আমাদের হাইব্রিড-অ্যাটেনশন ডিজাইনটি স্বাভাবিকভাবেই আরএল এর দক্ষতা বাড়ায়, যেখানে হাইব্রিড আর্কিটেকচারের সাথে আরএলকে স্কেল করার সময় আমরা অনন্য চ্যালেঞ্জগুলির সমাধান করি। আমরা মিনিম্যাক্স-এম 1 মডেলের দুটি সংস্করণ সহ প্রশিক্ষণ দিই 40 কে এবং

80 কে যথাক্রমে বাজেট চিন্তাভাবনা। স্ট্যান্ডার্ড বেঞ্চমার্কগুলির পরীক্ষাগুলি দেখায় যে আমাদের মডেলগুলি অন্যান্য শক্তিশালী ওপেন-ওজন মডেলগুলিকে ছাড়িয়ে যায় যেমন মূল ডিপসেক-আর 1 এবং কিউইএনইএন 3-235 বি, বিশেষত জটিল সফ্টওয়্যার ইঞ্জিনিয়ারিং, সরঞ্জাম ব্যবহার এবং দীর্ঘ প্রসঙ্গের কার্যগুলিতে। টেস্ট-টাইম কম্পিউটারের দক্ষ স্কেলিংয়ের সাথে, মিনিম্যাক্স-এম 1 পরবর্তী প্রজন্মের ভাষা মডেল এজেন্টদের বাস্তব-বিশ্বের চ্যালেঞ্জগুলি যুক্তি এবং মোকাবেলায় একটি শক্তিশালী ভিত্তি হিসাবে কাজ করে।





প্রতিযোগিতা-স্তরের গণিত, কোডিং, সফটওয়্যার ইঞ্জিনিয়ারিং, এজেন্ট সরঞ্জাম ব্যবহার এবং দীর্ঘ-প্রসঙ্গ বোঝার কাজগুলি জুড়ে শীর্ষস্থানীয় বাণিজ্যিক এবং উন্মুক্ত ওজন মডেলের বেঞ্চমার্ক পারফরম্যান্সের তুলনা। আমরা মিনিম্যাক্স-এম 1 এর জন্য এখানে মিনিম্যাক্স-এম 1-80 কে মডেল ব্যবহার করি।

কোর বেঞ্চমার্কগুলিতে মিনিম্যাক্স-এম 1 এর পারফরম্যান্স।

* কেবল পাঠ্য-কেবলমাত্র এইচএলই সাবসেটে পরিচালিত।

আমাদের মডেলগুলির সাথে মূল্যায়ন করা হয় temperature=1.0 , top_p=0.95 ।

আমরা এজেন্টলেস স্ক্যাফোল্ড থেকে প্রাপ্ত ফলাফলগুলি প্রতিবেদন করি। মূল পাইপলাইন থেকে প্রস্থান করে, আমাদের পদ্ধতিটি একটি দ্বি-পর্যায়ের স্থানীয়করণ প্রক্রিয়া নিয়োগ করে (কোনও এম্বেডিং-ভিত্তিক পুনরুদ্ধার প্রক্রিয়া ছাড়াই): প্রাথমিক মোটা-দানাদার ফাইল স্থানীয়করণ এবং নির্দিষ্ট ফাইল এবং কোড উপাদানগুলিতে সূক্ষ্ম-দানাযুক্ত স্থানীয়করণ দ্বারা। আমাদের মডেলগুলির মানগুলি n = 486 যাচাই করা কার্যগুলির উপসেটে গণনা করা হয় যা আমাদের অবকাঠামোতে কাজ করে। আমাদের অভ্যন্তরীণ অবকাঠামোর সাথে বেমানান ছিল এমন 14 টি পরীক্ষার কেসগুলি হ’ল:

"astropy__astropy-7606" ,

"astropy__astropy-8707" ,

"astropy__astropy-8872" ,

"django__django-10097" ,

"matplotlib__matplotlib-20488" ,

"psf__requests-2317" ,

"psf__requests-2931" ,

"psf__requests-5414" ,

"pylint-dev__pylint-6528" ,

"pylint-dev__pylint-7277" ,

"sphinx-doc__sphinx-10435" ,

"sphinx-doc__sphinx-7985" ,

"sphinx-doc__sphinx-8269" ,

"sphinx-doc__sphinx-8475"

আমরা জিপিটি -৪.১ এর সাথে ব্যবহারকারীর মডেল হিসাবে এবং কোনও কাস্টম সরঞ্জাম ছাড়াই তাউ-বঞ্চকে মূল্যায়ন করি। ইন্টারঅ্যাকশন পদক্ষেপের সর্বাধিক সংখ্যা 40। আমাদের সাধারণ সিস্টেম প্রম্পটটি হ’ল: