
এটি ব্যাপকভাবে স্বীকৃত যে অবিচ্ছিন্নভাবে ডেটা আকার এবং মডেল আকার উভয়ই স্কেলিংয়ের ফলে মডেল বুদ্ধিমত্তায় উল্লেখযোগ্য উন্নতি হতে পারে। যাইহোক, গবেষণা এবং শিল্প সম্প্রদায়ের কার্যকরভাবে অত্যন্ত বড় মডেলগুলি স্কেলিং করার ক্ষেত্রে সীমিত অভিজ্ঞতা রয়েছে, তারা ঘন বা মিশ্রণ-বিশেষজ্ঞ (এমওই) মডেলগুলিই হোক। এই স্কেলিং প্রক্রিয়া সম্পর্কিত অনেক সমালোচনামূলক বিবরণ কেবল ডিপসেক ভি 3 এর সাম্প্রতিক প্রকাশের সাথে প্রকাশ করা হয়েছিল। একসাথে, আমরা QWEN2.5-ম্যাক্স বিকাশ করছি, একটি বৃহত আকারের এমওই মডেল যা 20 ট্রিলিয়নেরও বেশি টোকেন এবং আরও প্রশিক্ষিত পরবর্তী প্রশিক্ষিত সূক্ষ্ম-টিউনিং (এসএফটি) এবং হিউম্যান ফিডব্যাক (আরএলএইচএফ) পদ্ধতি থেকে শক্তিবৃদ্ধি শেখার সাথে আরও প্রশিক্ষিত হয়েছে । আজ, আমরা QWEN2.5-ম্যাক্সের পারফরম্যান্সের ফলাফলগুলি ভাগ করে নিতে এবং এর প্রাপ্যতা ঘোষণা করতে আগ্রহী এপিআই আলিবাবা ক্লাউডের মাধ্যমে। আমরা আপনাকে QWEN2.5-সর্বাধিক অন্বেষণ করতে আমন্ত্রণ জানাচ্ছি কুইন চ্যাটআর!
পারফরম্যান্স
আমরা সম্প্রদায়ের পক্ষে উল্লেখযোগ্য আগ্রহী এমন একাধিক মানদণ্ড জুড়ে মালিকানাধীন বা উন্মুক্ত ওজনের, শীর্ষস্থানীয় মডেলগুলির পাশাপাশি QWEN2.5-সর্বাধিক মূল্যায়ন করি। এর মধ্যে এমএমএলইউ-প্রো অন্তর্ভুক্ত রয়েছে, যা কলেজ-স্তরের সমস্যা, লাইভকোডবেঞ্চের মাধ্যমে জ্ঞান পরীক্ষা করে, যা কোডিং ক্ষমতা, লাইভব্যাঞ্চের মূল্যায়ন করে, যা সাধারণ ক্ষমতা এবং আখড়া-হার্ডকে ব্যাপকভাবে পরীক্ষা করে, যা মানুষের পছন্দকে প্রায় অনুমান করে। আমাদের অনুসন্ধানে উভয় বেস মডেল এবং নির্দেশ মডেলগুলির জন্য পারফরম্যান্স স্কোর অন্তর্ভুক্ত।
আমরা সরাসরি নির্দেশের মডেলগুলির পারফরম্যান্সের সাথে তুলনা করে শুরু করি, যা চ্যাট এবং কোডিংয়ের মতো ডাউনস্ট্রিম অ্যাপ্লিকেশনগুলির জন্য পরিবেশন করতে পারে। আমরা ডিপসেক ভি 3, জিপিটি -4 ও, এবং ক্লড -3.5-সোনেট সহ শীর্ষস্থানীয় অত্যাধুনিক মডেলগুলির পাশাপাশি QWEN2.5-সর্বাধিকের পারফরম্যান্সের ফলাফলগুলি উপস্থাপন করি।

QWEN2.5-MAX এর আখড়া-হার্ড, লাইভব্যাঞ্চ, লাইভকোডবেঞ্চ এবং জিপিকিউএ-ডায়ামন্ডের মতো বেঞ্চমার্কগুলিতে ডিপসেক ভি 3 কে ছাড়িয়ে যায়, পাশাপাশি এমএমএলইউ-প্রো সহ অন্যান্য মূল্যায়নে প্রতিযোগিতামূলক ফলাফল প্রদর্শন করে।
বেস মডেলগুলির তুলনা করার সময়, আমরা জিপিটি -4o এবং ক্লড -3.5-সোনেটের মতো মালিকানাধীন মডেলগুলিতে অ্যাক্সেস করতে অক্ষম। অতএব, আমরা ডিপসেক ভি 3 এর বিরুদ্ধে QWEN2.5-সর্বাধিক মূল্যায়ন করি, একটি শীর্ষস্থানীয় ওপেন-ওজন এমওই মডেল, লামা -৩.১-৪০৫ বি, বৃহত্তম ওপেন-ওজন ঘন মডেল এবং QWEN2.5-72B, যা শীর্ষ ওপেন- এর মধ্যেও রয়েছে ওজন ঘন মডেল। এই তুলনার ফলাফলগুলি নীচে উপস্থাপন করা হয়েছে।

আমাদের বেস মডেলগুলি বেশিরভাগ মানদণ্ড জুড়ে উল্লেখযোগ্য সুবিধাগুলি প্রদর্শন করেছে এবং আমরা আশাবাদী যে প্রশিক্ষণ পরবর্তী কৌশলগুলির অগ্রগতি QWEN2.5-ম্যাক্সের পরবর্তী সংস্করণটিকে নতুন উচ্চতায় উন্নীত করবে।
QWEN2.5-MAX ব্যবহার করুন
এখন QWEN2.5-সর্বোচ্চ QWEN চ্যাটে উপলব্ধ, এবং আপনি সরাসরি মডেলের সাথে চ্যাট করতে পারেন, বা শিল্পকর্ম, অনুসন্ধান ইত্যাদি দিয়ে খেলতে পারেন
QWEN2.5-MAX এর API (যার মডেল নাম qwen-max-2025-01-25
) উপলব্ধ। আপনি প্রথমে করতে পারেন একটি আলিবাবা ক্লাউড অ্যাকাউন্ট নিবন্ধন করুন এবং আলিবাবা ক্লাউড মডেল স্টুডিও পরিষেবা সক্রিয় করুন এবং তারপরে কনসোলে নেভিগেট করুন এবং একটি এপিআই কী তৈরি করুন।
যেহেতু কুইনের এপিআইগুলি ওপেনএআই-এপিআই সামঞ্জস্যপূর্ণ, তাই আমরা ওপেনএআই এপিআই ব্যবহারের সাধারণ অনুশীলনটি সরাসরি অনুসরণ করতে পারি। নীচে পাইথনে QWEN2.5-ম্যাক্স ব্যবহারের একটি উদাহরণ রয়েছে:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.getenv("API_KEY"),
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
model="qwen-max-2025-01-25",
messages=(
{'role': 'system', 'content': 'You are a helpful assistant.'},
{'role': 'user', 'content': 'Which number is larger, 9.11 or 9.8?'}
)
)
print(completion.choices(0).message)
ভবিষ্যতের কাজ
ডেটা এবং মডেলের আকারের স্কেলিং কেবল মডেল গোয়েন্দাগুলিতে অগ্রগতি প্রদর্শন করে না তবে অগ্রণী গবেষণার প্রতি আমাদের অটল প্রতিশ্রুতিও প্রতিফলিত করে। আমরা স্কেলড রিইনফোর্সমেন্ট লার্নিংয়ের উদ্ভাবনী প্রয়োগের মাধ্যমে বৃহত ভাষার মডেলগুলির চিন্তাভাবনা এবং যুক্তির ক্ষমতা বাড়ানোর জন্য উত্সর্গীকৃত। এই প্রচেষ্টাটি আমাদের মডেলগুলিকে মানব বুদ্ধি অতিক্রম করতে সক্ষম করার প্রতিশ্রুতি রাখে, জ্ঞান এবং বোঝার অবিচ্ছিন্ন অঞ্চলগুলি অন্বেষণ করার সম্ভাবনা আনলক করে।
আপনি যদি QWEN2.5 সহায়ক বলে মনে করেন তবে নিম্নলিখিত নিবন্ধটি উদ্ধৃত করতে নির্দ্বিধায়।
@article{qwen25,
title={Qwen2.5 technical report},
author={Qwen Team},
journal={arXiv preprint arXiv:2412.15115},
year={2024}
}