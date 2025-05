এটি এর সরকারী ভাণ্ডার

ফাস্টভিএলএম: ভিশন ল্যাঙ্গুয়েজ মডেলগুলির জন্য দক্ষ দৃষ্টি এনকোডিং। (সিভিপিআর 2025)

আমরা FASTVLM ভেরিয়েন্টগুলি প্রশিক্ষণের জন্য LLAVA কোডবেস ব্যবহার করি। আপনার নিজস্ব রূপগুলি প্রশিক্ষণ বা ফিনেটুন করার জন্য, দয়া করে llava কোডবেসে প্রদত্ত নির্দেশাবলী অনুসরণ করুন। আমরা আমাদের মডেলগুলির সাথে চলমান অনুমানের জন্য নির্দেশাবলী সরবরাহ করি।

বিভিন্ন মূল্যায়ন সম্পর্কিত বিস্তারিত তথ্যের জন্য, দয়া করে আমাদের দেখুন কাগজ।

সমস্ত প্রিটরাইন্ড চেকপয়েন্টগুলি ডাউনলোড করতে নীচের কমান্ডটি চালান (নোট করুন যে এটি আপনার সংযোগের উপর নির্ভর করে কিছুটা সময় নিতে পারে তাই আপনি অপেক্ষা করার সময় ভাল হতে পারে)।

পাইটোরচ চেকপয়েন্টের অনুমান চালানোর জন্য, নীচের নির্দেশটি অনুসরণ করুন

অ্যাপল সিলিকনে অনুমান চালানোর জন্য, অ্যাপল সিলিকনে দৌড়ানোর জন্য উপযুক্ত ফর্ম্যাটে পাইটোরচ চেকপয়েন্টগুলি রফতানি করতে হবে, বিশদ নির্দেশাবলী এবং কোড পাওয়া যাবে model_export সাবফোল্ডার আরও তথ্যের জন্য দয়া করে সেখানে রিডমে দেখুন।

সুবিধার জন্য, আমরা 3 টি মডেল সরবরাহ করি যা অ্যাপল সিলিকন সামঞ্জস্যপূর্ণ ফর্ম্যাটে রয়েছে: FASTVLM_0.5B_STAGE3,

FASTVLM_1.5B_STAGE3,

FASTVLM_7B_STAGE3। আমরা বিকাশকারীদের নির্দেশাবলী অনুসরণ করে উপযুক্ত কোয়ান্টাইজেশন স্তরের সাথে তাদের পছন্দের মডেলটি রফতানি করতে উত্সাহিত করি model_export ।

আইফোন, আইপ্যাড বা ম্যাকের মতো অ্যাপল ডিভাইসে অনুমান চালানোর জন্য দেখুন app আরও তথ্যের জন্য সাবফোল্ডার।

আপনি যদি এই কোডটি দরকারী বলে মনে করেন তবে নীচের কাগজটি উদ্ধৃত করুন: