“ডিপসেক-ভি 3 এর অন্তর্দৃষ্টি: এআই আর্কিটেকচারের জন্য হার্ডওয়ারের উপর স্কেলিং চ্যালেঞ্জ এবং প্রতিচ্ছবি”, ডিপসেকের প্রতিষ্ঠাতা লিয়াং ওয়েনফেং সহ-রচনা করেছেন এবং বুধবার প্রকাশিত হয়েছে, প্রশিক্ষণ উচ্চ-পারফরম্যান্স, ব্যয়-দক্ষ এআই সিস্টেমগুলিতে একটি হার্ডওয়্যার-সুইফটওয়্যার সহ-নকশাকৃত পদ্ধতির জন্য স্টার্ট-আপের যুগান্তকারীকে দায়ী করেছেন।
কাগজটিতে প্রযুক্তিগত অপ্টিমাইজেশনগুলির বিবরণ রয়েছে যা মেমরির দক্ষতা বৃদ্ধি করে, আন্তঃ-চিপ যোগাযোগকে প্রবাহিত করে এবং সামগ্রিক এআই অবকাঠামোগত কর্মক্ষমতা বাড়ায়-স্কেলিং ক্ষমতা স্কেলিংয়ের সময় অপারেশনাল ব্যয় হ্রাস করার মূল অগ্রগতি। এগুলি “পরবর্তী প্রজন্মের এআই সিস্টেমে উদ্ভাবনের জন্য ব্যবহারিক নীলনকশা” সরবরাহ করে, গবেষকরা বলেছিলেন।
ডিপসেক এর মিশ্রণ-বিশেষজ্ঞের (এমইই) মডেল আর্কিটেকচারের ব্যবহারকেও হাইলাইট করেছেন, একটি মেশিন-লার্নিং পদ্ধতির যা একটি এআই মডেলকে পৃথক উপ-নেটওয়ার্ক বা বিশেষজ্ঞদের মধ্যে বিভক্ত করে, প্রতিটি সহযোগিতামূলকভাবে কাজ করার সময় ইনপুট ডেটার একটি উপসেটে ফোকাস করে।