চীনা এআই ফার্ম ডিপসেকের নতুন মডেলগুলির মধ্যে একটি ডিপসেক-আর 1 এর দ্রুত মুক্তি বিশ্বকে একটি উন্মত্ত এবং নাসডাককে একটি নাটকীয় নিমজ্জনে পরিণত করেছে। কারণটি সহজ-ডিপসেক-আর 1, এক ধরণের কৃত্রিম বুদ্ধিমত্তা যুক্তি মডেল যা প্রশ্নের উত্তর দেওয়ার আগে “ভাবতে” সময় লাগে, 50 বার পর্যন্ত হয় সস্তা অনেক মার্কিন এআই মডেলের চেয়ে চালানো। এর পাতিত সংস্করণগুলিও পারে চালানো একটি কম্পিউটিং পাওয়ার উপর ল্যাপটপঅন্য মডেলগুলির জন্য এনভিডিয়ার বেশ কয়েকটি ব্যয়বহুল চিপ প্রয়োজন। তবে যা সত্যিই মাথা ঘুরিয়েছে তা হ’ল ডিপসিকের দাবি এটি শেষ পর্যন্ত তার মডেলটি প্রশিক্ষণের জন্য প্রায় 6 মিলিয়ন ডলার ব্যয় করেছে – ওপেনাইয়ের ও 1 এর চেয়ে অনেক কম। যদিও এই চিত্রটি বিভ্রান্তিকর এবং এর যথেষ্ট ব্যয়কে অন্তর্ভুক্ত করে না পূর্ব গবেষণাপরিমার্জন এবং আরও অনেক কিছু, এমনকি আংশিক ব্যয় হ্রাস এবং দক্ষতা লাভের উল্লেখযোগ্য ভূ -রাজনৈতিক প্রভাব থাকতে পারে।
সুতরাং, কেন ডিপসেক-আর 1 প্রশিক্ষণ, চালানো এবং ব্যবহারের জন্য এত সস্তা? উত্তরটি আর 1 মডেলটিতে করা বেশ কয়েকটি গণনার দক্ষতার উন্নতির মধ্যে রয়েছে। প্রথমত, আর 1 “বিশেষজ্ঞদের মিশ্রণ” নামে একটি আলাদা মেশিন লার্নিং আর্কিটেকচার ব্যবহার করেছিল যা বিভাজন ছোট সাবনেটওয়ার্কগুলিতে একটি বৃহত্তর এআই মডেল, বা “বিশেষজ্ঞরা”। এই পদ্ধতির অর্থ এটি যখন প্রম্পট দেওয়া হয়, তখন আরআইকে কেবলমাত্র একটি নির্দিষ্ট কাজের সাথে সম্পর্কিত বিশেষজ্ঞদের সক্রিয় করতে হবে, এর গণনামূলক ব্যয়কে ব্যাপকভাবে হ্রাস করে।
চীনা এআই ফার্ম ডিপসেকের নতুন মডেলগুলির মধ্যে একটি ডিপসেক-আর 1 এর দ্রুত মুক্তি বিশ্বকে একটি উন্মত্ত এবং নাসডাককে একটি নাটকীয় নিমজ্জনে পরিণত করেছে। কারণটি সহজ-ডিপসেক-আর 1, এক ধরণের কৃত্রিম বুদ্ধিমত্তা যুক্তি মডেল যা প্রশ্নের উত্তর দেওয়ার আগে “ভাবতে” সময় লাগে, 50 বার পর্যন্ত হয় সস্তা অনেক মার্কিন এআই মডেলের চেয়ে চালানো। এর পাতিত সংস্করণগুলিও পারে চালানো একটি কম্পিউটিং পাওয়ার উপর ল্যাপটপঅন্য মডেলগুলির জন্য এনভিডিয়ার বেশ কয়েকটি ব্যয়বহুল চিপ প্রয়োজন। তবে যা সত্যিই মাথা ঘুরিয়েছে তা হ’ল ডিপসিকের দাবি এটি শেষ পর্যন্ত তার মডেলটি প্রশিক্ষণের জন্য প্রায় 6 মিলিয়ন ডলার ব্যয় করেছে – ওপেনাইয়ের ও 1 এর চেয়ে অনেক কম। যদিও এই চিত্রটি বিভ্রান্তিকর এবং এর যথেষ্ট ব্যয়কে অন্তর্ভুক্ত করে না পূর্ব গবেষণাপরিমার্জন এবং আরও অনেক কিছু, এমনকি আংশিক ব্যয় হ্রাস এবং দক্ষতা লাভের উল্লেখযোগ্য ভূ -রাজনৈতিক প্রভাব থাকতে পারে।
সুতরাং, কেন ডিপসেক-আর 1 প্রশিক্ষণ, চালানো এবং ব্যবহারের জন্য এত সস্তা? উত্তরটি আর 1 মডেলটিতে করা বেশ কয়েকটি গণনার দক্ষতার উন্নতির মধ্যে রয়েছে। প্রথমত, আর 1 “বিশেষজ্ঞদের মিশ্রণ” নামে একটি আলাদা মেশিন লার্নিং আর্কিটেকচার ব্যবহার করেছিল যা বিভাজন ছোট সাবনেটওয়ার্কগুলিতে একটি বৃহত্তর এআই মডেল, বা “বিশেষজ্ঞরা”। এই পদ্ধতির অর্থ এটি যখন প্রম্পট দেওয়া হয়, তখন আরআইকে কেবলমাত্র একটি নির্দিষ্ট কাজের সাথে সম্পর্কিত বিশেষজ্ঞদের সক্রিয় করতে হবে, এর গণনামূলক ব্যয়কে ব্যাপকভাবে হ্রাস করে।
দ্বিতীয়ত, ডিপসেক কীভাবে দক্ষতার সাথে আর 1 এর অ্যালগরিদমগুলি উন্নত করেছে ব্যবহৃত বিভিন্ন কাজ সম্পাদনের জন্য এর গণনামূলক সংস্থান। উদাহরণস্বরূপ, আর 1 একটি অ্যালগরিদম ব্যবহার করে যা ডিপসেক আগে পরিচয় করিয়ে দেওয়া গ্রুপ আপেক্ষিক নীতি অপ্টিমাইজেশন বলা হয়, যা অন্যান্য সাধারণভাবে ব্যবহৃত অ্যালগরিদমের তুলনায় কম গণনামূলকভাবে নিবিড়। এই অঞ্চলগুলি ছাড়িয়ে, ডিপসেক তৈরি অন্যান্য গণনামূলক অপ্টিমাইজেশন পাশাপাশি। উদাহরণস্বরূপ, এটি মডেল প্রশিক্ষণের সময় ঘটে যাওয়া গণনার কয়েকটি সংখ্যার প্রতিনিধিত্ব করতে কম দশমিক ব্যবহার করেছিল – মিশ্র নির্ভুলতা প্রশিক্ষণ নামে একটি কৌশল – এবং অন্যান্য অনেক উন্নতির মধ্যে মডেলটির জন্য ডেটা ক্রিউশন উন্নত করে। একসাথে, এই গণনা দক্ষতা উন্নতি উত্পাদিত এমন একটি মডেল যা অন্যান্য অনেক বিদ্যমানগুলির চেয়ে বেশি ব্যয়বহুল ছিল।
এই দক্ষতা অর্জনগুলি উল্লেখযোগ্য এবং অফার, আরও অনেকের মধ্যে, চারটি সম্ভাব্য – যদিও গ্যারান্টিযুক্ত নয় – গ্লোবাল এআই বাজারের জন্য গুরুত্বপূর্ণ। প্রথমত, এই দক্ষতা অর্জনগুলি এআই রেসে নতুন প্রবেশকারীদের সম্ভাব্যভাবে চালিত করতে পারে, এমন দেশগুলি সহ যেগুলি আগে বড় বড় এআই মডেলের অভাব ছিল। এখন অবধি, ফ্রন্টিয়ার এআই মডেল বিকাশের প্রচলিত দৃষ্টিভঙ্গি ছিল যে এআই মডেলের পারফরম্যান্সকে উল্লেখযোগ্যভাবে বাড়ানোর প্রাথমিক উপায়টি ছিল বৃহত্তর পরিমাণে গণনা – আরএডাব্লু প্রসেসিং পাওয়ার, মূলত। ছোট খেলোয়াড়রা তাদের অনেককে বাজার থেকে দূরে রেখে এই অনেক গণনা অ্যাক্সেস করতে সংগ্রাম করবে।
যাইহোক, আর 1, এমনকি যদি এর প্রশিক্ষণের ব্যয়গুলি সত্যই million মিলিয়ন ডলার না হয়, তবে অনেককেই প্রশিক্ষণ দেওয়া যুক্তিযুক্ত মডেলগুলি-এআই মডেলের শীর্ষস্থানীয় পারফরম্যান্স স্তর-অনেক কম ব্যয় করতে পারে এবং অন্যথায় অনুমানের চেয়ে অনেক কম চিপ ব্যবহার করতে পারে তা নিশ্চিত করেছে। ফলাফল, ডিপসেক মূলত এই সত্যের সাথে মিলিত ভাড়া গার্হস্থ্য চীনা ইঞ্জিনিয়ারিং কর্মীদের স্নাতক, সম্ভবত অন্যান্য দেশ, সংস্থাগুলি এবং উদ্ভাবকদের বোঝাতে পারে যে তারা নতুন মডেলগুলি প্রশিক্ষণের জন্য প্রয়োজনীয় মূলধন এবং সংস্থানও রাখতে পারে।
প্রকৃতপক্ষে, এই ধরনের উপলব্ধি ইতিমধ্যে শিকড় নিচ্ছে। আর 1 এর পরিপ্রেক্ষিতে, বিভ্রান্তির সিইও আরবিন্দ শ্রীনিবাস কল করা হয়েছে ডিপসেকের উদাহরণের ভিত্তিতে ভারতের নিজস্ব ফাউন্ডেশন মডেল বিকাশ করা। উদাহরণস্বরূপ ফ্রান্সের মতো সরকারগুলি ইতিমধ্যে ফ্রান্সের রাজ্য বিনিয়োগ ব্যাংকের সাথে তাদের এআই প্রতিযোগিতা বাড়াতে মিস্ট্রাল এআইয়ের মতো স্বজাতীয় সংস্থাগুলিকে সমর্থন করে আসছে বিনিয়োগ মিস্ট্রালের আগের একটি তহবিল সংগ্রহের রাউন্ডে। ডিপসেকের দ্বারা তৈরি প্রবেশের ক্ষেত্রে কম বাধা উপলব্ধি সহ, নতুন, স্বজাতীয় এআই সংস্থাগুলি সমর্থন করার ক্ষেত্রে রাজ্যগুলির আগ্রহ কেবল বৃদ্ধি পেতে পারে।
প্রবেশের এই নিম্ন বাধাগুলি গ্লোবাল এআই রেসে অতিরিক্ত জটিলতা যুক্ত করতে পারে। সাম্প্রতিক মাসগুলিতে, অনেকগুলি ধরে নেওয়া হয়েছে এআই ওয়াশিংটন এবং বেইজিংয়ের মধ্যে একটি পদক্ষেপে পরিণত হবে। তবে এখন, যদিও মার্কিন যুক্তরাষ্ট্র এবং চীন সম্ভবত বৃহত্তম মডেলের প্রাথমিক বিকাশকারী হিসাবে থাকবে, এআই জাতি আরও জটিল আন্তর্জাতিক মাত্রা অর্জন করতে পারে। মাইক্রোসফ্টের সাথে দেখা হিসাবে মার্কিন যুক্তরাষ্ট্র এবং চীনা সংস্থা উভয়ই বিদেশে এআই বিকাশকারীদের সাথে আন্তর্জাতিক অংশীদারিত্বের জন্য ভারীভাবে সম্মতি জানিয়েছে অংশীদারিত্ব আরবি ভাষার এআই মডেল বিকাশকারী জি 42 বা হুয়াওয়ের সাথে বিনিয়োগ চীন-আসিয়ান এআই ইনোভেশন সেন্টারে। আরও প্রবেশকারীদের সাথে, এই অংশীদারিত্বগুলি সুরক্ষিত করার একটি প্রতিযোগিতা এখন আগের চেয়ে আরও জটিল হয়ে উঠতে পারে।
তদ্ব্যতীত, দক্ষতা শীঘ্রই গ্লোবাল এআই রেসে রাষ্ট্রীয় শিল্প নীতিগুলির আরেকটি কেন্দ্রীয় ফোকাস হিসাবে গণনা যোগ দিতে পারে। আর 1 এর আগে, বিশ্বজুড়ে সরকারগুলি তাদেরকে আরও অবাধে চালানোর এবং জেনারেটর এআই মডেলগুলি আরও অবাধে ব্যবহার করার অনুমতি দেওয়ার জন্য গণনা ক্ষমতা তৈরি করার জন্য দৌড়াদৌড়ি করছিল, বিশ্বাস করে যে এআই মডেলগুলির পারফরম্যান্সকে উল্লেখযোগ্যভাবে স্কেল করার প্রাথমিক উপায় ছিল।
উদাহরণস্বরূপ, ভারতের মুকেশ আম্বানি is পরিকল্পনা ভারতের গুজরাটে একটি বিশাল 3-গিগাওয়াট ডেটা সেন্টার তৈরি করতে। তবে, আর 1 এর লঞ্চটি কিছু বিনিয়োগকারীকে বিশ্বাস করে যে এআইয়ের জন্য খুব কম গণনা এবং শক্তি প্রয়োজন হবে তা বিশ্বাস করে, অনুরোধ আমেরিকা যুক্তরাষ্ট্র জুড়ে এআই-সম্পর্কিত স্টকগুলিতে একটি বৃহত বিক্রয় অফ, এনভিডিয়ার মতো গণনা নির্মাতারা তাদের স্টক ভ্যালুতে $ 600 বিলিয়ন হ্রাস পেয়েছে।
এই সাম্প্রতিক বিক্রয়কর্মগুলি সত্ত্বেও, গণনা সম্ভবত অব্যাহত থাকবে অপরিহার্য দুটি কারণে। প্রথমত, জেভনস প্যারাডক্সের ক্লাসিক অর্থনৈতিক কেস রয়েছে – যখন প্রযুক্তি কোনও সংস্থান ব্যবহার করতে আরও দক্ষ করে তোলে, সেই সংস্থানটির ব্যবহার প্রতি ব্যয় হ্রাস পেতে পারে, তবে সেই দক্ষতা অর্জনগুলি প্রকৃতপক্ষে আরও বেশি লোককে সামগ্রিক সংস্থান ব্যবহার করে এবং চাহিদা বাড়িয়ে তোলে ।
কিছু প্রমাণ আছে সমর্থন শক্তি বাজারে জেভনস প্যারাডক্স, যার মাধ্যমে মোট গণনা চাহিদা যে কোনও দৃশ্যে উঠতে পারে। এনভিডিয়ার শেয়ারের দাম হ্রাস উল্লেখযোগ্য ছিল, তবে সংস্থার স্থায়ী $ 2.9 ট্রিলিয়ন ডলার মূল্যায়ন পরামর্শ দেয় যে বাজারটি এখনও গণনা ভবিষ্যতের এআই বিকাশের একটি গুরুত্বপূর্ণ অংশ হিসাবে দেখছে। দ্বিতীয়ত, আর 1 এর লাভগুলি আরও গণনাও অস্বীকার করে না সীসা এআই মডেলগুলির কাছে যা আরও ভাল সম্পাদন করে; এটি কেবল বৈধতা দেয় যে দক্ষতা লাভের মাধ্যমে অন্য একটি প্রক্রিয়া পাশাপাশি আরও ভাল পারফরম্যান্স চালাতে পারে।
এই কারণগুলি সুপারিশ করে যে গণনার চাহিদা আসলে বাড়তে পারে, হ্রাস করতে পারে না – তবে একই সময়ে, দক্ষতার উন্নতি সম্ভবত সংস্থাগুলি এবং সরকার উভয়ের জন্যই অগ্রাধিকার হবে। বিশেষত, মার্কিন যুক্তরাষ্ট্রের সংস্থাগুলি – যা ডিপসিকের আর 1 -এর প্রবর্তন দ্বারা ছড়িয়ে পড়েছে – এটি হবে সম্ভবত তাদের বিশাল গণনা বিল্ডআউটগুলির পাশাপাশি তার গণনামূলক দক্ষতার উন্নতিগুলি গ্রহণ করার চেষ্টা করুন, যখন চীনা সংস্থাগুলি চেষ্টা করতে পারে ডাবল ডাউন এই বিদ্যমান সুবিধার উপর তারা মার্কিন রফতানি নিয়ন্ত্রণকে বাইপাস করতে ঘরোয়া গণনা উত্পাদন বাড়ায়।
উভয় দেশের সরকারগুলি এই দক্ষতা লাভগুলিতে সংস্থাগুলিকে সমর্থন করার চেষ্টা করতে পারে, বিশেষত যেহেতু বিডেন প্রশাসনের 2024 এর মতো নথি জাতীয় সুরক্ষা স্মারকলিপি বিশ্বের সর্বাধিক পারফরম্যান্ট এআই সিস্টেমগুলিকে একটি জাতীয় অগ্রাধিকার হিসাবে তৈরি করা হয়েছে।
আর 1 এর কম দাম, বিশেষত যখন পশ্চিমা মডেলগুলির সাথে তুলনা করা হয়, বিশ্বব্যাপী এটির মতো মডেলগুলি গ্রহণের ব্যাপকভাবে চালিত করার সম্ভাবনা রয়েছে, বিশেষত গ্লোবাল সাউথের কিছু অংশে। এই ধরণের দ্রুত এআই গ্রহণ এই দেশগুলিতে অর্থনৈতিক প্রবৃদ্ধির জন্য এআইয়ের সুবিধাগুলি ত্বরান্বিত করতে পারে, সম্ভাব্যভাবে তাদের দীর্ঘমেয়াদী ভূ-রাজনৈতিক হেফট বৃদ্ধি করে এবং চীনা এআই সরঞ্জামগুলির বিশ্বব্যাপী ব্যবহার সম্পর্কে উদ্বিগ্ন মার্কিন নীতিনির্ধারকদের জন্য নতুন চ্যালেঞ্জ তৈরি করে।
যাইহোক, ডিপসেক যেমন এই বিশাল বিশ্ব বাজারকে দেখছেন, আমেরিকার অনেক পাওয়ার হাউস এআই বিকাশকারীরাও দ্বিগুণ হয়ে যেতে পারেন বিল্ডিং এই দেশগুলির এআই বাজারগুলিতে প্রতিযোগিতামূলক অফার করার জন্য আরও গণনামূলকভাবে দক্ষ এবং নিম্ন-দামের মডেলগুলি বিশ্বব্যাপী দক্ষিণ জুড়ে একটি এআই রেসের পরামর্শ দেয়-অংশীদারিত্বের পাশাপাশি গ্রহণের স্তরে-এটি ঘটতে পারে।
খুব কম প্রতিযোগিতায় এটির মতো দ্রুত চলমান গ্যারান্টিযুক্ত হতে পারে। যাইহোক, ডিপসিকের দক্ষতা লাভগুলি গ্লোবাল এআই জাতির বিদ্যমান অনুমানগুলিকে একটি চ্যালেঞ্জ সরবরাহ করেছে এবং এর প্রতিযোগিতামূলক গতিশীলতা এমনভাবে পরিবর্তন করতে পারে যা পূর্বে অপ্রত্যাশিতভাবে পরিবর্তন করতে পারে। বিশ্বের বেশিরভাগ অংশে, এটি সম্ভব যে ডিপসিকের সস্তা দাম এবং আরও দক্ষ গণনাগুলি এটিকে একটি অস্থায়ী সুবিধা দিতে পারে, যা দীর্ঘমেয়াদী গ্রহণের প্রসঙ্গে উল্লেখযোগ্য প্রমাণ করতে পারে।
তবে, আমাদের এবং স্বদেশে বা আঞ্চলিক বিকল্প উভয়ই লড়াইয়ে প্রবেশের আগেও খুব বেশি দিন নাও হতে পারে, কোন প্ল্যাটফর্মগুলি কে ব্যবহার করবে তা নিয়ে আরও প্রতিযোগিতা শুরু করে। আগের তুলনায় আরও বেশি মডেল এবং দামের সাথে, কেবলমাত্র একটি জিনিস নিশ্চিত – গ্লোবাল এআই রেসটি অনেক দূরে এবং যে কেউ ভাবেন তার চেয়ে অনেক বেশি মোচড়।