উদ্যোক্তাদের দ্বারা প্রকাশিত মতামতগুলি তাদের নিজস্ব।
আমার কাজ এআই গ্রহণের বিষয়ে এন্টারপ্রাইজ নেতাদের পরামর্শ দেওয়ার ক্ষেত্রে, আমি একটি আশ্চর্যজনক প্যাটার্নটি উদ্ভূত দেখেছি। শিল্পটি সর্বদা-বৃহত্তর মডেলগুলি তৈরির সাথে ব্যস্ত থাকলেও পরবর্তী সুযোগের তরঙ্গটি শীর্ষ থেকে আসছে না-এটি ক্রমবর্ধমান প্রান্ত থেকে আসছে।
কমপ্যাক্ট মডেলগুলি, বা ছোট ভাষার মডেলগুলি (এসএলএম), স্কেলিবিলিটির একটি নতুন মাত্রা আনলক করছে – নিখুঁত গণনামূলক শক্তির মাধ্যমে নয়, অ্যাক্সেসযোগ্যতার মাধ্যমে। কম গণনা প্রয়োজনীয়তা, দ্রুত পুনরাবৃত্তি চক্র এবং সহজ স্থাপনার সাথে, এসএলএমগুলি মূলত কে তৈরি করে, কে মোতায়েন করে এবং কত দ্রুত ব্যবসায়ের মান তৈরি করা যায় তা মূলত পরিবর্তন করে। তবুও, আমি দেখতে পাচ্ছি যে অনেক উদ্যোক্তা এখনও এই উল্লেখযোগ্য পরিবর্তনটি উপেক্ষা করছেন।
সম্পর্কিত: আর কোনও চ্যাটজিপ্ট নেই? ছোট ভাষার মডেলগুলি কেন এআই স্পটলাইট চুরি করছে তা এখানে
মডেল আকারের উপর টাস্ক ফিট
আমার অভিজ্ঞতায়, এআই গ্রহণের সবচেয়ে অবিরাম কল্পকাহিনীগুলির মধ্যে একটি হ’ল পারফরম্যান্স মডেল আকারের সাথে রৈখিকভাবে স্কেল করে। অনুমানটি স্বজ্ঞাত: বড় মডেল, আরও ভাল ফলাফল। তবে বাস্তবে, এই যুক্তিটি প্রায়শই বিচ্যুত হয় কারণ বেশিরভাগ বাস্তব-বিশ্বের ব্যবসায়ের কাজগুলি সহজাতভাবে আরও অশ্বশক্তি প্রয়োজন হয় না; তাদের তীক্ষ্ণ টার্গেটিং প্রয়োজন, যা আপনি ডোমেন-নির্দিষ্ট অ্যাপ্লিকেশনগুলির দিকে তাকালে স্পষ্ট হয়ে যায়।
মানসিক স্বাস্থ্য চ্যাটবট থেকে শুরু করে কারখানা-তল ডায়াগনস্টিকগুলিতে সুনির্দিষ্ট অসাধারণ সনাক্তকরণের প্রয়োজন হয়, ফোকাসযুক্ত কার্যগুলির জন্য তৈরি কমপ্যাক্ট মডেলগুলি ধারাবাহিকভাবে জেনারালিস্ট সিস্টেমগুলিকে ছাড়িয়ে যেতে পারে। কারণটি হ’ল বৃহত্তর সিস্টেমগুলি প্রায়শই নির্দিষ্ট প্রসঙ্গে অতিরিক্ত ক্ষমতা বহন করে। এসএলএমএসের শক্তি কেবল গণনামূলক নয় – এটি গভীরভাবে প্রাসঙ্গিক। ছোট মডেলগুলি পুরো বিশ্বকে পার্স করছে না; তারা একটির জন্য সমাধান করার জন্য সাবধানে সুর করা হয়।
এই সুবিধাটি প্রান্ত পরিবেশে আরও বেশি প্রকট হয়ে ওঠে, যেখানে মডেলটিকে অবশ্যই দ্রুত এবং স্বাধীনভাবে কাজ করতে হবে। স্মার্টগ্লাস, ক্লিনিকাল স্ক্যানার এবং পয়েন্ট-অফ-বিক্রয় টার্মিনালগুলির মতো ডিভাইসগুলি মেঘের বিলম্ব থেকে উপকৃত হয় না। তারা স্থানীয় অনুমান এবং অন-ডিভাইস পারফরম্যান্সের দাবি করে, যা কমপ্যাক্ট মডেলগুলি সরবরাহ করে-রিয়েল-টাইম প্রতিক্রিয়াশীলতা সক্ষম করে, ডেটা গোপনীয়তা সংরক্ষণ করে এবং অবকাঠামোকে সরলকরণ করে।
তবে সম্ভবত সবচেয়ে গুরুত্বপূর্ণ, বৃহত্তর ভাষার মডেলগুলির (এলএলএম) এর বিপরীতে, প্রায়শই বিলিয়ন ডলারের ল্যাবগুলিতে সীমাবদ্ধ, কমপ্যাক্ট মডেলগুলি কেবল কয়েক হাজার ডলার হতে পারে তার জন্য সূক্ষ্ম সুরযুক্ত এবং মোতায়েন করা যেতে পারে।
এবং সেই ব্যয় পার্থক্যটি কে তৈরি করতে পারে তার সীমানা পুনর্নির্মাণ করে, উদ্যোক্তাদের জন্য বাধা হ্রাস করে গতি, নির্দিষ্টতা এবং সমস্যার সান্নিধ্যকে অগ্রাধিকার দেয়।
লুকানো সুবিধা: বাজার থেকে গতি
যখন কমপ্যাক্ট মডেলগুলি খেলতে আসে, বিকাশ কেবল ত্বরান্বিত হয় না – এটি রূপান্তরিত হয়। দলগুলি অনুক্রমিক পরিকল্পনা থেকে অভিযোজিত আন্দোলনে স্থানান্তরিত করে। এগুলি দ্রুত সুরক্ষিত, বিদ্যমান অবকাঠামোতে মোতায়েন করে এবং বড় আকারের সিস্টেমগুলি প্রবর্তন করে এমন বাধা ছাড়াই রিয়েল টাইমে প্রতিক্রিয়া জানায়।
এবং এই ধরণের প্রতিক্রিয়াশীলতা কীভাবে বেশিরভাগ প্রতিষ্ঠাতা প্রকৃতপক্ষে কাজ করে তা আয়না করে: চর্বি চালু করা, ইচ্ছাকৃতভাবে পরীক্ষা করা এবং বাস্তব ব্যবহারের উপর ভিত্তি করে পুনরাবৃত্তি করা, কেবলমাত্র দূরবর্তী রোডম্যাপের পূর্বাভাসের ভিত্তিতে নয়।
সুতরাং কোয়ার্টারে ধারণাগুলি বৈধ করার পরিবর্তে দলগুলি চক্রগুলিতে বৈধতা দেয়। প্রতিক্রিয়া লুপটি শক্ত করে, অন্তর্দৃষ্টি যৌগগুলি এবং সিদ্ধান্তগুলি বাজারটি আসলে কোথায় টানছে তা প্রতিফলিত করতে শুরু করে।
সময়ের সাথে সাথে, পুনরাবৃত্ত ছন্দটি আসলে কী মান তৈরি করে তা স্পষ্ট করে। একটি হালকা ওজনের স্থাপনা, এমনকি এর প্রথম পর্যায়েও, পৃষ্ঠগুলি সংকেত দেয় যে traditional তিহ্যবাহী টাইমলাইনগুলি অস্পষ্ট হবে। ব্যবহারগুলি প্রকাশ করে কোথায় জিনিসগুলি ভেঙে যায়, কোথায় তারা অনুরণিত হয় এবং কোথায় তাদের মানিয়ে নেওয়া দরকার। এবং ব্যবহারের ধরণগুলি যেমন আকার নেয়, তারা সবচেয়ে বেশি গুরুত্বপূর্ণ বিষয়গুলিতে স্পষ্টতা এনে দেয়।
দলগুলি অনুমানের মাধ্যমে নয়, এক্সপোজারের মাধ্যমে ফোকাসকে স্থানান্তরিত করে – মিথস্ক্রিয়া পরিবেশের দাবি করে তার প্রতিক্রিয়া জানায়।
সম্পর্কিত: সিলিকন ভ্যালি থেকে সর্বত্র – এআই কীভাবে উদ্ভাবন এবং উদ্যোক্তা গণতান্ত্রিক করছে
উন্নত অর্থনীতি, বিস্তৃত অ্যাক্সেস
সেই ছন্দটি কেবল কীভাবে পণ্যগুলি বিকশিত হয় তা পরিবর্তন করে না; এটি তাদের সমর্থন করার জন্য কী অবকাঠামো প্রয়োজন তা পরিবর্তন করে।
কারণ স্থানীয়ভাবে কমপ্যাক্ট মডেল স্থাপন করা – সিপিইউ বা এজ ডিভাইসে – বাহ্যিক নির্ভরতার ওজন সরিয়ে দেয়। ট্রিলিয়ন-প্যারামিটার পুনরায় প্রশিক্ষণে প্রতিটি অনুমান বা বার্ন কম্পিউটারের জন্য ওপেনএআই বা গুগলের মতো ফ্রন্টিয়ার মডেল কল করার দরকার নেই। পরিবর্তে, ব্যবসায়গুলি গণনা ব্যয়, মোতায়েনের সময় এবং সিস্টেমগুলি একবারে জীবিত হয়ে ওঠার জন্য আর্কিটেকচারাল নিয়ন্ত্রণ ফিরে পায়।
এটি শক্তি প্রোফাইলও পরিবর্তন করে। ছোট মডেলগুলি কম গ্রাস করে। তারা সার্ভার ওভারহেড হ্রাস করে, ক্রস-নেটওয়ার্ক ডেটা প্রবাহকে হ্রাস করে এবং আরও এআই কার্যকারিতা যেখানে এটি ব্যবহৃত হয় সেখানে বেঁচে থাকতে সক্ষম করে। স্বাস্থ্যসেবা, প্রতিরক্ষা বা ফিনান্সের মতো – ভারী নিয়ন্ত্রিত পরিবেশে – এটি কেবল কোনও প্রযুক্তিগত জয় নয়। এটি একটি সম্মতি পথ।
এবং আপনি যখন এই শিফটগুলি যুক্ত করেন, ডিজাইন লজিক ফ্লিপগুলি। ব্যয় এবং গোপনীয়তা আর ট্রেড-অফ হয় না। তারা নিজেই সিস্টেমে এম্বেড হয়েছে।
বড় মডেলগুলি গ্রহ স্কেলে কাজ করতে পারে তবে কমপ্যাক্ট মডেলগুলি ডোমেনগুলিতে কার্যকরী প্রাসঙ্গিকতা নিয়ে আসে যেখানে স্কেল একবারে দাঁড়িয়ে ছিল। অনেক উদ্যোক্তাদের জন্য, এটি বিল্ডিংয়ের জন্য সম্পূর্ণ নতুন অ্যাপারচারটি আনলক করে।
ইতিমধ্যে ঘটছে এমন একটি ব্যবহারের কেস শিফট
উদাহরণস্বরূপ, রেপ্লিকা একটি হালকা ওজনের সংবেদনশীল এআই সহকারী তৈরি করেছিলেন যা একটি বিশাল এলএলএম-এর উপর নির্ভর না করে 30 মিলিয়নেরও বেশি ডাউনলোড অর্জন করেছিল কারণ তাদের ফোকাস সাধারণ-উদ্দেশ্যমূলক প্ল্যাটফর্ম তৈরির দিকে ছিল না। এটি একটি সংকীর্ণ, উচ্চ-প্রভাব ব্যবহারের ক্ষেত্রে সহানুভূতি এবং প্রতিক্রিয়াশীলতার জন্য সুরযুক্ত একটি গভীর প্রাসঙ্গিক অভিজ্ঞতা ডিজাইন করার উপর ছিল।
এবং সেই মোতায়েনের কার্যকারিতাটি প্রান্তিককরণ থেকে এসেছে – মডেলটির কাঠামো, টাস্ক ডিজাইন এবং প্রতিক্রিয়া আচরণটি প্রবেশ করা পরিবেশের উপদ্রব মেলে যথেষ্ট ঘনিষ্ঠভাবে আকারযুক্ত হয়েছিল। এই ফিটটি এটিকে সত্যের পরে পুনরুদ্ধার করার পরিবর্তে ইন্টারঅ্যাকশন নিদর্শনগুলি বিকশিত হিসাবে মানিয়ে নিতে সক্ষম করেছে।
লামা, মিস্ট্রাল এবং আলিঙ্গন মুখের মতো ওপেন ইকোসিস্টেমগুলি সেই ধরণের প্রান্তিককরণ অ্যাক্সেসকে সহজ করে তুলছে। এই প্ল্যাটফর্মগুলি বিল্ডারদের শুরু করার পয়েন্টগুলি সরবরাহ করে যা সমস্যার কাছাকাছি থেকে শুরু হয়, এটি থেকে বিমূর্ত নয়। এবং সেই নৈকট্য একবার সিস্টেম স্থাপন করা হলে শেখার ত্বরান্বিত করে।
সম্পর্কিত: মাইক্রোসফ্ট কমপ্যাক্ট এআই মডেল পিএইচআই -4 গাণিতিক চ্যালেঞ্জগুলি গ্রহণ করে
বিল্ডারদের জন্য একটি বাস্তববাদী রোডম্যাপ
আজ এআইয়ের সাথে বিলিয়ন বিলিয়ন অবকাঠামোগত অ্যাক্সেস ছাড়াই উদ্যোক্তাদের বিল্ডিংয়ের জন্য, আমার পরামর্শটি হ’ল কমপ্যাক্ট মডেলগুলিকে একটি সীমাবদ্ধতা হিসাবে নয়, তবে কৌশলগত সূচনা পয়েন্ট হিসাবে যা মান সত্যিকারের জীবনযাপনের প্রতিফলনকারী সিস্টেমগুলি ডিজাইনের একটি উপায় সরবরাহ করে: টাস্কে, প্রসঙ্গে এবং মানিয়ে নেওয়ার ক্ষমতা।
কীভাবে শুরু করবেন তা এখানে:
ফলাফলটি সংজ্ঞায়িত করুন, উচ্চাকাঙ্ক্ষা নয়: গুরুত্বপূর্ণ যে একটি কাজ দিয়ে শুরু করুন। সমস্যাটি সিস্টেমটিকে আকার দিন, অন্যভাবে নয়।
ইতিমধ্যে সারিবদ্ধ যা দিয়ে তৈরি করুন: আলিঙ্গন ফেস, মিস্ট্রাল এবং লামার মতো মডেল পরিবারগুলি ব্যবহার করুন যা প্রান্তে টিউনিং, পুনরাবৃত্তি এবং স্থাপনার জন্য অনুকূলিত।
সিগন্যালের কাছে থাকুন: যেখানে প্রতিক্রিয়া দৃশ্যমান এবং কার্যক্ষম-সেখানে ডাইভিস, প্রসঙ্গে, রিয়েল টাইমে বিকশিত হওয়ার জন্য যথেষ্ট বন্ধ রয়েছে সেখানে মোতায়েন করুন।
অবকাঠামো হিসাবে পুনরাবৃত্তি: চলাচলের সাথে লিনিয়ার পরিকল্পনা প্রতিস্থাপন করুন। প্রতিটি রিলিজ ফিটকে আরও তীক্ষ্ণ করতে দিন, এবং ব্যবহার করুন – রোডম্যাপ নয় – এরপরে যা আসে তা ড্রাইভ করুন।
কারণ এই পরবর্তী এআই তরঙ্গে, যেমনটি আমি এটি দেখছি, সুবিধাটি কেবলমাত্র বৃহত্তম সিস্টেমগুলি তৈরিকারীদের সাথে সম্পর্কিত হবে না – এটি তাদের বিল্ডিংয়ের সাথে সম্পর্কিত হবে নিকটতম।
টাস্কের নিকটতম। প্রসঙ্গের নিকটতম। সিগন্যালের নিকটতম।
এবং যখন মডেলগুলি সেই মানটি তৈরি করা হয় তার সাথে দৃ ly ়ভাবে সারিবদ্ধ করে, স্কেলের উপর নির্ভর করে অগ্রগতি বন্ধ হয়ে যায়। এটি ফিটের উপর নির্ভর করে শুরু হয়।