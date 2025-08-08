আমি স্থানীয় সবকিছু চাই – মেঘ নেই, কোনও রিমোট কোড এক্সিকিউশন নেই।
এটাই বলল এক বন্ধু। এই এক-লাইনের প্রয়োজনীয়তা, সহজ হলেও, এটি ঘটানোর জন্য টেন্ডেমে কাজ করার জন্য একাধিক জিনিসের প্রয়োজন হবে।
একটি মূলধারার এলএলএম (বৃহত্তর ভাষার মডেল) চ্যাটজিপিটি বা ক্লাউডের মতো চ্যাট অ্যাপটি উচ্চ স্তরে সরবরাহ করে?
- ক্লাউড হোস্টেড এলএলএম এর সাথে চ্যাট ব্যবহার করার ক্ষমতা,
- তাদের দ্বারা উত্পাদিত কোড চালানোর ক্ষমতা বেশিরভাগ ক্ষেত্রে তাদের ক্লাউড ইনফ্রায়, কখনও কখনও স্থানীয়ভাবে শেলের মাধ্যমে,
- নতুন সামগ্রী বা পরিষেবার জন্য ইন্টারনেট অ্যাক্সেস করার ক্ষমতা।
এতগুলি এলএলএম ওপেন সোর্স / ওপেন ওজন হওয়ায়, স্থানীয়ভাবে সমস্ত কিছু করা কি সম্ভব হবে না? তবে কেবল স্থানীয় এলএলএম যথেষ্ট নয়, কোড চালানোর জন্য আমাদেরও সত্যিকারের বিচ্ছিন্ন পরিবেশের প্রয়োজন।
সুতরাং, চ্যাটের জন্য এলএলএম, কোড এক্সিকিউশন ধারক করতে ডকার এবং অবশেষে সামগ্রীর জন্য কোনও ধরণের ব্রাউজার অ্যাক্সেস।
🧠 ধারণা
আমরা একটি সিস্টেম চেয়েছিলাম যেখানে:
- এলএলএম পুরোপুরি চালায় স্থানীয়ভাবে
- কোড একটি লাইটওয়েট ভিএম এর ভিতরে কার্যকর করেহোস্ট মেশিনে নেই
- বোনাস: হেডলেস ব্রাউজার অটোমেশন এবং ইন্টারনেট অ্যাক্সেসের জন্য
এলএলএমের মাধ্যমে পরিকল্পনা থেকে শুরু করে কোনও ধারকটির অভ্যন্তরে কোড এক্সিকিউশন থেকে শুরু করে স্থানীয়ভাবে পুরোপুরি কার্যকর করা দরকার এমন কাজগুলি সম্পাদন করা ছিল। উদাহরণস্বরূপ, আপনি যদি নিজের ফটো বা ভিডিওগুলি সম্পাদনা করতে চান তবে ওপেনএআই/গুগল/নৃতাত্ত্বিককে আপনার ডেটা না দিয়ে আপনি কীভাবে এটি করতে পারেন? যদিও তারা সুরক্ষাকে গুরুত্ব সহকারে নেয় (অনেকের চেয়ে বেশি), এটি আপনার ব্যক্তিগত ডেটা আপোস করার দিকে পরিচালিত একটি স্লিপের বিষয় মাত্র, যখন ব্যবহারকারী চ্যাটগুলি ছিল তখন চ্যাটজিপিটি -র প্রথম দিনগুলি হিসাবে একটি ঘটনা অ্যাক্সেসযোগ্য অন্যের অ্যাকাউন্ট থেকে!
আমরা যে স্ট্যাক ব্যবহার করেছি
💡 আমরা এটি পুরোপুরি অ্যাপল সিলিকনে চালিয়েছি, ব্যবহার করে
containerবিচ্ছিন্নতার জন্য।
🛠 একটি ম্যাক অ্যাপে আমাদের প্রচেষ্টা
আমরা উদ্যোগী উচ্চাকাঙ্ক্ষা দিয়ে শুরু করেছি: এটিকে স্থানীয় বোধ করুন। আমরা ব্যবহার করার চেষ্টা করেছি
a0.devআশা করি এটি একটি ম্যাক অ্যাপ্লিকেশন তৈরি করতে সহায়তা করতে পারে। তবে এটি আইওএস অ্যাপ্লিকেশন বিকাশের জন্য আরও বেশি বোঝানো হয়েছে বলে মনে হচ্ছে – এবং এটি ম্যাকোসের পক্ষে কাজ করা বেদনাদায়ক ছিল, কমপক্ষে বলতে গেলে।
এমনকি “ওয়ার্ল্ডস সেরা” এলএলএমএসের সহায়তায়, জিনিসগুলি আমাদের প্রত্যাশার মতো এতটা সুচারুভাবে যায় নি। তারা মায়াময় পদক্ষেপগুলি, প্ল্যাটফর্ম-নির্দিষ্ট কুইর্কগুলি মিস করে এবং প্রায়শই আমাদের আরও খারাপ করে ফেলে দেয়।
তারপরে আমরা একটি মোড়ানো চেষ্টা করেছি
NextJS ইলেক্ট্রনের ভিতরে অ্যাপ। আমরা আমাদের স্বীকার করতে চাই তার চেয়ে বেশি সময় নিয়েছে। এই লেখার হিসাবে, দেখে মনে হচ্ছে এটি করার মতো কোনও (পরিষ্কার) উপায় নেই।
সুতরাং, আমরা ম্যাক অ্যাপটি ছেড়ে দিয়েছি। এর স্থানীয় ওয়েব সংস্করণ
assistant-ui যথেষ্ট ভাল ছিল – সহজ, কনফিগারযোগ্য, এবং পিছনে লড়াই করেনি।
সহকারী ইউআই
আমরা ভেবেছিলাম
Assistant-UI বক্সের বাইরে একাধিক এলএলএম সমর্থন সরবরাহ করেছে, কারণ তাদের ল্যান্ডিং পৃষ্ঠাটি মডেলগুলির একটি ড্রপ-ডাউন দেখায়। তবে, না। সুতরাং, আমাদের কীভাবে এটি সম্পর্কে যেতে হবে তার উদাহরণগুলি সন্ধান করতে হয়েছিল এবং
ai-sdk জনপ্রিয় পছন্দ হিসাবে উপস্থিত হয়েছিল। অবশেষে আমাদের মডেল নির্বাচনের জন্য একটি ড্রপডাউন ছিল। আমরা সেটটিকে কেবল স্থানীয় মডেলগুলিতে সীমাবদ্ধ না করার সিদ্ধান্ত নিয়েছি, কারণ ছোট স্থানীয় মডেলগুলি এখনও সেখানে নেই। ব্যবহারকারীরা সরঞ্জাম এবং এর সক্ষমতাগুলির সাথে পরিচিত হতে পারে এবং পরে ছোট স্থানীয় মডেলগুলি আরও ভাল হয়ে ওঠে, তারা কেবল সম্পূর্ণ স্থানীয় হওয়ার দিকে স্যুইচ করতে পারে।
সরঞ্জাম-কলিং
আমাদের ব্যবহারের ক্ষেত্রেও আমাদের এমন মডেল থাকা দরকার যা সরঞ্জাম-কলিংকে সমর্থন করে। কিছু মডেল করার সময়, ওলামা তাদের জন্য সরঞ্জাম সমর্থন প্রয়োগ করেনি। উদাহরণস্বরূপ:
responseBody: '{"error":"registry.ollama.ai/library/deepseek-r1:8b does not support tools"}',
এবং বিভ্রান্তিতে যোগ করার জন্য, ওলামা এই মডেলটিকে তাদের সাইটে সরঞ্জাম কলিং বিভাগের অধীনে রাখার সিদ্ধান্ত নিয়েছে। বোধগম্যভাবে, দ্রুত-চলমান এআই ল্যান্ডস্কেপের সাথে, সম্প্রদায় চালিত প্রকল্পগুলির পক্ষে রাখা কঠিন হতে পারে।
এই মুহুর্তে, কোনও মডেলের সরঞ্জাম-সমর্থন আছে কি না, টোকেন প্রতি মূল্য নির্ধারণের মতো প্রয়োজনীয় তথ্যগুলি এত চঞ্চল। একটি মডেলের অফিসিয়াল পৃষ্ঠায় সরঞ্জাম-সমর্থনের কথা উল্লেখ করা হয়েছে তবে তারপরে ওলামার মতো সরঞ্জামগুলি সেগুলি বাস্তবায়নের জন্য কিছুটা সময় নেয়। যাইহোক, আমাদের অভিযোগ করা উচিত নয় – এটি ওপেন সোর্স, আমরা অবদান রাখতে পারতাম।
ধারক সম্পাদন
ইউআই এমভিপি-স্তরের বাছাইয়ের পরে, আমরা বিচ্ছিন্ন ভিএম অংশে চলে এসেছি। সম্প্রতি অ্যাপল ‘কনটেইনার’ নামে একটি সরঞ্জাম প্রকাশ করেছে। হ্যাঁ, এটা ঠিক। সুতরাং, আমরা এটি পরীক্ষা করে দেখেছি এবং এটি ডকারের চেয়ে ভাল বলে মনে হয়েছিল কারণ এটি ধারক প্রতি একটি বিচ্ছিন্ন ভিএম সরবরাহ করেছে – এআই উত্পন্ন কোড চালানোর জন্য একটি উপযুক্ত ফিট। সুতরাং, আমরা ভিএম -তে একটি জুপিটার সার্ভার স্থাপন করেছি, এটি এমসিপি (মডেল প্রসঙ্গ প্রোটোকল) সরঞ্জাম হিসাবে প্রকাশ করেছি এবং এটি উপলব্ধ করেছি
http://coderunner.local:8222/mcp।
এমসিপিং বনাম একটি এপিআই প্রকাশের সুবিধা হ’ল এমসিপিগুলির সাথে কাজ করে এমন বিদ্যমান সরঞ্জামগুলি এখনই এটি ব্যবহার করতে পারে। উদাহরণস্বরূপ, ক্লাড ডেস্কটপ এবং জেমিনি সিএলআই একটি সাধারণ কনফিগারেশন সহ এআই-উত্পাদিত কোডটি কার্যকর করা শুরু করতে পারে।
"mcpServers": {
"coderunner": {
"httpUrl": "
}
}
আপনি নীচে দেখতে পাচ্ছেন, ক্লডটি বুঝতে পেরেছেন এটি সরঞ্জামটি ব্যবহার করা উচিত
execute_python_code এমসিপি এন্ডপয়েন্টের মাধ্যমে আমাদের বিচ্ছিন্ন ভিএম থেকে উন্মুক্ত।
একদিকে – আপনি যদি কেবল ব্যবহার করতে চান
coderunner আপনার বিদ্যমান সরঞ্জামগুলির সাথে কোডটি কার্যকর করার জন্য এমসিপি হিসাবে বিট করুন, এর জন্য কোড
coderunner হয় জনসাধারণ।
অ্যাপল কনটেইনার
একটি স্পর্শক – যদি আপনি অ্যাপলের সাথে কাজ করার পরিকল্পনা করছেন
containerএবং এটি ব্যবহার করে ভিএম চিত্রগুলি তৈরি করা, প্রচুর ধৈর্য রয়েছে। বিল্ডটি ব্যর্থ রাখে
Trapত্রুটি বা কেবল কোনও আউটপুট ছাড়াই ঝুলছে। চালিয়ে যেতে, আপনার উচিত
pkillসমস্ত ধারক প্রক্রিয়া এবং পুনরায় আরম্ভ
containerসরঞ্জাম তারপরে সরান
buildkitচিত্র যাতে পরবর্তী
buildপ্রক্রিয়া একটি তাজা একটি আনতে পারে। এবং সফলভাবে কাজ না করা পর্যন্ত তিনটি পদক্ষেপ পুনরাবৃত্তি করুন; এটি কয়েক ঘন্টা সময় নিতে পারে। অ্যাপল কনটেইনার পরিপক্ক দেখে আমরা আগ্রহী কারণ এটি তার প্রাথমিক পর্যায়ে চলে যায়।
আমাদের অ্যাপে ফিরে, আমরা পরীক্ষা করেছি
UI + LLMs + CodeRunner একটি কাজ
edit a video এবং এটি কাজ!
আমি এটিকে সিস্টেমের নির্দেশাবলীর জন্য স্যানিটি চেক হিসাবে লর্ড ভলডেমর্ট হিসাবে আমাকে সম্বোধন করতে বলেছি
কোডারুনারকে কাজ করার জন্য যাচাই করার পরে, আমরা একটি হেডলেস ব্রাউজারের সমর্থন যুক্ত করার সিদ্ধান্ত নিয়েছি। মূল কারণটি ছিল অ্যাপটিকে অনলাইনে নতুন/আপডেট হওয়া সরঞ্জাম/তথ্য সন্ধান করার অনুমতি দেওয়া, উদাহরণস্বরূপ, গিটহাবকে ব্রাউজ করা এমন কিছু সরঞ্জামের জন্য ইনস্টলেশন নির্দেশনা খুঁজতে এটি এখনও জানে না। আর একটি কারণ ছিল ভিত্তি স্থাপন করা
research। আমরা কাজের জন্য নাট্যকারকে বেছে নিয়েছি। আমরা এটি একই পাত্রে স্থাপন করেছি এবং এটি এমসিপি সরঞ্জাম হিসাবে উন্মুক্ত করেছি। এখানে একটি কাজ আমরা এটি করতে বলেছি –
এটির সাথে আমাদের বেসিক সেট আপটি প্রস্তুত ছিল: স্থানীয় এলএলএম + স্যান্ডবক্সযুক্ত স্বেচ্ছাসেবী কোড এক্সিকিউশন + হেডলেস ব্রাউজার সর্বশেষ তথ্যের জন্য।
এটি কী করতে পারে (উদাহরণ)
- একটি বিষয় নিয়ে গবেষণা করুন
- চার্ট উত্পন্ন এবং রেন্ডার করুন সিএসভি থেকে সরল ইংরেজি ব্যবহার করে
- ভিডিও সম্পাদনা করুন (মাধ্যমে
ffmpeg) – যেমন, “0:10 থেকে 1:00 এর মধ্যে কাটা”
- চিত্রগুলি সম্পাদনা করুন – পুনরায় আকার, শস্য, রূপান্তর ফর্ম্যাট
- গিটহাব থেকে সরঞ্জাম ইনস্টল করুন একটি ধারক স্থান
- একটি হেডলেস ব্রাউজার ব্যবহার করুন পৃষ্ঠাগুলি আনতে এবং সামগ্রীর সংক্ষিপ্তসার ইত্যাদি
খণ্ড এবং বিচ্ছিন্নতা
আমরা একটি ভলিউম ম্যাপ করেছি
~/.coderunner/assets (হোস্ট) থেকে
/app/uploads (ধারক)
সুতরাং ফাইলগুলি সম্পাদিত/উত্পাদিত নিরাপদ ভাগ করা জায়গায় থাকুন, তবে কোড কখনই হোস্ট সিস্টেমকে স্পর্শ করে না।
সীমাবদ্ধতা এবং পরবর্তী পদক্ষেপ
- বর্তমানে কেবল অ্যাপল সিলিকনে কাজ করে (ম্যাকোস 26 al চ্ছিক)
- সরঞ্জাম এবং আউটপুট স্ট্রিমিং পরিচালনার জন্য আরও ভাল ইউআই প্রয়োজন
- হেডলেস ব্রাউজারটি বিভিন্ন সাইট দ্বারা বট হিসাবে শ্রেণিবদ্ধ করা হয়
চূড়ান্ত চিন্তা
এটি কেবল একটি পরীক্ষার চেয়ে বেশি। এটি একটি দর্শন শিফট আপনার মেশিনে গণনা এবং এজেন্সি ফিরিয়ে আনছে। কোনও মেঘ নির্ভরতা নেই। কোনও গোপনীয়তা ট্রেড অফস নেই। যদিও সেরা মডেলগুলি সম্ভবত সর্বদা জায়ান্টদের সাথে থাকবে, আমরা আশা করি যে আমাদের কাছে এখনও স্থানীয় সরঞ্জাম থাকবে যা আমাদের প্রাপ্য গোপনীয়তার সাথে আমাদের প্রতিদিনের কাজটি করতে পারে।
আমরা কেবল এটি কল্পনা করিনি। আমরা এটি তৈরি করেছি। এবং এখন, আপনি এটিও ব্যবহার করতে পারেন।
চেক আউট
coderunner-uiচালু গিরুব শুরু করতে, এবং আপনি কী ভাবেন তা আমাদের জানান। আমরা প্রতিক্রিয়া, সমস্যা এবং অবদানকে স্বাগত জানাই।