আমার 2.5 বছরের পুরানো ল্যাপটপ GLM-4.5 এয়ার এবং এমএলএক্স ব্যবহার করে এখনই জাভাস্ক্রিপ্টে স্পেস আক্রমণকারীদের লিখতে পারে

29 জুলাই 2025

আমি গতকাল নতুন জিএলএম -4.5 মডেল পরিবার সম্পর্কে লিখেছি-নতুন ওপেন ওজন (এমআইটি লাইসেন্সযুক্ত) মডেলগুলি থেকে Z.ai চীনে যা তাদের মানদণ্ডগুলি ক্লড সোননেট 4 এর মতো মডেলের বিরুদ্ধে কোডিংয়ে উচ্চ স্কোর দাবি করে।

মডেলগুলি বেশ বড়-ছোট জিএলএম -4.5 এয়ার মডেলটি এখনও 106 বিলিয়ন মোট পরামিতি, যা 205.78 গিগাবাইট আলিঙ্গন মুখ।

ইভান ফিয়েরাবন্তী নির্মিত এই এমএলএক্সের জন্য 44 জিবি 3 বিট কোয়ান্টাইজড সংস্করণবিশেষত আকারের যাতে 64 জিবি মেশিনযুক্ত লোকেরা এটি চালানোর সুযোগ পেতে পারে। আমি এটি চেষ্টা করে দেখেছি … এবং এটি কাজ করে অত্যন্ত ভাল।

আমি এটি নিম্নলিখিত প্রম্পট খাওয়ানো:

Write an HTML and JavaScript page implementing space invaders

এবং এটি কিছুক্ষণের জন্য মন্থন করে নিম্নলিখিতগুলি তৈরি করেছে:

স্পষ্টতই এটি একটি বিশেষ অভিনব উদাহরণ নয়, তবে আমি এখনও মনে করি এটি লক্ষণীয় যে আমার 2.5 বছরের পুরানো ল্যাপটপে চলমান একটি মডেল (একটি 64 জিবি ম্যাকবুক প্রো এম 2) এই জাতীয় কোড তৈরি করতে সক্ষম হয়েছে – বিশেষত কোড যা আর কোনও সম্পাদনার প্রয়োজন ছাড়াই প্রথমবারের মতো কাজ করে।

আমি কীভাবে মডেল চালিয়েছি

আমাকে বর্তমান ব্যবহার করে এটি চালাতে হয়েছিল main শাখা এমএলএক্স-এলএম গ্রন্থাগার (আমার কাছে ছিল তা নিশ্চিত করার জন্য) এই প্রতিশ্রুতিবদ্ধ যোগ করা glm4_moe সমর্থন)। আমি যে ব্যবহার করছি ইউভি এটি পছন্দ:

uv run \
  --with 'https://github.com/ml-explore/mlx-lm/archive/489e63376b963ac02b3b7223f778dbecc164716b.zip' \
  python

তারপরে সেই পাইথন দোভাষীতে আমি এমএলএক্স মডেলগুলি চালানোর জন্য স্ট্যান্ডার্ড রেসিপিটি ব্যবহার করেছি:

from mlx_lm import load, generate
model, tokenizer = load("mlx-community/GLM-4.5-Air-3bit")

এটি আমার 44 জিবি মডেল ওজন ডাউনলোড করেছে ~/.cache/huggingface/hub/models--mlx-community--GLM-4.5-Air-3bit ফোল্ডার

তারপরে:

prompt = "Write an HTML and JavaScript page implementing space invaders"
messages = ({"role": "user", "content": prompt})
prompt = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True
)
response = generate(
    model, tokenizer,
    prompt=prompt,
    verbose=True,
    max_tokens=8192
)

প্রতিক্রিয়া এইভাবে শুরু হয়েছিল:

<think>ব্যবহারকারী চান যে আমি এইচটিএমএল, সিএসএস এবং জাভাস্ক্রিপ্ট ব্যবহার করে একটি স্পেস আক্রমণকারী গেম তৈরি করব। নিম্নলিখিত বৈশিষ্ট্যগুলি সহ আমার একটি সম্পূর্ণ, কার্যকরী গেম তৈরি করতে হবে:
প্লেয়ার স্পেসশিপ যা বাম/ডানদিকে যেতে পারে এবং গুলি করতে পারে
শত্রু আক্রমণকারীরা যা গঠন এবং পিছনে গুলি চালায়
স্কোর ট্র্যাকিং
জীবন/স্বাস্থ্য ব্যবস্থা
শর্তের উপর খেলা (…)

এর পরে এইচটিএমএল এবং এই ডিবাগিং আউটপুট:

Prompt: 14 tokens, 14.095 tokens-per-sec
Generation: 4193 tokens, 25.564 tokens-per-sec
Peak memory: 47.687 GB

আপনি দেখতে পারেন এখানে সম্পূর্ণ প্রতিলিপিবা দেখুন গিটহাবের উত্সঅথবা এটি আপনার ব্রাউজারে চেষ্টা করে দেখুন।

ভাল পরিমাপের জন্য একটি পেলিকান

আমি গতকাল পুরো আকারের মডেলগুলির বিরুদ্ধে আমার পেলিকান বেঞ্চমার্কটি চালিয়েছি, তবে আমি এই ছোট 3 বিট মডেলের বিরুদ্ধে এটি চেষ্টা করে প্রতিরোধ করতে পারি না। আমি যা পেয়েছি তা এখানে "Generate an SVG of a pelican riding a bicycle"::

নীল ব্যাকগ্রাউন্ড, পেলিকান কোনও কমলা বাইকযুক্ত মেঘের মতো দেখাচ্ছে, সাইকেলটি সাইকেল হিসাবে স্বীকৃত যদি একেবারে সঠিক জ্যামিতি না হয়।

এখানে যে জন্য প্রতিলিপি।

উভয় ক্ষেত্রেই মডেলটি প্রায় 48 গিগাবাইট র‌্যামকে শীর্ষে ব্যবহার করেছিল, আমাকে অন্য সব কিছুর জন্য মাত্র 16 জিবি রেখে দিয়েছে – মডেলটি চালানোর জন্য আমাকে বেশ কয়েকটি অ্যাপ্লিকেশন ছাড়তে হয়েছিল তবে এটি চলার পরে গতিটি বেশ ভাল ছিল।

স্থানীয় কোডিং মডেলগুলি এখন সত্যিই ভাল

এটি আকর্ষণীয় যে 2025 সালে প্রকাশিত প্রায় প্রতিটি মডেল কীভাবে বিশেষভাবে কোডিংকে লক্ষ্য করে। এই ফোকাসটি স্পষ্টভাবে পরিশোধ করা হয়েছে: এই কোডিং মডেলগুলি পাচ্ছে সত্যিই ভাল এখন।

দু’বছর আগে যখন আমি প্রথম লামার চেষ্টা করেছি আমি কখনই চেষ্টা করি না স্বপ্ন দেখেছি আমি তখন একই ল্যাপটপটি ব্যবহার করছিলাম যে একদিন আমি জিএলএম 4.5 এয়ার – এবং মিস্ট্রাল 3.2 ছোট, এবং জেমমা 3, এবং কুইন 3, এবং গত ছয় মাস ধরে উদ্ভূত অন্যান্য উচ্চমানের মডেলগুলির একটি হোস্টের কাছ থেকে যা দেখছি তার মতো শক্তিশালী মডেলগুলি চালাতে সক্ষম হবে।

Source link