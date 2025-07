আমি কিছুক্ষণের জন্য স্পিগট সম্পর্কে জঘন্য কাজ করছি। এটি ছোট ওয়েব অ্যাপ্লিকেশন যা ফ্লাইতে ওয়েব পৃষ্ঠাগুলির একটি নকল শ্রেণিবিন্যাস তৈরি করে, আক্রমণাত্মক ওয়েব ক্রোলারদের ইনজেস্টের জন্য গিব্বারিশ সামগ্রী তৈরি করতে একটি মার্কভ চেইন ব্যবহার করে।

স্পিগট সেখানে বসে আছেন, তার কাজটি করছেন, এখন কয়েক মাস ধরে, প্রতিদিন এক মিলিয়ন পৃষ্ঠাগুলি পরিবেশন করছেন। আমি আসলে এটি কী তা নিয়ে নজর রাখছি না, তবে প্রতিবার এবং তারপরে আমি এর লগগুলি দেখি যে ক্রলাররা কী আঘাত করছে তা দেখার জন্য।

দুঃখের বিষয়, দু’জন কঠোর-হিট ক্রলারের তাদের পরিচয় আড়াল করতে, এলোমেলোভাবে উত্পন্ন করা, এবং অসম্ভব, ব্রাউজারের স্বাক্ষর (যেমন ফায়ারফক্স সংস্করণ 134.0, 64 বিট, উইন্ডোজ 98 এ) এবং এলোমেলো ঠিকানাগুলি থেকে অ্যাক্সেস করার জন্য চরম দৈর্ঘ্যে যায়। এটি সম্ভবত বোটনেটের মাধ্যমে করা হচ্ছে বলে মনে হচ্ছে – অবৈধভাবে হাজার হাজার লোকের ডিভাইসকে গালি দেওয়া। দীর্ঘশ্বাস

যেখানে আমি একটি ভারী হিটার সনাক্ত করতে পারি, আমি এটি স্পিগোটের প্রথম পৃষ্ঠায় তালিকায় যুক্ত করি যাতে আমি সময়ের সাথে সাথে ক্রলারের আচরণটি ট্র্যাক করতে পারি।

যাইহোক … কয়েক সপ্তাহ আগে, আমি একটি নতুন ভারী হিটার, “ইমেজফিটবট” লক্ষ্য করেছি। স্পিগোটের আউটপুটটির কোনওটিতেই চিত্র নেই, তবে ইমেজফিফটবোট ব্যস্ততার সাথে প্রতি ঘন্টা হাজার হাজার অনুরোধের সাথে এটি আঘাত করছিল, মরিয়া হয়ে ইনজেস্টের জন্য চিত্রগুলি খুঁজছিল। আমি এর কৃতজ্ঞতার জন্য দুঃখিত এবং আমি কীভাবে এটি খুশি করতে পারি সে সম্পর্কে ভাবতে শুরু করি।

স্পিগোটের জন্য আমার প্রাথমিক লক্ষ্যটি হ’ল এটি আমার সার্ভারে অতিরিক্ত সিপিইউ না খেয়ে সেখানে বসে থাকা উচিত। সিপিইউ লোডের ক্ষেত্রে ফ্লাইতে চিত্র তৈরি করা তুচ্ছ নয়। যদি আমি একগুচ্ছ পিক্সেল তৈরি করতে চাই, এমন একটি ফর্ম যা একজন ক্রলার বিশ্বাস করবে, আমাকে সংকুচিত ডেটা সরবরাহ করতে হবে। এবং ফ্লাইতে সংকুচিত হওয়া সিপিইউ নিবিড়। এটি স্পিগোটের জন্য দুর্দান্ত হবে না, এবং যখন আমরা কোনও ক্ষেত্রে কেবল থ্রো-অ্যাভের আবর্জনা তৈরি করি তখন এটি একটি সম্পূর্ণ বর্জ্য।

আমি ভাবতে পেরেছি: সংক্ষেপণ কিছুটা স্ট্রিমের এনট্রপি বাড়িয়ে তোলে। যদি কোনও ফাইল এলোমেলো সামগ্রী না দেখায় তবে এটি সংকোচনের এবং একটি সর্বোত্তমভাবে সংকুচিত ডেটা সেট এলোমেলো ডেটা থেকে কমবেশি পৃথক পৃথক হবে। জেপিইজিগুলি বেশ ভালভাবে সংকুচিত। সুতরাং একটি জেপিজি -তে সংকুচিত ডেটা এলোমেলো দেখাবে, তাই না?

যদি আমার কাছে কোনও জেপিইজি ফাইলের জন্য একটি টেম্পলেট থাকে, যার মধ্যে “কাঠামোগত” অংশগুলি রয়েছে (আকার, রঙের গভীরতা ইত্যাদি তথ্য) এবং ট্যাগগুলি নির্দেশ করে যেখানে অত্যন্ত সংকুচিত ডেটা যায় সেখানে আমি এলোমেলো ডেটা সহ “সংকুচিত” অঞ্চলগুলি পূরণ করে একটি জেপিগের মতো দেখতে এমন কিছু তৈরি করতে পারি। এটি একটি খুব কম-সিপিইউ অপারেশন। প্রাপক এমন কিছু দেখতে পাবেন যা কোনও জেপিজির মতো দেখায় এবং এলোমেলো ডেটাটিকে ডিকম্প্রেস করার মতো কিছু হিসাবে বিবেচনা করে।

আমি জেপিইজি ফাইলগুলির কাঠামোতে কিছুটা পড়েছি এবং আবিষ্কার করেছি যে তারা বেশ জটিল হতে পারে। তবে এটি খুব বেশি কিছু যায় আসে না। একটি জেপিইজি ফাইল খণ্ডগুলি নিয়ে গঠিত। প্রতিটি অংশে একটি চিহ্নিতকারী এবং একটি দৈর্ঘ্য থাকে (কখনও কখনও স্পষ্টভাবে শূন্য, কখনও কখনও কেবল কেবল কেবল খাঁটি বিষয়বস্তু পড়ে, পরবর্তী চিহ্নিতকারীটির সন্ধান করে)। সুতরাং, একটি জেপিইজি পার্সিং তুলনামূলকভাবে সহজ। এবং আমি জেপিজের প্রচুর পরিমাণে পেয়েছি। সুতরাং: আমি যদি “মন্তব্য” খণ্ডগুলি বাতিল করে, “পিক্সেল ডেটা” খণ্ডগুলির দৈর্ঘ্য লক্ষ্য করে এবং বাকী অংশটি রাখি তবে আমি যদি বিদ্যমান ফাইলগুলির একটি গুচ্ছ স্ক্যান করি তবে কী হবে? ফলাফল কত বড় হবে?

আমি বর্তমানে আমার ওয়েব সাইটে 514 জেপিজি পেয়েছি, মোট প্রায় 150mbytes ডেটা। যদি আমি কেবল “কাঠামোগত” খণ্ডগুলি রেখে এবং “পিক্সেল” অংশের দৈর্ঘ্য লক্ষ্য করে তাদের সমস্তগুলি স্ক্যান করি তবে ফলস্বরূপ ডেটা সেটটি 500 কেবিটের নীচে রয়েছে – সমুদ্রের একটি ড্রপ। এটি আমাকে 514 বাস্তববাদী টেম্পলেট, বিভিন্ন আকারের, রঙের গভীরতা ইত্যাদি দেয়

একটি জেপিগ তৈরি করা নেমে আসবে: