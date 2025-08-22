শতাব্দীর শুরুতে আমরা উচ্চ ক্ষমতা সম্পন্ন ওয়েব সার্ভারগুলির জন্য আরও বড় প্রয়োজন পেতে শুরু করি। উদাহরণস্বরূপ সেখানে ছিল সি 10 কে সমস্যা কাগজ।
সেই সময়ে, অনুরোধ অনুযায়ী করা কাজ হ্রাস করার জন্য যে ধরণের জিনিসগুলি করা হয়েছিল তা হ’ল ওয়েব সার্ভারকে প্রাক-বিরক্ত করা। এর অর্থ একটি ব্যয়বহুল প্রক্রিয়া তৈরি ছাড়াই একটি অনুরোধ পরিচালনা করা যেতে পারে।
কারণ হ্যাঁ, প্রতিটি অনুরোধের জন্য একটি নতুন প্রক্রিয়া তৈরি করা পুরোপুরি স্বাভাবিক কিছু হিসাবে ব্যবহৃত হত।
বিষয়গুলি আরও ভাল হয়েছে। লোকেরা কীভাবে থ্রেড তৈরি করতে শিখেছে, জিনিসগুলি আরও হালকা ওজন করে তোলে। তারপরে তারা ব্যবহার করতে স্যুইচ করলেন
poll()/
select()কেবল প্রক্রিয়া/থ্রেড তৈরিটি ছাড়ার জন্য নয়, পুরো প্রসঙ্গটি স্যুইচ করে।
আমি একটি মন্তব্য মনে আছে ক্রস আনাকাতার কাছ থেকে, জলদস্যু বে এবং ওয়েব সার্ভার উভয়ের স্রষ্টা যা এটি চালিত করেছিল, “আমি বর্গের নির্বাচিত (), প্রতিরোধের নিরর্থক” এর লাইনের সাথে, কোনও স্কেলেবল ওয়েব সার্ভার কীভাবে লিখতে হয় তা বোঝার জন্য কাউকে উপহাস করে।
কিন্তু
select()/
poll() এছাড়াও স্কেল না। আপনার যদি দশ হাজার সংযোগ থাকে তবে এটি দশ হাজার পূর্ণসংখ্যার একটি অ্যারে যা আপনার অনুরোধের লুপটি পরিচালনা করার প্রতিটি একক পুনরাবৃত্তির জন্য কার্নেলে প্রেরণ করা দরকার।
প্রবেশ করুন
epoll (
kqueue অন্যান্য অপারেটিং সিস্টেমে, তবে আমি এখানে লিনাক্সে ফোকাস করছি)। এখন এটা ভাল। মূল লুপটি এখন:
set_up_epoll()
while True:
new, read, write = epoll()
epoll_add_connections(new)
for con in read:
process(con.read())
if con.read_all_we_need:
epoll_remove_read_op(con)
for con in write:
con.write_buffer()
if con.buffer_empty:
epoll_remove_write_op(con)
সমস্ত সিস্কলগুলি বেশ সস্তা।
epoll() কেবল ডেল্টাসে ডিল করে এবং এটি হাজার হাজার সক্রিয় সংযোগগুলি পুনরায় চালু করতে হবে না।
তবে তারা ব্যয় ছাড়াই নয়। একবার আমরা এ পর্যন্ত অর্জন করার পরে, একটি সিস্কলের ব্যয় আসলে মোট অবশিষ্ট ব্যয়ের একটি উল্লেখযোগ্য অংশ।
আমরা এখানে এখানে যেমন উন্নতি উপেক্ষা করব
sendfile() এবং
splice()এবং পরিবর্তে লাফিয়ে…
io_urn
আমরা যা করতে চাই তার জন্য একটি সিস্কল সম্পাদন করার পরিবর্তে কার্নেলকে এটি বা এটি করার আদেশ দিয়েছিলেন, আইও_উরিং আমাদের কেবল একটি কাতারে অর্ডার লেখার জন্য এবং কার্নেলকে সেই সারিটি অসাধারণভাবে গ্রাস করতে দেয়।
উদাহরণস্বরূপ, আমরা রাখতে পারি
accept() সারি মধ্যে। কার্নেলটি এটি বেছে নেবে, আগত সংযোগের জন্য অপেক্ষা করবে এবং এটি উপস্থিত হলে এটি সমাপ্তির কাতারে একটি “সমাপ্তি” রাখবে।
ওয়েব সার্ভারটি তারপরে সমাপ্তির সারিটি পরীক্ষা করতে পারে। যদি সেখানে কোনও সমাপ্তি থাকে তবে এটি এটিতে কাজ করতে পারে।
এইভাবে ওয়েব সার্ভারটি সমস্ত ধরণের অপারেশনগুলি সারি করতে পারে যা পূর্বে “ব্যয়বহুল” সিস্কলগুলি কেবল স্মৃতিতে লিখে লিখে। এটাই। এবং তারপরে এটি মেমরির অন্য অংশ থেকে ফলাফলগুলি পড়বে। এটাই।
ব্যস্ত লুপিং এড়াতে, কার্নেল এবং ওয়েব সার্ভার উভয়ই কেবল কিছুটা জন্য সারিটি পরীক্ষা করে ব্যস্ত-লুপ করবে (কনফিগারযোগ্য, তবে মিলিসেকেন্ডগুলি ভাবেন), এবং যদি নতুন কিছু না থাকে তবে ওয়েব সার্ভারটি “ঘুমাতে যেতে” কোনও সিস্কল করবে যতক্ষণ না কাতারে কিছু যোগ হয়।
একইভাবে কার্নেলের দিকে, কার্নেলটি নতুন কিছু না থাকলে ব্যস্ত-লুপিং বন্ধ করে দেবে এবং আবার বুসিলুপিং শুরু করার জন্য একটি সিস্কলের প্রয়োজন হবে।
এটি মনে হচ্ছে এটি অপ্টিমাইজ করা মুশকিল হবে তবে তা নয়। শেষ পর্যন্ত ওয়েব সার্ভারটি কেবল কাতারে স্টাফ রাখে এবং একটি লাইব্রেরি ফাংশন কল করে যা কেবল সেই সিস্কল করে যদি কার্নেলটি আসলে বুসিলুপিং বন্ধ করে দেয়।
এর অর্থ হ’ল একটি ব্যস্ত ওয়েব সার্ভার তার সমস্ত প্রশ্নগুলি একবার ছাড়াই (সেটআপ শেষ হওয়ার পরে) সিস্কল করার প্রয়োজন হয় না। যতক্ষণ সারিগুলি যুক্ত হতে থাকে,
strace প্রদর্শন করবে কিছুই না।
প্রতি কোর একটি থ্রেড
যেহেতু সিপিইউগুলির আজ অনেকগুলি কোর রয়েছে, আদর্শভাবে আপনি প্রতি কোরকে ঠিক একটি থ্রেড চালাতে চান, এটি সেই কোরের সাথে আবদ্ধ করুন এবং কোনও পঠন-লেখার ডেটা কাঠামো ভাগ করবেন না।
জন্য নুমা হার্ডওয়্যার, আপনি এটিও নিশ্চিত করতে চান যে কোনও থ্রেড কেবল স্থানীয় নুমা নোডে মেমরি অ্যাক্সেস করে। এই নেটফ্লিক্স টক নুমা এবং উচ্চ ভলিউম এইচটিটিপি বিতরণে কিছু আকর্ষণীয় জিনিস রয়েছে।
অনুরোধের লোডটি এখনও থ্রেডগুলির (এবং সেইজন্য কোর) এর মধ্যে পুরোপুরি ভারসাম্যপূর্ণ হবে না, তবে আমি অনুমান করি যে এটি ভবিষ্যতের পোস্টের বিষয় হতে হবে।
স্মৃতি বরাদ্দ
কার্নেল এবং ওয়েব সার্ভার উভয় দিকেই আমাদের এখনও মেমরি বরাদ্দ থাকবে। ব্যবহারকারীর জায়গাতে মেমরি বরাদ্দের জন্য শেষ পর্যন্ত সিস্কলগুলির প্রয়োজন হবে।
ওয়েব সার্ভার পক্ষের জন্য, আপনি প্রতিটি সংযোগের জন্য একটি নির্দিষ্ট অংশকে প্রাক-বরাদ্দ করতে পারেন এবং তারপরে সেই সংযোগটি সম্পর্কে সমস্ত কিছু সেখানে লাইভ রাখতে পারেন। এইভাবে নতুন সংযোগগুলির জন্য সিস্কলগুলির প্রয়োজন হয় না, মেমরি খণ্ডিত হয় না এবং আপনি মেমরির বাইরে চলে যাওয়ার ঝুঁকিটি চালান না।
কার্নেলের পাশে প্রতিটি সংযোগের জন্য এখনও আগত এবং বহির্গামী বাইটগুলির জন্য বাফার প্রয়োজন। এটি সকেট বিকল্পগুলির মাধ্যমে কিছুটা নিয়ন্ত্রণযোগ্য হতে পারে তবে এটি আবার ভবিষ্যতের পোস্টের বিষয় হতে হবে।
র্যামের বাইরে না যাওয়ার চেষ্টা করুন। খারাপ জিনিস ঘটতে থাকে।
কেটিএলএস
কেটিএলএস লিনাক্স কার্নেলের একটি বৈশিষ্ট্য যেখানে কোনও অ্যাপ্লিকেশন এনক্রিপশন/ডিক্রিপশনটির কাজটি কার্নেলের কাছে হস্তান্তর করতে পারে। অ্যাপ্লিকেশনটি এখনও টিএলএস হ্যান্ডশেক সম্পাদন করতে হবে, তবে এর পরে এটি কেটিএলএস সক্ষম করতে পারে এবং ভান করতে পারে যে এটি সমস্তই প্লেইনটেক্সটে প্রেরণ করা হয়েছে।
আপনি বলতে পারেন যে এটি আসলে কোনও গতি বাড়ায় না, এটি কেবল সরে যায় কোথায়
এনক্রিপশন করা হয়েছিল। তবে লাভ আছে:
- এর অর্থ যে
sendfile()ব্যবহার করা যেতে পারে, ব্যবহারকারীর স্থান এবং কার্নেল স্পেসের মধ্যে একগুচ্ছ ডেটা অনুলিপি করার প্রয়োজনীয়তা অপসারণ করে।
- যদি নেটওয়ার্ক কার্ডের জন্য এটির জন্য হার্ডওয়্যার সমর্থন থাকে তবে ক্রিপ্টো অপারেশনটি আসলে সিপিইউ থেকে নেটওয়ার্ক কার্ডে অফলোড করা যেতে পারে, সিপিইউকে আরও ভাল কিছু করতে রেখে।
বর্ণনাবিহীন ফাইল
আরেকটি অপ্টিমাইজেশন হ’ল ব্যবহারকারীর স্থান এবং কার্নেল স্পেসের মধ্যে পিছনে পিছনে ফাইল বর্ণনাকারীদের পাস করা এড়ানো। ফাইল বর্ণনাকারী এবং আইও_উরিংয়ের মধ্যে ম্যাপিংয়ের স্পষ্টতই ওভারহেড রয়েছে।
তাই আসে বর্ণনাবিহীন ফাইল মাধ্যমে
register_files।
এখন ব্যবহারকারী স্পেস যে অনুমিত ফাইল বর্ণনাকারী সংখ্যাগুলি দেখেন সেগুলি কেবল পূর্ণসংখ্যা। তারা প্রদর্শিত হয় না
/proc/pid/fdএবং কেবল আইও_উরিংয়ের সাথে ব্যবহার করা যেতে পারে। তারা এখনও দ্বারা আবৃত
ulimit যদিও ফাইল বর্ণনাকারী সীমা।
গম
এই প্রযুক্তিগুলি আরও ভালভাবে শিখতে আমি তৈরি করেছি এই সমস্ত জিনিসকে অন্তর্ভুক্ত করে একটি ওয়েব সার্ভার।
এটির নামকরণ করা হয়েছে
tarweb কারণ এটি একটি ওয়েব সার্ভার যা একটি একক টার ফাইলের সামগ্রী সরবরাহ করে।
মরিচা, আইও_উরিং, এবং কেটিএলএস। ঠিক সবচেয়ে সাধারণ সংমিশ্রণ নয়। আমি দেখতে পেয়েছি যে আইও_উরিং এবং কেটিএলগুলি একসাথে সুপার খেলেনি। কেটিএলএস সক্ষম করার জন্য তিনটি প্রয়োজন
setsockopt() কল, এবং আইও_উরিং সমর্থন করে না
setsockopt (যতক্ষণ না তারা মার্জ হয় আমার পিআরযে)।
এবং
ktls ক্রেট, অংশ
rustlsকেবল আপনাকে সিঙ্ক্রোনাস কল করতে দেয়
setsockopt()আমার নতুন আইও_উরিংয়ে যাওয়ার জন্য প্রয়োজনীয় স্ট্রাক্টটি রফতানি করবেন না
setsockopt। আরেকটি জন পাঠানো।
সুতরাং এই দুটি পিআর একীভূত হওয়ার সাথে সাথে এটি দুর্দান্ত কাজ করছে।
তারওয়েব নিখুঁত থেকে অনেক দূরে। কোডটির প্রচুর কাজ প্রয়োজন, এবং টিএলএস লাইব্রেরি (রাস্টলস) হ্যান্ডশেকগুলির সময় মেমরি বরাদ্দ করে না এমন কোনও গ্যারান্টি নেই। তবে এটি প্রতি অনুরোধের ভিত্তিতে একটি সিস্কল ছাড়াই এইচটিটিপিএস পরিবেশন করে। এবং এটি বেশ দুর্দান্ত।
বেঞ্চমার্কস
আমি এখনও কোনও মানদণ্ড করিনি। আমি প্রথমে কোডটি পরিষ্কার করতে চাই।
আইও-আইরিং এবং সুরক্ষা
সিঙ্ক্রোনাস সিস্কলগুলির চেয়ে আইও_উরিং আরও জটিল করে তোলা একটি জিনিস হ’ল যে কোনও বাফারকে মেমরিতে থাকতে হবে যতক্ষণ না অপারেশনটি সমাপ্তির সারিটি দেখিয়ে সম্পন্ন না করা হয়।
উদাহরণস্বরূপ জমা দেওয়ার সময় a
write অপারেশন, সেই বাইটগুলির মেমরির অবস্থানটি অবশ্যই ডিলোকেটেড বা ওভাররাইট করা উচিত নয়।
দ্য
io-uring ক্রেট এটিতে খুব বেশি সাহায্য করে না। এপিআই orrow ণ পরীক্ষককে সংকলনের সময় আপনাকে রক্ষা করতে দেয় না এবং আমি এটি কোনও রানটাইম চেক করতে দেখি না।
আমার মনে হচ্ছে আমি সি ++ এ ফিরে এসেছি, যেখানে কোনও ভুল আপনার পুরো পাটি উড়িয়ে দিতে পারে। এটি একটি অলৌকিক ঘটনা যা আমি কোনও সেগফল্ট দেখিনি।
কারও তৈরি করা উচিত
safer-ring ক্রেট বা অনুরূপ, শক্তি ব্যবহার করে
পিনিং এবং/অথবা orrow ণ নেওয়া বা কিছু, মরিচাটির স্বাভাবিক অর্জন করতে “যদি এটি সংকলন করে তবে এটি সঠিক”।