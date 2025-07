সি#তে কোকিল ফিল্টার বাস্তবায়নে কাজ করার সময়, আমি অন্তর্নিহিত হ্যাশ টেবিলের জন্য একটি অ্যারে-জাতীয় কাঠামো তৈরি করেছি। আমি একটি 8-বিট ফিঙ্গারপ্রিন্টটি বেছে নিয়েছি: এটি একটি বাইট সীমানায় সুন্দরভাবে সারিবদ্ধ করে এবং এখনও মিথ্যা-পজিটিভ হারকে চারপাশে রাখে 3 %।

লেআউটটি সোজা তাকিয়ে ছিল – কেবল একটি বাইট অ্যারে যেখানে প্রতিটি বালতি শুরু হিসাবে গণনা করা হয় bucketIdx * bucketSize । প্রতিটি বালতির আকার 4 স্লট, যা কোকিল ফিল্টারটির জন্য একটি শক্ত পছন্দ।

তবে একটি বালতিতে এই চারটি বাইট আমাকে কিছু মনে করিয়ে দেয়। তারা অনুভূতি পছন্দ… একটি পূর্ণসংখ্যা!

আমি অতি-স্বল্প বিলম্বের তাড়া করছিলাম না-সর্বোপরি, এটি সি#ut তবে আমি পরীক্ষার প্রতিরোধ করতে পারিনি। আমি কি 4-বাইট বালতিটি একটি সরল পুরানো 32-বিট পূর্ণসংখ্যার সাথে প্রতিস্থাপন করে আমার কোকিল ফিল্টারে লুকআপগুলি গতি বাড়িয়ে তুলতে পারি?

সময় খুঁজে। 💪

একটি নমনীয় এবং সহজ বাস্তবায়ন

এখানে আমি শুরু করা নির্বোধ স্টোরেজ। বাকী কোডটি পরিষ্কার রাখতে, সমস্ত টেবিল লজিক তার নিজস্ব শ্রেণিতে বাস করে, যার হৃদয় একটি প্রাক-বরাদ্দযুক্ত বাইট অ্যারে:

private readonly byte () _table ;

প্রতিটি বালতিতে 4 টি স্লট থাকে, তাই দ্বিতীয় মাত্রার প্রয়োজন ছিল না; এর বালতিতে একটি কী ম্যাপিং সুস্পষ্ট:

var offset = bucketIdx * 4 ;

কোনও নির্দিষ্ট ফিঙ্গারপ্রিন্ট (একটি একক বাইট) বালতিতে বসে আছে কিনা তা যাচাই করা ঠিক ততটাই স্পষ্ট:

public bool Contains ( byte fingerprint , uint bucketIdx ) { var s = bucketIdx * 4 ; for ( var i = s ; i < s + BucketSize ; i ++ ) { if ( _table ( i ) == fingerprint ) return true ; } return false ; }

(দয়া করে অনুপস্থিত সীমানা চেকগুলি উপেক্ষা করুন – তারা আজ বিন্দু নয়))

আমি কোনও বিট-টুইডলিং উইজার্ড-আমি একটি আরামদায়ক, জিসি-সংঘবদ্ধ বিশ্বে থাকি-তবে এই 4 টি বাইট চুলকানি রেখেছিল। একটি বালতি লাইন আপ পুরোপুরি একটি 32-বিট সহ uint ; এটি ভবিষ্যতের লক-মুক্ত দরজা খুলে দেয় তুলনা এবং অদলবদল। তাই আমি খেলার সিদ্ধান্ত নিয়েছি।

স্থানান্তরিত ক uint টেবিল

ব্যাকিং অ্যারে স্যুইচ করা তুচ্ছ কারণ হ্যাশ টেবিলটি এখনও এক-মাত্রিক:

- private readonly byte() _table; + private readonly uint() _table;

এখন আসুন সন্ধানটি রিফ্যাক্টর করা যাক:

public bool Contains(byte fingerprint, uint bucketIdx) { - var s = bucketIdx * 4; + var bucket = _table(bucketIdx); - for (var i = s; i < s + BucketSize; i++) + for (var i = 0; i < BucketSize; i++) { - if (_table(i) == fingerprint) return true; + var shift = i * 8; + var fp = (byte)(bucket >> shift); + if (fp == fingerprint) return true; } return false; }

বালতি অফসেট অদৃশ্য হয়ে যায় কারণ প্রতিটি uint একটি বালতি। তবে আমি সরাসরি সূচকগুলির বিলাসিতা হারিয়েছি – যদি না আমি পূর্ণসংখ্যাটিকে প্রথমে বাইটে রূপান্তর করি:

Span < byte > bucketBytes = stackalloc byte ( sizeof ( uint )); BitConverter . TryWriteBytes ( bucketBytes , _table ( bucketIdx )); for ( var i = 0 ; i < BucketSize ; i ++ ) { var fp = bucketBytes ( i ); if ( fp == fingerprint ) return true ; }

আমি উভয়ের উপর একটি দ্রুত বেঞ্চমার্ক চালিয়েছি uint ভিত্তিক লুকআপ, এবং ফলাফলগুলি প্রকাশিত হয়েছিল। শিফটিং সংস্করণটি সম্পর্কে একটি দুর্দান্ত গতি বাড়িয়েছে 35% মূল বাইট-অ্যারে লুপের চেয়ে দ্রুত। আমি আনরোলড লুপটিও পরীক্ষা করেছি, তবে এটি কোনও উল্লেখযোগ্য উন্নতি দেখায় নি কারণ সংকলকটি ইতিমধ্যে এটি অনার্য করেছে।

দ্য BitConverter পদ্ধতির অবশ্য এক ধাপ পিছনে ছিল। এটি মূলের চেয়েও ধীর ছিল, সম্ভবত অতিরিক্ত কারণে Span ওভারহেড আমি নেতিবাচক লাভের জন্য জটিলতা প্রবর্তন করতে চলেছি না, তাই BitConverter সংস্করণ একটি অ স্টার্টার ছিল।

এমনকি শিফটিং সংস্করণটি বেশ পারফরম্যান্স, আমরা কি আরও ভাল করতে পারি? সম্ভবত কেবল লুপটি পুরোপুরি মুছে ফেলবেন?

মাস্কিং সহ একটি বাইট সন্ধান করা

অনেক আগে আমি শন অ্যান্ডারসনের দুর্দান্ত বুকমার্ক করেছি বিট টুইডলিং হ্যাকস। একটি রত্ন সেখানেকোনও শব্দের শূন্য বাইট আছে কিনা তা নির্ধারণ করুন– ঠিক আমার যা প্রয়োজন। সি# সংস্করণটি প্রায় অভিন্ন:

private static bool HasZero ( uint v ) { return (( v - 0x01010101U ) & ~ v & 0x80808080U ) != 0 ; }

স্বীকার করা অস্বচ্ছ, সুতরাং আসুন এটি আনপ্যাক করা যাক।

কৌশলটির মূলটি হয় (v - 0x01010101U) & ~v । এই অভিব্যক্তি একটি বিশেষ সম্পত্তি আছে:

যে কোনও শূন্য বাইট বি এর জন্য সবচেয়ে উল্লেখযোগ্য বিট (b - 1) & ~b সবসময় হবে 0 ।

সবচেয়ে উল্লেখযোগ্য বিট সবসময় হবে । শূন্য-বাইট বি = 0x00 এর জন্যঅভিব্যক্তি হয়ে যায় (0x00 - 1) & ~0x00 যা 0xFF & 0xFF = 0xFF । সবচেয়ে উল্লেখযোগ্য বিট হয় 1 ।

সুতরাং, এই অপারেশনটি একটি “চিহ্নিতকারী” বিট তৈরি করে (এটি সবচেয়ে উল্লেখযোগ্য বিট সেট করে 1 ) মূলত যে কোনও বাইট পজিশনে 0x00 ।

আসুন এটি আমাদের প্রয়োগ করা যাক v উদাহরণস্বরূপ, 0x4462002E ::

প্রথমত, আমরা বিয়োগ করি 0x01010101U ।

01000100 01100010 00000000 00101110 ( 0x4462002e ) – 00000001 00000001 00000001 00000001 ( 0x01010101 ) 01000011 01100000 11111111 00101101 ( 0x4360ff2d ) \ শুরু {অ্যারে} {r} \ পাঠ্য {01000100 \; 01100010 \; 00000000 \; \ পাঠ্য {00000001 \; 00000001 \; 00000001 \; \ পাঠ্য {01000011 \; 01100000 \; 11111111 \; 00101101} \; (\ টেক্সটটিটি {0x4360ff2d}) \ শেষ {অ্যারে} 01000100 01100010 00000000 00101110 ( 0x4462002e ) – 00000001 00000001 00000001 00000001 ( 0x01010101 ) 01000011 01100000 11111111 00101101 ( 0x4360ff2d ) ​ ​

নোট করুন যে এটি একটি একক 32-বিট বিয়োগ, যাতে orrow ণ নেওয়া বাইট সীমানা অতিক্রম করতে পারে। দ্য 0x00 বাইট থেকে orrows ণ 0x62 ফলাফল 0x...60FF... ।

দ্বিতীয়ত, আমরা মূল মানটি না করে কিছুটা প্রয়োগ করি:

¬ 01000100 01100010 00000000 00101110 ( 0x4462002e ) 10111011 10011101 11111111 11010001 ( 0xbb9dffd1 ) \ শুরু {অ্যারে} {r} \ নেগ \; \ টেক্সটটিটি {01000100 \; 01100010 \; 00000000 \; \ পাঠ্য {10111011 \; 10011101 \; 11111111 \; 11010001} \; (\ পাঠ্যটি {0xbb9dffd1}) \ শেষ {অ্যারে} ¬ 01000100 01100010 00000000 00101110 ( 0x4462002e ) 10111011 10011101 11111111 11010001 ( 0xbb9dffd1 ) ​ ​

এখন, & তাদের একসাথে:

01000011 01100000 11111111 00101101 ( 0x4360ff2d ) & 10111011 10011101 11111111 11010001 ( 0xbb9dffd1 ) 00000011 00000000 11111111 00000001 ( 0x0300FF01 ) \ শুরু {অ্যারে} {r} \ পাঠ্য {01000011 \; 01100000 \; 11111111 \; \ পাঠ্য {10111011 \; 10011101 \; 11111111 \; 11010001} \; (\ পাঠ্যটি {0xbb9dffd1}) \\ \ hline \ টেক্সটটিটি {00000011 \; 00000000 \; 11111111 \; 01000011 01100000 11111111 00101101 ( 0x4360ff2d ) & 10111011 10011101 11111111 11010001 ( 0xbb9dffd1 ) 00000011 00000000 11111111 00000001 ( 0x0300FF01 ) ​ ​

লক্ষ্য করুন যে বাম দিক থেকে তৃতীয় বাইট 0xFF । এটির সবচেয়ে উল্লেখযোগ্য বিট 1 ইঙ্গিত করে যে এটি ছিল আমাদের শূন্য-বাইট অবস্থান।

ফাইনাল & 0x80808080U এমন একটি মুখোশ যা অন্যান্য সমস্ত বিটগুলি সরিয়ে দেয়, প্রতিটি বাইটের সর্বাধিক উল্লেখযোগ্য বিট রেখে।

00000011 00000000 11111111 00000001 ( 0x0300FF01 ) & 10000000 10000000 10000000 10000000 ( 0x80808080 ) 00000000 00000000 10000000 00000000 ( 0x00008000 ) \ শুরু {অ্যারে} {r} \ পাঠ্য {00000011 \; 00000000 \; 11111111 \; \ পাঠ্য {10000000 \; 10000000 \; 10000000 \; 10000000} \; (\ টেক্সটটিটিটি {0x80808080}) \ \ \ এইচলাইন \ টেক্সটটিটি {000000 \; \ শেষ {অ্যারে} 00000011 00000000 11111111 00000001 ( 0x0300FF01 ) & 10000000 10000000 10000000 10000000 ( 0x80808080 ) 00000000 00000000 10000000 00000000 ( 0x00008000 ) ​ ​

পদ্ধতিটি ফলাফল দেয় 0x00008000 != 0 । যেহেতু 0x8000 শূন্য নয়, অভিব্যক্তি হয় true এবং পদ্ধতিটি সঠিকভাবে জানিয়েছে যে শূন্য বাইটটি পাওয়া গেছে।

দুর্দান্ত, এখন আমি শাখা ছাড়াই একটি শূন্য বাইট সনাক্ত করতে পারি। যা কিছু রয়েছে তা হয় বাইটটি ঘুরিয়ে আমি শূন্যে অনুসন্ধান করছি।

উদ্ধার করতে xor

আসুন ধরে নেওয়া যাক আমাদের পূর্ণসংখ্যা, ওরফে বালতি, 0x12345678 এবং আমি বাইট খুঁজছি 0x56 । শিফট ছাড়াই এটি শক্ত বলে মনে হচ্ছে। ভাগ্যক্রমে, আমাদের যা করতে হবে তা হ’ল রূপান্তর 0x56 বাইট থেকে 0x00 ।

অন্যান্য বাইটসের সাথে যা ঘটে তা অপ্রাসঙ্গিক, কারণ আমাদের HasZero ট্রিক কেবল যত্ন করে যদি যে কোনও বাইট শূন্য।

Xor ( ^ ) অপারেটরের একটি দরকারী সম্পত্তি রয়েছে: A ^ B = 0 যদি এবং শুধুমাত্র যদি A == B । সুতরাং, যদি আমরা আমাদের টার্গেট বাইটের পুনরাবৃত্তি মুখোশ সহ পুরো বালতিটি এক্সওর করি তবে কেবল ম্যাচিং বাইটটি শূন্য হয়ে যাবে।

00010010 00110100 01010110 01111000 ( 0x12345678 ) ⊕ 01010110 01010110 01010110 01010110 ( 0x56565656 ) 01000100 01100010 00000000 00101110 ( 0x4462002e ) \ শুরু {অ্যারে} {r} \ পাঠ্য {00010010 \; 00110100 \; 01010110 \; 01111000} \; (\ টেক্সটটিটি {0x12345678}) \ (-2pt) \ oplus \; \ পাঠ্য {01010110 \; 01010110 \; 01010110 \; 01010110} \; (\ টেক্সটটিটি {0x56565656}) \ \ \ এইচলাইন \ টেক্সটটিটি {01000100 \; 01100010 \; 00000000 \; 00010010 00110100 01010110 01111000 ( 0x12345678 ) ⊕ 01010110 01010110 01010110 01010110 ( 0x56565656 ) 01000100 01100010 00000000 00101110 ( 0x4462002e ) ​ ​

সুতরাং এই ধাঁধার অবশিষ্ট অংশটি হ’ল একটি পুনরাবৃত্তিমূলক মুখোশ তৈরি করা, যা বেশ গাণিতিক: আমার দ্বারা লক্ষ্য বাইটকে গুণিত করা উচিত 0x01010101U ::

মুখোশ = 0x56 × 0x01010101 = 0x56565656 \ পাঠ্য {মাস্ক} \; = \; \ পাঠ্য {0x56} \ বার \ পাঠ্য {0x01010101} \; = \; \ পাঠ্য {0x56565656} মুখোশ = 0x56 × 0x01010101 = 0x56565656

বিদ্যমান শূন্য সম্পর্কে কি?

একজন সতর্ক পাঠক জিজ্ঞাসা করতে পারেন: বালতি হলে কী হয় ইতিমধ্যে এটিতে একটি শূন্য বাইট আছে? যে যুক্তি জগাখিচুড়ি করে?

আমাদের বালতিটি বলি 0xAA00CCDD এবং আমরা যেমন একটি শূন্য ফিঙ্গারপ্রিন্ট অনুসন্ধান করছি 0xBB । এক্সওআর অপারেশনটি মূল শূন্যকে একটি শূন্য-জিরো মানতে রূপান্তরিত করে, তাই HasZero সঠিকভাবে ফিরে আসে false ।

10101010 00000000 11001100 11011101 ( 0xA00CCDD ) ⊕ 10111011 10111011 10111011 10111011 ( 0xbbbbbbb ) 00010001 10111011 01110111 01100110 ( 0x11BB7766 ) \ শুরু {অ্যারে} {আর} \ টেক্সটটিটিটি {10101010 \; \ পাঠ্য {10111011 \; 10111011 \; 10111011 \; 10111011} \; (\ টেক্সটটিটি {0xbbbbbbbb}) \\ \ hline \ পাঠ্য {00010001 \; 10111011 \; 01110111 \; 01100110} \; (\ টেক্সটটিটি {0x11BB7766}) \ শেষ {অ্যারে} 10101010 00000000 11001100 11011101 ( 0xA00CCDD ) ⊕ 10111011 10111011 10111011 10111011 ( 0xbbbbbbb ) 00010001 10111011 01110111 01100110 ( 0x11BB7766 ) ​ ​

এখন, যদি আমরা অনুসন্ধান করি 0x00 নিজেই (আমার ক্ষেত্রে একটি খালি স্লট)? মুখোশ হয় 0x00000000 সুতরাং এক্সওআর বালতিটি অপরিবর্তিত রেখে দেয়। HasZero এরপরে ফলাফলটিতে প্রয়োগ করা হয়, যা সঠিকভাবে প্রাক-বিদ্যমান শূন্যটি খুঁজে পায় এবং ফিরে আসে true ।

10101010 00000000 11001100 11011101 ( 0xA00CCDD ) ⊕ 00000000 00000000 00000000 00000000 ( 0x00000000 ) 10101010 00000000 11001100 11011101 ( 0xA00CCDD ) \ শুরু {অ্যারে} {আর} \ টেক্সটটিটিটি {10101010 \; \ পাঠ্য {00000000 \; 00000000 \; 00000000 \; \ টেক্সটটিটি {10101010 \; 10101010 00000000 11001100 11011101 ( 0xA00CCDD ) ⊕ 00000000 00000000 00000000 00000000 ( 0x00000000 ) 10101010 00000000 11001100 11011101 ( 0xA00CCDD ) ​ ​

সুতরাং না, কিছুই ভেঙে যায় না, অ্যালগরিদম এখনও শক্তিশালী: HasZero এক্সওরের পরে যদি শূন্য বাইট বিদ্যমান থাকে তবে কেবল একটি ইতিবাচক ফলাফল দেয়, যা কেবল তখনই ঘটে যদি আমাদের টার্গেট ফিঙ্গারপ্রিন্টটি বালতিতে শুরু হয়।

সব একসাথে রাখা

এখানে চূড়ান্ত, শাখা-মুক্ত চেহারা:

public bool Contains ( byte fingerprint , uint bucketIdx ) { uint bucket = _table ( bucketIdx ); uint mask = fingerprint * 0x01010101U ; uint xored = bucket ^ mask ; return (( xored - 0x01010101U ) & ~ xored & 0x80808080U ) != 0 ; }

আমরা জিরো-আউট ম্যাচিং বাইটগুলিতে এক্সওর করি, তারপরে কোনও বাইট শূন্য কিনা তা দেখতে বিট-টুইডলিং ট্রিকটি ব্যবহার করি।

বেঞ্চমার্কগুলি নিশ্চিত করেছে যে এই বিট-টুইডলিং অনুশীলনটি প্রচেষ্টাটির পক্ষে যথেষ্ট উপযুক্ত। ইতিবাচক চেহারা শেষ হয়ে গেল 60% দ্রুতনেতিবাচক চেহারা হয়ে উঠলে দ্বিগুণেরও বেশি দ্রুত মূল বাইট-অ্যারে বাস্তবায়নের তুলনায়। এটি স্থানান্তরিত সংস্করণটির উপরও একটি গুরুত্বপূর্ণ লাফ। পঠনযোগ্যতা অবশ্যই একটি হিট নিয়েছিল, কাঁচা পারফরম্যান্স লাভ একটি বাণিজ্য বন্ধ যা আমি ঠিক আছি।

চূড়ান্ত চিন্তা

আমি এখনও প্রযোজনায় ঘন বিট কৌশলগুলি স্টাফ করার বিশাল ফ্যান নই C তবে আমি মনে করি এই ছোট্ট অ্যাডভেঞ্চারটি এটি মূল্যবান হয়েছে: লুকআপের পথটি এখন দ্বিগুণ দ্রুত, এবং কোডবেসটি এখনও কৌশলটি ভালভাবে রাখতে যথেষ্ট কমপ্যাক্ট। আমি আশা করি এই নোটগুলি অন্য কাউকে একটি পথচলা বাঁচায় – বা খুব কমপক্ষে যে আপনি আমার সাথে এই ছোট্ট অপ্টিমাইজেশন ট্রিপটি উপভোগ করেছেন।