নিম্নলিখিত কোড সহ, আমরা এক বছর 0 ≤ কিনা তা পরীক্ষা করতে পারি y ≤ 102499 প্রায় 3 টি সিপিইউ নির্দেশাবলী সহ একটি লিপ বছর:

bool is_leap_year_fast(uint32_t y) return ((y * 1073750999) & 3221352463) <= 126976;

এই কাজ কিভাবে? উত্তরটি আশ্চর্যজনকভাবে জটিল। এই নিবন্ধটি এটি ব্যাখ্যা করে, বেশিরভাগ বিট-টুইডলিংয়ের সাথে কিছু মজা করার জন্য; শেষে, আমি ব্যবহারিক ব্যবহার সংক্ষেপে আলোচনা করব।

এভাবেই একটি লিপ ইয়ার চেক সাধারণত প্রয়োগ করা হয়:

bool is_leap_year(uint32_t y) if ((y % 4) != 0) return false; if ((y % 100) != 0) return true; if ((y % 400) == 0) return true; return false;

আমরা ব্যবহার করছি প্রোলেপটিক গ্রেগরিয়ান ক্যালেন্ডারযা গ্রেগরিয়ান ক্যালেন্ডারটিকে তার প্রবর্তন থেকে 1582 সালে পিছনে প্রসারিত করে এবং একটি বছর 0 অন্তর্ভুক্ত করে Thus সুতরাং, আমাদের 1582 এর আগে কয়েক বছর আলাদা আলাদাভাবে চিকিত্সা করার দরকার নেই। সরলতার জন্য, আমরা নেতিবাচক বছরগুলি উপেক্ষা করি এবং একটি স্বাক্ষরবিহীন বছর ব্যবহার করি।

স্ট্যান্ডার্ড পদ্ধতির অনুকূলিতকরণ

আসুন প্রথমে কিছু সাধারণ স্পিডআপগুলি করা যাক যাতে আমরা একটি ভাল বেসলাইন পাই। আমি কোথায় credit ণ নির্ধারণ করব তা নিশ্চিত নই – এই কৌশলগুলি সম্ভবত অনেকবার স্বাধীনভাবে পুনরায় নতুনভাবে পুনরায় সজ্জিত হয়েছে।

আমরা প্রতিস্থাপন করতে পারেন (y % 100) != 0 দ্বারা (y % 25) != 0 : আমরা ইতিমধ্যে এটি জানি y 2 এর একাধিক2সুতরাং যদি এটি 5 এর একাধিক হয়2এটি 2 এর একাধিক2 ⋅ 52 = 100। একইভাবে, আমরা প্রতিস্থাপন করতে পারি (y % 400) == 0 দ্বারা (y % 16) == 0 : আমরা ইতিমধ্যে এটি জানি y 5 এর একাধিক2সুতরাং যদি এটি 2 এর একাধিক হয়4এটি 5 এর একাধিক2 ⋅ 24 = 400।

bool is_leap_year1(uint32_t y) if ((y % 4) != 0) return false; if ((y % 25) != 0) return true; if ((y % 16) == 0) return true; return false;

এটি দরকারী কারণ আমরা এখন মডুলোকে 4 এবং 16 দ্বারা বিট মাস্কিং দিয়ে প্রতিস্থাপন করতে পারি। কীভাবে 25 দ্বারা মডুলো কমিয়ে আনতে হবে সে সম্পর্কে সংকলক প্রয়োগকারীদের কাছে আরও একটি পরিচিত রয়েছে। (x % 25) != 0 জিসিসির সাথে এবং সি তে অনুবাদ করে আমরা পাই x * 3264175145 > 171798691 । কমপক্ষে 20 টি চক্রের 3 টি চক্রের একটি সাধারণ বিলম্বিত এবং মডুলোতে গুণনের সাথে, এটি একটি দুর্দান্ত উন্নতি। আমি কেবল এটি কীভাবে কাজ করে সে সম্পর্কে একটি স্বজ্ঞাততা দেব; আরও বিশদ পাওয়া যাবে

ম্যাজিক নম্বরগুলি কোথা থেকে আসে? আমাদের আছে

232 ⋅ 19/25 = 3264175144.96 (ঠিক)।

সুতরাং 3264175145 এর সাথে গুণিত করে, আমরা (19/25) দিয়ে গুণমানের প্রায় ভগ্নাংশের অংশ গণনা করি। যদি এটি একটি সঠিক গুণ হয় তবে আমরা 25 এর বহুগুণের জন্য শূন্যের একটি ভগ্নাংশের অংশটি পেয়ে যাব We আমরা এমন একটি সংখ্যার সাথে গুণ করি যা 0.04 দ্বারা খুব বেশি, তাই ত্রুটিটি 0.04 ⋅ (2 পর্যন্ত হতে পারে32 – 1) = 171798691.8, যা দ্বিতীয় যাদু নম্বর থেকে আসে।

এই কৌশলটি বেশ সুন্দরভাবে কাজ করে না x % 100 যেখানে আমাদের আরও একটি ফিক্সআপ নির্দেশনা প্রয়োজন, তাই হ্রাস y % 100 থেকে y % 25 সহায়ক ছিল।

আমাদের লিপ ইয়ার চেক এখন এর মতো দেখাচ্ছে:

bool is_leap_year2(uint32_t y) if ((y & 3) != 0) return false; if (y * 3264175145u > 171798691u) return true; if ((y & 15) == 0) return true; return false;

নোট করুন যে জিসিসি বা ক্ল্যাংয়ের মতো আধুনিক সংকলকগুলি উত্পাদন করবে কিছু পছন্দ is_leap_year2 থেকে is_leap_year1 সুতরাং সি উত্সে এটি করার খুব বেশি বক্তব্য নেই, তবে এটি অন্যান্য প্রোগ্রামিং ভাষায় কার্যকর হতে পারে।

এই কোডটি সাধারণত ব্রাঞ্চিং অ্যাসেমব্লিতে সংকলন করে। অনুশীলনে, ইনপুটগুলি সাধারণত মোটামুটি অনুমানযোগ্য, যাতে এটি অগত্যা খারাপ হয় না। যদি আমরা শাখার ভুল ধারণা জরিমানা এড়াতে চাই, সেরা কেসকে ধীর করে দেওয়ার দামে, আমরা কিছুটা ঘিরে জিনিস বদলাতে পারি এবং পেতে পারি ব্রাঞ্চলেস কোড (এবং একটি শালীন কোড গল্ফ প্রার্থীও):

bool is_leap_year3(uint32_t y) return !(y & ((y % 25) ? 3 : 15));

আপনি যদি আরও কিছু ক্যালেন্ডার গণনার স্পিডআপগুলি দেখতে চান তবে জ্যাকব প্র্যাট দ্বারা চেক আউট করতে ভুলবেন না।

একটি বিট-টুইডলিং পদ্ধতির সন্ধান করা

আমরা কি সমস্ত ইনপুটগুলির জন্য নির্ভুলতা ছেড়ে দিয়ে লিপ বছরের গণনা উন্নত করতে পারি? সর্বোপরি, আমরা সাধারণত 3584536493 বছরটি লিপ বছর কিনা সেদিকে খেয়াল রাখি না; প্রকৃতপক্ষে, পাইথন, সি#, এবং যান কেবলমাত্র বছর 0 (বা 1) থেকে 9999 (যেখানে asons তুগুলির সাথে সম্পর্কিত ড্রিফ্ট ইতিমধ্যে 4 দিনের বেশি) সমর্থন করে। আমার ধারণা ছিল যে যদি কিছু সংক্ষিপ্ত উপস্থিত থাকে তবে এটি মূলত যাদু ধ্রুবকগুলি ব্যবহার করে কিছু অদ্ভুত হ্যাশিংয়ের মতো দেখাবে, তাই আমি কিছু ছোট ফর্ম চেষ্টা করতে এবং নিষ্ঠুর শক্তি দ্বারা ধ্রুবকগুলি অনুমান করতে চেয়েছিলাম। ফর্ম (y * f) <= t দরকারী বলে মনে হচ্ছে তবে এখনও যথেষ্ট শক্তিশালী নয়। আমার একজন প্রার্থী একটি মুখোশ যুক্ত করছিলেন: ((y * f) & m) <= t । এখন আমাদের অনুমান করার জন্য 96 টি বিট রয়েছে, যা কেবল নিষ্ঠুর শক্তি দ্বারা সম্ভব নয়। আসুন ব্যবহার করা যাক জেড 3এমন একটি সলভার যা বিটভেক্টর সীমাবদ্ধতাগুলিকে সমর্থন করে যা এর জন্য পুরোপুরি উপযুক্ত:

import z3 BITS = 32 f, m, t, y = z3.BitVecs('f m t y', BITS) def target(y): return z3.And((y & 3) == 0, z3.Or(z3.URem(y, 25) != 0, (y & 15) == 0)) def candidate(x): return z3.ULE((x * f) & m, t) solver = z3.Solver() solver.add(z3.ForAll(y, z3.Implies(z3.ULE(y, 400), candidate(y) == target(y)))) if solver.check() == z3.sat: print(f'found solution: solver.model()') else: print('no solution found')

কয়েক সেকেন্ডের মধ্যে, এটি এমন ধ্রুবকগুলি খুঁজে পায় যা একটি অনিয়ন্ত্রিত বছরের পরিসরের জন্য সঠিক ফলাফল দেয়। পরিসীমাটি প্রসারিত করে, অবশেষে আমি এমন ধ্রুবকগুলি পেয়েছি যা গণনার সময় প্রায় আধা ঘন্টা ধরে 102499 বছর থেকে 0 বছর পর্যন্ত সঠিক ফলাফল দেয় এবং প্রমাণ করেছে যে এটি 32 বিটের জন্য সর্বোত্তম:

bool is_leap_year_fast(uint32_t y) const uint32_t f = 1073750999u; const uint32_t m = 3221352463u; const uint32_t t = 126976u; return ((y * f) & m) <= t;

ব্যাখ্যা

এটা কিভাবে কাজ করে? এটি আশ্চর্যজনক বলে মনে হচ্ছে, প্রায় যাদু, আমরা এই সমস্ত গণনাগুলিকে তিনটি নির্দেশিকায় চেপে ধরতে পারি। যাইহোক, উপরের বিবেচনাগুলি আমাদের এটি বোঝার বেশিরভাগ সরঞ্জাম দেয়।

চিঠিগুলি দ্বারা নির্দেশিত চারটি প্রাসঙ্গিক বিট রেঞ্জ সহ বাইনারিটিতে আমাদের ধ্রুবকগুলি এখানে:

A D f: 01 0000000000000000 10001111010111 m: 11 0000000000000 11111 00000000 1111 t: 00 0000000000000 11111 00000000 0000 B C

প্রথমে পণ্যটির জন্য বিবেচনা করা যাক পি : = y ⋅ চ কি সঙ্গে মাস্কিং মি এবং তুলনা টি কি। ব্লক কবিট ইন টি 0 হয়, এবং তাই, ফলাফলটি কোনও বিট হিসাবে যত তাড়াতাড়ি মিথ্যা ক সেট করা হয় পি। অন্যথায়, ব্লক খ প্রাসঙ্গিক হয়ে ওঠে। এখানে সমস্ত বিট ইন টি 1, সুতরাং ফলাফলটি যত তাড়াতাড়ি সত্য হয় খ আনসেট ইন পি। অন্যথায়, ব্লকের জন্য গ আমাদের প্রয়োজন যে সমস্ত বিট আনসেট করা আছে পি। এইভাবে, বিট রেঞ্জের তুলনাগুলির একগুচ্ছ সবগুলিই একটি একক হিসাবে united ক্যবদ্ধ <= ।

সুতরাং, আমরা আবার লিখতে পারে is_leap_year_fast নিম্নরূপ:

bool is_leap_year_fast2(uint32_t y) uint32_t p = y * 1073750999u; const uint32_t A = 0b11000000000000000000000000000000; const uint32_t B = 0b00000000000000011111000000000000; const uint32_t C = 0b00000000000000000000000000001111; if ((p & A) != 0) return false; if ((p & B) != B) return true; if ((p & C) == 0) return true; return false;

এটি সন্দেহজনকভাবে দেখতে পছন্দ করে is_leap_year2 আর! এবং প্রকৃতপক্ষে, তিনটি শর্তের ঠিক একই উদ্দেশ্য রয়েছে। আমরা দেখাব

(p & A) != 0 ট্রিগার যখন (y % 4) != 0 ; (p & B) != B ট্রিগার যখন (y % 100) != 0 ; (p & C) == 0 ট্রিগার যখন (y % 16) == 0 (এবং তাই (y % 400) == 0 যেহেতু আমরা ইতিমধ্যে জানি y 25 এর একাধিক)।

দুটি সহজ মামলা: (1) এবং (3)

(1): 1 বিট ইন ক মধ্যে চ দুটি নিম্ন বিট পুনরুত্পাদন করে y মধ্যে পি এ ক। এটি বিটসের সাথে গুণনের ফলাফল দ্বারা ক্লোবারড করা যায় না ডি: আমরা যে সর্বোচ্চ মানটি পেতে পারি তা হ’ল 102499 ⋅ (এফএন্ডডি) = 940428325, যার মধ্যে কেবল 30 বিট রয়েছে। সুতরাং, পি -তে শূন্য কিনা তা যাচাই করা পরীক্ষা করার সমতুল্য কিনা y 0 মডুলো 4।

(3): পরীক্ষা করা হচ্ছে যে সর্বনিম্ন 4 বিটগুলির কোনওটিই সেট করা নেই পি কিনা তা যাচাই করছে পি 0 মডুলো 16। তবে, আমরা আসলে যাচাই করতে চাই y। এটি কোনও সমস্যা নয়: এটি কেবলমাত্র সর্বনিম্ন 4 বিট দেখার পক্ষে যথেষ্ট চএবং চ 1111 2 = 15 সেখানে। 15 = 3 ⋅ 5 এর সাথে গুণ করা 2 এর কোনও অতিরিক্ত ফ্যাক্টর প্রবর্তন করে না, সুতরাং 16 দ্বারা বিভাজনযোগ্যতা অপরিবর্তিত।

আকর্ষণীয় মামলা: (2)

এরপরে, আসুন কোন সংখ্যাগুলির জন্য সন্ধান করার চেষ্টা করি পি & খ ≠ খ। এই জন্য, 1 বিট ইন চ & ক কোনও ভূমিকা পালন করে না, তাই বিটগুলি বিবেচনা করুন চ & ডি। তারা 10001111010111 2 = 9175। আসুন দেখুন কোন সংখ্যাটি পরীক্ষাটি হিট করে।

>>> B = 0b00000000000000011111000000000000 >>> s = (y for y in range(5000) if ((y * 9175) & B) == B) >>> for i in range(0, len(s), 16): print(*(f'n:4d' for n in s(i:i+16))) 14 57 71 100 114 157 171 200 214 257 271 300 314 357 371 400 414 457 471 500 514 557 571 600 614 657 671 700 714 757 771 800 814 857 871 900 914 957 971 1000 1014 1057 1071 1100 1114 1157 1171 1200 1214 1257 1271 1300 1314 1357 1371 1400 1414 1457 1471 1500 1514 1557 1571 1600 1614 1657 1671 1700 1714 1757 1771 1800 1814 1857 1871 1900 1914 1957 1971 2000 2014 2057 2071 2100 2114 2157 2171 2200 2214 2257 2271 2300 2314 2357 2371 2400 2414 2457 2471 2500 2514 2557 2571 2600 2614 2657 2671 2700 2714 2757 2771 2800 2814 2857 2871 2900 2914 2957 2971 3000 3014 3057 3071 3100 3114 3157 3171 3200 3214 3257 3271 3300 3314 3357 3371 3400 3414 3457 3471 3500 3514 3557 3571 3600 3614 3657 3671 3700 3714 3757 3771 3800 3814 3857 3871 3900 3914 3957 3971 4000 4014 4057 4071 4100 4114 4157 4200 4214 4257 4300 4314 4357 4400 4414 4457 4500 4514 4557 4600 4614 4657 4700 4714 4757 4800 4814 4857 4900 4914 4957

100 এর গুণগুলি এখানে পছন্দসই হিসাবে রয়েছে, তবে অন্যান্য সংখ্যার একগুচ্ছ। এটি কোনও সমস্যা নয় যতক্ষণ না এগুলির কোনওটিই 4 এর একাধিক নয়, যেহেতু সেগুলি ইতিমধ্যে পূর্ববর্তী পদক্ষেপে ফিল্টার করা হয়েছিল। এছাড়াও, 0 অনুপস্থিত, তবে এটি কোনও সমস্যা নয়, যেহেতু 0 টিও 400 এর একাধিক।

আসুন প্যাটার্নটি বোঝার চেষ্টা করি। প্রথম নজরে, এটি খুব সহজ দেখায়: আমাদের *14, *57, *71 এবং *00 রয়েছে। যাইহোক, 4171 থেকে *71 ড্রপ আউট (আপনি কি খেয়াল করেছেন?)। আমাদের পরে নতুন প্যাটার্নগুলি পপ আপ রয়েছে। এর বিশ্লেষণ করা যাক। নিম্নলিখিত পাইথন প্রোগ্রাম

def test(y): B = 126976 return ((y * 9175) & B) == B active = set() for y in range(120000): r = y % 100 if test(y): if r not in active: print(f'y:6: started *r:02') active.add(r) else: if r in active: print(f'y:6: stopped *r:02') active.remove(r)

আউটপুট

14: started *14 57: started *57 71: started *71 100: started *00 4171: stopped *71 32843: started *43 36914: stopped *14 65586: started *86 69657: stopped *57 98329: started *29 102500: stopped *00

সুতরাং, 102500 থেকে, আমরা আর 100 এর গুণগুলি ধরতে পারি না, যা ব্যাখ্যা করে যে কেন 102499 শেষ সংখ্যা যার জন্য is_leap_year_fast সঠিক ফলাফল প্রদান করে। আমরা এও দেখতে পাচ্ছি যে এর নীচে, কোনও সংখ্যা 100 এর গুণাবলী ব্যতীত 4 এর একাধিক নয় (সুবিধাজনকভাবে, আমরা কেবল শেষ দুটি দশমিক সংখ্যা জেনে এটি পরীক্ষা করতে পারি)। এটি শর্তের প্রমাণ (2) শেষ করে, যদি আমরা এই নালো-বাহিনী গণনায় বিশ্বাস করি; তবে আসুন আমরা কেন এই সংখ্যাগুলি পেয়েছি তা আরও ভালভাবে বুঝতে পারি।

আসুন আমরা কেন প্রথমে 100 টি গুণগুলি পাচ্ছি তা দেখুন। ফ্যাক্টর 9175 17-বিট স্থির পয়েন্ট উপস্থাপনায় 1/100 এর একাধিকের কাছাকাছি:

217 ⋅ 7/100 = 9175.04 (ঠিক)।

9175.04 দ্বারা 100 এর একাধিককে গুণিত করা একটি পূর্ণসংখ্যা দেয় (7 এর একাধিক) বিট 17 এবং তার উপরে এবং এর নীচে 17 টি শূন্য বিট দেয়। উদাহরণস্বরূপ

9175.04 ⋅ 500 = 10001100000000000000000000 2 100011 সহ 2 = 35 = 5 ⋅ 7।

9175 দ্বারা 100 এর একাধিক গুণকে কিছুটা কম দেয়:

9175 ⋅ 500 = 1000110000000000000000000 2 – 500 ⋅ 0.04 = 10001011111111111111101110000 2 ।

সাধারণভাবে, প্রচুর শূন্যে শেষ হওয়া একটি সংখ্যা থেকে কিছুটা বিয়োগ করা এমন একটি সংখ্যা তৈরি করে যা একেবারে শেষ ব্যতীত অনেকের মধ্যে শেষ হয়। এখানে, আমরা 5 টি বিট পরীক্ষা করি খ। জন্য y 100 এর একাধিক, জমে থাকা ত্রুটিটি নীচের প্রান্তে না আসা পর্যন্ত এগুলি সমস্ত 1 টির গ্যারান্টিযুক্ত খযা কেবল পরে ঘটে y = 212 / 0.04 = 102400, সুতরাং এটি ফিট করে।

এখন 14, 57 এবং 71 এর মতো অন্যান্য সংখ্যাগুলি কোথা থেকে এসেছে? আসুন এটি একটি ভিন্ন কোণ থেকে দেখুন। আমাদের 9175 = 2 রয়েছে17 ⋅ 0.06999969482421875 (ঠিক) এবং খ = 217 ⋅ 0.96875, সুতরাং

পি & খ = খ

⇔ y ⋅ 0.06999969482421875 ≥ 0.96875, কোথায় এক্স এর ভগ্নাংশ অংশ এক্স

⇔ 6.999969482421875y মোড 100 ≥ 96.875

100 এর গুণক কেন গৃহীত হয় তা দেখার এটি অন্য উপায়: তাদের জন্য 7y মোড 100 0, তাই 6.999969482421875y মোড 100 100 এর নীচে কিছুটা বেরিয়ে আসে এবং কেবল পরে 96.875 এর নীচে নেমে আসে y = (100 – 96.875) / (7 – 6.999969482421875) = 102400।

আমাদের ক্রমটিতে প্রদর্শিত অন্যান্য সংখ্যাগুলি বোঝার জন্য, প্রথমে বিবেচনা করা যাক সমাধানগুলি কী হবে যদি আমাদের এই অসমতার মধ্যে একটি পরিষ্কার 7 থাকে:

100 এর বিপরীতে 7y ≥ 96.875

100 এর বিপরীতে 7y ∈ 97, 98, 99।

এর সমাধানগুলি খুঁজতে, আমাদের প্রথমে 7 মডুলো 100 এর মডুলার বিপরীত প্রয়োজন, অর্থাৎ সংখ্যাটি এক্স যেমন 7এক্স মোড 100 = 1। আমরা বর্ধিত ইউক্লিডিয়ান অ্যালগরিদম ব্যবহার করে বা কেবল ব্যবহার করে এটি গণনা করতে পারি কিছু অনলাইন ক্যালকুলেটরযা আমাদের ফলাফলটি 43 বলে বলে Then তারপরে সমাধানগুলি 43 ⋅ 97 (মোড 100), 43 ⋅ 98 (মোড 100), এবং 43 ⋅ 99 (মোড 100), যা যথাক্রমে 71, 14 এবং 57 (মোড 100)। এটি ব্যাখ্যা করে যে আমরা কেন প্রাথমিকভাবে *14, *57 এবং *71 ফর্মের সংখ্যা দেখছি। এটি আরও ব্যাখ্যা করে যে আমরা কেন 4071 এর পরে ইজি *71 দেখা বন্ধ করে দিয়েছি: যখন 7 ⋅ 4171 = 29197, আমাদের 6.999969482421875 ⋅ 4171 = 29196.87271181640625, যা (মডুলো 100) 96.875 এর চেয়ে কম। একইভাবে, 32843 পপ আপ হয় কারণ জমে থাকা ত্রুটি (7 – 6.999969482421875) ⋅ 32843 = 1.002288818359375 একটি ছাড়িয়ে গেছে। এখানে আরও কিছু প্রচেষ্টা সহ, আমরা ম্যানুয়ালি উপরের পাইথন প্রোগ্রামের আউটপুট পুনরুত্পাদন করতে পারি এবং পরীক্ষা করে দেখতে পারি যে এই সংখ্যাগুলির কোনওটিই 4 এর একাধিক নয়।

অন্যান্য বিটউইথস এক্সটেনশন

এখন যেহেতু আমরা বুঝতে পারি যে কৌশলটি কীভাবে কাজ করে, আমরা অন্যান্য বিটউইথগুলির জন্য পরামিতিগুলি সন্ধান করার চেষ্টা করতে পারি। পরিবর্তনশীল অংশগুলি হ’ল ব্লকের অবস্থান খ এবং 100 এর ভগ্নাংশ চ & ডি।

uint64_t score(uint64_t f, uint64_t m, uint64_t t) for (uint64_t y = 0; ; y++) if ((((y * f) & m) <= t) != is_leap_year(y)) return y; int main() { uint64_t best_score = 0; for (int k = 0; k < BITS; k++) for (int k2 = 0; k2 < k; k2++) 0b1111; for (int n = 0; n < 100; n++) uint64_t f = (0b01ULL << (BITS - 2)) return 0; }

জন্য BITS = 64 প্রায় 7 মিনিটের মধ্যে আমরা খুঁজে পাই চ = 4611686019114582671, মি = 13835058121854156815, টি = 66571993088, যা সঠিক y = 5965232499। এটি দুর্দান্ত কারণ 5965232499> 232সুতরাং যে কোনও 32-বিট বছর এই বৈকল্পিকের সাথে সঠিকভাবে পরীক্ষা করা যেতে পারে।

এটি কি সর্বোচ্চ আমরা 64 বিট দিয়ে যেতে পারি? সম্ভবত আরও কিছু ধ্রুবক রয়েছে যা আরও ভাল কাজ করে? আমি এটি প্রমাণ করার জন্য তাত্ক্ষণিকভাবে কোনও উপায় খুঁজে পাইনি, তাই আমি আমার জন্য এটি করার জন্য অন্য কাউকে পাওয়ার চেষ্টা-সত্য পদ্ধতিটি নিযুক্ত করেছি এটি কোড গল্ফ স্ট্যাকেক্সচেঞ্জে পোস্ট করা। প্রকৃতপক্ষে কেবল 1 ঘন্টা ব্যবহারকারী ওভিগুলি খুব ভাল ফলাফল পোস্ট করেছে এবং দু’দিন পরে ব্যবহারকারী এক্সাল্টেড টোস্ট পোস্ট করেছেন একটি প্রমাণ যে 5965232499 সত্যই 64 বিটের জন্য সেরা সম্ভাব্য পরিসীমা, জেড 3 সলভারকেও নিয়োগ করে।

বেঞ্চমার্ক

অর্থবহ মানদণ্ড পাওয়া মুশকিল, যেহেতু ফাংশনটি কেবলমাত্র এত অল্প সময় নেয় এবং শাখাগুলি সংস্করণগুলির জন্য কার্যকর করার সময়টি ইনপুটটির নিদর্শনগুলির উপর নির্ভর করে। আসুন দুটি চরম কেস চেষ্টা করুন: সর্বদা 2025 বছর এবং সম্পূর্ণ এলোমেলো বছর। এগুলি একটি আই 7-8700 কে (কফি লেক, 4.7 গিগাহার্টজ) এর বেঞ্চমার্কের ফলাফল, সংকলিত ডাব্লুআইআরএইচ g++ -O3 -fno-tree-vectorize ::

2025 (এনএস) এলোমেলো (এনএস) is_leap_year 0.65 2.61 is_leap_year2 0.65 2.75 is_leap_year3 0.67 0.88 is_leap_year_fast 0.69 0.69

কিছু অদ্ভুত জিনিস এখানে দাঁড়িয়ে:

is_leap_year2 আসলে এর চেয়ে সামান্য ধীর হয় is_leap_year এলোমেলো ক্ষেত্রে। এটি আশ্চর্যজনক কারণ y % 100 কৌশলটির চেয়ে আরও একটি নির্দেশের প্রয়োজন is_leap_year2 ।

আসলে এর চেয়ে সামান্য ধীর হয় এলোমেলো ক্ষেত্রে। এটি আশ্চর্যজনক কারণ কৌশলটির চেয়ে আরও একটি নির্দেশের প্রয়োজন । is_leap_year3 স্থির মানের চেয়ে এলোমেলো ডেটার জন্য কিছুটা ধীর। এটি আশ্চর্যজনক কারণ এটি কোনও শাখা করে না।

বেঞ্চমার্কিং ব্যতীত অন্যের জন্য আমার কোনও ব্যাখ্যা নেই।

নতুন ফাংশন is_leap_year_fast এলোমেলো ডেটার জন্য স্ট্যান্ডার্ড বাস্তবায়নের চেয়ে 3.8 গুণ দ্রুত এবং নিখুঁতভাবে অনুমানযোগ্য ইনপুটটির জন্য প্রায় 6% ধীর। সামগ্রিকভাবে, এটি বেশ শক্ত বলে মনে হচ্ছে।

উপসংহার

সুতরাং, এটি কি সত্যিই সার্থক? আমাদের যেমন প্রতিস্থাপন করা উচিত? সিপিথন ডেটটাইম বাস্তবায়ন এই কৌশল সঙ্গে? ঠিক আছে, এটি নির্ভর করে। বেশিরভাগ বছর অনুশীলনে জিজ্ঞাসা করা চলতি বছর হবে, বা কমপক্ষে মোটামুটি অনুমানযোগ্য, সেক্ষেত্রে আমাদের কোনও দুর্দান্ত সুবিধা নেই। কোনও পরিবর্তনকে সম্পূর্ণরূপে ন্যায়সঙ্গত করার জন্য, আদর্শভাবে আমাদের কাছে বাস্তবসম্মত ডেটা সহ একটি মানদণ্ড থাকবে যা কেবল মাইক্রোব্যাঞ্চমার্কিংয়ের পরিবর্তে সাব্রুটাইন হিসাবে একটি লিপ ইয়ার চেক নিয়োগ করে। আমি এই জাতীয় ফলাফল শুনে খুশি হব!